.

Дисперсионный анализ

Язык: русский
Формат: реферат
Тип документа: Word Doc
97 3161
Скачать документ

Министерство образования Российской Федерации

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО
ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

Факультет информационных технологий

Кафедра прикладной информатики

КУРСОВАЯ РАБОТА

По дисциплине: «Системный анализ»

На тему: «Дисперсионный анализ»

ГОУ ОГУ 071900.5303.09 ПЗ

Руководитель работы

_____________Юдина Н.М.

«___»_____________2003 г.

Исполнитель

студент гр. 99 ИСЭ-2

_____________Жбанов В.В.

«___»_____________2003 г.

г. Оренбург-2003

Содержание

с.

Введение…………………….……………………………………………….3

Дисперсионный анализ………………………………………………….4

1.1 Основные понятия дисперсионного анализа…………………..……4

1.2 Однофакторный дисперсионный анализ……………………………..6

1.3 Многофакторный дисперсионный анализ……………………………12

Применение дисперсионного анализа в различных задачах и

исследованиях………………………………………………………………………16

2.1 Использование дисперсионного анализа при изучении

миграционных процессов……………………………………………….……..….16

2.2 Принципы математико-статистического анализа данных

медико-биологических исследований……………………………….……………17

2.3 Биотестирование почвы…………………………………………..……19

2.4 Грипп вызывает повышенную выработку гистамина…………..…..21

2.5 Дисперсионный анализ в химии…………………………………..….22

2.6 Использование прямого преднамеренного внушения в

бодрствующем состоянии в методике воспитания физических качеств………23

2.7 Купирование острой психотической симптоматики у больных

шизофренией атипичным нейролептиком……………………………………….26

2.8 Снование фасонной пряжи с ровничным эффектом……………..….28

2.9 Сопутствующая паталогия при полной утрате зубов у лиц

пожилого и старческого возраста…………………………………………………29

3 Дисперсионный анализ в контексте статистических

методов………………………………………………………….
……………………………………………31

3.1 Векторные авторегрессии……………………………………………..34

3.2 Факторный анализ………………………………………………….…37

3.3 Парная регрессия. Вероятностная природа регрессионных

моделей……………………………………………………………………….….…41

Заключение………………………………………………………….…….. 44

Список использованных источников………………………………….….45

Введение

Цель работы: познакомится с таким статистическим методом, как
дисперсионный анализ.

Дисперсионный анализ (от латинского Dispersio – рассеивание) –
статистический метод, позволяющий анализировать влияние различных
факторов на исследуемую переменную. Метод был разработан биологом Р.
Фишером в 1925 году и применялся первоначально для оценки экспериментов
в растениеводстве. В дальнейшем выяснилась общенаучная значимость
дисперсионного анализа для экспериментов в психологии, педагогике,
медицине и др.

Целью дисперсионного анализа является проверка значимости различия
между средними с помощью сравнения дисперсий. Дисперсию измеряемого
признака разлагают на независимые слагаемые, каждое из которых
характеризует влияние того или иного фактора или их взаимодействия.
Последующее сравнение таких слагаемых позволяет оценить значимость
каждого изучаемого фактора, а также их комбинации /1/.

При истинности нулевой гипотезы (о равенстве средних в нескольких
группах наблюдений, выбранных из генеральной совокупности), оценка
дисперсии, связанной с внутригрупповой изменчивостью, должна быть
близкой к оценке межгрупповой дисперсии.

При проведении исследования рынка часто встает вопрос о сопоставимости
результатов. Например, проводя опросы по поводу потребления какого-либо
товара в различных регионах страны, необходимо сделать выводы, на
сколько данные опроса отличаются или не отличаются друг от друга.
Сопоставлять отдельные показатели не имеет смысла и поэтому процедура
сравнения и последующей оценки производится по некоторым усредненным
значениям и отклонениям от этой усредненной оценки. Изучается вариация
признака. За меру вариации может быть принята дисперсия. Дисперсия ?2 –
мера вариации, определяемая как средняя из отклонений признака,
возведенных в квадрат.

На практике часто возникают задачи более общего характера – задачи
проверки существенности различий средних выборочных нескольких
совокупностей. Например, требуется оценить влияние различного сырья на
качество производимой продукции, решить задачу о влиянии количества
удобрений на урожайность с/х продукции.

Иногда дисперсионный анализ применяется, чтобы установить однородность
нескольких совокупностей (дисперсии этих совокупностей одинаковы по
предположению; если дисперсионный анализ покажет, что и математические
ожидания одинаковы, то в этом смысле совокупности однородны). Однородные
же совокупности можно объединить в одну и тем самым получить о ней более
полную информацию, следовательно, и более надежные выводы /2/.

1 Дисперсионный анализ

1.1 Основные понятия дисперсионного анализа

В процессе наблюдения за исследуемым объектом качественные факторы
произвольно или заданным образом изменяются. Конкретная реализация
фактора (например, определенный температурный режим, выбранное
оборудование или материал) называется уровнем фактора или способом
обработки. Модель дисперсионного анализа с фиксированными уровнями
факторов называют моделью I, модель со случайными факторами – моделью
II. Благодаря варьированию фактора можно исследовать его влияние
на величину отклика. В настоящее время общая теория дисперсионного
анализа разработана для моделей I.

В зависимости от количества факторов, определяющих вариацию
результативного признака, дисперсионный анализ подразделяют на
однофакторный и многофакторный.

Основными схемами организации исходных данных с двумя и более факторами
являются:

– перекрестная классификация, характерная для моделей I, в которых
каждый уровень одного фактора сочетается при планировании эксперимента с
каждой градацией другого фактора;

– иерархическая (гнездовая) классификация, характерная для модели II, в
которой каждому случайному, наудачу выбранному значению одного фактора
соответствует свое подмножество значений второго фактора.

Если одновременно исследуется зависимость отклика от качественных и
количественных факторов, т.е. факторов смешанной природы, то
используется ковариационный анализ /3/.

При обработке данных эксперимента наиболее разработанными и поэтому
распространенными считаются две модели. Их различие обусловлено
спецификой планирования самого эксперимента. В модели дисперсионного
анализа с фиксированными эффектами исследователь намеренно устанавливает
строго определенные уровни изучаемого фактора. Термин «фиксированный
эффект» в данном контексте имеет тот смысл, что самим исследователем
фиксируется количество уровней фактора и различия между ними. При
повторении эксперимента он или другой исследователь выберет те же самые
уровни фактора. В модели со случайными эффектами уровни значения фактора
выбираются исследователем случайно из широкого диапазона значений
фактора, и при повторных экспериментах, естественно, этот диапазон будет
другим.

Таким образом, данные модели отличаются между собой способом выбора
уровней фактора, что, очевидно, в первую очередь влияет на возможность
обобщения полученных экспериментальных результатов. Для дисперсионного
анализа однофакторных экспериментов различие этих двух моделей не столь
существенно, однако в многофакторном дисперсионном анализе оно может
оказаться весьма важным.

При проведении дисперсионного анализа должны выполняться следующие
статистические допущения: независимо от уровня фактора величины отклика
имеют нормальный (Гауссовский) закон распределения и одинаковую
дисперсию. Такое равенство дисперсий называется гомогенностью. Таким
образом, изменение способа обработки сказывается лишь на положении
случайной величины отклика, которое характеризуется средним значением
или медианой. Поэтому все наблюдения отклика принадлежат сдвиговому
семейству нормальных распределений.

Говорят, что техника дисперсионного анализа является “робастной”. Этот
термин, используемый статистиками, означает, что данные допущения могут
быть в некоторой степени нарушены, но несмотря на это, технику можно
использовать.

При неизвестном законе распределения величин отклика используют
непараметрические (чаще всего ранговые) методы анализа.

и определяется по формуле:

,

где k – число групп;

nj – число единиц в j-ой группе;

– частная средняя по j-ой группе;

– общая средняя по совокупности единиц.

Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой
группе внутригрупповая дисперсия ?j2.

.

существует соотношение:

+ ?2.

Внутригрупповая дисперсия объясняет влияние неучтенных при группировке
факторов, а межгрупповая дисперсия объясняет влияние факторов
группировки на среднее значение по группе /2/.

1.2 Однофакторный дисперсионный анализ

Однофакторная дисперсионная модель имеет вид:

xij = ? + Fj + ?ij, (1)

где хij – значение исследуемой переменой, полученной на i-м уровне
фактора (i=1,2,…,т) c j-м порядковым номером (j=1,2,…,n);

Fi – эффект, обусловленный влиянием i-го уровня фактора;

?ij – случайная компонента, или возмущение, вызванное влиянием
неконтролируемых факторов, т.е. вариацией переменой внутри отдельного
уровня.

Основные предпосылки дисперсионного анализа:

– математическое ожидание возмущения ?ij равно нулю для любых i,
т.е.

M(?ij) = 0; (2)

– возмущения ?ij взаимно независимы;

– дисперсия переменной xij (или возмущения ?ij) постоянна для

любых i, j, т.е.

D(?ij) = ?2; (3)

– переменная xij (или возмущение ?ij) имеет нормальный закон

распределения N(0;?2).

Влияние уровней фактора может быть как фиксированным или систематическим
(модель I), так и случайным (модель II).

Пусть, например, необходимо выяснить, имеются ли существенные различия
между партиями изделий по некоторому показателю качества, т.е. проверить
влияние на качество одного фактора – партии изделий. Если включить в
исследование все партии сырья, то влияние уровня такого фактора
систематическое (модель I), а полученные выводы применимы только к тем
отдельным партиям, которые привлекались при исследовании. Если же
включить только отобранную случайно часть партий, то влияние фактора
случайное (модель II). В многофакторных комплексах возможна смешанная
модель III, в которой одни факторы имеют случайные уровни, а другие –
фиксированные.

Пусть имеется m партий изделий. Из каждой партии отобрано соответственно
n1, n2, …, nm изделий (для простоты полагается, что n1=n2=…=nm=n).
Значения показателя качества этих изделий представлены в матрице
наблюдений:

x11 x12 … x1n

x21 x22 … x2n

………………… = (xij), (i = 1,2, …, m; j = 1,2, …, n).

xm1 xm2 … xmn

Необходимо проверить существенность влияния партий изделий на их
качество.

Если полагать, что элементы строк матрицы наблюдений – это численные
значения случайных величин Х1,Х2,…,Хm, выражающих качество изделий и
имеющих нормальный закон распределения с математическими ожиданиями
соответственно a1,а2,…,аm и одинаковыми дисперсиями ?2, то данная
задача сводится к проверке нулевой гипотезы Н0: a1=a2 =…= аm,
осуществляемой в дисперсионном анализе.

Усреднение по какому-либо индексу обозначено звездочкой (или точкой)
вместо индекса, тогда средний показатель качества изделий i-й партии,
или групповая средняя для i-го уровня фактора, примет вид:

, (4)

i* – среднее значение по столбцам;

ij – элемент матрицы наблюдений;

n – объем выборки.

А общая средняя:

. (5)

** выглядит так:

2+

2. (6)

или

Q = Q1 + Q2 + Q3.

Последнее слагаемое равно нулю

=0. (7)

так как сумма отклонений значений переменной от ее средней равна нулю,
т.е.

2=0.

Первое слагаемое можно записать в виде:

В результате получается тождество:

Q = Q1 + Q2,
(8)

– общая, или полная, сумма квадратов отклонений;

– сумма квадратов отклонений групповых средних от общей средней, или
межгрупповая (факторная) сумма квадратов отклонений;

– сумма квадратов отклонений наблюдений от групповых средних, или
внутригрупповая (остаточная) сумма квадратов отклонений.

В разложении (8) заключена основная идея дисперсионного анализа.
Применительно к рассматриваемой задаче равенство (8) показывает, что
общая вариация показателя качества, измеренная суммой Q, складывается из
двух компонент – Q1 и Q2, характеризующих изменчивость этого показателя
между партиями (Q1) и изменчивость внутри партий (Q2), характеризующих
одинаковую для всех партий вариацию под воздействием неучтенных
факторов.

В дисперсионном анализе анализируются не сами суммы квадратов
отклонений, а так называемые средние квадраты, являющиеся
несмещенными оценками соответствующих дисперсий, которые получаются
делением сумм квадратов отклонений на соответствующее число степеней
свободы.

Число степеней свободы определяется как общее число наблюдений минус
число связывающих их уравнений. Поэтому для среднего квадрата s12,
являющегося несмещенной оценкой межгрупповой дисперсии, число степеней
свободы k1=m-1, так как при его расчете используются m групповых
средних, связанных между собой одним уравнением (5). А для среднего
квадрата s22, являющегося несмещенной оценкой внутригрупповой дисперсии,
число степеней свободы k2=mn-m, т.к. при ее расчете используются все mn
наблюдений, связанных между собой m уравнениями (4).

Таким образом:

= Q1/(m-1),

= Q2/(mn-m).

, подставить в их формулы выражение xij (1) через параметры модели, то
получится:

(9)

т.к. с учетом свойств математического ожидания

а

(10)

Для модели I с фиксированными уровнями фактора Fi(i=1,2,…,m) –
величины неслучайные, поэтому

2 /(m-1) +?2.

Гипотеза H0 примет вид Fi = F*(i = 1,2,…,m), т.е. влияние всех уровней
фактора одно и то же. В случае справедливости этой гипотезы

)= ?2.

Для случайной модели II слагаемое Fi в выражении (1) – величина
случайная. Обозначая ее дисперсией

получим из (9)

(11)

и, как и в модели I

)= ?2.

В таблице 1.1 представлен общий вид вычисления значений, с помощью
дисперсионного анализа.

Таблица 1.1 – Базовая таблица дисперсионного анализа

= Q2/(mn-m)

mn-1

Гипотеза H0 примет вид ?F2 =0. В случае справедливости этой гипотезы

)= ?2.

В случае однофакторного комплекса как для модели I, так и модели II
средние квадраты S2 и S2, являются несмещенными и независимыми оценками
одной и той же дисперсии ?2.

дисперсии ?2.

больше критического F?:K1:K2, определенного на уровне значимости ? при
числе степеней свободы k1=m-1 и k2=mn-m, и принимается, если F jln„†??TH6 ? ?????"?†???¬°OOeUUe( 0 2 4 ? c ¦ ? & F AE gdjPE gdjPE ?? ?? gdO gdO gdO w hO hO hO gd `„$ gdo\E h?6 ???? ??????X h•4 @? h?gI@? h•4 @? h?gI@? hp;z@? hp;z@? h•4 @? h•4 @? h•4 @? h•4 @? ?@? hX#t@? h•4 @? h•4 @? h h ?@? h•4 @? a$gd a$gd gd gd gd gd h•4 @? a$gd gd gd h h•4 @? h•4 @? h•4 @? ?znn?b gd?*9 gdjPE gdjPE j h h•4 @? h•4 @? h gd gdjPE h h ??????? ??????? j*o h“' h“' h“' jbi h“' gdUNo h h h h h h h h h h h h $ $ P % hEL hEL gdUNo gdy( gdUNo ???? …$…h… …?…†B† ‡L‡e?oooooooooooococccoccococco '® Физическая подготовка – основополагающая сторона спортивной тренировки, так как в большей мере, чем другие стороны подготовки, характеризуется физическими нагрузками, воздействующими на морфофункциональные свойства организма. От уровня физической подготовленности зависят успешность технической подготовки, содержание тактики спортсмена, реализация личностных свойств в процессе тренировок и состязаний. Одной из основных задач физической подготовки является воспитание физических качеств. В связи с этим возникает необходимость в разработке педагогических средств и методов, позволяющих учитывать возрастные особенности юных спортсменов, сохраняющих их здоровье, не требующих дополнительных затрат времени и в то же время стимулирующих рост физических качеств и, как следствие, - спортивного мастерства. Использование вербального гетеровоздействия в тренировочном процессе в группах начальной подготовки - одно из перспективных направлений исследований по данной проблеме. Анализ теории и практики реализации внушающего вербального гетеровоздействия выявил основные противоречия: - доказанность эффективного использования специфических методов вербального гетеровоздействия в тренировочном процессе и практическую невозможность их использования тренером; - признание прямого преднамеренного внушения (далее ППВ) в бодрствующем состоянии как одного из основных методов вербального гетеровоздействия в педагогической деятельности тренера и отсутствие теоретического обоснования методических особенностей его применения в спортивной подготовке, и в частности в процессе воспитания физических качеств. В связи с выявленными противоречиями и недостаточной разработанностью проблема использования системы методов вербального гетеровоздействия в процессе воспитания физических качеств спортсменов предопределила цель исследования - разработать рациональные целенаправленные методики ППВ в бодрствующем состоянии, способствующие совершенствованию процесса воспитания физических качеств на основе оценки психического состояния, проявления и динамики физических качеств дзюдоистов групп начальной подготовки. С целью апробации и определения эффективности экспериментальных методик ППВ при воспитании физических качеств дзюдоистов был проведен сравнительный педагогический эксперимент, в котором приняли участие четыре группы – три экспериментальных и одна контрольная. В первой экспериментальной группе (ЭГ) использовалась методика ППВ М1, во второй - методика ППВ М2, в третьей - методика ППВ М3. В контрольной группе (КГ) методики ППВ не применялись. Для определения эффективности педагогического воздействия методик ППВ в процессе воспитания у дзюдоистов физических качеств был проведен однофакторный дисперсионный анализ. Степень влияния методики ППВ M1 в процессе воспитания: - выносливости: а) после третьего месяца составила 11,1%; - скоростных способностей: а) после первого месяца - 16,4%; б) после второго - 26,5%; в) после третьего - 34,8%; - силы: а) после второго месяца - 26, 7%; б) после третьего - 35,3%; - гибкости: а) после третьего месяца - 20,8%; - координационных способностей: а) после второго месяца основного педагогического эксперимента степень влияния методики составила 6,4%; б) после третьего - 10,2%. Следовательно, существенные изменения в показателях уровня развития физических качеств с использованием методики ППВ М1 обнаружены в скоростных способностях и силе, степень влияния методики в данном случае наибольшая. Наименьшая степень влияния методики обнаружена в процессе воспитания выносливости, гибкости, координационных способностей, что дает основание говорить о недостаточной эффективности использования методики ППВ М1 при воспитании указанных качеств. Степень влияния методики ППВ M2 в процессе воспитания: - выносливости а) после первого месяца эксперимента - 12,6%; б) после второго - 17,8%; в) после третьего - 20,3%. - скоростных способностей: а) после третьего месяца тренировочных занятий - 28%. - силы: а) после второго месяца - 27,9%; б) после третьего - 35,9%. - гибкости: а) после третьего месяца тренировочных занятий - 14,9%; - координационных способностей - 13,1%. Полученный результат однофакторного дисперсионного анализа данной ЭГ позволяет сделать вывод о том, что методика ППВ М2 наиболее результативна при воспитании выносливости и силы. Менее эффективна она в процессе воспитания гибкости, скоростных и координационных способностей. Степень влияния методики ППВ М3 в процессе воспитания: - выносливости: а) после первого месяца эксперимента 16,8%; б) после второго - 29,5%; в) после третьего - 37,6%. - скоростных способностей: а) после первого месяца - 26,3%; б) после второго - 31,3%; в) после третьего - 40,9%. - силы: а) после первого месяца - 18,7%; б) после второго - 26,7%; в) после третьего - 32,3%. - гибкости: а) после первого - изменений нет; б) после второго - 16,9%; в) после третьего - 23,5%. - координационных способностей: а) после первого месяца изменений нет; б) после второго - 23,8%; в) после третьего - 91% . Таким образом, однофакторный дисперсионный анализ показал, что использование методики ППВ М3 в подготовительном периоде наиболее эффективно в процессе воспитания физических качеств, так как наблюдается увеличение степени ее влияния после каждого месяца педагогического эксперимента /9/.     2.7 Купирование острой психотической симптоматики у больных шизофренией атипичным нейролептиком Цель исследования сводилась к изучению возможности применения рисполепта для купирования острых психозов у больных с диагнозом шизофрении (параноидный тип по МКБ-10) и шизоаффективного расстройства. При этом в качестве основного изучаемого критерия использовался показатель длительности сохранения психотической симптоматики в условиях фармакотерапии рисполептом (основная группа) и классическими нейролептиками. Основные задачи исследования сводились к определению показателя длительности психоза (так называемый нетто-психоз), под которым понималось сохранение продуктивной психотической симптоматики с момента начала применения нейролептиков, выраженное в днях. Данный показатель был рассчитан отдельно для группы, принимавшей рисперидон, и отдельно для группы, принимавшей классические нейролептики. Наряду с этим была поставлена задача по определению доли редукции продуктивной симптоматики под влиянием рисперидона в сравнении с классическими нейролептиками в разные сроки терапии.   В общей сложности изучены 89 больных (42 мужчины и 47 женщин) с острой психотической симптоматикой в рамках параноидной формы шизофрении (49 больных) и шизоаффективного расстройства (40 больных). Первый эпизод и длительность заболевания до 1 года были зарегистрированы у 43 больных, тогда как в остальных случаях на момент исследования отмечались последующие эпизоды шизофрении при длительности заболевания свыше 1 года. Терапию рисполептом получали 29 человек, среди которых с так называемым первым эпизодом было 15 больных. Терапию классическими нейролептиками получали 60 человек, среди которых с первым эпизодом было 28 человек. Доза рисполепта варьировала в диапазоне от 1 до 6 мг в сутки и в среднем составляла 4±0,4 мг/сут. Рисперидон принимали исключительно внутрь после еды один раз в сутки в вечернее время. Терапия классическими нейролептиками включала применение трифлуоперазина (трифтазина) в суточной дозе до 30 мг внутримышечно, галоперидола в суточной дозе до 20 мг внутримышечно, триперидола в суточной дозе до 10 мг внутрь. Подавляющее большинство больных принимало классические нейролептики в виде монотерапии в течение первых двух недель, после чего переходили в случае необходимости (при сохранении бредовой, галлюцинаторной или другой продуктивной симптоматики) к сочетанию нескольких классических нейролептиков. При этом в качестве основного препарата оставался нейролептик с выраженным элективным антибредовым и антигаллюцинаторным аффектом (например, галоперидол или трифтазин), к нему присоединяли в вечернее время препарат с отчетливым гипноседативным эффектом (аминазин, тизерцин, хлорпротиксен в дозах до 50-100 мг/сут). В группе, принимавшей классические нейролептики, был предусмотрен прием корректоров холинолитического ряда (паркопан, циклодол) в дозах до 10-12 мг/сут. Корректоры назначались в случае появления отчетливых побочных экстрапирамидных эффектов в виде острых дистоний, лекарственного паркинсонизма и акатизии. В таблице 2.1 представлены данные по длительности психоза при лечении рисполептом и классическими нейролептиками. Таблица 2.1 – Длительность психоза ("нетто-психоз") при лечении рисполептом и классическими нейролептиками Группа больных Длительность терапии, дни Значимость различий, p рисполепт классические нейролептики Вся выборка (n = 89) 15,4±1,4 (n = 29) 31,4±2,5 (n = 60) Таблица 3.1 – Применение статистических методов при решении аналитических задач Аналитические задачи, возникающие в сфере бизнеса, финансов и управления Методы описательной статистики Методы поверки статисти-ческих гипотез Методы регресси-онного анализа Методы дисперси-онного анализа Методы анализа категории-альных данных Методы много-мерного анализа Методы дискрими-нантного анализа Методы кластер-ного анализа Методы анализа выжива-емости Методы анализа и прогноза временных рядов Задачи горизонталь-ного (временного) анализа ++ + - + + - - - - - Задачи вертикального (структурного) анализа ++ - - + ++ ++ + + - - Задачи трендового анализа и прогноза ++ - +++ ++ - - - - ++ +++ Задачи анализа относительных показателей ++ + + - + +++ ++ ++ - ++ Задачи сравнитель- ного (пространствен-ного) анализа ++ - + + ++ +++ ++ ++ - + Задачи факторного анализа + + ++ - ++ +++ + ++ - + К большинству сложных систем применим принцип Парето, согласно которому 20 % факторов определяют свойства системы на 80 %. Поэтому первоочередной задачей исследователя имитационной модели является отсеивание несущественных факторов, позволяющее уменьшить размерность задачи оптимизации модели. Анализ дисперсии оценивает отклонение наблюдений от общего среднего. Затем вариация разбивается на части, каждая из которых имеет свою причину. Остаточная часть вариации, которую не удается связать с условиями эксперимента, считается его случайной ошибкой. Для подтверждения значимости используется специальный тест - F-статистика. Дисперсионный анализ определяет, есть ли эффект. Регрессионный анализ позволяет прогнозировать отклик (значение целевой функции) в некоторой точке пространства параметров. Непосредственной задачей регрессионного анализа является оценка коэффициентов регрессии /16/. Слишком большая размерность выборок затрудняет проведение статистических анализов, поэтому имеет смысл уменьшить размер выборки. Применив дисперсионный анализ можно выявить значимость влияния различных факторов на исследуемую переменную. Если влияние фактора окажется несущественным, то этот фактор можно исключить из дальнейшей обработки. 3.1 Векторные авторегрессии Макроэконометристы должны уметь решать четыре логически отличающиеся задачи: - описание данных; - макроэкономический прогноз; - структурный вывод; - анализ политики. Описание данных означает описание свойств одного или нескольких временных рядов и сообщение этих свойств широкому кругу экономистов. Макроэкономический прогноз означает предсказание курса экономики, обычно на два-три года или меньше (главным образом потому, что прогнозировать на более длинные горизонты слишком трудно). Структурный вывод означает проверку того, соответствуют ли макроэкономические данные конкретной экономической теории. Макроэконометрический анализ политики происходит по нескольким направлениям: с одной стороны, оценивается влияние на экономику гипотетического изменения инструментов политики (например налоговой ставки или краткосрочной процентной ставки), с другой стороны, оценивается влияние изменения правил политики (например переход к новому режиму монетарной политики). Эмпирический макроэкономический исследовательский проект может включать одну или несколько из этих четырех задач. Каждая задача должна быть решена таким образом, чтобы были учтены корреляции между рядами по времени. В 1970-х годах эти задачи решались с использованием разнообразных методов, которые, если оценить их с современных позиций, были неадекватны по нескольким причинам. Чтобы описать динамику отдельного ряда, достаточно было просто использовать одномерные модели временных рядов, а чтобы описать совместную динамику двух рядов – спектральный анализ. Однако отсутствовал общепринятый язык, пригодный для систематического описания совместных динамических свойств нескольких временных рядов. Экономические прогнозы делались либо с использованием упрощенных моделей авторегрессии — скользящего среднего (ARMA), либо с использованием популярных в то время больших структурных эконометрических моделей. Структурный вывод основывался либо на малых моделях с одним уравнением, либо на больших моделях, идентификация в которых достигалась за счет плохо обоснованных исключающих ограничений, и которые обычно не включали ожидания. Анализ политики на основе структурных моделей зависел от этих идентифицирующих предположений. Наконец, рост цен в 1970-е годы рассматривался многими как серьезная неудача больших моделей, которые в то время использовались для выработки политических рекомендаций. То есть это было подходящее время для появления новой макроэконометрической конструкции, которая могла бы решить эти многочисленные проблемы. В 1980 году была создана такая конструкция – векторные авторегрессии (VAR). На первый взгляд, VAR – не более, чем обобщение одномерной авторегрессии на многомерный случай, и каждое уравнение в VAR – не более, чем обычная регрессия по методу наименьших квадратов одной переменной на запаздывающие значения себя и других переменных в VAR. Но этот вроде бы простой инструмент дал возможность систематически и внутренне согласованно уловить богатую динамику многомерных временных рядов, а статистический инструментарий, который сопутствует VAR, оказался удобным и, что очень важно, его было легко интерпретировать. Выделяют три различных VAR-модели: - приведенная форма VAR; - рекурсивная VAR; - структурная VAR. Все три являются динамическими линейными моделями, которые связывают текущие и прошлые значения вектора Yt n-мерного временного ряда. Приведенная форма и рекурсивные VAR – это статистические модели, которые не используют никакие экономические соображения за исключением выбора переменных. Эти VAR используются для описания данных и прогноза. Структурная VAR включает ограничения, полученные из макроэкономической теории, и эта VAR используется для структурного вывода и анализа политики. Приведенная форма VAR выражает Yt в виде распределенного лага прошлых значений плюс серийно некоррелированный член ошибки, то есть обобщает одномерную авторегрессию на случай векторов. Математически приведенная форма модели VAR – это система n уравнений, которые можно записать в матричной форме следующим образом: (17) где ? - это n? l вектор констант; A1, A2, ..., Ap – это n? n матрицы коэффициентов; . Ошибки ?t, в (17) – это неожиданная динамика в Yt, остающаяся после учета линейного распределенного лага прошлых значений. можно состоятельно оценить выборочной ковариационной матрицей полученных из МНК остатков. Единственная тонкость – определить длину лага p, но это можно сделать, используя информационный критерий, такой как AIC или BIC. На уровне матричных уравнений рекурсивная и структурная VAR выглядят одинаково. Эти две модели VAR учитывают в явном виде одновременные взаимодействия между элементами Yt, что сводится к добавлению одновременного члена к правой части уравнения (17). Соответственно, рекурсивная и структурная VAR обе представляются в следующем общем виде: (18) где ? - вектор констант; B0,..., Bp - матрицы; ?t — ошибки. Наличие в уравнении матрицы B0 означает возможность одновременного взаимодействия между n переменными; то есть B0 позволяет сделать так, чтобы эти переменные, относящиеся к одному моменту времени, определялись совместно. Рекурсивную VAR можно оценить двумя способами. Рекурсивная структура дает набор рекурсивных уравнений, которые можно оценить с помощью МНК. Эквивалентный способ оценивания заключается в том, что уравнения приведенной формы (17), рассматриваемые как система, умножаются слева на нижнюю треугольную матрицу. Метод оценивания структурной VAR зависит от того, как именно идентифицирована B0. Подход с частичной информацией влечет использование методов оценивания для отдельного уравнения, таких как двухшаговый метод наименьших квадратов. Подход с полной информацией влечет использование методов оценивания для нескольких уравнений, таких как трехшаговый метод наименьших квадратов. Необходимо помнить о множественности различных типов VAR. Приведенная форма VAR единственна. Данному порядку переменных в Yt соответствует единственная рекурсивная VAR, но всего имеется n! таких порядков, т.е. n! различных рекурсивных VAR. Количество структурных VAR – то есть наборов предположений, которые идентифицируют одновременные взаимосвязи между переменными, - ограничено только изобретательностью исследователя. Поскольку матрицы оцененных коэффициентов VAR затруднительно интерпретировать непосредственно, результаты оценивания VAR обычно представляют некоторыми функциями этих матриц. К таким статистикам разложения ошибки прогноза. Разложения дисперсии ошибки прогноза вычисляются в основном для рекурсивных или структурных систем. Такое разложение дисперсии показывает, насколько ошибка в j-м уравнении важна для объяснения неожиданных изменений i-й переменной. Когда ошибки VAR некоррелированы по уравнениям, дисперсию ошибки прогноза на h периодов вперед можно записать как сумму компонентов, являющихся результатом каждой из этих ошибок /17/. 3.2 Факторный анализ В современной статистике под факторным анализом понимают совокупность методов, которые на основе реально существующих связей признаков (или объектов) позволяют выявлять латентные обобщающие характеристики организационной структуры и механизма развития изучаемых явлений и процессов. Понятие латентности в определении ключевое. Оно означает неявность характеристик, раскрываемых при помощи методов факторного анализа. Вначале имеется дело с набором элементарных признаков Xj, их взаимодействие предполагает наличие определенных причин, особенных условий, т.е. существование некоторых скрытых факторов. Последние устанавливаются в результате обобщения элементарных признаков и выступают как интегрированные характеристики, или признаки, но более высокого уровня. Естественно, что коррелировать могут не только тривиальные признаки Xj, но и сами наблюдаемые объекты Ni поэтому поиск латентных факторов теоретически возможен как по признаковым, так и по объектным данным. Если объекты характеризуются достаточно большим числом элементарных признаков (m > 3), то логично и другое предположение – о существовании
плотных скоплений точек (признаков) в пространстве n объектов. При этом
новые оси обобщают уже не признаки Xj, а объекты ni, соответственно и
латентные факторы Fr будут распознаны по составу наблюдаемых объектов:

Fr = c1n1 + c2n2 + … + cNnN,

где ci – вес объекта ni в факторе Fr.

В зависимости от того, какой из рассмотренных выше тип корреляционной
связи – элементарных признаков или наблюдаемых объектов – исследуется в
факторном анализе, различают R и Q – технические приемы обработки
данных.

Название R-техники носит объемный анализ данных по m признакам, в
результате него получают r линейных комбинаций (групп) признаков:
Fr=f(Xj), (r=1..m). Анализ по данным о близости (связи) n наблюдаемых
объектов называется Q-техникой и позволяет определять r линейных
комбинаций (групп) объектов: F=f(ni), (i = l .. N).

В настоящее время на практике более 90% задач решается при помощи
R-техники.

Набор методов факторного анализа в настоящее время достаточно велик,
насчитывает десятки различных подходов и приемов обработки данных. Чтобы
в исследованиях ориентироваться на правильный выбор методов, необходимо
представлять их особенности. Разделим все методы факторного анализа на
несколько классификационных групп:

– Метод главных компонент. Строго говоря, его не относят к факторному
анализу, хотя он имеет с ним много общего. Специфическим является,
во-первых, то, что в ходе вычислительных процедур одновременно получают
все главные компоненты и их число первоначально равно числу
элементарных признаков. Во-вторых, постулируется возможность полного
разложения дисперсии элементарных признаков, другими словами, ее полное
объяснение через латентные факторы (обобщенные признаки).

– Методы факторного анализа. Дисперсия элементарных признаков здесь
объясняется не в полном объеме, признается, что часть дисперсии остается
нераспознанной как характерность. Факторы обычно выделяются
последовательно: первый, объясняющий наибольшую долю вариации
элементарных признаков, затем второй, объясняющий меньшую, вторую после
первого латентного фактора часть дисперсии, третий и т.д. Процесс
выделения факторов может быть прерван на любом шаге, если принято
решение о достаточности доли объясненной дисперсии элементарных
признаков или с учетом интерпретируемости латентных факторов.

Методы факторного анализа целесообразно разделить дополнительно на два
класса: упрощенные и современные аппроксимирующие методы.

Простые методы факторного анализа в основном связаны с начальными
теоретическими разработками. Они имеют ограниченные возможности в
выделении латентных факторов и аппроксимации факторных решений. К ним
относятся:

– однофакторная модель. Она позволяет выделить только один генеральный
латентный и один характерный факторы. Для возможно существующих других
латентных факторов делается предположение об их незначимости;

– бифакторная модель. Допускает влияние на вариацию элементарных
признаков не одного, а нескольких латентных факторов (обычно двух) и
одного характерного фактора;

– центроидный метод. В нем корреляции между переменными рассматриваются
как пучок векторов, а латентный фактор геометрически представляется как
уравновешивающий вектор, проходящий через центр этого пучка. : Метод
позволяет выделять несколько латентных и характерные факторы, впервые
появляется возможность соотносить факторное решение с исходными данными,
т.е. в простейшем виде решать задачу аппроксимации.

Современные аппроксимирующие методы часто предполагают, что первое,
приближенное решение уже найдено каким либо из способов, последующими
шагами это решение оптимизируется. Методы отличаются сложностью
вычислений. К этим методам относятся:

– групповой метод. Решение базируется на предварительно отобранных
каким-либо образом группах элементарных признаков;

– метод главных факторов. Наиболее близок методу главных компонент,
отличие заключается в предположении о существовании характерностей;

– метод максимального правдоподобия, минимальных остатков,
а-факторного анализа канонического факторного анализа, все
оптимизирующие.

Эти методы позволяют последовательно улучшить предварительно найденные
решения на основе использования статистических приемов оценивания
случайной величины или статистических критериев, предполагают большой
объем трудоемких вычислений. Наиболее перспективным и удобным для работы
в этой группе признается метод максимального правдоподобия.

Основной задачей, которую решают разнообразными методами факторного
анализа, включая и метод главных компонент, является сжатие информации,
переход от множества значений по m элементарным признакам с объемом
информации n х m к ограниченному множеству элементов матрицы факторного
отображения (m х r) или матрицы значений латентных факторов для каждого
наблюдаемого объекта размерностью n х r, причем обычно r

Нашли опечатку? Выделите и нажмите CTRL+Enter

Похожие документы
Обсуждение

Ответить

Курсовые, Дипломы, Рефераты на заказ в кратчайшие сроки
Заказать реферат!
UkrReferat.com. Всі права захищені. 2000-2020