Реферат на тему:

Дисперсійний аналіз економетричної моделі

Побудова економетричної моделі на основі покрокової регресії

Оцінювання параметрів економетричної моделі та її дисперсійний аналіз
становлять загальний процес побудови моделі. Поєднання цих частин
зумовило появу альтернативного методу оцінювання параметрів моделі 1МНК,
яка базується на елементах дисперсійного аналізу.

При елементарному тлумаченні взаємозв’язку між двома змінними за
допомогою 1МНК увагу, як правило, акцентують на коефіцієнтах кореляції.
Причому неважко показати, що

,

— середньоквадратичне відхилення незалежної змінної.

Отже,оцінка параметрів моделі прямо пропорційна до коефіцієнта парної
кореляції. Аналогічні співвідношення виконуються і в загальному випадку.

А це означає, що оцінити параметри моделі можна через коефіцієнти
кореляції: спочатку оцінити тісноту зв’язку між кожною парою змінних, а
потім знайти оцінки параметрів економетричної моделі.

Оскільки коефіцієнти парної кореляції та співвідношення між ними і
оцінками параметрів моделі базуються на дисперсіях та середніх
квадратичних відхиленнях, то побудову економетричної моделі через
коефіцієнти парної кореляції доцільно розглянути в дисперсійному аналізі
моделі.

Залежність оцінок параметрів економетричної моделі і коефіцієнтів парної
кореляції покладено в основу алгоритму покрокової регресії.

Опишемо цей алгоритм.

Крок 1-й. Усі вихідні дані змінних стандартизуються (нормалізуються):

(5.1)

— середньоквадратичні відхилення.

дорівнюють нулю, а дисперсії — одиниці.

Крок 2-й. Знаходиться кореляційна матриця (матриця парних коефіцієнтів
кореляції):

(5.2)

— парні коефіцієнти кореляції між залежною і незалежними змінними,

n — кількість спостережень;

— парні коефіцієнти кореляції між незалежними змінними,

вказує на ту незалежну змінну, яка найтісніше пов’язана з y. На цьому
кроці на основі 1МНК знаходиться оцінка параметра цієї змінної в моделі:

, (5.3)

— оцінка параметру моделі, яка будується на основі стандартизованих
даних.

і в модель вводиться наступна незалежна змінна

і т.д.

Якщо немає обмеження на внесення до економетричної моделі кожної
наступної незалежної змінної, то обчислення виконуються доти, поки
поступово не будуть внесені до моделі всі змінні.

Сума квадратів залишків для такої моделі запишеться так:

.

звідси мінімізації підлягає

.

Узявши похідну за кожним невідомим параметром (j цієї функції і
прирівнявши всі здобуті похідні нулю, дістанемо систему нормальних
рівнянь.

Система нормальних рівнянь для знаходження параметрів моделі (j в
загальному вигляді запишеться так:

. тоді система нормальних рівнянь набере вигляду

,

а оператор оцінювання параметрів:

(5.4)

, тим сильніше впливає j-та змінна на результат.

Зв’язок між оцінками параметрів моделі на основі стандартизованих і
нестандартизованих змінних запишеться так:

(5.5)

Приклад 5.1. Для десяти цехів машинобудівного підприємства наведено такі
дані (табл. 5.1).

Побудуємо економетричну модель, яка описуватиме зв’язок продуктивності
праці з наведеними чинниками згідно з алгоритмом покрокової регресії.

Таблиця 5.1

Номер цеху Середньомісячна зарплата у Продуктивність праці х1
Фондомісткість продукції х2 виконання норми виробітку х3, %

1 45 265 0,20 130

2 42 236 0,04 127

3 50 257 0,30 151

4 55 279 0,20 149

5 40 226 0,10 140

6 70 350 0,10 141

7 56 278 0,25 152

8 57 262 0,03 188

9 55 269 0,15 120

10 53 250 0,32 126

Запишемо кореляційну матрицю для цих вихідних даних:

Із матриці бачимо, що діагональні її елементи дорівнюють одиниці, бо
вони характеризують зв’язок кожної змінної із собою. Ця матриця
квадратна і симетрична.

У першому рядку містяться коефіцієнти парної кореляції, що
характеризують тісноту зв’язку кожної змінної з продуктивністю праці.

Так,

= 0,28.

— % виконання норми виробітку.

Порівнявши потім інші два коефіцієнти:

:

і, нарешті,

Далі, використовуючи співвідношення (5.5), обчислимо оцінки параметрів
моделі для вихідної нестандартизованої інформації.

У результаті дістанемо такі регресійні рівняння зв’язку:

;

(5.6)

Множинний коефіцієнт кореляції і детермінації

Тіснота зв’язку загального впливу всіх незалежних змінних на залежну
визначається коефіцієнтами детермінації і множинної кореляції.

)* може бути розкладена на дві складові:

;

) навколо фактичних (Y).

Необхідні при цьому обчислення зведемо в табл. 5.2.

Таблиця 5.2

Джерело

варіації Сума квадратів відхилень Ступені свободи Середнє квадратів
відхилень або дисперсія

Зауважимо, що всі змінні Y i X взяті як відхилення від свого середнього
значення.

Використаємо середні квадратів відхилень (дисперсії) (див. табл. 5.2) і
запишемо формулу для обчислення коефіцієнта детермінації:

(5.7)

або, не враховуючи ступенів свободи:

(5.8)

Оскільки у (5.7) задані незміщені оцінки дисперсії з урахуванням числа
ступенів свободи, то коефіцієнт детермінації може зменшуватись при
введені в модель нових незалежних змінних. Тоді як для коефіцієнта
детермінації, обчисленого без урахування поправки (n – 1/m – 1) на число
ступенів свободи (5.8), коефіцієнт детермінації ніколи не зменшується.
Залежність між цими двома коефіцієнтами можна подати так:

(5.9)

— коефіцієнт детермінації з урахуванням числа ступенів свободи;

— коефіцієнт детермінації без урахування числа ступенів свободи.

) визначається варіацією незалежних змінних. Чим ближчий він до
одиниці, тим більше варіація залежної змінної визначається варіацією
незалежних змінних.

Множинний коефіцієнт кореляції:

Він характеризує тісноту зв’язку усіх незалежних змінних із залежною.

Для множинного коефіцієнта кореляції з урахуваннням і без урахуванння
числа ступенів свободи характерна така сама зміна числового значення, як
і для коефіцієнта детермінації.

Приклад 5.2. Порівняємо коефіцієнти кореляції і детермінації для різних
економетричних моделей, побудованих для вихідних даних, наведених у
табл. 5.1, на основі покрокової регресії.

Таблиця 5.3

. Зауважимо при цьому, що коефіцієнти детермінації і кореляції без
урахування числа ступенів свободи мають більші числові значення, ніж з
урахуванням цього числа.

.

У такому разі оцінку параметрів моделі можна записати:

(5.10)

.

:

— визначник кореляційної матриці. А це, у свою чергу, дає нам
альтернативний вираз для коефіцієнта детермінації:

(5.11)

можна подати у вигляді

(5.12)

Звідси коефіцієнт кореляції

(5.13)

Частинні коефіцієнти кореляції

і коефіцієнти регресії

Частинні коефіцієнти кореляції так само, як і парні, характеризують
тісноту зв’язку між двома змінними. Але на відміну від парних частинні
коефіцієнти характеризують тісноту зв’язку за умови, що інші незалежні
змінні сталі.

Можна дістати спрощений вираз для розрахунку коефіцієнта частинної
кореляції, обравши інший спосіб інтерпретації цього коефіцієнта. Для
випадку простої регресії двох змінних маємо

. Отже, квадрат коефіцієнта парної кореляції дорівнює добутку двох
наведених коефіцієнтів. Коефіцієнт частинної кореляції можна визначити
аналогічно. Наприклад, розглянемо два регресійні рівняння:

;

у двох множинних регресіях.

Згідно з (5.10) запишемо ці рівняння у вигляді

.

Звідси

.

Для знаходження частинного коефіцієнта кореляції змінної y з x2 за
умови, що змінна x3 стала, достатньо взяти добуток параметрів при x2 і y
в наведених щойно рівняннях з протилежним знаком.

Аналогічно

Тоді частинні коефіцієнти кореляції будуть такі:

(5.14)

, але при цьому решта незалежних змінних (крім двох) є константами.

Перевірка значущості і довірчі інтервали

?

?

/////////////////iiii/aa/a

? ? ¦ ? ¬ o o ue th

*

,

.

0

L

N

?

?

A

A

Ae

AE

??????A

???????????A

”y1® *

”y1® *

”y1® *

”y1® *

”y1® *

”y1® *

”y1® *

”y1® *

”y1® *

”y1® *

A

A©kd-

”y1® *

9P9’9”9?9o:z<\=>j>‚>occcss*occccCssssccccc»

A

A

oe

?????A

oe

A

$

A

?y8

y



?y8

y



$

A

?y8

y



g&m„m?maemOenaenoeoUoEoE1/21/2ooeoeeooeeoo

$

$

A

A

$

$

A

Значущість економетричної моделі

Гіпотезу про рівень значущості зв’язку між залежною і незалежною
змінними можна перевірити з допомогою F-критерію:

(5.15)

з n ступенями свободи.

Дисперсії, які застосовуються для обчислення F-критерію, наведено в
табл.5.2.

Фактичне значення F-критерію порівнюється з табличним при ступенях
свободи n – m і m – 1 і вибраному рівні значущості. Якщо Fфакт > Fтабл,
то гіпотеза про істотність зв’язку між залежною і незалежними змінними
економетричної моделі підтвержується, у противному разі — відкидається.

Приклад 5.3. Обчислимо F-критерій для економетричних моделей (5.6),
розглянутих у прикладі 5.1 (табл. 5.4).

Таблиця 5.4

Економетрична модель Число ступенів

12,09

F1табл (0,95) для першої моделі дорівнює 5,32.

F2табл (0,95) для другої моделі дорівнює 4,74.

F3табл (0,95) для третьої моделі дорівнює 4,76.

= 0,05:

F1факт > Fтабл ,

F2факт > Fтабл ,

F3факт > Fтабл .

Це означає, що відповідні економетричні моделі є вірогідними, тобто
підтверджується гіпотеза про те, що кількісна оцінка зв’язку між
залежною і незалежними змінними в моделі є істотною.

Скориставшись виразами дисперсій, які наведено в табл.5.2:

запишемо альтернативну форму F-критерію:

. (5.16)

Згідно з цим критерієм перевіряється значущість коефіцієнта
детермінації, а отже, й усієї моделі.

Цей результат підводить базу під традиційно дисперсійний аналіз, який
застосовується для перевірки нульових гіпотез.

Значущість коефіцієнта кореляції

Оскільки коефіцієнт кореляції є також вибірковою характеристикою, яка
може відхилятись від свого “істинного” значення, значущість коефіцієнта
кореляції також потребує перевірки. Базується вона на t-критерії

— число ступенів свободи.

ступенями свободи, то можна зробити висновок про значущість
коефіцієнта кореляції між залежною і незалежними змінними моделі.

Приклад 5.4. Для множинних коефіцієнтів кореляції, які наведено в
табл.5.3, обчислимо значення t- критерію:

 = 0,05 і відповідних ступенях свободи такі:

t1табл = 1,860;

t2табл = 1,895;

t3табл = 1,943.

Порівнюючи їх з фактичними, де

t1 > t1табл,

t2 > t2табл,

t3 > t3табл,

доходимо висновку, що коефіцієнти кореляції, які характеризують тісноту
зв’язку між залежною і незалежними змінними в моделях, є достовірними.

Значущість оцінок параметрів моделі

. Тоді параметри моделі ( задовольняють багатовимірний нормальний
розподіл:

(5.17)

невідома, а отже, потрібно розглянути методи її знаходження.

Для цього визначимо залишки:

(5.18)

. Тоді суму квадратів відхилень подамо у вигляді

(5.19)

де N — симетрична ідемпотентна матриця.

— симетрична розміром n ( m.

— слід матриці N, а далі — властивість комутативності добутку матриць
відносно операцій обчислення сліду матриці.

З огляду на сказане маємо:

(5.20)

. Звідси

. (5.21)

Співвідношення (5.21) дає нам незміщену оцінку дисперсії залишків.

розподілена незалежно від (. Для цього знайдемо коваріацію залишків:

(5.22)

і ( є лінійні функції від нормально розподілених змінних, то вони
також розподілені нормально і, як було показано, їх коваріації
дорівнюють нулю.

Це дає нам змогу скористатися t-розподілом для перевірки гіпотез
відносно істотності кожного з параметрів економетричної моделі

Перевірку гіпотези виконаємо згідно з t-критерієм:

, (5.23)

— називається стандартною помилкою оцінки параметра моделі.

ступенях свободи. Якщо t факт > t табл, то відповідно оцінка параметра
економетричної моделі є достовірною.

:

(5.24)

Приклад 5.5. Перевіримо гіпотези про значущість оцінок параметрів моделі
(5.6)

побудованої на основі вихідних даних, наведених у табл. 5.1.

.

може перебувати в таких межах:

Відповідно можна знайти довірчі інтервали інших параметрів моделі. Коли
стандартні помилки параметрів більші за абсолютні значення оцінки цих
параметрів, то це може означати, що оцінка параметра є зміщеною. Нехай,
наприклад, стандартна помилка на 10 % перевищує абсолютне значення
оцінки параметра, тоді вже можна говорити про те, що цей параметр має
зміщення щодо його істинного значення.

висновки

1. З огляду на залежність між оцінками параметрів моделі та
коефіцієнтами парної кореляціі можна запропонувати альтернативну оцінку
1МНК на основі покрокової регресії.

. Ця залежність справджується і в загальному вигляді. Її покладено в
основу алгоритму покрокової регресії.

3. Система нормальних рівнянь для визначення оцінок параметрів моделі
1МНК на основі покрокової регресії запишеться так:

або в матричному вигляді:

r = rxy .

Звідси оператор оцінювання параметрів моделі:

=  r-1rxy ,

— оцінки параметрів моделі у стандартизованому вигляді.

4. Щоб побудувати таку систему нормальних рівнянь на основі 1МНК,
необхідно стандартизувати (нормалізувати) вихідні дані так:

дорівнюють нулю, а дисперсії — одиниці.

5. Зв’язок між оцінками параметрів моделі на основі стандартизованих і
нестандартизованих змінних запишеться у вигляді:

6. Тіснота зв’зку загального впливу всіх незалежних змінних на залежну
визначається коефіцієнтами детермінації і множинної кореляції.
Коефіцієнт детермінації без урахування числа ступенів свободи

з урахуванням числа ступенів свободи

.

Альтернативні залежності для обчислення коефіцієнта детермінації можна
записати:

Формули б) і в) доцільно застосовувати в тому разі, коли для оцінки
параметрів економетричної моделі виконується 1МНК на основі
стандартизованих даних.

7. Коефіцієнт детермінації показує, на скільки процентів варіація
залежної змінної визначається варіацією пояснюючих (незалежних) змінних.

Коефіцієнт кореляції характеризує тісноту зв’язку між залежною і
пояснювальними змінними.

8. Значення коефіцієнта детермінації і кореляції для багатофакторної
залежності належать множині:

R2( ( 0, 1 (;

R ( ( 0, 1 (.

Чим ближчі ці значення до 1, тим істотніший зв’язок між змінними
економетричної моделі. Отже, коефіцієнти детермінації і кореляції можна
розглядати як характеристики дисперсійного аналізу, що характеризують
вірогідність економетричної моделі.

9. Оскільки коефіцієнти детермінації і кореляції є вибірковими
характеристиками, то їх числові значення також перевіряються на
значущість згідно зі статистичними гіпотезами. При цьому t-критерій для
перевірки значущості коефіцієнта кореляції обчислюється так:

Якщо значення цього критерію не менше за критичне (табличне) при
вибраному рівні довіри і ступені свободи n – m, то відповідний
коефіцієнт кореляції (детермінації) є достовірним.

10. Гіпотеза про істотність зв’язку між залежною і незалежною змінними
може бути перевірена з допомогою F-критерію:

або в матричному вигляді:

Альтернативна формула для його обчислення така:

.

Фактичне значення F-критерію порівнюється з табличним при ступенях
свободи n – m і m – 1 та вибраному рівні довіри. Якщо Fфакт ( Fтабл, то
гіпотеза про істотність зв’язку між залежною і пояснювальними змінними
підтверджується, у противному разі — відхиляється.

11. Частинні коефіцієнти кореляції, так само як і парні, характеризують
тісноту зв’язку за умови, що інші незалежні змінні сталі. Величину їх
можна визначити з допомогою алгебраїчних доповнень до елементів матриці
r (парних коефіцієнтів кореляції)

де Rkj — алгебраїчне доповнення до елемента матриці rkj; Rkk, Rjj —
алгебраїчні доповнення до відповідних діагональних елементів.

12. Перевірку гіпотези про значущість параметрів економетричної моделі
можна виконати згідно з t-критерієм:

або

— стандартна помилка оцінок параметрів моделі.

Обчислене значення t-критерію порівнюється з табличним для вибраного
рівня довіри і n – m cтупенів свободи. Якщо tфакт ( tтабл, то
відповідний параметр економетричної моделі є вірогідним.

13. На основі t-критерію і стандартної помилки будуються граничні
довірчі інтервали для оцінок параметрів моделі:

ЛІТЕРАТУРА

Джонстон Дж. Эконометрические методы.— М., 1980.

Дрейлер Н., Смит Г. Прикладной регрессионный анализ. — М.: Финансы и
статистика, 1986.

Кейн Э. Экономическая статистика и эконометрия. — М.: 1977.– Вып.12.

Класc А., Гергели К., Колек Ю., Шуян И. Введение в эконометрическое
моделирование. –– М., 1975.

Крамер Г. Математические методы статистики. — М., 1975.

Ланге О. Введение в эконометрику. –– М., 1964.

Лизер С. Эконометрические методы и задачи. –– М., 1971.

Линник Ю. В. Метод наименьших квадратов и основы
математико-статистической обработки наблюдений. — М., 1962.

Маленво Э. Статистические методы в эконометрии. — М., 1975 – 1976. Вып.
1,2.

Мальцев А. Н. Основы линейной алгебры. –– М., 1975.

Пирогов Г., Федоровский Ю. Проблемы структурного оценивания в
эконометрии. –– М., 1979.

Тинтнер Г. Введение в эконометрию. –– М., 1964.

Фишер Ф. Проблема идентификации в эконометрии. — М., 1978.

Чупров А. А. Основные проблемы теории корреляции. — М., 1960. 2-е изд.

Klein L. R., Goldberger A. S. An Ekonometric Model of United States,
1929 – 1952 North Holland, Amsterdam, 1964.

збігаються.

PAGE

Похожие записи