.

Регрессионный анализ в моделировании систем. Исследование посещаемости WEB сайта (Курсовая)

Язык: русский
Формат: реферат
Тип документа: Word Doc
0 1036
Скачать документ

Кафедра математической статистики и эконометрики

Дополнительная работа

По курсу:

“Математическая статистика”

По теме:

“Регрессионный анализ в экономическом моделировании”

“Исследование посещаемости WEB сайта”

Группа: ДИ 202

Студент: Шеломанов Р.Б.

Руководитель: Шевченко К.К.

Москва 1999

Содержание

TOC \t “з;2;З1;1” Теоретическая часть работы PAGEREF _Toc449683783
\h 3

Основные задачи корреляционно-регрессионного анализа PAGEREF
_Toc449683784 \h 3

Корреляция случайных величин PAGEREF _Toc449683785 \h 4

Линейная регрессия PAGEREF _Toc449683786 \h 5

Оценка существенности связи, принятие решения на основе уравнения
регрессии. PAGEREF _Toc449683787 \h 10

Практическая часть работы PAGEREF _Toc449683788 \h 11

1. Описание объекта PAGEREF _Toc449683789 \h 11

2. Экономические показатели ( факторы ) PAGEREF _Toc449683790 \h 12

3. Анализ аномальных явлений PAGEREF _Toc449683791 \h 13

4. Анализ матрицы коэффициентов парных корреляций PAGEREF
_Toc449683792 \h 13

6. Построение уравнения регрессии PAGEREF _Toc449683793 \h 14

6. Экономический смысл модели PAGEREF _Toc449683794 \h 15

Литература PAGEREF _Toc449683795 \h 16

Теоретическая часть работы

Основные задачи корреляционно-регрессионного анализа

Все явления и процессы, характеризующие социально-экономическое развитие
и составляющие единую систему национальных счетов, тесно взаимосвязаны и
взаимозависимы между собой.

В статистике показатели, характеризующие эти явления, могут быть связаны
либо корреляционной зависимостью, либо быть независимыми Корреляционная
зависимость является частным случаем стохастической зависимости, при
которой изменение значений факторных признаков (х 1 х2 …, хn ) влечет
за собой изменение среднего значения результативного признака.

Корреляционная зависимость исследуется с помощью методов корреляционного
и регрессионного анализов.

Корреляционный анализ изучает взаимосвязи показателей и позволяет решить
следующие задачи.

1. Оценка тесноты связи между показателями с помощью парных, частных и
множественных коэффициентов корреляции

2. Оценка уравнения регрессии.

Основной предпосылкой применения корреляционного анализа является
необходимость подчинения совокупности значений всех факторных (х1 х2
…. хn) и результативного (У) признаков r-мерному нормальному закону
распределения или близость к нему. Если объем исследуемой совокупности
достаточно большой ( n > 50), то нормальность распределения может быть
подтверждена на основе расчета и анализа критериев Пирсона, Боярского,
Колмогорова, чисел Вастергарда и т. д. Если n tкр

Наиболее сложным в этом выражении является определение дисперсии,
которая может быть рассчитана двояким способом.

Наиболее простой способ, выработанный методикой экспериментирования,
заключается в том, что величина дисперсии коэффициента регрессии может
быть приближенно определена по выражению:

– дисперсия результативного признака:

k – число факторных признаков в уравнении.

Наиболее сложным этапом, завершающим регрессионный анализ, является
интерпретация уравнения, т. е. перевод его с языка статистики и
математики на язык экономиста.

Интерпретация моделей регрессии осуществляется методами той отрасли
знаний, к которой относятся исследуемые явления. Но всякая интерпретация
начинается со статистической оценки уравнения регрессии в целом и оценки
значимости входящих в модель факторных признаков, т. е. с выяснения, как
они влияют на величину результативного признака. Чем больше величина
коэффициента регрессии, тем значительнее влияние данного признака на
моделируемый. Особое значение при этом имеет знак перед коэффициентом
регрессии. Знаки коэффициентов регрессии говорят о характере влияния на
результативный признак. Если факторный признак имеет знак плюс, то с
увеличением данного фактора результативный признак возрастает; если
факторный признак со знаком минус, то с его увеличением результативный
признак уменьшается. Интерпретация этих знаков полностью определяется
социально-экономическим содержанием моделируемого (результативного)
признака. Если его величина изменяется в сторону увеличения, то плюсовые
знаки факторных признаков имеют положительное влияние. При изменении
результативного призна-л-1 в сторону снижения положительное значение
имеют минусовые знаки факторных признаков. Если экономическая теория
подсказывает, что факторный признак должен иметь положительное значение,
а он со знаком минус, то необходимо проверить расчеты параметров
уравнения регрессии. Такое явление чаще всего бывает в силу допущенных
ошибок при решении. Однако следует иметь в виду, что при анализе
совокупного влияния факторов, при наличии взаимосвязей между ними
характер их влияния может меняться. Для того чтобы быть уверенным, что
факторный признак изменил знак влияния, необходима тщательная проверка
решения данной модели, так как часто знаки могут меняться в силу
допустимых ошибок при сборе или обработке информации.

При адекватности уравнения регрессии исследуемому процессу возможны
следующие варианты.

1. Построенная модель на основе ее проверки по F-критерию Фишера в целом
адекватна, и все коэффициенты регрессии значимы. Такая модель может быть
использована для принятия решений к осуществлению прогнозов.

2. Модель по F-критерию Фишера адекватна, но часть коэффициентов
регрессии незначима. В этом случае модель пригодна для принятия
некоторых решений, но не для производства прогнозов.

3. Модель по F-критерию Фишера адекватна, но все коэффициенты регрессии
незначимы. Поэтому модель полностью считается неадекватной. на ее основе
не принимаются решения и не осуществляются прогнозы.

Практическая часть работы

1. Описание объекта

В нашем случае объектом исследования является совокупность наблюдений
за посещаемостью WEB сайта Комитета по делам семъи и молодежи
Правительства г. Москвы HYPERLINK http://www.telekurs.ru/ismm
www.telekurs.ru/ismm . Тематика сайта – это предоставление социально
незащищенным слоям населения: молодежи, студентам информации о
трудоустройстве в Москве. Информация ежедневно обновляется,
приблизительно 200 новых вакансий в день. Также на сайте содержится
информация о текущих программах правительства г. Москвы направленных на
поддержку указанных выше категорий населения. Моделируемым показателем
является N- количество человек в день посетивших сайт.

2. Факторы формирующие моделируемое явление

Отбор факторов для модели осуществляется в два этапа. На первом идет
анализ, по результатам которого исследователь делает вывод о
необходимости рассмотрения тех или иных явлений в качестве переменных,
определяющих закономерности развития исследуемого процесса, на втором –
состав предварительно отобранных факторов уточняется непосредственно по
результатам статистического анализа.

Полученные данные с помощью программы наблюдения за компьютерной сетью
(Net Medic, Net lab) являются не совсем точными, но довольно близки к
реальным и по этому будем считать, что они дают представление о
характере процесса. (получение более точных данных было для автора
невозможно в связи с недостаточной технической базой) Из совокупности
этих факторов я отобрал следующие :

Зависимый фактор:

N- количество человек в день посетивших сайт.

Для модели в абсолютных показателях

Независимые факторы:

Х1 – стоимость сырья и материалов ( тыс.руб.)

Х2 – заработная плата ( тыс.руб. )

S – Cкорость обмена данными в сети

Х4 – отчисления на социальное страхование ( тыс.руб. )

V – Кол-во вакансий на текущий день

B – Количество «Баннеров» – рекламных ссылок на исследуемый сайт.

Данные представлены в таблице 1.

Таблица 1

№ Объекта

наблюдения N

Кол-во человек в день X1

Стоимость сырья и материалов ( тыс.руб.)

X2

Заработная плата

(тыс.руб. )

S

Скорость обмена данными в сети X4

Отчисления на социальное страхование ( тыс.руб. )

V

Кол-во вакансий на текущий день.

B

Кол-во баннеров

1 11 865 651 2627 54 165 4

2 18 1334 1046 3045 85 400 4

3 19 6944 944 2554 79 312 5

4 11 4425 1084 4089 92 341 4

5 15 4662 1260 6417 105 496 7

6 10 2100 1212 4845 101 264 8

7 12 1215 254 923 19 78 1

8 14 5191 1795 9602 150 599 13

9 9 4965 2851 12542 240 622 12

10 15 2067 1156 6718 96 461 9

4. Анализ матрицы коэффициентов парных корреляций

Таблица 3

№ фактора Y X1 X2 X3 X4 X5 X6

Y 1.00 0.52 -0.22 -0.06 -0.23 0.44 0.12

X1 0.52 1.00 0.38 0.52 0.38 0.74 0.60

X2 -0.22 0.38 1.00 0.91 1.00 0.68 0.74

X3 -0.06 0.52 0.91 1.00 0.91 0.86 0.91

X4 -0.23 0.38 1.00 0.91 1.00 0.67 0.74

X5 0.44 0.74 0.68 0.86 0.67 1.00 0.85

X6 0.12 0.60 0.74 0.91 0.74 0.85 1.00

Из таблицы 3 находим тесно коррелирующие факторы. Налицо
мультиколлениарность факторов Х2 и Х4 . Оставим только один фактор Х2 .
Так же достаточно высокий коэффициент корреляции ( 0.91 ) между
факторами Х2 и Х3 . Избавимся от фактора Х3 .

Построение уравнения регрессии

Используя программное обеспечение «ОЛИМП» (которое в свою очередь
использует для расчетов указанные выше принципы и формулы чем
значительно облегчает нам жизнь), найдем искомое уравнение множественной
регрессии, исключив из расчетов, как указывалось выше, факторы X3
-основные промышленно производственные фонды (тыс.руб. ) X4 –
отчисления на социальное страхование (тыс.руб.).

Путем перебора возможных комбинаций оставшихся факторных признаков
получим следующую модель:

Функция Y = +12.567-0.005*x2+0.018*x5

Оценки коэффициентов линейной регрессии

№ Значение Дисперсия Среднеквадратическое отклонение Значение tрасч

1 12.57 2.54 1.59 7.88

2 -0.01 0 0 -3.60

3 0.02 0 0 4.07

Кpитические значения t-pаспpеделения

пpи 8 степенях свободы

имеют следующие значения:

веpоятность t-значение

0.900 1.400

0.950 1.863

0.990 2.887

В нашей модели |tрасч |> tкритич у всех коэффициентов регрессии значит
можно утверждать, что модель является адекватной моделируемому явлению,
т.е. гипотеза о значимости уравнения не отвергается, о чем говорят также
данные выдаваемые компьютером:

Характеристики остатков

Среднее значение……………….………….. -0.000

Оценка дисперсии……………….…………. 3.6

Оценка приведенной дисперсии………. 4.95

Средний модуль остатков………..……… 1.391

Относительная ошибка аппроксимации. 9.898

Критерий Дарбина-Уотсона………..……. 1.536

Коэффициент детерминации………..…… 0.690

F – значение ( n1 = 3, n2 = 8).………. 143

Гипотеза о значимости уравнения не отвергается с вероятностью
0.950

6. Экономический смысл модели

При увеличении расходов на подготовку и освоение производства
производительность труда будет увеличиваться . Это означает что на
данных предприятиях есть резервы для расширения производства , для
введения новых технологий и инноваций с целью увеличения прибыли .

При увеличении заработной платы производительность труда будет
снижаться. Это, скорее всего, будет происходить из-за того , что рабочие
на данных предприятиях получают и так высокие зарплаты , либо фонд
заработной платы используется по максимуму и дальнейший его рост
приведёт к непредвиденным расходам . Коэффициент детерминации у
линейной модели – 0.69. Это означает , что факторы , вошедшие в модель
объясняют изменение производительности труда на 69%. Следовательно
значения полученные с помощью линейной модели близки к фактическим.

Литература

«Теория статистики» учебник под редакцией проф. Р.А.Шмойловой
Издательство «Финансы и статистика» 1996 г.

PAGE 15

PAGE 13

Нашли опечатку? Выделите и нажмите CTRL+Enter

Похожие документы
Обсуждение

Оставить комментарий

avatar
  Подписаться  
Уведомление о
Заказать реферат!
UkrReferat.com. Всі права захищені. 2000-2020