.

Уральский федеральный округ

Язык: украинский
Формат: курсова
Тип документа: Word Doc
0 586
Скачать документ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ОБЛАСТНОЙ УНИВЕРСИТЕТ

Экономический факультет. Государственное и муниципальное управление.

Курсовая работа
На тему: «Статистическое изучение социально-экономического явления.»
Вариант №7.

Выполнила студентка
заочного отделения
группа 21
Живаева К.М.

Москва, 2008

Оглавление

Введение
Формирование исходной выборки
Статистические распределения рядов признаков-факторов и результирующего признака
Проверка однородности и нормальности
Вывод зависимостей результирующего-признака от факторов-признаков
Группировка
Определение доверительного интервала
Вычисление линейных коэффициентов корреляции, вывод уравнения регрессии
Заключение
Список источников

Введение

Целью данной работы является статистическое исследование взаимосвязей стоимости автомобиля марки «Хонда-Сивик» с факторными признаками: пробегом и временем эксплуатации; а также, на основании исследования выявления первичных факторов, влияющих на стоимость и вывод зависимости целевого параметра(стоимости) от первичного фактора.
Для построения исходной выборки был выбран сайт www.auto.ru.

Формирование исходной выборки

Используя сайт auto.ru проводим выборочное исследование 50 автомобилей марки Хонда-Сивик.
Исследуемые признаки:
Y цена автомобиля, тыс.руб.;
Х1 время эксплуатации, лет;
Х2 пробег, тыс. км.
№ п/п Марка Y Х1 Х2
1 Civic VII 379 5 121
2 Civic VII 399 4 74
3 Civic VII 429 4 88
4 Civic VII 393 3 95
5 Civic VII 397 3 60
6 Civic VII 430 3 54
7 Civic VII 459 3 46
8 Civic VIII 455 2 107
9 Civic VIII 467 2 47
10 Civic VIII 468 2 97
11 Civic VIII 552 2 60
12 Civic VIII 565 2 41
13 Civic VIII 570 2 57
14 Civic VIII 579 2 30
15 Civic VIII 597 2 150
16 Civic VIII 441 1 75
17 Civic VIII 466 1 30
18 Civic VIII 500 1 15
19 Civic VIII 524 1 26
20 Civic VIII 530 1 22
21 Civic VIII 539 1 32
22 Civic VIII 555 1 62
23 Civic VIII 560 1 14
24 Civic VIII 575 1 30
25 Civic VIII 575 1 88
26 Civic VIII 600 1 18
27 Civic VIII 600 1 18
28 Civic VIII 615 1 40
29 Civic VIII 680 1 14
30 Civic VIII 510 0 18
31 Civic VIII 533 0 0
32 Civic VIII 533 0 0
33 Civic VIII 541 0 0
34 Civic VIII 541 0 0
35 Civic VIII 561 0 0
36 Civic VIII 570 0 29
37 Civic VIII 585 0 0
38 Civic VIII 590 0 0
39 Civic VIII 606 0 0
40 Civic VIII 616 0 0
41 Civic VIII 640 0 0
42 Civic VIII 640 0 0
43 Civic VIII 640 0 0
44 Civic VIII 643 0 0
45 Civic VIII 650 0 10
46 Civic VIII 650 0 0
47 Civic VIII 661 0 0
48 Civic VIII 661 0 0
49 Civic VIII 683 0 0
50 Civic VIII 600 0 13

Статистические распределения рядов признаков-факторов и результирующего признака

Исследуем статистическое распределение признаков Х1 с помощью интервального вариационного ряда:
Интервальный ряд для Х 1
Х 1 F 1 Ср. цена тыс.руб.
0-1 21 603
1-2 14 554
2-3 8 532
3-4 4 420
4-5 2 414
5-6 1 379

Приведем графическое отображение ряда для Х1 в виде гистограммы и кумуляты:

Вычислим среднюю арифметическую, моду и медиану интервального ряда распределения для X1. Формула для вычисления среднего арифметического:

где – средняя по ряду распределения;
– средняя по i-му интервалу;
– частота i-го интервала (число автомобилей в интервале).

Мода – это наиболее часто встречающееся значение признака. Для интервального ряда мода определяется по формуле:

где – значение моды;
X0 – нижняя граница модального интервала;
h – величина модального интервала (1 год);
– частота модального интервала;
– частота интервала, предшествующая модальному;
– частота послемодального интервала.

Модальный интервал определяется по наибольшей частоте. Для ряда X1 наибольшее значение частоты равно 21, т.е. это будет интервал 0 лет , тогда значение моды:

Медиана – значение признака, лежащее в середине упорядоченного ряда распределения.
Номер медианы определяется по формуле:

где
n – число единиц в совокупности

т.к. медиана с дробным номером не бывает, то полученный результат указывает, что медиана находится между 25-й и 26-й величинами совокупности.
Значение медианы можно определить по формуле:

где – значение медианы;
– нижняя граница медианного интервала;
– номер медианы;
– накопленная частота интервала, предшествующая медианному;
– частота медианного интервала.
По накопленной частоте определяем, что медиана будет находиться в интервале от 1 года до 2-х лет , тогда значение медианы:

Для вычисления дисперсии воспользуемся следующей формулой:

где – дисперсия;
– среднее по i-му интервалу;
– среднее по ряду распределения;
– частота i-го интервала;
n – размер выборки (n=50).

Среднее квадратическое отклонение вычислим по следующей формуле:

где – дисперсия;
– среднее квадратическое отклонение;

Вычислим коэффициент вариации

где – коэффициент вариации;
– среднее квадратическое отклонение;
– среднее по ряду распределения.

Вычислим значения коэффициента ассиметрии:

где ;
– коэффициент ассиметрии;
– среднее квадратическое отклонение;
– среднее по i-му интервалу;
– среднее по ряду распределения;
– частота i-го интервала;
n – размер выборки (n=50).

Вычислим значения коэффициента эксцесса:

где
– коэффициент эксцесса;
– среднее квадратическое отклонение;
– среднее по i-му интервалу;
– среднее по ряду распределения;
– частота i-го интервала;
n – размер выборки (n=50).

Исследуем статистическое распределение признаков Х2 с помощью интервального вариационного ряда.
Для построения ряда распределения необходимо определить число групп и величину интервала. Для определения числа групп воспользуемся формулой Стерджесса:

гдеm – число групп (всегда целое);
n – число единиц в выборке, в нашем случае n= 50.
Вычислим m:

Величину интервала определим по формуле:

где Хmax – максимальное значение признака;
Хmin – минимальное значение признака;
m – число групп.

На основании полученных данных построим интервальный ряд для Х2:
Интервальный ряд для Х 2
Х 2 F 2 Ср. цена тыс.руб.
0 – 21 25 601
21 – 42 9 551
42 – 63 7 490
63 – 84 2 420
84 – 105 4 466
105 – 126 2 417
126 – 150 1 597

Приведем графическое отображение ряда для Х2 в виде гистограммы и кумуляты:

Вычислим среднюю арифметическую, моду и медиану интервального ряда распределения для X2. Формула для вычисления среднего арифметического:

где – средняя по ряду распределения;
– средняя по i-му интервалу;
– частота i-го интервала (число автомобилей в интервале).

Мода – это наиболее часто встречающееся значение признака. Для интервального ряда мода определяется по формуле:

где – значение моды;
– нижняя граница модального интервала;
h – величина модального интервала (1 год);
– частота модального интервала;
– частота интервала, предшествующая модальному;
– частота послемодального интервала.

Модальный интервал определяется по наибольшей частоте. Для ряда X1 наибольшее значение частоты равно 25, т.е. это будет интервал 0 до 21 тыс. км., тогда значение моды:

Медиана – значение признака, лежащее в середине упорядоченного ряда распределения.
Номер медианы определяется по формуле:

где
n – число единиц в совокупности

т.к. медиана с дробным номером не бывает, то полученный результат указывает, что медиана находится между 25-й и 26-й величинами совокупности.
Значение медианы можно определить по формуле:

где – значение медианы;
– нижняя граница медианного интервала;
– номер медианы;
– накопленная частота интервала, предшествующая медианному;
– частота медианного интервала.
По накопленной частоте определяем, что медиана будет находиться в интервале от 21 до 42 тыс. км., тогда значение медианы:

Для вычисления дисперсии воспользуемся следующей формулой:

где – дисперсия;
– среднее по i-му интервалу;
– среднее по ряду распределения;
– частота i-го интервала;
n – размер выборки (n=50).

Среднее квадратическое отклонение вычислим по следующей формуле:

где – дисперсия;
– среднее квадратическое отклонение;

Вычислим коэффициент вариации

где – коэффициент вариации;
– среднее квадратическое отклонение;
– среднее по ряду распределения.

Вычислим значения коэффициента ассиметрии:

где
– коэффициент ассиметрии
– среднее квадратическое отклонение;
– среднее по i-му интервалу;
– среднее по ряду распределения;
– частота i-го интервала;
n – размер выборки (n=50).

Вычислим значения коэффициента эксцесса:

где ;
– коэффициент эксцесса;
– среднее квадратическое отклонение;
– среднее по i-му интервалу;
– среднее по ряду распределения;
– частота i-го интервала;
n – размер выборки (n=50).

Исследуем статистическое распределение признаков Y с помощью интервального вариационного ряда.
Величину интервала определим по формуле, используя полученное ранее значение m:

где Хmax – максимальное значение признака;
Хmin – минимальное значение признака;
m – число групп.

На основании полученных данных построим интервальный ряд для Y:

Интервальный ряд для Y
Y Fy Ср. цена тыс.руб.
379 – 422 4 400,5
422 – 465 5 443,5
465 – 508 4 486,5
508 – 551 8 529,5
551 – 594 12 572,5
594 – 637 7 615,5
637 – 683 10 660

Приведем графическое отображение ряда для Y в виде гистограммы и кумуляты:

Вычислим среднюю арифметическую , моду и медиану интервального ряда распределения для Y. Формула для вычисления среднего арифметического:

где – средняя по ряду распределения;
– средняя по i-му интервалу;
– частота i-го интервала (число автомобилей в интервале).

Мода – это наиболее часто встречающееся значение признака. Для интервального ряда мода определяется по формуле:

где – значение моды;
Y0 – нижняя граница модального интервала;
h– величина модального интервала;
– частота модального интервала;
– частота интервала, предшествующая модальному;
– частота послемодального интервала.

Модальный интервал определяется по наибольшей частоте. Для ряда Y наибольшее значение частоты равно 12, т.е. это будет интервал 551-594, тогда значение моды:

Медиана – значение признака, лежащее в середине упорядоченного ряда распределения.

Номер медианы определяется по формуле:

где ;
n – число единиц в совокупности;

т.к. медиана с дробным номером не бывает, то полученный результат указывает, что медиана находится между 25-й и 26-й величинами совокупности.
Значение медианы можно определить по формуле:

где – значение медианы;
– нижняя граница медианного интервала;
– номер медианы;
– накопленная частота интервала, предшествующего медианному;
– частота медианного интервала;
По накопленной частоте определяем, что медиана будет находиться в интервале 551-594 , тогда значение медианы:

Для вычисления дисперсии воспользуемся следующей формулой:

где – дисперсия;
– среднее по i-му интервалу;
– среднее по ряду распределения;
– частота i-го интервала;
n – размер выборки (n=50).

Среднее квадратическое отклонение вычислим по следующей формуле:

где – дисперсия;
– среднее квадратическое отклонение;

Вычислим коэффициент вариации

где – коэффициент вариации;
– среднее квадратическое отклонение;
– среднее по ряду распределения.

Вычислим значения коэффициента ассиметрии:

где
– коэффициент ассиметрии;
– среднее квадратическое отклонение;
– среднее по i-му интервалу;
– среднее по ряду распределения;
– частота i-го интервала;
n – размер выборки (n=50).

Подставив значения, получим, что:

Вычислим значения коэффициента эксцесса:

где ;
– коэффициент эксцесса;
– среднее квадратическое отклонение;
– среднее по i-му интервалу;
– среднее по ряду распределения;
– частота i-го интервала;
n – размер выборки (n=50).

Проверка однородности и нормальности

Проверим интервальные распределения на однородность:

следовательно, совокупность для Х1 является неоднородной.

следовательно, совокупность для Х2 является неоднородной.

следовательно, совокупность для Y является однородной.

Исследуем нормальность распределения факторного признака Х1:
Интервалы значений признака-фактора Число единиц, входящих в интервал Удельный вес единиц, входящих в интервал, в общем их числе, % Удельный вес единиц, входящих в интервал, при нормальном распределении, %
1 2 3 4
(1,6-1,25)-(1,6+1,25)
0,35 – 2,85 22 44 68,3
(1,6-2×1,25) – (1,6+2×1,25)
-0,9 – 4,1 49 98 95,4
(1,6-3×1,25) – (1,6+3×1,25)
-2,15 – 5,35 50 100 99,7

Таким образом, сопоставляя гр.3 и гр.4 делаем вывод: распределение Х1 относительно близко к нормальному, но не подчиняется ему.

Исследуем нормальность распределения факторного признака Х2:
Интервалы значений признака-фактора Число единиц, входящих в интервал Удельный вес единиц, входящих в интервал, в общем их числе, % Удельный вес единиц, входящих в интервал, при нормальном распределении, %
1 2 3 4
(36,15-34,03)-(36,15+34,03)
2,12 – 70,18 24 48 68,3
(36,15-2×34,03) – (36,15+2×34,03)
-31,91 – 104,21 47 94 95,4
(36,15-3×34,03) – (36,15+3×34,03)
-65,94 – 138,24 49 98 99,7

Таким образом, сопоставляя гр.3 и гр.4 делаем вывод: распределение Х2 близко к нормальному, но не подчиняется ему.
Таким образом, проведя анализ на нормальность распределения мы можем отобрать данные не попадающие в диапазон 3х σ. Для ряда Х1 таких значений нет. Для ряда Х2 исключаем значение с пробегом 150 тыс. км.
С учетом отфильтрованных по правилу 3х сигм составим интервальные ряды для Х1, Х2, Y.

Вывод зависимостей результирующего-признака от факторов-признаков
Интервальный ряд для Х 1
Х 1 F 1 Ср. цена тыс.руб.
0-1 21 603
1-2 14 554
2-3 7 522
3-4 4 420
4-5 2 414
5-6 1 379
Интервальный ряд для Х 2
Х 2 F 2 Ср. цена тыс.руб.
0 – 21 25 601
21 – 42 9 551
42 – 63 7 490
63 – 84 2 420
84 – 105 4 466
105 – 126 2 417
Интервальный ряд для Y
Y F y Ср. цена тыс.руб.
379 – 422 4 400,5
422 – 465 5 443,5
465 – 508 4 486,5
508 – 551 8 529,5
551 – 594 12 572,5
594 – 637 6 615,5
637 – 683 10 660

Проведем аналитические группировки продаваемых автомобилей по времени эксплуатации и пробегу и определим групповые средние.
Построим график Y(X1)

Зависимость цены от времени эксплуатации существует и носит линейный характер, чем больше время эксплуатации, тем дешевле автомобиль.
Построим график Y(X2)

Зависимость цены от пробега существует и носит линейный характер, чем больше пробег автомобиля, тем дешевле автомобиль.

Группировка
На основании данных статистического наблюдения выделим три типа автомобилей:
• по времени эксплуатации:
o новые автомобили от 0 до 1 года – 34 шт.
o средние автомобили от 2 до 3 лет – 13 шт.
o старые автомобили от 3 до 5 лет – 3 шт.
• по пробегу:
o новые автомобили от 0 до 50 тыс. км. – 36 шт.
o средние автомобили от 50 до 100 тыс.км. – 11 шт.
o старые автомобили от 100 до 150 тыс.км. – 3 шт.
• по цене:
o новые автомобили от 581 до 683 тыс. руб. – 19 шт.
o средние автомобили от 480 до 581 тыс. руб. – 12 шт.
o старые автомобили от 379 до 480 тыс. руб. – 12 шт.

Определение доверительного интервала

Определим доверительный интервал, в котором заключена средняя цена всех продаваемых автомобилей, с вероятностью 0,9.

При вероятности 0,9 t = 1,64
Следовательно:
Таким образом, с вероятностью 0,9 можно утверждать, что средняя цена автомобиля равна:

Определим доверительный интервал, в котором заключена средняя цена всех продаваемых автомобилей, с вероятностью 0,95.

При вероятности 0,95 t = 1,96
Следовательно:
Таким образом, с вероятностью 0,95 можно утверждать, что средняя цена автомобиля равна:

Определим необходимую численность выборки при определении средней цены продаваемых автомобилей, чтобы с вероятностью 0,95 предельная ошибка выборки не превышала 10 тыс. руб.

Вычисление линейных коэффициентов корреляции, вывод уравнения регрессии

На основании выборочного наблюдения оценим степень тесноты связи и проведем оценку ее существенности:
Для определения степени тесноты парной линей зависимости используем линейный коэффициент корреляции(r) :

Для вычисления линейных коэффициентов корреляции составим вспомогательную таблицу:

5 121 379 1,6 36,15 509,8 3,4 84,85 -130,8 -444,72 -11098,4 288,49
4 74 399 1,6 36,15 509,8 2,4 37,85 -110,8 -265,92 -4193,78 90,84
4 88 429 1,6 36,15 509,8 2,4 51,85 -80,8 -193,92 -4189,48 124,44
3 95 393 1,6 36,15 509,8 1,4 58,85 -116,8 -163,52 -6873,68 82,39
3 60 397 1,6 36,15 509,8 1,4 23,85 -112,8 -157,92 -2690,28 33,39
3 54 430 1,6 36,15 509,8 1,4 17,85 -79,8 -111,72 -1424,43 24,99
3 46 459 1,6 36,15 509,8 1,4 9,85 -50,8 -71,12 -500,38 13,79
2 107 455 1,6 36,15 509,8 0,4 70,85 -54,8 -21,92 -3882,58 28,34
2 47 467 1,6 36,15 509,8 0,4 10,85 -42,8 -17,12 -464,38 4,34
2 97 468 1,6 36,15 509,8 0,4 60,85 -41,8 -16,72 -2543,53 24,34
2 60 552 1,6 36,15 509,8 0,4 23,85 42,2 16,88 1006,47 9,54
2 41 565 1,6 36,15 509,8 0,4 4,85 55,2 22,08 267,72 1,94
2 57 570 1,6 36,15 509,8 0,4 20,85 60,2 24,08 1255,17 8,34
2 30 579 1,6 36,15 509,8 0,4 -6,15 69,2 27,68 -425,58 -2,46
2 150 597 1,6 36,15 509,8 0,4 113,85 87,2 34,88 9927,72 45,54
1 75 441 1,6 36,15 509,8 -0,6 38,85 -68,8 41,28 -2672,88 -23,31
1 30 466 1,6 36,15 509,8 -0,6 -6,15 -43,8 26,28 269,37 3,69
1 15 500 1,6 36,15 509,8 -0,6 -21,15 -9,8 5,88 207,27 12,69
1 26 524 1,6 36,15 509,8 -0,6 -10,15 14,2 -8,52 -144,13 6,09
1 22 530 1,6 36,15 509,8 -0,6 -14,15 20,2 -12,12 -285,83 8,49
1 32 539 1,6 36,15 509,8 -0,6 -4,15 29,2 -17,52 -121,18 2,49
1 62 555 1,6 36,15 509,8 -0,6 25,85 45,2 -27,12 1168,42 -15,51
1 14 560 1,6 36,15 509,8 -0,6 -22,15 50,2 -30,12 -1111,93 13,29
1 30 575 1,6 36,15 509,8 -0,6 -6,15 65,2 -39,12 -400,98 3,69
1 88 575 1,6 36,15 509,8 -0,6 51,85 65,2 -39,12 3380,62 -31,11
1 18 600 1,6 36,15 509,8 -0,6 -18,15 90,2 -54,12 -1637,13 10,89
1 18 600 1,6 36,15 509,8 -0,6 -18,15 90,2 -54,12 -1637,13 10,89
1 40 615 1,6 36,15 509,8 -0,6 3,85 105,2 -63,12 405,02 -2,31
1 14 680 1,6 36,15 509,8 -0,6 -22,15 170,2 -102,12 -3769,93 13,29
0 18 510 1,6 36,15 509,8 -1,6 -18,15 0,2 -0,32 -3,63 29,04
0 0 533 1,6 36,15 509,8 -1,6 -36,15 23,2 -37,12 -838,68 57,84
0 0 533 1,6 36,15 509,8 -1,6 -36,15 23,2 -37,12 -838,68 57,84
0 0 541 1,6 36,15 509,8 -1,6 -36,15 31,2 -49,92 -1127,88 57,84
0 0 541 1,6 36,15 509,8 -1,6 -36,15 31,2 -49,92 -1127,88 57,84
0 0 561 1,6 36,15 509,8 -1,6 -36,15 51,2 -81,92 -1850,88 57,84
0 29 570 1,6 36,15 509,8 -1,6 -7,15 60,2 -96,32 -430,43 11,44
0 0 585 1,6 36,15 509,8 -1,6 -36,15 75,2 -120,32 -2718,48 57,84
0 0 590 1,6 36,15 509,8 -1,6 -36,15 80,2 -128,32 -2899,23 57,84
0 0 606 1,6 36,15 509,8 -1,6 -36,15 96,2 -153,92 -3477,63 57,84
0 0 616 1,6 36,15 509,8 -1,6 -36,15 106,2 -169,92 -3839,13 57,84
0 0 640 1,6 36,15 509,8 -1,6 -36,15 130,2 -208,32 -4706,73 57,84
0 0 640 1,6 36,15 509,8 -1,6 -36,15 130,2 -208,32 -4706,73 57,84
0 0 640 1,6 36,15 509,8 -1,6 -36,15 130,2 -208,32 -4706,73 57,84
0 0 643 1,6 36,15 509,8 -1,6 -36,15 133,2 -213,12 -4815,18 57,84
0 10 650 1,6 36,15 509,8 -1,6 -26,15 140,2 -224,32 -3666,23 41,84
0 0 650 1,6 36,15 509,8 -1,6 -36,15 140,2 -224,32 -5068,23 57,84
0 0 661 1,6 36,15 509,8 -1,6 -36,15 151,2 -241,92 -5465,88 57,84
0 0 661 1,6 36,15 509,8 -1,6 -36,15 151,2 -241,92 -5465,88 57,84
0 0 683 1,6 36,15 509,8 -1,6 -36,15 173,2 -277,12 -6261,18 57,84
0 13 600 1,6 36,15 509,8 -1,6 -23,15 90,2 -144,32 -2088,13 37,04
Итого: -4829,8 -98283,3 1894,15

Тогда

Таким образом, значение линейного коэффициента корреляции = -0,84 свидетельствует о наличии обратной и тесной связи между временем эксплуатации и ценой автомобиля.

Таким образом, значение линейного коэффициента корреляции = -0,63 свидетельствует о наличии обратной и тесной связи между пробегом и ценой автомобиля.

Таким образом, значение линейного коэффициента корреляции = 0,89 свидетельствует о наличии прямой и тесной связи временем эксплуатации и пробегом автомобиля.
Проведем анализ матрицы парных коэффициентов корреляции:
Составим матрицу парных коэффициентов корреляции:

Y X1 X2
Y 1 -0,84 -0,63
X1 -0,84 1 0,89
X2 -0,63 0,89 1

Так как оба условия не соблюдаются, то для составления уравнения регрессии будем использовать наиболее значимый (весомый) факторный признак, т.е. – X1 (время эксплуатации), т.к. .
Составим уравнение регрессии:
В качестве регрессионной модели выберем линейную модель, которая имеет вид:

Вычислим коэффициенты регрессионного уравнения:

Таким образом, уравнение регрессии примет вид:

Заключение
В ходе исследования были выявлены следующие характеристики взаимосвязи стоимости автомобиля с факторными признаками:
• Стоимость автомобиля линейно зависит от пробега и времени эксплуатации причем эта зависимость обратная для обоих случаев. При увеличении пробега (времени эксплуатации) стоимость автомобиля уменьшается;
• Основным фактором, влияющим на конечную стоимость, является время эксплуатации;
• Выявлена зависимость стоимости автомобиля от времени эксплуатации, которая имеет следующий вид:

Список источников

1) Сайт www.auto.ru.
2) Ефимова М.Р., Ганченко О.И., Петрова Е.В. Практикум по общей теории статистики: Учеб. пособие. – 2-е изд., перераб. и доп. – М.: Финансы и статистика, 2005. – 336 с: ил. ISBN 5-279-02555-0.

Нашли опечатку? Выделите и нажмите CTRL+Enter

Похожие документы
Обсуждение

Оставить комментарий

avatar
  Подписаться  
Уведомление о
Заказать реферат!
UkrReferat.com. Всі права захищені. 2000-2020