Реферат на тему:
Ряди розподілу. аналіз варіацій та форми розподілу
Закономірність розподілу
Статистична сукупність формується під впливом причин та умов, з одного
боку — типових, спільних для всіх елементів сукупності, а з іншого —
випадкових, індивідуальних. Ці чинники взаємозв’язані, а їх спільна
взаємодія визначає як індивідуальні значення ознак, так і розподіл
останніх у межах сукупності. Характерні властивості структури
статистичної сукупності відбиваються в рядах розподілу.
Ряд розподілу складається з двох елементів: варіант — значень
групувальної ознаки xj та частот (часток) fj. Саме у співвідношенні
варіант і частот виявляється закономірність розподілу.
) характеризує обсяг сукупності зі значеннями варіант, які не
перевищують xj (табл. 5.1).
.
Таблиця 5.1
ЧАСТОТНІ ХАРАКТЕРИСТИКИ РЯДІВ РОЗПОДІЛУ
Значення
1 ( (
Як приклад розглянемо розподіл фірм регіону за рівнем фондоозброєності
праці в розрахунку на одного працюючого (табл. 5.2). Згідно зі
значеннями кумулятивних часток на більшості фірм (50,6%)
фондоозброєність праці не перевищує 5 млн грн. Щільність розподілу зі
зростанням ширини інтервалу зменшується.
Таблиця 5.2
РОЗПОДІЛ ФІРМ РЕГІОНУ ЗА РІВНЕМ ФОНДООЗБРОЄНОСТІ ПРАЦІ
Фондоозброєність праці, млн грн. Частка
dj, % Кумулятивна
Щільність
частки gj, %
1 — 2 13,4 13,4 13,4
2 — 5 37,2 50,6 12,4
5 — 10 23,5 74,1 4,7
10 — 20 16,8 90,9 4,7
20 — 50 9,1 100,0 0,3
Разом 100 ( (
Кожний розподіл має характерні особливості. Найтиповіші з них подано в
рядах розподілу (табл. 5.3). Групувальною ознакою є тарифний розряд,
значення якого варіюють у межах від 2 до 6. Припустимо, що розподіли
робітників умовних професій за рівнем кваліфікації різні. Так, у рядах А
і В розподіл частот однаковий, але центри розподілу, навколо яких
групуються індивідуальні значення, різні: в ряду А — 5-й розряд, в ряду
В — 4-й. У рядах С, D, К центр розподілу такий самий, як і в ряду В, —
4-й, проте форма розподілу різна. Ряди В і С різняться межами варіації;
у рядах С і D при однакових межах варіації і симетричному розподілі
частот різний ступінь витягнутості вздовж осі ординат, різна крутизна
розподілу: у розподілі С лише 36% обсягу сукупності групується навколо
центра, у розподілі D — 76% обсягу. Розподіл К відрізняється від інших
асиметричністю відносно центра.
Таблиця 5.3
РОЗПОДІЛ РОБІТНИКІВ ЗА РІВНЕМ КВАЛІФІКАЦІЇ
Тарифний
розряд Професії
А В С D К
2 — — 7 2 1
3 — 25 25 10 4
4 25 50 36 76 58
5 50 25 25 10 27
6 25 — 7 2 10
Разом 100 100 100 100 100
Отже, поглиблений аналіз закономірностей розподілу передбачає
характеристику зазначених особливостей сукупності, зокрема:
а) визначення типового рівня ознаки, який є центром тяжіння;
б) вимірювання варіації ознаки, ступеня згрупованості індивідуальних
значень ознаки навколо центра розподілу;
в) оцінювання особливостей варіації, ступеня її відхилення від симетрії;
г) оцінювання нерівномірності розподілу значень ознаки між окремими
елементами сукупності, тобто ступінь їх концентрації.
Базою аналізу закономірностей розподілу є варіаційний ряд — дискретний
або інтервальний — з рівними інтервалами.
Характеристики центра розподілу
. За даними ряду розподілу середня обчислюється як арифметична зважена;
вагами є частоти fj або частки dj:
,
де j — номер групи; m — число груп.
використовують середину інтервалу. При цьому ширину відкритого
інтервалу умовно вважають такою самою, як сусіднього закритого
інтервалу.
= 1800 : 200 = 9 м2 житлової площі. Це типовий рівень забезпеченості
населення житлом.
Таблиця 5.4
РОЗПОДІЛ ДОМОГОСПОДАРСТВ МІСТА ЗА РІВНЕМ
ЗАБЕЗПЕЧЕНОСТІ ЖИТЛОМ
Житлова площа на одного члена домогосподарства, м2 Кількість домо-
господарств fj xj xj fj Кумулятивна
До 5 17 4 68 17
5 — 7 39 6 234 56
7 — 9 51 8 408 107
9 — 11 42 10 420 149
11 — 13 29 12 348 178
13 — 15 15 14 210 193
15 і більше 7 16 112 200
Разом 200 ( 1800 (
Окрім типового рівня важливе значення має домінанта, тобто найбільш
поширене значення ознаки. Таке значення називають модою (Мо). У
дискретному ряду моду визначають безпосередньо за найбільшою частотою
(часткою). Наприклад, якщо депозитна ставка у восьми комерційних банків
— 12% річних, а в двох — 10%, то модальною є ставка 12%.
В інтервальному ряду за тим самим принципом визначається модальний
інтервал, а в разі потреби конкретне модальне значення в середині
інтервалу обчислюється за інтерполяційною формулою
,
— частоти (частки) відповідно модального, передмодального та
післямодального інтервалів.
= 42. За такого співвідношення частот модальне значення забезпеченості
населення житлом:
= 8,1 м2.
Для моди як домінанти число відхилень (х – Мо) мінімальне. Оскільки мода
не залежить від крайніх значень ознаки, то її доцільно використовувати
тоді, коли ряд розподілу має невизначені межі.
).
В інтервальному ряду за цим принципом визначають медіанний інтервал, а
значення медіани в середині інтервалу, як і значення моди, обчислюють за
інтерполяційною формулою:
,
— кумулятивна частота передмедіанного інтервалу.
= 56. Отже, медіана забезпеченості населення житлом:
м2.
. Саме таке співвідношення характеристик центра розподілу в
розглянутому прикладі:
3 (9 – 8,7) = 9 – 8,1.
Медіана, як і мода, не залежить від крайніх значень ознаки; сума модулів
відхилень варіант від медіани мінімальна, тобто вона має властивість
лінійного мінімуму:
.
Цю властивість медіани можна використати при проектуванні розміщення
зупинок міського транспорту, заготівельних пунктів тощо.
Окрім моди і медіани, в аналізі закономірностей розподілу
використовуються також квартилі та децилі. Квартилі — це варіанти, які
поділяють обсяги сукупності на чотири рівні частини, децилі — на десять
рівних частин. Ці характеристики визначаються на основі кумулятивних
частот (часток) за аналогією з медіаною, яка є другим квартилем або
п’ятим децилем.
У ряду розподілу (див. табл. 5.4) перший квартиль становить 6,7 м2,
перший дециль — 5,2 м2, дев’ятий — 13,3 м2 :
;
;
.
Отже, у 25% сімей забезпеченість житлом не перевищує 6,7 м2, серед 10%
малозабезпечених найвищий рівень становить 5,2 м2, а серед 10% найбільш
забезпечених нижня межа — 13,3 м2.
Характеристики варіації
В одних сукупностях індивідуальні значення ознаки щільно групуються
навколо центра розподілу, в інших — значно відхиляються. Чим менші
відхилення, тим однорідніша сукупність, а отже, тим більш надійні й
типові характеристики центра розподілу, передусім середня величина.
Вимірювання ступеня коливання ознаки, її варіації — невід’ємна складова
аналізу закономірностей розподілу. Міри варіації широко використовуються
у практичній діяльності: для оцінювання диференціації домашніх
господарств за рівнем доходу, фінансового ризику інвестування,
ритмічності роботи підприємств, сталості врожайності
сільськогосподарських культур тощо.
На основі характеристик варіації оцінюється інтенсивність структурних
зрушень, щільність взаємозв’язків соціально-економічних явищ, точність
результатів вибіркового обстеження.
Для вимірювання та оцінювання варіації використовуються абсолютні та
відносні характеристики. До абсолютних належать: варіаційний розмах,
середнє лінійне та середнє квадратичне відхилення, дисперсії; відносні
характеристики подаються низкою коефіцієнтів варіації, локалізації,
концентрації.
Варіаційний розмах R — це різниця між максимальним і мінімальним
значеннями ознаки: R = xmax – xmin. Він характеризує діапазон варіації,
наприклад родючості ґрунтів у регіоні, продуктивності праці в галузях
промисловості тощо. Безперечною перевагою варіаційного розмаху як міри
варіації є простота його обчислення й тлумачення.
— 80%.
. Узагальнюючою характеристикою варіації є середнє відхилення:
а) лінійне
;
б) квадратичне, або стандартне
;
в) дисперсія (середній квадрат відхилень)
.
На підставі первинних, незгрупованих даних наведені характеристики
обчислюють за принципом незваженої середньої:
.
не має сенсу.
. Значення коефіцієнтів k наведено в табл. 5.5.
Таблиця 5.5
КОЕФІЦІЄНТИ k ДЛЯ РІЗНОГО ОБСЯГУ СУКУПНОСТІ
n 10 20 30 40 50 100 200
k 0,32 0,27 0,24 0,23 0,22 0,20 0,18
. Дисперсія входить до більшості теорем теорії ймовірностей, які є
фундаментом математичної статистики, і широко використовується для
вимірювання зв’язку й перевірки статистичних гіпотез. Види та
властивості дисперсій розглядаються в підрозд. 5.5.
, R) до центра розподілу, найчастіше виражаються у процентах. Значення
цих коефіцієнтів залежить від того, яка саме абсолютна характеристика
варіації використовується. Отже, маємо коефіцієнти варіації:
;
;
.
Якщо центр розподілу поданий медіаною, то за відносну міру варіації
беруть квартильний коефіцієнт варіації
.
Для оцінювання ступеня варіації застосовують також співвідношення
децилів. Так, коефіцієнт децильної диференціації показує кратність
співвідношення дев’ятого та першого децилів:
.
Необхідні для розрахунку узагальнюючих характеристик варіації величини
подано в табл. 5.6 на прикладі розподілу домогосподарств за рівнем
забезпеченості житлом. Середня розподілу становить 9 м2.
Таблиця 5.6
ДО РОЗРАХУНКУ УЗАГАЛЬНЮЮЧИХ ХАРАКТЕРИСТИК ВАРІАЦІЇ
4 17 –5 85 25 425
6 39 –3 117 9 351
8 51 –1 51 1 51
10 42 1 42 1 42
12 29 3 87 9 261
14 15 5 75 25 375
16 7 7 49 49 343
Разом 200 ( 506 ( 1848
Згідно з розрахунками:
2,53 м2;
;
м2;
.
Децильний коефіцієнт VD = 13,3 : 5,2 = 2,5 показує, що нижня межа 10%
відносно забезпечених житлом домогосподарств в 2,5 раза перевищує верхню
межу 10% малозабезпечених домогосподарств.
Характеристики форми розподілу
Аналіз закономірностей розподілу передбачає оцінювання ступеня
однорідності сукупності, асиметрії та ексцесу розподілу.
Однорідність сукупності — передумова використання інших статистичних
методів (середніх величин, регресійного аналізу тощо). Однорідними
вважаються такі сукупності, елементи яких мають спільні властивості і
належать до одного типу, класу. При цьому однорідність означає не повну
тотожність властивостей елементів, а лише наявність у них спільного в
істотному, головному.
4
6
?
HV|~”–? 3/4AAAe.
P
?
b
gd 8?
P
R
^
b
?
?
?
oaeaeaeaepaeaeaeaeaeukd
J
gd 8?
?Т?Т??
J
J
gd 8?…kd
J
J
J
J
gd 8?
J
gd 8?
O
O
O
O
O
O
O
O
gd 8?
gd 8?
j
gd 8?
gd 8?
gd 8?
gd 8?
oeaaaaoUOOooooooooEoooo
gd 8?
).
З-поміж одновершинних розподілів є симетричні та асиметричні (скошені),
гостро- та плосковершинні. У симетричному розподілі рівновіддалені від
центра значення ознаки мають однакові частоти, в асиметричному — вершина
розподілу зміщена. Напрям асиметрії протилежний напряму зміщення
вершини. Якщо вершина зміщена ліворуч, маємо правосторонню асиметрію, і
навпаки. Зазначимо, що асиметрія виникає внаслідок обмеженої варіації в
одному напрямі або під впливом домінуючої причини розвитку, яка
призводить до зміщення центра розподілу. Ступінь асиметрії різний — від
помірного до значного.
.
.
Іншою властивістю одновершинних розподілів є ступінь зосередженості
елементів сукупності навколо центра розподілу. Цю властивість називають
ексцесом розподілу.
Асиметрія та ексцес — дві пов’язані з варіацією властивості форми
розподілу. Комплексне їх оцінювання виконується на базі центральних
моментів розподілу. Алгебраїчно центральний момент розподілу — це
середня арифметична k-го ступеня відхилення індивідуальних значень
ознаки від середньої:
.
— висока.
.
Аналіз закономірностей розподілу можна поглибити, описати його певною
функцією.
Не менш важливими у статистичному аналізі є характеристика
нерівномірності розподілу певної ознаки між окремими складовими
сукупності, а також оцінка концентрації значень ознаки в окремих її
частинах (наприклад, розподіл майна чи доходів між окремими групами
населення, кількості зайнятих між окремими галузями промисловості, площі
сільськогосподарських угідь між окремими агрогосподарствами).
Так, наведені в табл. 5.8 дані про розподіл промислових підприємств
регіону за вартістю основних виробничих фондів і за обсягами спожитої
електроенергії свідчать про нерівномірне споживання електроенергії. До
першої групи належить 20% підприємств, а частка спожитої електроенергії
становить 4%. Натомість шоста група містить 3% підприємств, які
споживають 46% електроенергії. На відхиленнях часток двох розподілів —
за кількістю елементів сукупності dj і обсягом значень ознаки Dj —
ґрунтується оцінювання концентрації.
Таблиця 5.8
ДО РОЗРАХУНКУ КОЕФІЦІЄНТА КОНЦЕНТРАЦІЇ
Вартість основних
виробничих фондів, грн. У % до підсумку Модуль
відхилення часток
Кількість
підприємств
dj Спожито
електроенергії
Dj
До 5 20 4 0,16
5 — 10 38 5 0,33
10 — 20 22 8 0,14
20 — 50 13 12 0,01
50 — 100 4 25 0,21
100 і більше 3 46 0,43
Разом 100 100 1,28
, а тому коефіцієнт концентрації обчислюється як півсума модулів
відхилень:
.
Значення коефіцієнта коливаються в межах від нуля (рівномірний розподіл)
до одиниці (повна концентрація). Чим більший ступінь концентрації, тим
більше значення коефіцієнта K. У нашому прикладі K = 1,28 : 2 = 0,64, що
свідчить про високий ступінь концентрації споживання електроенергії у
промисловості регіону.
Коефіцієнти концентрації широко використовуються в регіональному аналізі
для оцінювання рівномірності територіального розподілу виробничих
потужностей, фінансових ресурсів тощо. За кожним регіоном визначається
також коефіцієнт локалізації
,
який характеризує співвідношення часток.
За даними табл. 5.9 коефіцієнти локалізації свідчать про нерівномірність
купівлі (продажу) на душу населення і певною мірою про варіацію
життєвого рівня населення різних регіонів.
Таблиця 5.9
КОЕФІЦІЄНТИ ТЕРИТОРІАЛЬНОЇ ЛОКАЛІЗАЦІЇ
Регіон У % до підсумку Коефіцієнти
локалізації Lj, %
Чисельність
населення dj Обсяг
товарообороту Dj
А 30 34 113
В 50 42 84
С 20 24 120
Разом 100 100 *
Порівняння структур на основі відхилень часток доцільне в рядах з
нерівними інтервалами, а надто в атрибутивних рядах.
За аналогією з коефіцієнтом концентрації обчислюється коефіцієнт
подібності (схожості) структур двох сукупностей:
.
Якщо структури однакові, Р = 1; якщо абсолютно протилежні, Р = 0. Чим
більше схожі структури, тим більше значення Р. За наведеними у
табл. 5.10 даними про галузеву структуру зайнятості населення у двох
країнах коефіцієнт подібності структур становить:
,
тобто розподіл зайнятих за галузями економіки відхиляється в середньому
на 18 п. п.
Таблиця 5.10
ГАЛУЗЕВА СТРУКТУРА ЗАЙНЯТОСТІ НАСЕЛЕННЯ
Країна Структура зайнятих, %
Сільське
господарство Промисловість
та будівництво Сфера послуг
А 36 24 40
В 25 42 33
відхилень часток:
;
,
де dj0 та dj1 — частки відповідно базисного та поточного періоду; m —
число складових сукупності.
Таблиця 5.11
СТРУКТУРА ТА СТРУКТУРНІ ЗРУШЕННЯ
СПОЖИВАННЯ ПАЛИВА ПО РОКАХ
Вид
палива 1995 р.,
d0 2000 р.,
d1 Відхилення часток,
d1 – d0 Модулі
Квадрати
п. п.
Види та взаємозв’язок дисперсій
Дисперсія посідає особливе місце у статистичному аналізі
соціально-економічних явищ. На відміну від інших характеристик варіації
завдяки своїм математичним властивостям вона є невіддільним і важливим
елементом інших статистичних методів, зокрема дисперсійного аналізу.
Для ознак метричної шкали дисперсія — це середній квадрат відхилень
індивідуальних значень ознаки від середньої:
.
Як і будь-яка середня, дисперсія має певні математичні властивості.
Сформулюємо найважливіші з них.
1. Якщо всі значення варіант xj зменшити на сталу величину А, то
дисперсія не зміниться:
.
2. Якщо всі значення варіант xj змінити в А раз, то дисперсія зміниться
в A2 раз:
.
3. Якщо частоти замінити частками, дисперсія не зміниться.
. Якщо
,
і поділивши всі складові на n, дістанемо:
,
— середній квадрат значень ознаки.
. Застосуємо основну формулу дисперсії до цих характеристик структури:
.
(див. підрозд. 6.4).
. Узагальнюючими характеристиками цих вiдхилень є дисперсії: загальна,
групова та міжгрупова.
Загальна дисперсія характеризує варіацію ознаки у навколо загальної
середньої:
.
Групова дисперсія характеризує варіацію відносно групової середньої:
.
Оскільки в групи об’єднуються певною мірою схожі елементи сукупності, то
варіація в групах, як правило, менша, ніж у цілому по сукупності. Якщо
причинні комплекси, що формують варіацію в різних групах, неоднакові, то
й групові дисперсії різняться між собою.
Узагальнюючою мірою внутрішньогрупової варіації є середня з групових
дисперсій:
.
. Мірою варіації їх навколо загальної середньої є міжгрупова дисперсія
.
Отже, загальна дисперсія складається з двох частин. Перша характеризує
внутрішньогрупову, друга — міжгрупову варіацію.
Взаємозв’язок дисперсій називається правилом розкладання (декомпозиції)
варіації:
.
Розглянемо розрахунок зазначених дисперсій на прикладі варіації якості
твердого сиру у залежно від терміну його зберігання х. Результати
вибіркового обстеження якості 20 партій сиру, розподіл їх за терміном
зберігання (1, 2, 3 місяці), розрахунки середніх та дисперсій наведено в
табл. 5.13. Згідно з даними таблиці маємо:
1) середній бал якості сиру (за 10-бальною шкалою)
;
2) загальна дисперсія балів якості
;
3) групові середні бали якості та групові дисперсії:
.
Таблиця 5.13
РОЗРАХУНОК ЗАГАЛЬНОЇ ТА ГРУПОВИХ ДИСПЕРСІЙ ЯКОСТІ СИРУ
№
з/п Термін зберігання
х, міс. Бал
1 2 7,3 0,01
7,3 0,01
2 1 8,8 1,96 8,8 0,01
3 1 8,4 1,00 8,4 0,09
4 3 6,5 0,81
6,5 0,36
5 2 7,5 0,01
7,5 0,09
6 3 6,4 1,00
6,4 0,25
7 1 9,1 2,89 9,1 0,16
8 1 8,6 1,44 8,6 0,01
9 3 5,7 2,89
5,7 0,04
10 2 6,8 0,36
6,8 0,16
11 2 7,7 0,09
7,7 0,25
12 3 5,6 3,24
5,6 0,09
13 1 8,9 2,25 8,9 0,04
14 2 7,8 0,16
7,8 0,36
15 3 5,3 4,41
5,3 0,36
16 1 8,5 1,21 8,5 0,04
17 2 6,8 0,36
6,8 0,16
18 2 7,1 0,09
7,1 0,01
19 1 8,6 1,44 8,6 0,01
20 2 6,6 0,64
6,6 0,36
Разом — 148,0 26,26 60,9 0,36 57,6 1,4 29,5 1,1
Середня — 7,4 — 8,7 — 7,2 — 5,9 —
Дисперсія — — 1,313 — 0,051 — 0,175 — 0,220
Значення групових середніх підтверджують залежність якості сиру від
терміну його зберігання. У 1-й групі середній бал якості становить 8,7,
у 2-й групі якість сиру знижується на 1,5 бала, а в 3-й зниження якості
порівняно з першою групою становить 2,8 бала. Водночас зростає варіація
балів у групах, що відбиває посилення впливу інших чинників на якість
сиру.
Необхідні величини для розрахунку середньої з групових і міжгрупової
дисперсій наведено в табл. 5.14.
Таблиця 5.14
ДО РОЗРАХУНКУ МІЖГРУПОВОЇ ТА СЕРЕДНЬОЇ З ГРУПОВИХ ДИСПЕРСІЙ
Групи
за терміном
зберігання, міс. Число
партій
Середній бал
якості
Групова дисперсія
Розрахунок дисперсій
середньої з групових
1 7 8,7 0,051 0,36 1,3 11,83
2 8 7,2 0,175 1,40 – 0,2 0,32
3 5 5,9 0,220 1,10 – 1,5 11,25
Разом 20 7,4 ( 2,86 ( 23,4
За даними таблиці міжгрупова дисперсія становить
середня з групових дисперсій
.
Сума їх дорівнює загальній дисперсії: 0,143 + 1,170 = 1,313.
:
.
, тобто 84,2% варіації якості сиру пов’язані з терміном зберігання. На
інші фактори припадає 100 – 84,2 =
= 15,8% варіації.
Правило декомпозиції варіації є основою вимірювання щільності зв’язку.
Нашли опечатку? Выделите и нажмите CTRL+Enter