Реферат на тему:

Ряди розподілу. аналіз варіацій та форми розподілу

Закономірність розподілу

Статистична сукупність формується під впливом причин та умов, з одного
боку — типових, спільних для всіх елементів сукупності, а з іншого —
випадкових, індивідуальних. Ці чинники взаємозв’язані, а їх спільна
взаємодія визначає як індивідуальні значення ознак, так і розподіл
останніх у межах сукупності. Характерні властивості структури
статистичної сукупності відбиваються в рядах розподілу.

Ряд розподілу складається з двох елементів: варіант — значень
групувальної ознаки xj та частот (часток) fj. Саме у співвідношенні
варіант і частот виявляється закономірність розподілу.

) характеризує обсяг сукупності зі значеннями варіант, які не
перевищують xj (табл. 5.1).

.

Таблиця 5.1

ЧАСТОТНІ ХАРАКТЕРИСТИКИ РЯДІВ РОЗПОДІЛУ

Значення

1 ( (

Як приклад розглянемо розподіл фірм регіону за рівнем фондоозброєності
праці в розрахунку на одного працюючого (табл. 5.2). Згідно зі
значеннями кумулятивних часток на більшості фірм (50,6%)
фондоозброєність праці не перевищує 5 млн грн. Щільність розподілу зі
зростанням ширини інтервалу зменшується.

Таблиця 5.2

РОЗПОДІЛ ФІРМ РЕГІОНУ ЗА РІВНЕМ ФОНДООЗБРОЄНОСТІ ПРАЦІ

Фондоозброєність праці, млн грн. Частка

dj, % Кумулятивна

Щільність

частки gj, %

1 — 2 13,4 13,4 13,4

2 — 5 37,2 50,6 12,4

5 — 10 23,5 74,1 4,7

10 — 20 16,8 90,9 4,7

20 — 50 9,1 100,0 0,3

Разом 100 ( (

Кожний розподіл має характерні особливості. Найтиповіші з них подано в
рядах розподілу (табл. 5.3). Групувальною ознакою є тарифний розряд,
значення якого варіюють у межах від 2 до 6. Припустимо, що розподіли
робітників умовних професій за рівнем кваліфікації різні. Так, у рядах А
і В розподіл частот однаковий, але центри розподілу, навколо яких
групуються індивідуальні значення, різні: в ряду А — 5-й розряд, в ряду
В — 4-й. У рядах С, D, К центр розподілу такий самий, як і в ряду В, —
4-й, проте форма розподілу різна. Ряди В і С різняться межами варіації;
у рядах С і D при однакових межах варіації і симетричному розподілі
частот різний ступінь витягнутості вздовж осі ординат, різна крутизна
розподілу: у розподілі С лише 36% обсягу сукупності групується навколо
центра, у розподілі D — 76% обсягу. Розподіл К відрізняється від інших
асиметричністю відносно центра.

Таблиця 5.3

РОЗПОДІЛ РОБІТНИКІВ ЗА РІВНЕМ КВАЛІФІКАЦІЇ

Тарифний

розряд Професії

А В С D К

2 — — 7 2 1

3 — 25 25 10 4

4 25 50 36 76 58

5 50 25 25 10 27

6 25 — 7 2 10

Разом 100 100 100 100 100

Отже, поглиблений аналіз закономірностей розподілу передбачає
характеристику зазначених особливостей сукупності, зокрема:

а) визначення типового рівня ознаки, який є центром тяжіння;

б) вимірювання варіації ознаки, ступеня згрупованості індивідуальних
значень ознаки навколо центра розподілу;

в) оцінювання особливостей варіації, ступеня її відхилення від симетрії;

г) оцінювання нерівномірності розподілу значень ознаки між окремими
елементами сукупності, тобто ступінь їх концентрації.

Базою аналізу закономірностей розподілу є варіаційний ряд — дискретний
або інтервальний — з рівними інтервалами.

Характеристики центра розподілу

. За даними ряду розподілу середня обчислюється як арифметична зважена;
вагами є частоти fj або частки dj:

,

де j — номер групи; m — число груп.

використовують середину інтервалу. При цьому ширину відкритого
інтервалу умовно вважають такою самою, як сусіднього закритого
інтервалу.

= 1800 : 200 = 9 м2 житлової площі. Це типовий рівень забезпеченості
населення житлом.

Таблиця 5.4

РОЗПОДІЛ ДОМОГОСПОДАРСТВ МІСТА ЗА РІВНЕМ

ЗАБЕЗПЕЧЕНОСТІ ЖИТЛОМ

Житлова площа на одного члена домогосподарства, м2 Кількість домо-

господарств fj xj xj fj Кумулятивна

До 5 17 4 68 17

5 — 7 39 6 234 56

7 — 9 51 8 408 107

9 — 11 42 10 420 149

11 — 13 29 12 348 178

13 — 15 15 14 210 193

15 і більше 7 16 112 200

Разом 200 ( 1800 (

Окрім типового рівня важливе значення має домінанта, тобто найбільш
поширене значення ознаки. Таке значення називають модою (Мо). У
дискретному ряду моду визначають безпосередньо за найбільшою частотою
(часткою). Наприклад, якщо депозитна ставка у восьми комерційних банків
— 12% річних, а в двох — 10%, то модальною є ставка 12%.

В інтервальному ряду за тим самим принципом визначається модальний
інтервал, а в разі потреби конкретне модальне значення в середині
інтервалу обчислюється за інтерполяційною формулою

,

— частоти (частки) відповідно модального, передмодального та
післямодального інтервалів.

= 42. За такого співвідношення частот модальне значення забезпеченості
населення житлом:

= 8,1 м2.

Для моди як домінанти число відхилень (х – Мо) мінімальне. Оскільки мода
не залежить від крайніх значень ознаки, то її доцільно використовувати
тоді, коли ряд розподілу має невизначені межі.

).

В інтервальному ряду за цим принципом визначають медіанний інтервал, а
значення медіани в середині інтервалу, як і значення моди, обчислюють за
інтерполяційною формулою:

,

— кумулятивна частота передмедіанного інтервалу.

= 56. Отже, медіана забезпеченості населення житлом:

м2.

. Саме таке співвідношення характеристик центра розподілу в
розглянутому прикладі:

3 (9 – 8,7) = 9 – 8,1.

Медіана, як і мода, не залежить від крайніх значень ознаки; сума модулів
відхилень варіант від медіани мінімальна, тобто вона має властивість
лінійного мінімуму:

.

Цю властивість медіани можна використати при проектуванні розміщення
зупинок міського транспорту, заготівельних пунктів тощо.

Окрім моди і медіани, в аналізі закономірностей розподілу
використовуються також квартилі та децилі. Квартилі — це варіанти, які
поділяють обсяги сукупності на чотири рівні частини, децилі — на десять
рівних частин. Ці характеристики визначаються на основі кумулятивних
частот (часток) за аналогією з медіаною, яка є другим квартилем або
п’ятим децилем.

У ряду розподілу (див. табл. 5.4) перший квартиль становить 6,7 м2,
перший дециль — 5,2 м2, дев’ятий — 13,3 м2 :

;

;

.

Отже, у 25% сімей забезпеченість житлом не перевищує 6,7 м2, серед 10%
малозабезпечених найвищий рівень становить 5,2 м2, а серед 10% найбільш
забезпечених нижня межа — 13,3 м2.

Характеристики варіації

В одних сукупностях індивідуальні значення ознаки щільно групуються
навколо центра розподілу, в інших — значно відхиляються. Чим менші
відхилення, тим однорідніша сукупність, а отже, тим більш надійні й
типові характеристики центра розподілу, передусім середня величина.
Вимірювання ступеня коливання ознаки, її варіації — невід’ємна складова
аналізу закономірностей розподілу. Міри варіації широко використовуються
у практичній діяльності: для оцінювання диференціації домашніх
господарств за рівнем доходу, фінансового ризику інвестування,
ритмічності роботи підприємств, сталості врожайності
сільськогосподарських культур тощо.

На основі характеристик варіації оцінюється інтенсивність структурних
зрушень, щільність взаємозв’язків соціально-економічних явищ, точність
результатів вибіркового обстеження.

Для вимірювання та оцінювання варіації використовуються абсолютні та
відносні характеристики. До абсолютних належать: варіаційний розмах,
середнє лінійне та середнє квадратичне відхилення, дисперсії; відносні
характеристики подаються низкою коефіцієнтів варіації, локалізації,
концентрації.

Варіаційний розмах R — це різниця між максимальним і мінімальним
значеннями ознаки: R = xmax – xmin. Він характеризує діапазон варіації,
наприклад родючості ґрунтів у регіоні, продуктивності праці в галузях
промисловості тощо. Безперечною перевагою варіаційного розмаху як міри
варіації є простота його обчислення й тлумачення.

— 80%.

. Узагальнюючою характеристикою варіації є середнє відхилення:

а) лінійне

;

б) квадратичне, або стандартне

;

в) дисперсія (середній квадрат відхилень)

.

На підставі первинних, незгрупованих даних наведені характеристики
обчислюють за принципом незваженої середньої:

.

не має сенсу.

. Значення коефіцієнтів k наведено в табл. 5.5.

Таблиця 5.5

КОЕФІЦІЄНТИ k ДЛЯ РІЗНОГО ОБСЯГУ СУКУПНОСТІ

n 10 20 30 40 50 100 200

k 0,32 0,27 0,24 0,23 0,22 0,20 0,18

. Дисперсія входить до більшості теорем теорії ймовірностей, які є
фундаментом математичної статистики, і широко використовується для
вимірювання зв’язку й перевірки статистичних гіпотез. Види та
властивості дисперсій розглядаються в підрозд. 5.5.

, R) до центра розподілу, найчастіше виражаються у процентах. Значення
цих коефіцієнтів залежить від того, яка саме абсолютна характеристика
варіації використовується. Отже, маємо коефіцієнти варіації:

;

;

.

Якщо центр розподілу поданий медіаною, то за відносну міру варіації
беруть квартильний коефіцієнт варіації

.

Для оцінювання ступеня варіації застосовують також співвідношення
децилів. Так, коефіцієнт децильної диференціації показує кратність
співвідношення дев’ятого та першого децилів:

.

Необхідні для розрахунку узагальнюючих характеристик варіації величини
подано в табл. 5.6 на прикладі розподілу домогосподарств за рівнем
забезпеченості житлом. Середня розподілу становить 9 м2.

Таблиця 5.6

ДО РОЗРАХУНКУ УЗАГАЛЬНЮЮЧИХ ХАРАКТЕРИСТИК ВАРІАЦІЇ

4 17 –5 85 25 425

6 39 –3 117 9 351

8 51 –1 51 1 51

10 42 1 42 1 42

12 29 3 87 9 261

14 15 5 75 25 375

16 7 7 49 49 343

Разом 200 ( 506 ( 1848

Згідно з розрахунками:

2,53 м2;

;

м2;

.

Децильний коефіцієнт VD = 13,3 : 5,2 = 2,5 показує, що нижня межа 10%
відносно забезпечених житлом домогосподарств в 2,5 раза перевищує верхню
межу 10% малозабезпечених домогосподарств.

Характеристики форми розподілу

Аналіз закономірностей розподілу передбачає оцінювання ступеня
однорідності сукупності, асиметрії та ексцесу розподілу.

Однорідність сукупності — передумова використання інших статистичних
методів (середніх величин, регресійного аналізу тощо). Однорідними
вважаються такі сукупності, елементи яких мають спільні властивості і
належать до одного типу, класу. При цьому однорідність означає не повну
тотожність властивостей елементів, а лише наявність у них спільного в
істотному, головному.

4

6

?

H V | ~ ” – ?   3/4 A A Ae .

P

?

b

gd 8?

P

R

^

b

?

?

?

oaeaeaeaepaeaeaeaeaeukd

J

gd 8?

?Т?Т??

J

J

gd 8?…kd

J

J

J

J

gd 8?

J

gd 8?

O

O

O

O

O

O

O

O

gd 8?

gd 8?

j

gd 8?

gd 8?

gd 8?

gd 8?

oeaaaaoUOOooooooooEoooo

gd 8?

).

З-поміж одновершинних розподілів є симетричні та асиметричні (скошені),
гостро- та плосковершинні. У симетричному розподілі рівновіддалені від
центра значення ознаки мають однакові частоти, в асиметричному — вершина
розподілу зміщена. Напрям асиметрії протилежний напряму зміщення
вершини. Якщо вершина зміщена ліворуч, маємо правосторонню асиметрію, і
навпаки. Зазначимо, що асиметрія виникає внаслідок обмеженої варіації в
одному напрямі або під впливом домінуючої причини розвитку, яка
призводить до зміщення центра розподілу. Ступінь асиметрії різний — від
помірного до значного.

.

.

Іншою властивістю одновершинних розподілів є ступінь зосередженості
елементів сукупності навколо центра розподілу. Цю властивість називають
ексцесом розподілу.

Асиметрія та ексцес — дві пов’язані з варіацією властивості форми
розподілу. Комплексне їх оцінювання виконується на базі центральних
моментів розподілу. Алгебраїчно центральний момент розподілу — це
середня арифметична k-го ступеня відхилення індивідуальних значень
ознаки від середньої:

.

— висока.

.

Аналіз закономірностей розподілу можна поглибити, описати його певною
функцією.

Не менш важливими у статистичному аналізі є характеристика
нерівномірності розподілу певної ознаки між окремими складовими
сукупності, а також оцінка концентрації значень ознаки в окремих її
частинах (наприклад, розподіл майна чи доходів між окремими групами
населення, кількості зайнятих між окремими галузями промисловості, площі
сільськогосподарських угідь між окремими агрогосподарствами).

Так, наведені в табл. 5.8 дані про розподіл промислових підприємств
регіону за вартістю основних виробничих фондів і за обсягами спожитої
електроенергії свідчать про нерівномірне споживання електроенергії. До
першої групи належить 20% підприємств, а частка спожитої електроенергії
становить 4%. Натомість шоста група містить 3% підприємств, які
споживають 46% електроенергії. На відхиленнях часток двох розподілів —
за кількістю елементів сукупності dj і обсягом значень ознаки Dj —
ґрунтується оцінювання концентрації.

Таблиця 5.8

ДО РОЗРАХУНКУ КОЕФІЦІЄНТА КОНЦЕНТРАЦІЇ

Вартість основних

виробничих фондів, грн. У % до підсумку Модуль

відхилення часток

Кількість

підприємств

dj Спожито

електроенергії

Dj

До 5 20 4 0,16

5 — 10 38 5 0,33

10 — 20 22 8 0,14

20 — 50 13 12 0,01

50 — 100 4 25 0,21

100 і більше 3 46 0,43

Разом 100 100 1,28

, а тому коефіцієнт концентрації обчислюється як півсума модулів
відхилень:

.

Значення коефіцієнта коливаються в межах від нуля (рівномірний розподіл)
до одиниці (повна концентрація). Чим більший ступінь концентрації, тим
більше значення коефіцієнта K. У нашому прикладі K = 1,28 : 2 = 0,64, що
свідчить про високий ступінь концентрації споживання електроенергії у
промисловості регіону.

Коефіцієнти концентрації широко використовуються в регіональному аналізі
для оцінювання рівномірності територіального розподілу виробничих
потужностей, фінансових ресурсів тощо. За кожним регіоном визначається
також коефіцієнт локалізації

,

який характеризує співвідношення часток.

За даними табл. 5.9 коефіцієнти локалізації свідчать про нерівномірність
купівлі (продажу) на душу населення і певною мірою про варіацію
життєвого рівня населення різних регіонів.

Таблиця 5.9

КОЕФІЦІЄНТИ ТЕРИТОРІАЛЬНОЇ ЛОКАЛІЗАЦІЇ

Регіон У % до підсумку Коефіцієнти

локалізації Lj, %

Чисельність

населення dj Обсяг

товарообороту Dj

А 30 34 113

В 50 42 84

С 20 24 120

Разом 100 100 *

Порівняння структур на основі відхилень часток доцільне в рядах з
нерівними інтервалами, а надто в атрибутивних рядах.

За аналогією з коефіцієнтом концентрації обчислюється коефіцієнт
подібності (схожості) структур двох сукупностей:

.

Якщо структури однакові, Р = 1; якщо абсолютно протилежні, Р = 0. Чим
більше схожі структури, тим більше значення Р. За наведеними у
табл. 5.10 даними про галузеву структуру зайнятості населення у двох
країнах коефіцієнт подібності структур становить:

,

тобто розподіл зайнятих за галузями економіки відхиляється в середньому
на 18 п. п.

Таблиця 5.10

ГАЛУЗЕВА СТРУКТУРА ЗАЙНЯТОСТІ НАСЕЛЕННЯ

Країна Структура зайнятих, %

Сільське

господарство Промисловість

та будівництво Сфера послуг

А 36 24 40

В 25 42 33

відхилень часток:

;

,

де dj0 та dj1 — частки відповідно базисного та поточного періоду; m —
число складових сукупності.

Таблиця 5.11

СТРУКТУРА ТА СТРУКТУРНІ ЗРУШЕННЯ

СПОЖИВАННЯ ПАЛИВА ПО РОКАХ

Вид

палива 1995 р.,

d0 2000 р.,

d1 Відхилення часток,

d1 – d0 Модулі

Квадрати

п. п.

Види та взаємозв’язок дисперсій

Дисперсія посідає особливе місце у статистичному аналізі
соціально-економічних явищ. На відміну від інших характеристик варіації
завдяки своїм математичним властивостям вона є невіддільним і важливим
елементом інших статистичних методів, зокрема дисперсійного аналізу.

Для ознак метричної шкали дисперсія — це середній квадрат відхилень
індивідуальних значень ознаки від середньої:

.

Як і будь-яка середня, дисперсія має певні математичні властивості.
Сформулюємо найважливіші з них.

1. Якщо всі значення варіант xj зменшити на сталу величину А, то
дисперсія не зміниться:

.

2. Якщо всі значення варіант xj змінити в А раз, то дисперсія зміниться
в A2 раз:

.

3. Якщо частоти замінити частками, дисперсія не зміниться.

. Якщо

,

і поділивши всі складові на n, дістанемо:

,

— середній квадрат значень ознаки.

. Застосуємо основну формулу дисперсії до цих характеристик структури:

.

(див. підрозд. 6.4).

. Узагальнюючими характеристиками цих вiдхилень є дисперсії: загальна,
групова та міжгрупова.

Загальна дисперсія характеризує варіацію ознаки у навколо загальної
середньої:

.

Групова дисперсія характеризує варіацію відносно групової середньої:

.

Оскільки в групи об’єднуються певною мірою схожі елементи сукупності, то
варіація в групах, як правило, менша, ніж у цілому по сукупності. Якщо
причинні комплекси, що формують варіацію в різних групах, неоднакові, то
й групові дисперсії різняться між собою.

Узагальнюючою мірою внутрішньогрупової варіації є середня з групових
дисперсій:

.

. Мірою варіації їх навколо загальної середньої є міжгрупова дисперсія

.

Отже, загальна дисперсія складається з двох частин. Перша характеризує
внутрішньогрупову, друга — міжгрупову варіацію.

Взаємозв’язок дисперсій називається правилом розкладання (декомпозиції)
варіації:

.

Розглянемо розрахунок зазначених дисперсій на прикладі варіації якості
твердого сиру у залежно від терміну його зберігання х. Результати
вибіркового обстеження якості 20 партій сиру, розподіл їх за терміном
зберігання (1, 2, 3 місяці), розрахунки середніх та дисперсій наведено в
табл. 5.13. Згідно з даними таблиці маємо:

1) середній бал якості сиру (за 10-бальною шкалою)

;

2) загальна дисперсія балів якості

;

3) групові середні бали якості та групові дисперсії:

.

Таблиця 5.13

РОЗРАХУНОК ЗАГАЛЬНОЇ ТА ГРУПОВИХ ДИСПЕРСІЙ ЯКОСТІ СИРУ

з/п Термін зберігання

х, міс. Бал

1 2 7,3 0,01

7,3 0,01

2 1 8,8 1,96 8,8 0,01

3 1 8,4 1,00 8,4 0,09

4 3 6,5 0,81

6,5 0,36

5 2 7,5 0,01

7,5 0,09

6 3 6,4 1,00

6,4 0,25

7 1 9,1 2,89 9,1 0,16

8 1 8,6 1,44 8,6 0,01

9 3 5,7 2,89

5,7 0,04

10 2 6,8 0,36

6,8 0,16

11 2 7,7 0,09

7,7 0,25

12 3 5,6 3,24

5,6 0,09

13 1 8,9 2,25 8,9 0,04

14 2 7,8 0,16

7,8 0,36

15 3 5,3 4,41

5,3 0,36

16 1 8,5 1,21 8,5 0,04

17 2 6,8 0,36

6,8 0,16

18 2 7,1 0,09

7,1 0,01

19 1 8,6 1,44 8,6 0,01

20 2 6,6 0,64

6,6 0,36

Разом — 148,0 26,26 60,9 0,36 57,6 1,4 29,5 1,1

Середня — 7,4 — 8,7 — 7,2 — 5,9 —

Дисперсія — — 1,313 — 0,051 — 0,175 — 0,220

Значення групових середніх підтверджують залежність якості сиру від
терміну його зберігання. У 1-й групі середній бал якості становить 8,7,
у 2-й групі якість сиру знижується на 1,5 бала, а в 3-й зниження якості
порівняно з першою групою становить 2,8 бала. Водночас зростає варіація
балів у групах, що відбиває посилення впливу інших чинників на якість
сиру.

Необхідні величини для розрахунку середньої з групових і міжгрупової
дисперсій наведено в табл. 5.14.

Таблиця 5.14

ДО РОЗРАХУНКУ МІЖГРУПОВОЇ ТА СЕРЕДНЬОЇ З ГРУПОВИХ ДИСПЕРСІЙ

Групи

за терміном

зберігання, міс. Число

партій

Середній бал

якості

Групова дисперсія

Розрахунок дисперсій

середньої з групових

1 7 8,7 0,051 0,36 1,3 11,83

2 8 7,2 0,175 1,40 – 0,2 0,32

3 5 5,9 0,220 1,10 – 1,5 11,25

Разом 20 7,4 ( 2,86 ( 23,4

За даними таблиці міжгрупова дисперсія становить

середня з групових дисперсій

.

Сума їх дорівнює загальній дисперсії: 0,143 + 1,170 = 1,313.

:

.

, тобто 84,2% варіації якості сиру пов’язані з терміном зберігання. На
інші фактори припадає 100 – 84,2 =

= 15,8% варіації.

Правило декомпозиції варіації є основою вимірювання щільності зв’язку.

Похожие записи