Лекція

Методи виміру зв’язку між явищами

Кореляційний аналіз.

Однієї з важливих цілей дослідницької роботи є виявлення і вимір зв’язку
між ознаками, що характеризують досліджувані явища чи процеси.
Розрізняють функціональний і кореляційний зв’язки.

При наявності функціонального зв’язку зміна величини однієї ознаки
неминуче викликає визначені зміни величини іншої ознаки. Прикладом
такого зв’язку може служити залежність площі кругу від його радіуса.
Функціональний зв’язок між явищами притаманний неживій природі. У
біологічних науках частіше приходиться мати справа з іншим зв’язком між
явищами, коли одній і тій же величині однієї ознаки відповідає ряд
значень іншої ознаки, що варіюють, що обумовлено надзвичайним
різноманіттям взаємодії різних явищ живої природи. Такого роду зв’язок
зветься кореляційної (соггеlation — відповідність, співвідносність). У
той час як функціональний зв’язок має місце в кожному окремому
спостереженні, кореляційний зв’язок виявляється, тільки при численному
зіставленні ознак.

Розглянемо, наприклад, зв’язок між віком дітей-дошкільників та їх
ростом. З приведених даних видно, що з віком ріст дітей збільшується, і
тому можна припустити наявність зв’язку між зазначеними ознаками.

Таблиця

Вік 3 роки 4 роки 5 років 6 років 7 років

Зріст в см 100,3 102,9 108,1 113,7 118,3

92,6 100,1 106,8 113,8 119,2

93,8 101,6 107,8 113,3 119,4

93,7 98,4 104,6 111,8 116,1

94,2 99,4 107,4 112,1

Разом з тим, слід зазначити, що тому самому віку відповідає різний ріст
дітей. Це відбувається тому, що ріст дітей визначається не тільки віком,
на нього впливають багато інших факторів, у тому числі умови життя,
харчування, заняття фізкультурою й ін. Таким чином, можна прийти до
висновку, що зв’язок між віком і ростом дітей є кореляційної.

Досліднику варто пам’ятати, що виявлення кореляції між явищами, що
зіставляються, не говорить ще про існування причинного зв’язку між ними.
Для встановлення останньої необхідний усебічний логічний і спеціальний
аналіз дійсності досліджуваних процесів. Статистичний метод дозволяє
обґрунтувати отримані в результаті наукового дослідження висновки про
наявність тих чи інших зв’язків між явищами, виділити самі головні з
них.

Сила зв’язку між явищами, її тіснота і спрямованість визначаються
величиною коефіцієнта кореляції, що коливається в межах від 0 до ±1. При
м = 0 зв’язок відсутній, при г = ±1 — зв’язок повна, функціональна.

По спрямованості зв’язок між явищами може бути прямий (позитивний), коли
зі збільшенням (зменшенням) значень однієї ознаки збільшуються
(зменшуються) значення іншого (тобто коли ознаки міняються в одному
напрямку), і зворотний (негативний), коли зі збільшенням значень однієї
ознаки значення іншої зменшуються і навпаки (тобто зміни ознак —
різнонаправлені).

Таблиця 34

Схема оцінки тісноти кореляційного зв’язку за коефіцієнтом кореляції

Величина коефіцієнта

кореляції при наявності

Тіснота зв’язку прямого зв’язку (+) зворотного зв’язку (—)

Зв’язок відсутній 0 0

Зв’язок слабкий від 0 до +0.3′ від 0 до —0.3

Зв’язок помірний від +0.3 до +0.7 від —0.3 до —0.7

Зв’язок сильний від +0.7 до +1.0 від —0.7 до 1.0

Зв’язок повний (функціональний)

+1.0 —1.0

Приведемо приклад обчислення коефіцієнта кореляції по приведеній формулі
(таблиця ).

Хід обчислень тут надзвичайно простий. Підсумовуючи ряди х и у,
одержуємо х= 119 і в= 105.2. Поділяючи суми на число членів
ряду (n), одержуємо середні арифметичні цих рядів: Mx =119:12=9.9 і Мy =
105:12 = 8.8. Ряди dx, і dy, тобто відхилення чисел рядів x і y являють
собою різниця між відповідними значеннями x і y і середніми
арифметичними цих рядів. Так, для рядів x, dx дорівнює для січня: x — М=
5 — 9.9 — 4.9; для лютого: x — M=2 — 9.9 = — 7.9 і т.д. Зводячи по черзі
числа рядів dx і dy у квадрат, одержуємо ряди dx2 і dy2, а перемножуючи
попарно числа рядів dx і dy між собою, одержуємо ряд dx помножити на dy.
Підставляємо значення сум цих рядів у формулу:

Кореляція між середньомісячною температурою повітря і число померлих
дітей до 1 року від кишкових захворювань:

Тобто між середньомісячною температурою повітря і числом померлих від
гострих кишкових інфекцій існує прямий кореляційний зв’язок.

Це надзвичайно прості для розуміння обчислення вимагає досить кропіткої,
хоча і нескладній математичної роботи. Обчислювальна робота особливо
утрудняється тоді, коли члени корелюємих рядів мають великі числові
значення, особливо якщо варіанти корелюємих рядів приведені у виді
згрупованих інтервалів. І, отже, приходиться обчислювати не просту, а
зважену середню.

Середня помилка коефіцієнта кореляції. Оскільки коефіцієнт кореляції в
клінічних дослідженнях розраховується звичайно для обмеженого числа
спостережень, нерідко виникає питання про надійність отриманого
коефіцієнта. З цією метою визначають середню помилку коефіцієнта
кореляції. При досить великому числі спостережень (більше 100) середня
помилка коефіцієнта кореляцій (mr) обчислюється по формулі:

де

n — число парних спостережень.

У тому випадку, якщо число спостережень менше 100, але більше 30,
точніше визначати середню помилку коефіцієнта кореляції, користаючись
формулою:

З достатньою для медичних досліджень надійністю про наявність третього
чи іншого ступеню зв’язку можна стверджувати тільки тоді, коли величина
коефіцієнта кореляції перевищує чи дорівнює величині трьох своїх помилок
(rху > Зmr,). Звичайно це відношення коефіцієнта кореляції (rху) до його
середньої помилки (mr) позначають буквою t і називають критерієм
вірогідності:

?

?

gdOeJN

`„?gdOeJN

?

?

?

`„?gdOeJN„kd< `„?gdOeJN„kd? gdOeJN # 3, то коефіцієнт кореляції достовірний. ДИСПЕРСІЙНИЙ АНАЛІЗ Дисперсійний аналіз дозволяє дати узагальнену характеристику трьом і більш середнім величинам чи показникам і дозволяє: — вимірити силу впливу; — оцінити різницю окремих чи середніх показників; — визначити вірогідність різниці окремих чи середніх показників. Дисперсійний аналіз показує ступінь розсіювання, варіації (дисперсії) вимірюваних ознак навколо середнього типового рівня, тому він дає можливість вивчити дію на кінцевий результат дослідження декількох факторів разом, роль кожного з них і порівняти дія окремих факторів між собою. Вивчення дії факторів проводиться шляхом порівняння середніх значень ознаки, що спостерігається, отриманих у результаті впливу кожного з цих факторів при рівному їхньому сполученні. Розрізняють наступні види дисперсійного аналізу: однофакторний, двофакторний і багатофакторний. Методика проведення дисперсійного аналізу викладена в численних спеціальних виданнях по медичній статистиці. НЕПАРАМЕТРИЧНІ КРИТЕРІЇ Непараметричні критерії використовуються переважно в тих випадках, коли досліджуване явище відрізняється від нормального розподілу. З одного боку, вони дозволяють оцінити характер, тенденцію явища (збільшення, зменшення, без змін), хоча, з іншого, більшість з них має досить високу статистичну потужність (чутливістю). Особливо ефективне застосування непараметричних критеріїв при малих вибірках [п < 30), при вивченні якісних ознак. Перевагою більшості непараметричних критеріїв є порівняльна простота розрахунків. Основні напрямки застосування непараметричних критеріїв: 1. Для характеристики однієї сукупності: — критерій ітерацій (флуктуації); — медіана, квартелі. 2. Для оцінки зв'язку між явищами: — коефіцієнт рангової кореляції (Спірмена); — коефіцієнт кореляції рангів (Кендела); — показник відповідності х2 (х-квадрат). 3. Для оцінки розходжень двох порівнюваних сукупностей. При цьому варто виділяти кілька варіантів: При цьому варто виділяти кілька варіантів: 1. Для порівняння кількісних ознак: Дві вибірки Кілька вибірок А Б У Г незалежні залежні незалежні залежні Критерій Лорда Ранговий критерій Вілкоксона (Т) Порівняння вибірок по Немені Критерій Фридмана Критерій Вілкоксона-Манна-Уітні Критерій знаків Критерій Вілкоксона Критерій Мостселлера Максимум критерій для різниці пар Критерій Розенбаума Критерій Уайта Серійний критерій Вальда-Вольровича Критерій Колмогорова-Смірнова 2. Для порівняння якісних ознак: Дві вибірки Кілька вибірок Д Е Ж З незалежні залежні незалежні залежні Критерій Стьюдента з виправленнями Єтса Критерій Умочи-Мара Критерій (х2) по Р. Руніоні Критерій Кокрена Критерій згоди Точний метод Фішера Критерій Вандер-Вардена Конкретні непараметричні критерії докладно викладені в спеціальних посібниках з медичної статистики. Таблиця Обчислення сигми (а) і середньої помилки (т) по амплітуді Число спостережень Коефіцієнт для сигми А Коефіцієнт для помилки, У Число спостережень Коефіцієнт для сигми А Коефіцієнт для помилки, У 1 - - 120 5.15 56.3 2 1.13 1.60 140 5.26 62.3 3 1.69 2.93 160 5.35 67.6 4 2.06 4.12 180 5.43 73.0 5 2.33 5.20 200 5.50 77.8 6 2.53 6.21 220 5.57 82.6 7 2.70 7.16 240 5.61 87.0 8 2.85 8.05 260 5.68 91.7 9 2.97 8.90 280 5.72 95.7 10 3.08 9.70 300 5.77 100.0 11 3.17 10.50 320 5.80 103.8 12 3.26 11.20 340 5.84 107.9 13 3.34 12.00 360 5.88 111.5 14 3.41 12.70 380 5.92 115.2 15 3.47 13.40 400 5.94 118.8 16 3.53 14.10 420 5.98 122.6 17 3.59 14.80 440 6.00 125.9 18 3.64 15.40 460 6.02 129.2 19 3.69 16.10 480 6.06 132.8 20 3.74 16.70 500 6.09 136.0 22 3.82 17.90 520 6.12 139.3 24 3.90 19.00 540 6.13 142.5 26 3.96 20.20 560 6.14 145.6 28 4.03 21.20 580 6.17 148.6 30 4.09 22.40 600 6.18 151.5 32 4.14 23.40 620 6.21 154.6 34 4.19 24.60 640 6.23 157.7 36 4.24 25.50 660 6.26 160.8 38 4.28 26.40 680 6.27 163.4 40 4.32 27.30 700 6.28 166.4 50 4.50 31.80 750 6.33 173.3 60 4.64 35.90 800 6.34 177.9 70 4.76 39.80 850 6.37 186.6 80 4.85 43.30 900 6.43 193,0 90 4.94 46.90 950 6.47 199.2 100 5.01 50.10 1000 6.48 204.9 Таблиця Таблиця t (критерій Стьюдента) n - 1 Відсоток можливої помилки 5% 1% 0,1% 1 12.70 63.66 637.59 2 4.30 9.92 31.60 3 3.18 5.84 12.94 4 2.78 4.60 8.61 5 2.57 4.03 6.86 6 2.42 3.71 5.96 7 2.36 3.50 5.31 8 2.31 3.36 5.04 9 2.26 3.25 4.78 10 2.23 3.17 4.59 11 2.20 3.11 4.44 12 2.18 3.06 4.32 13 2.16 3,01 4.22 14 2.14 2.98 4.14 15 2.13 2.95 4.07 16 2.12 2.92 4.02 17 7.11 2.90 3.96 18 2.10 2.88 3.92 19 2.09 2.86 3.88 20 2.09 2.84. 3.85 21 2.08 2.83 3.82 22 2.07 2.82 3.79 23 2.07 2.81 3.77 24 2.06 2.80 3.75 25 2.06 2.79 3.73 26 2.06 2.78 3.71 27 2.05 2.77 3.69 28 2.05 2.76 3.67 29 2.04 2.76 3.66 30 2.04 2.75 3.64 1.96 2.58 3.29

Похожие записи