.

Математичне опрацювання результатів вимірювань (реферат)

Язык: украинский
Формат: реферат
Тип документа: Word Doc
3 3027
Скачать документ

Реферат на тему:

Математичне опрацювання результатів вимірювань

Визначення статистичних параметрів розподілу на підставі побудови
гістограми

В звичайних умовах параметри розподілу визначаються при допомозі
математичного опрацювання обмеженої кількості результатів спостережень,
званої вибіркою. Множина результатів спостережень, з котрих зроблено
вибірку, називається генеральною сукупністю результатів спостережень.
При атестації засобів вимірювання виконують обмежену кількість
вимірювань одного і того ж розміру, котру також називають вибіркою.
Генеральною сукупністю в цьому випадку буде множина розмірів, котрі
можна було б отримати даним вимірювальним засобом при дотриманні умов
вимірювання, вказаних в інструкції з експлуа тації засобу вимірювання.

. При великих вибірках число інтервалів встановлюють залежно від
кількості спостережень за такими рекомендаціями:

n r

40-100 7-9

100-500 8-12

5000-10000 10-16

Довжину інтервалів зручніше вибрати однаковою. Але якщо розподіл має
раптові стрибки в сусідніх інтервалах, то в області максимальної
концентрації результатів спостережень належить вибирати вужчі інтервали.
Ширина інтервалу має бути зручною для графічних робіт відносно поділок
вздовж осі х. Нижню межу першого інтервалу не варто брати такою, як хmin
, якщо вона не відповідає зручному положенню на осі х. При опрацюванні
результатів слід віддати перевагу відхиленням розмірів, а не розмірам
(для зменшення помилок при обчисленнях). Особливо великі помилки
виникають при обчисленні моментів другого та вищих порядків.

Кількість розмірів m , що попали в заданий і-й інтервал за умовою

(2.71)

-го інтервалу. Необхідно звернути увагу на те, що сума частот mi має
дорівнювати кількості n, тобто

. (2.72)

Відношення частоти mi до загальної кількості спостережень п називають
частістю і позначають

. (2.73)

Частість становить собою емпіричну оцінку ймовірності попадання
результатів спостереження xj в j-й інтервал. Очевидно, що

(2.74)

Для наочності емпіричний розподіл подають графічно у вигляді полігона,
гістограми розподілу або ступінчастої функції розподілу.

Полігон будується так: на осі абсцис відкладають інтервали значень
вимірюваної величини, в середині кожного із інтервалів відзначають
ординати, пропорційні до частот або частостей, і ординати з’єднують
прямими лініями. Вибираючи масштаби вздовж осей абсцис та ординат
дотримуються співвідношення ? 5:8, яке є найпоширенішим при зображенні
кривих розподілу.

висота прямокутника буде пропорційною до емпіричної щільності
ймовірностей

(2.75)

, і звідти проводять горизонтальну пряму до середини наступного
інтервалу, де ордината знову зростає. Висота ординати в кожній точці
відповідає емпіричній інтегральній функції розподілу

(2.76)

– кумулятивною частотою. За допомогою гістограми розподілу можна
розраховувати параметри розподілу, застосовуючи такі формули:

для середнього арифметичного

(2.77)

для оцінки дисперсії

(2.78)

для оцінки центрального моменту третього порядку

; (2.79)

для оцінки центрального моменту четвертого порядку

; (2.80)

, а за початок відліку відхилень прийняти умовний нуль х0; він дорівнює
середині інтервалу, який має найбільшу частоту mi.

Відносні відхилення yi будуть визначатись як віддаль від умовного нуля
х0 до середини відповідного інтервалу та будуть виражатись додатними або
від’ємними цілими числами : 0,1,2,3,4 і т.д.:

. (2.81)

Відносні початкові моменти визначаються тепер так:

початковий момент першого порядку

; (2.82)

початковий момент другого порядку

; (2.83)

початковий момент третього порядку

; (2.84)

початковий момент четвертого порядку

. (2.85)

Повертаючись до розмірності вимірюваної величини, отримаємо параметри
розподілу:

; (2.86)

; (2.87)

; (2.88)

. (2.89)

Результати розрахунків відносних початкових моментів зручно звести в
таблицю.

Визначення геометричної функції щільності розподілу

Вигляд функції теоретичного розподілу вибирають, виходячи із
передбачень про фізичну природу розсіювання результатів вимірювань. При
цьому треба враховувати як загальні міркування про закон розподілу, так
і вигляд графічних зображень емпіричного розподілу — полігона і
гістограми. Знаючи форму кривої густини теоретичного розподілу і
порівнюючи її з гістограмою, приймають попередній висновок про
можливість використання конкретного вигляду теоретичного розподілу.

, визначаючи значення густини ймовірності за формулою:

. (2.90)

) за формулою

(2.91)

для конкретних значень ti , відкладемо ці значення на осі ординат в
точках, що відповідають відхиленням

. (2.92)

У випадку розбіжності теоретичної і емпіричної кривих розподілу, яке
викликає сумніви щодо правильності гіпотези про закон розподілу,
перевіряється узгодженість емпіричного і теоретичного розподілів.

Перевірка нормальності результатів спостереження

. Вибирають критерій розбіжності між пропонованим теоретичним і
емпіричним розподілами. Якщо така міра розбіжності переважає деяку
границю, то гіпотеза відхиляється, як необгрунтована.

. За міру розбіжності приймається сума квадратів різниць частостей і
теоретичних ймовірностей попадання результатів спостережень в кожний
інтервал, взятих з деякими ваговими коефіцієнтами кожного інтервалу
(розряду):

, (2.93)

– частість, отримана із гістограми;

Р і— теоретична ймовірність попадання випадкової величини в даний
інтервал:

. (2.94)

В практичних завданнях про перевірку нормальності розподілу значення Рі
визначається з таблиці Д.2. (Додаток 12) як:

. (2.95)

. Кількість ступенів свободи розподілу

,

.

Якщо перевіряється гіпотеза про нормальність розподілу, то до числа цих
зв’язків відносять:

.

Тому при визначенні нормальності розподілу s = 3.

і має такий вигляд:

, (2.96)

– міра розбіжності в кожному інтервалі;

. (2.97)

.

виходить за межі вірогідного інтервалу, то гіпотеза відкидається, як
несумісна з дослідними даними.

Необхідно розглянути широко вживане поняття «рівень значущості».
Оскільки перевірка гіпотези базується на дослідних даних, то завжди
можливими є помилки.

ця ймовірність буде

. (2.98)

Але ми можемо допустити помилку другого виду, прийнявши дійсно невірну
гіпотезу за вірну. Вирахувати ймовірність такої помилки, строго кажучи,
неможливо, можна лише стверджувати, що при зменшенні помилки першого
виду помилка другого виду збільшується. Звідси витікає висновок про
недоцільність встановлення дуже високих значень вірогідностей.

така:

, об’єднують з сусідніми. Кількість ступенів свободи при цьому
зменшується.

, котрі приймають за параметри теоретичного нормального розподілу

3. Для кожного інтервалу знаходять ймовірності попадання в нього за
формулою

.

і додають їх значення.

.

Значення ступінчастої функції розподілу визначається за формулою

(2.99)

збігається за ймовірністю з інтегральною функцією розподілу.

Оскільки змінна величина z визначається через результати спостережень
як

, (2.100)

то zk і хk поєднані лінійною залежністю.

Отже, при нормальному законі розподілу точки хk і zk, що нанесені на
графік в координатах х і z, повинні розміститися вздовж одної прямої
лінії. Якщо ж отримано криву лінію, то гіпотеза про нормальність
розподілу відкидається. Задача про те, наскільки допустимим є відхилення
від прямої лінії тут не розглядається.

Виявлення грубих похибок

Відомо, що грубими похибками називаються похибки, які значно переважають
похибки, обгрунтовані умовами експерименту. Вважаємо, що всі результати
спостереження мають однакову дисперсію. Проте окремі результати можуть
здатися експериментатору підозрілими. Необдумане відкидання цих
результатів може спотворити оцінку параметрів дійсного розподілу. Якщо
експериментатор зауважив результат, що видався йому неправильним, і,
крім того, знайшов причину промаху (помилкова дія, відчитування та ін.),
то він може відкинути цей результат і провести додаткові вимірювання.
Якщо причина не вияснена, то додаткові вимірювання належить провести,
але відкидати підозрілий результат без перевірки статистичними методами
не можна.

В такому разі припускають, що результат спостереження хі не містить
грубої похибки, тобто є одним із значень випадкової величини х,
розподіленої за законом Fx(xk), параметри якого попередньо визначені.

Підозрілими можуть бути або xmin, або xmax із всієї низки спостережень,
тому для перевірки гіпотези визначають величину ?:

(2.101)

.

Сукупне опрацювання декількох низок спостережень

В багатьох випадках результати спостережень можуть бути представлені
декількома серіями, отриманими в різних умовах, наприклад, при допомозі
різних засобів вимірювань. Тоді необхідно розв’язати два завдання: перше
– перевірити рівноточність цих серій, і при негативному висновку (серія
нерівноточна) — друге завдання – опрацювання нерівноточних результатів.

Розглянемо розв’язування першого завдання.

Для перевірки гіпотези про рівнорозсіяність спостережень
застосовується розподіл Фішера, якому підкоряється співвідношення:

, (2.102)

в котрому u і v є незалежними випадковими величинами, що підкоряються

?2-розподілу з відповідно k1 і k2 ступенями свободи.

чи рівня значущості q, апріорно прийнятих при перевірці гіпотези про
рівнорозсіяність дисперсій (див. таблицю Д.6 в Додатку 12).

Умова прийняття гіпотези про рівнорозсіяність має такий вигляд:

(2.103)

, отриманого із таблиці розподілу Фішера, це значить, що відмінність
оцінок є незначною і вони є двома незалежними оцінками однієї і тої
дисперсії.

Інший спосіб оцінки рівноточності дисперсій полягає в знаходженні
вірогідних границь для істинної дисперсії D[x] за формулою (2.68).
Нижню та верхню межі для D[x] знаходимо за формулами :

(2.104)

перекриваються , то вимірювання можна вважати рівноточними.

Взагалі, при наявності j груп результатів спостережень, оцінки
параметрів розподілу визначаються для кожної j-ої групи.

Рівнорозсіяність груп спостережень перевіряється методами математичної
статистики, відомими під загальною назвою дисперсійного аналізу. Це
робиться в два кроки.

Коли воно є незначущим, то незначущою є і решта. Гіпотезу про
рівноточність в цьому випадку вважають обгрунтованою, а дисперсії
відносно середніх – однаковими. Якщо ж співвідношення є значущим, то
гіпотезу відкидають і перевіряють співвідношення дисперсій інших груп
спостережень.

Крок другий. При позитивному результаті першого кроку необхідно
перевіряти гіпотезу про однаковість математичних сподівань у всіх
групах.

При малій кількості груп спостережень для дисперсійного аналізу
співвідношень дисперсії групової до дисперсії середнього арифметичного
розподіл Фішера переважно не застосовують. В цьому випадку обчислюють
величину t1-2 на підставі двох середніх арифметичних:

(2.105)

ступенями свободи, що асимптотично переходить в нормальний при великій
кількості спостережень з математичним сподіванням М[t1-2]=0 і дисперсією
D[t1-2]=1.

то гіпотеза про однаковість математичних сподівань приймається.

в групах ще не свідчить , що між іншими середніми відмінності також
будуть незначущими. Причиною цього є відмінність дисперсій в окремих
групах спостережень.

незначуще відрізняються одна від одної, то групи спостережень
вважаються рівнорозсіяними. Це значить, що всі результати можна
об’єднати і опрацьовувати як одну велику вибірку. Зрозуміло, що нові
оцінки параметрів розподілу дозволяють мати більш певні результати
вимірювання.

свідчить про те, що на формування результатів значно впливає якась
причина або низка причин (факторів). Належить проаналізувати умови
вимірювання, спробувати знайти причини систематичної похибки, визначити
її значення та ввести поправку у відповідні результати. У випадку, коли
відмінність дисперсій є значущою, а відмінність середніх арифметичних –
незначуща, групи результатів називають нерівнорозсіяними.

Опрацювання нерівнорозсіяних низок спостережень

Групи спостережень називаються нерівнорозсіяними (нерівноточними), якщо
оцінки їх дисперсій значуще відрізняються одна від одної, а середні
арифметичні є оцінками одного і того ж математичного сподівання.

Питання стоїть так: чи не можна об’єднати результати декількох груп
спостережень, незважаючи на відмінність їх дисперсій.

Для демонстрації доцільності об’єднання результатів розглянемо приклад з
результатами вимірювання, отриманими в двох рівноточних групах
спостережень із різною кількістю спостережень n1 і n2.

Результат вимірювання в кожній групі буде записано так:

(2.106)

де ?х- середнє квадратичне відхилення, визначене наперед для даного
методу та умов вимірювання. При об’єднанні всіх результатів в одну
вибірку, отримаємо результат:

(2.107)

разів меншим від групового.

Розглянемо інший приклад, коли експериментатор має два результати
вимірювання однієї і тієї ж величини, отримані різними вимірювальними
засобами і в різних умовах. Щоби розв’язати це завдання вводиться
поняття ваги результату кожного вимірювання та середньозваженого
об’єднаних результатів вимірювань.

При застосуванні принципу максимальної правдоподібності, у відповідності
до якого найкращою оцінкою для невідомого істинного значення буде така
оцінка, ймовірність котрої є максимальна, визначається найкраща оцінка
істинного значення за результатами j груп, яка має такий вигляд:

(2.108)

Величини, обернені до дисперсій результатів спостережень, називають
вагами оцінок істинного значення вимірюваної величини. Позначивши ваги

(2.109)

отримаємо середнє зважене

(2.110)

.

Деколи застосовують безрозмірні відносні вагові коефіцієнти аj :

(2.111)

Тепер вираз для середнього зваженого набуде вигляду

(2.112)

Дисперсія середнього зваженого визначається як обернена величина до суми
ваг результатів вимірювання:

(2.113)

а його середнє квадратичне відхилення

(2.114)

для нормованого нормального розподілу за заданою вірогідністю. При
малих кількостях нормально розподілених результатів спостережень в
групах для визначення tP користуються розподілом Стьюдента з числом
ступенів свободи

(2.115)

Якщо розподіли початкових даних невідомі, то на підставі центральної
граничної теореми можна припустити, що розподіл середнього зваженого є
нормальним, бо воно є сумою великої кількості випадкових величин з
певними дисперсіями та математичними сподіваннями.

Опрацювання результатів опосередкованих вимірювань. Визначення сумарної
похибки.

При опосередкованих вимірюваннях значення шуканої величини отримують на
підставі відомої залежності, що пов’язує її з іншими величинами, які
вимірюються безпосередньо (прямими вимірюваннями).

Розглянемо випадок, коли опосередковано вимірювана величина є сумою або
різницею величин, визначених прямими вимірюваннями.

Нехай Z=X+Y. При одноразовому вимірюванні величин X та Y результат може
бути записаний

(2.116)

:

:

(2.117)

Математичне сподівання добутку випадкових похибок називається
кореляційним моментом. Він визначає взаємозалежність відхилень X i Y.
Кореляційний момент у рівняннях, що визначають сумарну дисперсію,
виражають через коефіцієнт кореляції

(2.118)

З врахуванням коефіцієнта кореляції рівняння () набуде вигляду

. (2.119)

Нескладно показати, що для Z=X—Y.

. (2.120)

Коли ж дисперсії випадкових величин X та Y невідомі, то користуються
їх оцінками

, (2.121)

де знак плюс відповідає умові (2.119), а знак мінус — умові (2.120).

Оцінки коефіцієнта кореляції обчислюють на підставі результатів
спостережень початкових величин:

(2.122)

Коефіцієнт кореляції показує наскільки добре точки XiYi апроксимуються
прямою лінією. Якщо нанести на графіку точки сумісного розподілу пар
XiYi в координатах X i Y, то можна отримати чотири типи графіків,
показаних на рис.2.15.

Якщо rXY > 0 – додатня кореляція, то величини X i Y змінюються узгіднено
в одному напрямку (рис.2.15,а), тобто збільшення одної величини
супроводжується зростанням іншої, і чим ближче rXY до одиниці, тим
тісніше будуть лягати точки вздовж прямої лінії, котра визначає
взаємозалежність величин X i Y(рис.2.15,б).

Якщо rXY

Нашли опечатку? Выделите и нажмите CTRL+Enter

Похожие документы
Обсуждение

Оставить комментарий

avatar
  Подписаться  
Уведомление о
Заказать реферат!
UkrReferat.com. Всі права захищені. 2000-2020