Перевірка гіпотези про вид функції щільності ймовірності
Відомо декілька так званих критеріїв згоди, за допомогою яких перевіряються гіпотези про відповідність експериментальних даних теоретичної функції щільності розподілу ймовірностей. Найбільш розповсюдженим з них критерій , а також складений та W критерії.
Критерій використовується для перевірки узгодженості теоретичного та експериментального розподілів різних видів при числі результатів вимірювань у серії (спостережень) n≥50. Сутність його: оцінка відхилення гістограми експериментальних даних від гістограми з тим самим числом інтервалів, побудованої на основі теоретичного розподілу. Формульні відношення для критерію наведені в підрозділу 3.5.1. Цій критерий розглядался в курсі «Теорія ймовірності та математична статистика».
3.5.1. Критерій c2 (хі-квадрат)
Критерій використовується для перевірки узгодженості теоретичного та експериментального розподілів різних видів при числі результатів вимірювань у серії (спостережень) n≥50. Сутність його: оцінка відхилення гістограми експериментальних даних від гістограми з тим самим числом інтервалів, побудованої на основі теоретичного розподілу. Для кожного інтервалу гістограми визначають значення теоретичної і дослідної частостей (кількості спостережень, що потрапляють у даний інтервал) і знаходять показник різниці частостей. Величина має 3 форми запису (і обчислення) за експериментальними даними
(3.23)
де - теоретична ймовірність попадання результатів спостережень у l -й інтервал гістограми; - дослідна (статистична) оцінка ймовірності (частість) попадання результатів спостережень у l -й інтервал,
- експериментальне (дослідне) число результатів спостережень, що попадають у l -й інтервал гістограми; - теоретичне (очікуване) число результатів у l -му інтервалі; r - число інтервалів гістограми з постійною шириною h.
Значення залежить від довірчої імовірності P (або рівня значущості ) і числа степенів вільності , де s - число незалежних зв’язків, накладених на частості . Якщо перевіряється гіпотеза про нормальний розподіл, то до останніх належать: по-перше, рівності середнього арифметичного математичному сподіванню, а також точкової оцінки дисперсії і дисперсії передбачуваного нормального розподілу; по-друге, рівність одиниці суми частостей усіх інтервалів, тобто ; ∙
Теоретична величина для нормально розподілених результатів вимірювань визначається за формулою
.
Щільність ймовірності цієї величини:
де Г(∙) – відома гама-функція. Інтегральна функція ‑ табульована (додаток 8). Вхідними даними таблиць, які складені, є рівень значущості (або довірча ймовірність ) і число степенів вільності . Для рівня значущості знаходять нижню і для рівня значущості - верхню границі критичної області значень (рис.3.6).
Рис.3.6. Функція з довірчим інтервалом
Гіпотеза про нормальність розподілу результатів спостережень приймається, якщо виконується нерівність
. (3.24)
Методика застосування критерію :
1. Для серії n результатів спостережень обчислюють середнє арифметичне і незміщену оцінку СКВ за формулами (3.19) і (3.22) відповідно.
2. Визначають дослідні значення частостей . Для цього результати спостережень Хq розміщують у варіаційний ряд (у порядку зростання) Хmin= =Хmax і здійснюють групування даних, тобто він розбивається на r рівних інтервалів. Вибір числа r інтервалів проводиться залежно від числа спостережень, що входять у серію. В табл. 3.1. наведена одна з рекомендації щодо такого вибору.
Таблиця 3.1. – Рекомендації щодо вибору числа інтервалів
Число результатів спостережень, n
Рекомендоване число інтервалів, r
40 - 100
100 - 500
500 - 1000
1000 - 10000
15 - 20
20 - 30
30 - 40
40 - 55
Ширину інтервалу h визначають за формулою
.
Для кожного інтервалу гістограми підраховують число результатів спостережень, що потрапили в нього. Якщо число хоча б для одного з інтервалів менше від 5, то роблять нову розбивку на інтервали, зменшуючи їх число r.
3. Розраховують теоретичні ймовірності або теоретичне (сподіване) число результатів спостережень для кожного з інтервалів.
Імовірності попадання результатів спостережень Xq у l -й інтервал знаходять або за загальною формулою (3.13), або приблизно як добуток щільності теоретичного розподілу в середині l - го інтервалу на його ширину:
,
де .
Для визначення числа переходять від середин інтервалів до нормованих значень :
.
Для кожного значення за таблицею диференціальної функції нормованого нормального розподілу (додаток 7) знаходять значення і обчислюють
.
4. За одержаними значеннями і (або ) обчислюють значення показника із співвідношення (3.23). За таблицею (додаток 9) знаходять граничні значення та . Згідно з умовою (3.24) перевіряють
studopedia.su - Студопедия (2013 - 2026) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав!Последнее добавление