Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Критерии согласия




Определение законов распределения случайных величин.

Пусть в результате измерения некоторой случайной величины X получена некоторая статистическая выборка. Требуется определить закон распределения случайной величины.

Возьмем из совокупности значений случайной величины наибольшее и наименьшее значения. Первое несколько увеличивают, второе уменьшают. Это делается с целью уменьшения числа значащих цифр по границам диапазона изменения случайной величины.

Далее следует разделить весь диапазон изменения случайной величины на отдельные интервалы, определить их количество и назначить ширину интервала. Количество интервалов n не должно быть слишком большим (тогда ряд распределения становится невыразительным, так как в нем появляются незакономерные колебания); с другой стороны, оно не должно быть слишком малым (при малом числе разрядов свойства распределения описываются слишком грубо).

При физическом моделировании каждый эксперимент связан со значительными затратами. Поэтому число выходных данных ограничивается десятками. В этих условиях количество интервалов, как правило, не превышает 6-10.

При больших массивах случайных величин число интервалов выбирают порядка 12¸20.

Оптимальное количество интервалов n может быт найдено по формуле Стер­джеса:

n = 1+3,3×lg n,

где n – объем выборки.

Для удобства вычислений границы интервалов не должны быть дробными.

Прежде всего, массив экспериментальных данных следует расположить в порядке возрастания значений случайной величины с указанием, сколько раз такое значение повторяется

Затем определяют количество значений случайной величины , попавшее в каждый из интервалов, где i – номер интервала.

Далее определяют частоты для каждого из интервалов:

Очевидно, что сумма частот по всем интервалам равна 1.

Полученные данные позволяют построить гистограмму (рис. 30), для чего по оси абсцисс откладываются интервалы, и на каждом из них строится прямоугольник, площадь которого равна частоте данного интервала. В случае равных по длине интервалов высоты прямоугольников пропорциональны соответствующим частотам. Из способа построения гистограммы следует, что площадь ее равна единице.

Следующий этап – подбор подходящего теоретического распределения. Главными факторами здесь являются, с одной стороны, внешнее сходство кривых распределения, с другой стороны, ожидаемые закономерности распределения, исхо­дя из физической или математической сути исследуемых явлений или процессов.

Для того чтобы оценить сходство теоретического и экспериментального распределений, необходимо сравнить построенную гистограмму с кривыми известных теоретических распределений.

Для оценки сходства по сути явлений следует вникнуть в физический смысл данного распределения, выяснить причинно-следственные связи или учесть накопленный опыт подобных исследований.

Так, если рассматриваются равновероятные события, то следует ожидать равномерное распределение случайной величины. Если случайное событие является следствием многих причин, ни одна из которых не является преобладающей, логично ожидать нормальное распределение.

С другой стороны, распределение Пуассона хорошо описывает редкие события, а распределение Вейбулла – разрушение материалов. И это – далеко не полный перечень особенностей теоретических распределений.

Всё сказанное необходимо учитывать при выборе подходящего закона распределения на первом этапе.

Однако, окончательное суждение о законе распределения можно сделать только после количественных оценок. Такие оценки делаются на основе критериев согласия.

Выбрав тип предполагаемого теоретического распределения выдвигают нулевую гипотезу о соответствии экспериментального распределения теоретическому и проверяют её на заданном уровне значимости, используя критерии согласия.

Уровень значимости есть вероятность того, что верная гипотеза будет отвергнута. Насколько мала должна быть эта вероятность – вопрос неопределённый; он не может быть решён математическими средствами и принимается из практических соображений.

Критерий Пирсона (хи-квадрат) обычно применяется при больших выборках (n > 100), но иногда он используется и при существенно меньших выборках. Критерий Пирсона применим только к сгруппированным данным. Рекомендуется, чтобы число значений случайной величины в каждом интервале было не менее 5. Поэтому смежные малочисленные группы рекомендуется объединять.

Пирсон доказал, что мера согласованности между теоретическим и экспериментальным распределением является случайной величиной, подчиняющейся закону распределения хи-квадрат.

Поэтому в качестве меры согласия берется экспериментальная величина :

где - число значений случайной величины, попавшее в i -й интервал;

- вероятность попадания случайной величины в тот же интервал, вычисленная по теоретическому распределению;

n - объем выборки;

- количество интервалов.

 

 

Рисунок 30 – Выбор теоретического распределения:

1 – гистограмма; 2 – теоретическая кривая.

 

По таблицам распределения (таблица 10) при заданном уровне значимости и известном числе степеней свободы находят теоретическое значение .

Число степеней свободы равно числу интервалов n минус число наложенных связей r (в данном случае r =3).

При выполнении условия

считается, что при заданном уровне значимости (обычно = 0,05) принятая нулевая гипотеза не противоречит опытным данным.

Следует особо отметить, что с помощью любого критерия можно только отвергнуть нулевую гипотезу. Высокий уровень значимости b не может считаться доказательством справедливости гипотезы, а указывает только на то, что гипотеза не противоречит опытным данным.

Поэтому более жесткие требования по уровню значимости следует выдвигать с осторожностью, так как увеличивается вероятность того, что может быть отброшена верная гипотеза.

 

Таблица 10 – Критические точки распределения

Число степеней свободы                    
Уровень значимости b=0,05 7,8 9,5 11,1 12,6 14,1 15,5 18,3 21,0 25,0 31,4
Уровень значимости b=0,95 0,35 0,71 1,15 1,64 2,17 2,73 3,94 5,23 7,26 10,9

 

Критерий Колмогорова определяется по максимальной разности между теоретической функцией распределения F(x) и статистической функции распределения , полученной по результатам измерений.

 

 

По найденному значению определяется значение критерия :

Затем по заданному уровню значимости по таблице 11 находится значение . Если l < l0, то теоретическое и экспериментальное распределение согласуются на заданном уровне значимости.

Критерий Колмогорова своей простотой выгодно отличается от критерия Пирсона. Однако, этот критерий можно применять только в том случае, когда гипотетическое распределение F(x) полностью известно заранее из каких-либо теоретических соображений, т.е. когда известен не только вид функций распределения F(x), но и все входящие в неё параметры. Такие случаи сравнительно редко встречаются на практике.

Обычно из теоретических соображений известен только вид функции распределения, а входящие в неё числовые параметры определяются в результате математической обработки статистических данных. В случае применения критерия c2 это обстоятельство учитывается соответствующим уменьшением числа степеней свободы. Критерий Колмогорова такого согласования не предусматривает.

Если же применять этот критерий, когда параметры теоретического распределения выбираются по статистическим данным, критерий даёт заведомо завышенные значения вероятности . Поэтому в некоторых случаях может быть принята гипотеза, плохо согласующаяся с опытными данными.

 

Таблица 11 – Критические значения

Объем выборки n                 >35
Уровень значи­мости = 0,05 0,708 0,563 0,483 0,409 0,338 0,294 0,264 0,224
Уровень значи­мости = 0,1 0,636 0,509 0,436 0,369 0,304 0,265 0,238 0,202

 




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 977; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.021 сек.