Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Критерий знаков для одной выборки




Схема испытаний Бернулли

Проверка статистических гипотез (прикладные задачи)

Вероятности событий при гипотезе. Обратимся к описанному выше тройному тесту. Мы выяснили, что статистической моделью этого теста является схема испытаний Бернулли, и выдвинули несколько статистических гипотез, которые были сформулированы так: , , Н: р = 0.9, где р — вероятность правильного правильного ответа в одном испытании.

Пусть для определенности число испытаний п = 10. (Вообще-то десяти испытаний для серьезных выводов недостаточно. Мы выбрали п = 10 только ради простоты изложения, чтобы сделать последующие расчеты легко обозримыми.) В качестве наблюдения х в этой cxeме эксперимента должны выступать результаты этих 10 испытаний т.е. последовательность длины 10 вида успех, неудача, неудача, успех и т.д. Соответственно пространство Х состоит из всевозможных таких последовательностей. Вероятность любой из них равна , где S — число правильных ответов. Можно показать, что статистические решения, основанные на S, не будут менее точными, чем решения, основанные на полной записи результатов. (Это очень интересная математическая особенность, на которой мы не можем останавливаться. Скажем лишь, что это означает, что вся информация, необходимая для принятия решений о величине р, заключена в числе успехов S, а сведения о конкретном чередовании успехов и неудач не важны.) Поэтому проверку гипотез мы будем проводить, основываясь на числе успехов S, которое имеет биномиальное распределение.

Для проверки первой гипотезы надо выбрать такое событие, вероятность которого, вычисленная согласно гипотетическому распределению вероятностей, была бы малой. Обозначим это событие через А. Выберем некоторое число e, и все события, вероятность которых меньше e, будем считать маловероятными. Пусть, например, . Вероятность А, которую мы обыкновенно обозначаем через Р (А), сейчас удобно записать , отмечая, что эта вероятность вычислена при гипотезе Н. Рассмотрим некоторые примеры событий и вычислим их вероятности. В табл. 2 приведены вероятности событий вида { S = k } при .

Таблица 2

K            
0.0173 0.0868 0.1950 0.2602 0.2276 0.1365
k            
0.0569 0.0163 0.0030 0.0004 0.0000  

Легко видеть, что половина этих событий маловероятна согласно выбранному нами критерию.

В табл. 3 приведены вероятности событий, заключающихся в том, что правильных ответов больше или равно заданному числу, т.е. событий вида , k = 0,1, 2,..., 10. Таблица 3

k            
1.000 0.9872 0.8959 0.7009 0.4407 0.2131
k            
0.0766 0.0197 0.0034 0.0004 0.0000  

Здесь тоже несколько событий имеют вероятность меньше 0.02. Как видим, для выбора маловероятного при Н события А имеется довольно много возможностей. Как мы говорили в п. 3.2, надо выбрать А так, чтобы была малой, но при нарушении Н становилась бы большой. То есть выбрать такое А, которое неправдоподобно при Н и естественно, (обыкновенно, не удивительно) при рассматриваемой альтернативе к Н. Как мы установили в п. 3.3, альтернативой к гипотезе может быть совокупность распределений, для которых . Таким образом, с простой гипотезой Н конкурирует сложная альтернатива . Эту альтернативу называют односторонней (правосторонней), чтобы отличить от двусторонней альтернативы .

Можно, разумеется, рассматривать и простые альтернативы к гипотезе Н. Рассмотрим, например, альтернативу , и разберем в этой ситуации, как осуществить выбор множества А, руководствуясь изложенным выше принципом.

Вероятности событий при альтернативе. Посмотрим, как изменяются вероятности событий, приведенных в таблице 3, когда они вычисляются при альтернативе p = 0.9. Соответствующие значения даны в таблице 4.

Анализируя табл. 2, видим, что события S = 7, S = 8, S = 9, S = 10 маловероятны как каждое в отдельности, так и все вместе взятые, т.е. объединение этих событий, которое можно записать в виде S ³ 7, имеет вероятность, равную 0.0197 (см. табл. 3). Из табл. 4 видно, что вероятность события S ³ 7, вычисленного при альтернативе, равна 0.9872, т.е. событие S ³ 7 при справедливости альтернативы практически достоверно. Поэтому в качестве критического для гипотезы при ее проверке против конкурирующей гипотезы Н 3: р = 0.9 можно взять событие { 7}.

Может возникнуть следующий вопрос: почему мы не включили событие S = 0 в выбираемое нами маловероятное (при первой гипотезе) событие А, вместо, например, событий S =S = 8? Ответ дает расчет вероятности события при альтернативе. Действительно, , т.е. это событие менее вероятно при альтернативе, чем выбранное выше.

Разобранный пример характеризует в некотором смысле идеальную ситуацию, когда удается найти такое событие А, которое практически невозможно при Н и практически достоверно при альтернативе. В этом случае по результатам эксперимента, в зависимости от того, произошло или нет А, мы уверенно можем судить, имеем ли дело с Н или с альтернативой. Таблица 4

k            
1.000 1.000 1.000 1.000 1.000 0.9999
k            
0.9984 0.9872 0.9298 0.7361 0.3487  

Сложная альтернатива. С точки зрения экспериментатора, разумной альтернативой к гипотезе является сложная альтернатива . Эта альтернатива не задает конкретного распределения вероятностей в схеме Бернулли. Вероятности событий при альтернативе H 1 зависят от конкретного значения параметра р, . Они изменяются вместе с изменением этого параметра, и мы можем судить о тенденции изменения этой вероятности. Очевидно, что чем больше значение р, тем больше вероятность появления большого числа успехов S. Это наглядно показывает сравнение таблиц 2 и 4. Выше было установлено, что событие при справедливости первой гипотезы маловероятно. В то же время, чем больше значение р, тем больше вероятность этого события. Так, при р = 0.9 . Поэтому разумно именно с помощью этого события судить о справедливости Н — если альтернативой к Н выступает .

Предположим, что мы провели обсуждаемый эксперимент и получили для S конкретное значение. Обозначим это наблюденное значение как чтобы отличать случайную величину S от ее реализации . Пусть, к примеру, . Тем самым осуществилось событие . Поэтому мы отвергаем гипотезу на уровне значимости 0.02 в пользу альтернативы .

Упоминание уровня значимости в заключительном решении существенно — от его величины зависит, отвергаем мы гипотезу или нет. Пусть, например, e = 0.005. Тогда критическое множество есть , и опыт, в котором не отвергает гипотезу на уровне значимости 0.005 против альтернативы .

Выбор уровня значимости всегда произволен. Неприятно, что от этого произвола зависит решение — отвергнуть или нет гипотезу. В данном примере (и во многих других случаях) есть более гибкий способ действий — указать минимальный уровень значимости, на котором можно отвергнуть гипотезу.

Критическое событие в нашей задаче имеет вид , где С — некоторое критическое значение. Чем больше число С, тем менее вероятно при гипотезе Н событие . Тем больше поэтому уверенность, что Н надо отвергнуть, если . Наибольшей достижимой уверенности соответствует наименьший возможный уровень значимости, который в нашей задаче есть .

Наименьший уровень значимости полезно вычислять во всех случаях, так как он характеризует, насколько сильно наблюденное значение противоречит гипотезе Н.

Виды альтернатив. В примере испытаний Бернулли, которые обсуждались выше, разумный класс альтернатив к гипотезе был определен как . Такие альтернативы называют односторонними (в данном случае, правосторонними). Встречаются статистические задачи и с левосторонними альтернативами. Основную гипотезу в этом случае приходится отвергать, если успехов в опыте зарегистрировано неестественно мало с точки зрения гипотезы Н. Иначе говоря, критическое множество А имеет вид , а число С выбирается так, чтобы была малой.

Наиболее общими альтернативами являются двусторонние альтернативы. Пусть основная (нулевая, как часто говорят) гипотеза имеет вид , где р — некоторое определенное число. Если невозможно заранее указать направление изменения р при отступлении от Н 0, приходится рассматривать альтернативу вида . Руководствуясь изложенными принципами проверки статистических гипотез и характером изменения распределения вероятностей между возможными значениями S (числом успехов) при разных р, мы заключаем, что в данном случае следует отвергнуть гипотезу Н 0 и тогда, когда неправдоподобно велико, и тогда, когда оно неправдоподобно мало. Напомним, что все эти вероятности вычисляются так, как это предписывает проверяемая гипотеза Н 0.

Следовательно, надо выбрать два критических значения для S, а именно верхнее и нижнее, скажем, х и у. Выбрать их необходимо так, чтобы была малой. Гипотеза Н 0 отвергается, если , либо . Уровень значимости этого критерия есть .

Замечание. Обычно описанное правило оформляют несколько иначе, следя за отклонением наблюдаемого S от его ожидаемого значения пр 0. Напомним, что математическое ожидание числа успехов в схеме Бернулли равно MS = пр 0. С помощью таблиц выбирают число z так, что вероятность оказывается малой. Гипотезу Н 0: р = р 0 отвергают, если . В этом случае статистикой критерия служит уже не S, a . Здесь также можно вычислять минимальный уровень значимости, на котором можно отвергнуть Н 0: р = р 0 против двусторонней альтернативы . Он равен .

На изложенном выше способе проверки статистических гипотез в схеме Бернулли основан широко распространенный критерий знаков. Для его применения достаточны очень слабые предположения о закону распределения данных, такие как независимость наблюдений и однозначная определенность медианы. Напомним, что медианой распределения случайной величины x называется такое число q, для которого .

Предположим, что в результате многочисленных измерений артериального кровяного давления у пациентов некой поликлиники было установлено его медианное значение q. Эти измерения возобновились после летних отпусков. У первых N пациентов были зарегистрировано значения давления крови . Можно ли считать, что медианный уровень давления понизился после летнего отдыха?

Как обычно, проще проверить гипотезу о том, что значение медианы q не изменилось. При этом надо рассматривать только односторонние альтернативы — в данном случае, левосторонние (как будет описано ниже). Если гипотеза будет отвергнута, это будет означать положительный ответ на поставленный выше вопрос.

Проверка этой гипотезы с помощью критерия знаков проводится следующим образом. Рассмотрим случайную величину . Так как, согласно гипотезе, , то . В выборке , подсчитаем число положительных разностей и обозначим его через S. Для формализации этого алгоритма удобно ввести функцию

Тогда . Случайная величина принимает два значения: 0 и 1. Согласно выдвинутой гипотезе, вероятность каждого из этих значений равна 1/2. Таким образом, видно, что задача сводится к схеме испытаний Бернулли, в которой через S обозначено число «успехов», и следует проверить гипотезу . В нашем примере надо рассматривать левосторонние альтернативы, но вообще альтернативы могут быть как односторонними, так и двусторонними, в зависимости от решаемой задачи.

Отметим важное обстоятельство в приведенном примере. Гипотеза о значении медианы случайной величины, выдвинутая нами первоначально, не определяла однозначно закон распределения X, и тем самым не позволяла вычислить вероятность произвольных значений X. В связи с этим мы были вынуждены перейти к случайной величине , которая задает только знак разности . При этом вероятностное распределение определяется уже однозначно. Изложенный критерий получил название критерия знаков, так как он работает фактически только со знаками преобразованных некоторым образом случайных величин. Этот критерий хорош именно тем, что требует очень немногого от функции распределения случайной величины и очень прост в применении.




Поделиться с друзьями:


Дата добавления: 2014-12-26; Просмотров: 837; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.018 сек.