Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Выбор между параметрическим и непараметрическим тестом: насколько это на самом деле влияет на результат?




Тестами: сложные случаи.

Выбор между параметрическими и непараметрическими

Не всегда легко определить является ли выборка из Гауссовой популяции. Обратите внимание на следующие положения:

· Если Вы имеете большое количество наблюдений (100 или более) Вы можете посмотреть на распределение данных и совершенно четко будет видно насколько оно соответствует знаменитой колоколообразной кривой нормального распределения. Формальный статистический тест (тест Колмогорова-Смирнова) может использоваться для того, чтобы проанализировать вопрос насколько распределение данных отличается от Гауссова распределения. Когда у Вас имеется только небольшое количество наблюдений, очень сложно принять решение о том, следуют ли данные Гауссовому распределению и формальные тесты также имеют очень маленькую статистическую мощность для того, чтобы найти различие между Гауссовым и не Гауссовым распределением.

· Вы должны посмотреть на предыдущие данные. Помните, что то что Вас интересует - это распределение популяции в целом, а не распределение Вашей выборки. Принимая решение о том, является ли Ваше распределение нормальным, посмотрите на все имеющиеся данные, а не только на данные нынешнего эксперимента.

· Обратите внимание на источники разброса, когда разброс идет как результат суммы различных источников и ни один из источников не является основным источником разброса, у Вас скорее всего будет распределение Гаусса. Когда люди сомневаются, то некоторые выбирают параметрические тесты (поскольку они не уверены, что нарушается допущение о следовании нормальному закону распределения), а другие выбирают непараметрические тесты (поскольку они не уверены, что выполняются допущения о соответствии распределения Гаусса.

На самом деле надо ли задумываться о выборе параметрического или непараметрического теста? Ответ зависит от размере выборки. Есть четыре вещи о которых следует подумать:

· Большая выборка. Что произойдет, если Вы используете параметрический тест с данными, которые были получены на Гауссовой популяции? Центральная предельная теорема гарантирует, что параметрический тест будет хорошо работать с большими выборками если даже популяция, из которой была получены выборка, не является Гауссовой. Иными словами параметрические тесты являются устойчивыми к отклонению от Гауссового распределения в том случае, если выборка достаточно большая. Проблема, однако, заключается в том, что невозможно сказать насколько большая является достаточно большой и это все зависит от природы определенного не Гауссового распределения. Однако в том случае, если популяция не является действительно очень странной, Вы по всей вероятности, можете достаточно спокойно выбирать параметрический тест, если у Вас имеется по крайней мере, две дюжины наблюдений в каждой группе.

· Большая выборка. Что произойдет, если Вы будете использовать непараметрический тест с данными из Гауссовой популяции? Непараметрические тесты работают достаточно хорошо в большими выборками Гауссовой популяции. Р-значение имеет тенденцию быть немножко великоватым, но различия очень небольшие. Иными словами непараметрические тесты лишь ненамного менее мощны, чем параметрические тесты на больших выборках.

· Небольшие выборки. Что произойдет, если Вы будете использовать параметрический тест с данными от не Гауссовой популяции? Вы не можете полагаться на центральную предельную теорему и поэтому р-значение будет неправильным.

· Небольшие выборки. Что произойдет, если Вы будете использовать непараметрические тесты с данными из Гауссовой популяции? В этом случае р-оценка имеет тенденцию быть крайне высокой. Непараметрический тест не обладает достаточно высокой статистической мощностью на небольших выборках.

Поэтому большие наборы данных не представляют большой проблемы. Обычно достаточно легко сказать пришли ли данные из Гауссовой популяции, хотя на самом деле это уже не столь важно, поскольку непараметрические тесты достаточно мощны, а параметрические тесты устойчивы. Небольшие наборы данных как раз и являются основной проблемой. Достаточно сложно сказать пришли ли данные из Гауссовой популяции, однако это очень важно. Непараметрические тесты при небольшом объеме данных недостаточно мощны, а параметрические тесты не являются устойчивыми.




Поделиться с друзьями:


Дата добавления: 2015-04-24; Просмотров: 563; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.