Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Множественные сравнения




Множественные сравнения являются одной из труднейших проблем в математической статистике. В действительности при анализе данных исследователи сталкиваются с ними на каждом шагу.

Пусть, например, мы рассматриваем 100 независимых таблиц сопряженности пар переменных, отбирая среди них "интересные" для анализа с использованием критических значений хи-квадрат 5%-го уровня значимости. Тогда при отсутствии связи переменных мы будем в среднем в таких испытаниях получать 5 "интересных" (значимых) таблиц, даже если связь между всеми переменными отсутствует. Таким образом, какие бы ни были плохие данные, мы что-либо будем интерпретировать. Но при повторном сборе данных - мы можем получить противоположные результаты. Вот что значит множественные сравнения!

Сравнение групповых средних это одна из немногих задач, где удалось справиться с этой проблемой.

Суть задачи состоит в отборе значимых различий множества пар групп, определяемых переменной группирования. Сравнение пары средних мы научились делать с помощью процедуры T-TEST и, казалось бы, можно, задавшись уровнем значимости, пропустить через этот тест все пары групп и отобрать различающиеся по за данному уровню. Однако, перебирая группы, мы перебираем множество случайных чисел, и, благодаря этому, можем наткнуться на значимое отличие с гораздо большей вероятностью, чем при рассмотрении одной пары групп. В частности, если группы независимы и не связаны с тестируемой переменной, при 10 сравнениях по уровню значимости 0.05 мы с вероятностью 1-(1-0.05)10=0.4 случайно получим хотя бы одно "значимое" различие.

Для пояснения механизма работы тестов множественных сравнений остановимся на 3-х из 20 тестах, реализованных в SPSS.

Согласно методу Бонферрони, в случае множественных сравнений назначается более строгий уровень значимости для попарных сравнений. Он определяется так: задается уровень значимости для множественных сравнений a m и в качестве попарного уровня значимости берется a =(1/k)a m., где k - число сравнений. Пусть Ai - событие, состоящее в том, что мы в i -том сравнении выявили существенное отличие средних, когда средние совпадают, тогда, в соответствии с заданным уровнем значимости, P{Ai}<a. Ясно, что P{A1+A2+…+Ak}≤P{A1}+P{A2}+…+P{Ak}<ka =a m, поэтому метод Бонферрони гарантирует нас от ошибки с вероятностью, не меньшей a m. В независимых сравнениях неравенство P{A1+A2+…+Ak}<ka, будет выполняться почти точно, так как 1-(1-a)k» ka. Критерий несколько жестче, чем необходимо, так как средние в группах связаны - их взвешенная сумма равна общему среднему.

Метод Шеффе построен на контрастах. С его помощью проверяется гипотеза равенства нулю сразу всех контрастов, не только тех, что сравнивают пары групп. В результате он часто оказывается еще строже, чем критерий Бонферрони.

Таблица 4.10. Oneway, сравнение среднего промедианного логарифма доходов.

  N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Minimum Maximum
Lower Bound Upper Bound
1.00 Высшее   0.048 0.511 0.032 -0.016 0.111 -1.050 2.015
2.00 н/высш   -0.248 0.606 0.100 -0.450 -0.046 -1.386 1.099
3.00 ср спец   0.009 0.479 0.032 -0.055 0.073 -1.386 1.740
4.00 среднее   -0.093 0.619 0.054 -0.200 0.015 -2.254 1.504
5.00 ниже сред.   -0.107 0.530 0.092 -0.295 0.081 -0.916 1.099
Total   -0.016 0.534 0.021 -0.057 0.024 -2.254 2.015

Таблица 4.11. Oneway, проверка однородности дисперсий

Levene Statistic df1 df2 Sig.
2.282     0.059

Таблица 4.12. Oneway, обычный дисперсионный анализ

  Sum of Squares df Mean Square F Sig.
Between Groups 4.187   1.047 3.724 0.005
Within Groups 187.202   0.281    
Total 191.389        

Таблица 4.13. Oneway, группы неразличимых средних

  W10 образование      
Tukey HSD 2.00 н/высш   -0.248  
  5.00 ниже среднего   -0.107 -0.107
  4.00 среднее   -0.093 -0.093
  3.00 ср спец     0.009
  1.00 Высшее     0.048
  Sig.   0.429 0.436
Scheffe 2.00 н/высш   -0.248  
  5.00 ниже среднего   -0.107 -0.107
  4.00 среднее   -0.093 -0.093
  3.00 ср спец   0.009 0.009
  1.00 Высшее     0.048
  Sig.   0.093 0.579

Критерий Тьюки основан на одновременных доверительных интервалах разности матожиданий в группах. Этот критерий из трех рассматриваемых, пожалуй, наиболее разумен. Предположение об одновременном равенстве разностей всех групповых матожиданий - слишком сильное предположение, в критерии Тьюки такого не предполагается.

Таблица 4.14. Oneway, множественные попарные сравнения

      Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval
  (I) W10 образование (J) W10 образование       Lower Bound Upper Bound
Tukey HSD 1.00 Высшее 2.00 н/высш 0.296* 0.093 0.013 0.041 0.551
    3.00 ср спец 0.039 0.049 0.934 -0.095 0.172
    4.00 среднее 0.140 0.057 0.102 -0.016 0.297
    5.00 ниже среднего 0.154 0.098 0.516 -0.113 0.422
  2.00 н/высш 1.00 Высшее -0.296* 0.093 0.013 -0.551 -0.041
    3.00 ср спец -0.257 0.094 0.050 -0.514 0.000
    4.00 среднее -0.155 0.099 0.515 -0.425 0.114
    5.00 ниже среднего -0.142 0.127 0.799 -0.488 0.205
  3.00 ср спец 1.00 Высшее -0.039 0.049 0.934 -0.172 0.095
    2.00 н/высш 0.257 0.094 0.050 0.000 0.514
    4.00 среднее 0.102 0.059 0.412 -0.058 0.262
    5.00 ниже среднего 0.116 0.099 0.769 -0.154 0.386
  4.00 среднее 1.00 Высшее -0.140 0.057 0.102 -0.297 0.016
    2.00 н/высш 0.155 0.099 0.515 -0.114 0.425
    3.00 ср спец -0.102 0.059 0.412 -0.262 0.058
    5.00 ниже среднего 0.014 0.103 1.000 -0.268 0.296
  5.00 ниже среднего 1.00 Высшее -0.154 0.098 0.516 -0.422 0.113
    2.00 н/высш 0.142 0.127 0.799 -0.205 0.488
    3.00 ср спец -0.116 0.099 0.769 -0.386 0.154
    4.00 среднее -0.014 0.103 1.000 -0.296 0.268

В качестве примера рассмотрим различие среднего промедианного логарифма доходов в группах по образованию, группы которого несколько укрупнены:

recode v10 (4 5 =4) (6 7 8=5) (else=copy) into w10.

var lab w10 "образование".

value lab w10 1 "Высшее" 2 "н/высш" 3 "ср. спец" 4 "среднее" 5 "ниже среднего".

ONEWAY lnv14m BY w10 /STATISTICS DESCRIPTIVES HOMOGENEITY /POSTHOC = BTUKEY SCHEFFE BONFERRONI ALPHA(.05).

На основании полученной выдачи видим, что:

  • доверительные интервалы для высшего и неполного высшего образования не пересекаются (см. табл.4.10);
  • дисперсии в группах различаются не существенно (см. тест Ливиня, табл.4.11);
  • в целом наблюдается связь душевого дохода с образованием (гипотеза о равенстве средних - отвергается, см. таблицу 4.12);
  • выделились следующие две группы по образованию с неразличимыми средними: 2 н/высшее, 5 ниже среднего, 4 среднее и 5 ниже среднего, 4 среднее, 3 среднее спец, 1 высшее (табл.4.13);
  • попарные множественные сравнения показали, что единственная пара отличающихся по средним групп - это группы с неполным высшим и респондентов с высшим образованием (наблюдаемая значимость - 0.013, таблица 4.14).

Следует заметить, что мы не показали здесь часть таблицы попарных сравнений с результатами для метода Бонферрони и Шеффе; результаты аналогичны, но для указанной пары групп значимость различия по Шеффе - 0.041, по Бонферрони - 0.016. Это показывает большую чуствительность теста Тьюки.




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 691; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.