Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Медицины и обучение ее основам 3 страница




сить для нескольких переменных одновременно. В данном случае ин-

терпретация величины р не будет ничем отличаться от обычной.

ОДНОВРЕМЕННАЯ ПРОВЕРКА МНОЖЕСТВА ГИПОТЕЗ

Долгое время студенты университетов были объектами для проведе-

Ия Различных экспериментов. Следуя традиции, для нашего следую-

щего гипотетического исследования мы выбрали студентов-медиков.

Представьте себе медицинский институт и двух преподавателей, чи-

тающих вводный курс медицинской статистики. Один из них пользуется

большей популярностью среди учащихся. Декан факультета не может ни-

кем заменить менее популярного преподавателя. Тогда, стараясь действо-

вать справедливо, он решает провести рандомизированное распределение

200 студентов 1 -го курса по группам; в этом случае у каждого студента будут

равные шансы (50%) попасть к тому или иному преподавателю.

Преподаватели использовали это решение для того, чтобы наглядно

объяснить студентам некоторые важные принципы медицинской ста-

тистики. Они задали вопрос: ≪Имеются ли различия в характеристиках

студентов двух групп, которые нельзя объяснить влиянием случайных

факторов?≫ Из оцениваемых характеристик были выбраны пол, цвет глаз,

рост, средний балл, полученный в последний год обучения в колледже,

социально-экономический статус и любимая музыка. Для каждого срав-

нения была сформулирована своя нулевая гипотеза. Например, для ана-

лиза групп по половой принадлежности она звучала так: студентов от-

бирали с одного курса, поэтому число девушек в двух сформированных

группах должно быть одинаковым. Поскольку студентов отбирали из

одной популяции и распределяли по группам рандомизированно, при

всех сравнениях нулевая гипотеза истинна, а во всех случаях, когда она

отвергнута, результат будет недостоверным.

Преподаватели определили необходимые характеристики у каждого

из студентов. Было установлено, что группы не различаются по распре-

делению 5 из этих характеристик (во всех случаях при оценке сущест-

вующих различий р>0,10), однако в одной группе глаза были голубыми

у 25 из 100, а в другой —у 38 из 100 студентов. Формальный статистиче-

ский анализ показал, что в том случае, если нулевая гипотеза верна (а

она верна), вероятность обнаружения аналогичных или более выражен-

ных различий между группами по доле лиц с голубыми глазами чуть мень-

ше 0,05. Используя традиционную точку разделения (р<0,05), препода-

ватели вынуждены были отказаться от нулевой гипотезы.

Насколько вероятен тот факт, что при проверке 6 независимых гипо-

тез в 2 группах студентов хотя бы в 1 случае различия окажутся статисти-

чески значимыми в силу влияния случайных факторов? Под независи-

мыми гипотезами мы подразумеваем, что данные, полученные при про-

верке одной из них, не влияли на результаты проверки других. Если ве-

роятность получения статистически значимых результатов составляет

0,05, то вероятность получения статистически незначимых результатов

равна 1 —0,05 = 0,95. При одновременной проверке 2 гипотез вероят-

ность получения статистически незначимых результатов равна 0,95 х 0,95

лли 0,952, а при проверке 6 гипотез —0,956 (т.е. 74%). Таким образом, веро-

ятность получения, по меньшей мере, одного статистически значимого ре-

зультата при одновременной проверке 6 независимых гипотез составляет

jOO _ 74 = 26%; иными словами, он будет получен в 1 случае из 4, а не из 20.

Если мы хотим сохранить общую границу статистически значимых и не-

значимых данных, равную 0,05, для каждого из 6 сравнений пороговую ве-

личину р следует разделить на 6; таким образом, она составит 0,008.

Приведенный пример имеет двоякий смысл. Во-первых, редкие ис-

ходы иногда оказываются случайными. Даже при анализе одной гипо-

тезы результат, соответствующий р=0,01, будет получен в 1% наблюде-

ний. Во-вторых, не следует проверять одновременно несколько гипо-

тез, так как полученные при этом результаты могут оказаться ошибоч-

ными. В научной литературе имеется множество примеров данного фе-

номена. Так, анализируя результаты 45 испытаний, отчеты о которых

были опубликованы в 3 ведущих медицинских журналах, S.J. Pocock et

al. обнаружили, что в каждом исследовании применялись в среднем 6

критериев оценки, причем при проведении большинства сравнений оце-

нивалась статистическая значимость различий [2].

В качестве примера, убедительно иллюстрирующего опасность одно-

временного проведения нескольких сравнений, можно привести РКИ,

в котором оценивалось влияние реабилитационных мероприятий на

качество жизни больных после инфаркта миокарда. Участников рандо-

мизированно включали в группы стандартной терапии, лечебной физ-

культуры и медицинских консультаций. Все больные сообщали инфор-

мацию о своей работе, досуге, сексуальной активности, удовлетворен-

ности своим состоянием, соблюдении рекомендаций врача, качестве

досуга и работы, психологическом состоянии, симптомах сердечно-со-

судистых заболеваний и общем состоянии здоровья [4]. Три группы были

сравнимы практически по всем показателям, однако после 18 мес на-

блюдения удовлетворенность своим состоянием у больных из группы

лечебной физкультуры была выше; необходимость в помощи членов се-

мьи, посвящаемое работе время и частота половых актов в группе про-

ведения консультаций была ниже, чем в двух других группах. Означает

ли это, что программы лечебной физкультуры и консультаций необхо-

димо внедрять из-за того положительного (хотя и незначительного) влия-

ния, которые они оказывают на самочувствие больных, или, напротив,

от них следует отказаться, так как по большей части клинические исхо-

ды между группами не различались? Сами исследователи пришли к вы-

воду, что предложенные ими программы реабилитации не повышают

качества жизни больных. Однако их оппоненты могут возразить, что,

если они улучшают хотя бы некоторые клинические исходы, их приме-

нение имеет смысл. Очевидно, что использование многочисленных кри-

териев оценки способствует возникновению подобных споров.

Существует ряд статистических методов, позволяющих одновременно

проверять несколько гипотез. Один из них бьш продемонстрирован выше:

величину р разделили на число тестов. Можно также выбрать до начала ис-

следования один основной критерий оценки, который и будет определять

окончательные выводы. Кроме того, существуют статистические методы

(например, обобщение величины эффекта), позволяющие объединять раз-

личные клинические исходы в один комбинированный критерий оценки.

Более детальное обсуждение статистических методов, которые применя-

ются в исследованиях с множественными критериями оценки, в данной

книге не приводится. Однако те, кто заинтересовался данной проблемой,

смогут найти необходимую информацию в других источниках [5].

ПРОБЛЕМЫ, С КОТОРЫМИ ПРИХОДИТСЯ СТАЛКИВАТЬСЯ

ПРИ ПРОВЕРКЕ ГИПОТЕЗ

Несомненно, что у некоторых врачей возник ряд вопросов, которые

остались непонятыми. Почему, например, нужно использовать единст-

венную точку разделения, когда ее выбор осуществляется произвольно?

Почему на вопрос об эффективности лечения следует отвечать однознач-

но —да или нет, когда можно рассматривать этот критерий оценки как

непрерывную переменную (от ≪эффективность маловероятна≫ до ≪эф-

фективность практически не вызывает сомнения≫)?

Врачи, у которых возникли подобные вопросы, стоят на правильном

пути. В главе 3 Лечение и понимание результатов исследования: довери-

тельные интервалы дается объяснение, почему альтернативные подходы

к анализу данных имеют преимущества перед проверкой гипотезы.

Литература

1. Conn J.N, Johnson G., Ziesche S., et al. A comparison of enalapril with hydralazine-isosorbide dinitrate in

the treatment of chronic congestive heart failure. N Engl J Med 1991;325:303—10.

2. DetskyA.S., Sackett D.L. When was a "negative" trial big enough? How many patients you needed depends

on what you found. Arch Intern Med 1985; 145:709—715.




Поделиться с друзьями:


Дата добавления: 2015-04-24; Просмотров: 297; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.024 сек.