КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Медицины и обучение ее основам 3 страница
сить для нескольких переменных одновременно. В данном случае ин- терпретация величины р не будет ничем отличаться от обычной. ОДНОВРЕМЕННАЯ ПРОВЕРКА МНОЖЕСТВА ГИПОТЕЗ Долгое время студенты университетов были объектами для проведе- Ия Различных экспериментов. Следуя традиции, для нашего следую- щего гипотетического исследования мы выбрали студентов-медиков. Представьте себе медицинский институт и двух преподавателей, чи- тающих вводный курс медицинской статистики. Один из них пользуется большей популярностью среди учащихся. Декан факультета не может ни- кем заменить менее популярного преподавателя. Тогда, стараясь действо- вать справедливо, он решает провести рандомизированное распределение 200 студентов 1 -го курса по группам; в этом случае у каждого студента будут равные шансы (50%) попасть к тому или иному преподавателю. Преподаватели использовали это решение для того, чтобы наглядно объяснить студентам некоторые важные принципы медицинской ста- тистики. Они задали вопрос: ≪Имеются ли различия в характеристиках студентов двух групп, которые нельзя объяснить влиянием случайных факторов?≫ Из оцениваемых характеристик были выбраны пол, цвет глаз, рост, средний балл, полученный в последний год обучения в колледже, социально-экономический статус и любимая музыка. Для каждого срав- нения была сформулирована своя нулевая гипотеза. Например, для ана- лиза групп по половой принадлежности она звучала так: студентов от- бирали с одного курса, поэтому число девушек в двух сформированных группах должно быть одинаковым. Поскольку студентов отбирали из одной популяции и распределяли по группам рандомизированно, при
всех сравнениях нулевая гипотеза истинна, а во всех случаях, когда она отвергнута, результат будет недостоверным. Преподаватели определили необходимые характеристики у каждого из студентов. Было установлено, что группы не различаются по распре- делению 5 из этих характеристик (во всех случаях при оценке сущест- вующих различий р>0,10), однако в одной группе глаза были голубыми у 25 из 100, а в другой —у 38 из 100 студентов. Формальный статистиче- ский анализ показал, что в том случае, если нулевая гипотеза верна (а она верна), вероятность обнаружения аналогичных или более выражен- ных различий между группами по доле лиц с голубыми глазами чуть мень- ше 0,05. Используя традиционную точку разделения (р<0,05), препода- ватели вынуждены были отказаться от нулевой гипотезы. Насколько вероятен тот факт, что при проверке 6 независимых гипо- тез в 2 группах студентов хотя бы в 1 случае различия окажутся статисти- чески значимыми в силу влияния случайных факторов? Под независи- мыми гипотезами мы подразумеваем, что данные, полученные при про- верке одной из них, не влияли на результаты проверки других. Если ве- роятность получения статистически значимых результатов составляет 0,05, то вероятность получения статистически незначимых результатов равна 1 —0,05 = 0,95. При одновременной проверке 2 гипотез вероят- ность получения статистически незначимых результатов равна 0,95 х 0,95 лли 0,952, а при проверке 6 гипотез —0,956 (т.е. 74%). Таким образом, веро- ятность получения, по меньшей мере, одного статистически значимого ре- зультата при одновременной проверке 6 независимых гипотез составляет jOO _ 74 = 26%; иными словами, он будет получен в 1 случае из 4, а не из 20. Если мы хотим сохранить общую границу статистически значимых и не- значимых данных, равную 0,05, для каждого из 6 сравнений пороговую ве- личину р следует разделить на 6; таким образом, она составит 0,008.
Приведенный пример имеет двоякий смысл. Во-первых, редкие ис- ходы иногда оказываются случайными. Даже при анализе одной гипо- тезы результат, соответствующий р=0,01, будет получен в 1% наблюде- ний. Во-вторых, не следует проверять одновременно несколько гипо- тез, так как полученные при этом результаты могут оказаться ошибоч- ными. В научной литературе имеется множество примеров данного фе- номена. Так, анализируя результаты 45 испытаний, отчеты о которых были опубликованы в 3 ведущих медицинских журналах, S.J. Pocock et al. обнаружили, что в каждом исследовании применялись в среднем 6 критериев оценки, причем при проведении большинства сравнений оце- нивалась статистическая значимость различий [2]. В качестве примера, убедительно иллюстрирующего опасность одно- временного проведения нескольких сравнений, можно привести РКИ, в котором оценивалось влияние реабилитационных мероприятий на качество жизни больных после инфаркта миокарда. Участников рандо- мизированно включали в группы стандартной терапии, лечебной физ- культуры и медицинских консультаций. Все больные сообщали инфор- мацию о своей работе, досуге, сексуальной активности, удовлетворен- ности своим состоянием, соблюдении рекомендаций врача, качестве досуга и работы, психологическом состоянии, симптомах сердечно-со- судистых заболеваний и общем состоянии здоровья [4]. Три группы были сравнимы практически по всем показателям, однако после 18 мес на- блюдения удовлетворенность своим состоянием у больных из группы лечебной физкультуры была выше; необходимость в помощи членов се- мьи, посвящаемое работе время и частота половых актов в группе про- ведения консультаций была ниже, чем в двух других группах. Означает ли это, что программы лечебной физкультуры и консультаций необхо- димо внедрять из-за того положительного (хотя и незначительного) влия- ния, которые они оказывают на самочувствие больных, или, напротив, от них следует отказаться, так как по большей части клинические исхо- ды между группами не различались? Сами исследователи пришли к вы- воду, что предложенные ими программы реабилитации не повышают качества жизни больных. Однако их оппоненты могут возразить, что,
если они улучшают хотя бы некоторые клинические исходы, их приме- нение имеет смысл. Очевидно, что использование многочисленных кри- териев оценки способствует возникновению подобных споров. Существует ряд статистических методов, позволяющих одновременно проверять несколько гипотез. Один из них бьш продемонстрирован выше: величину р разделили на число тестов. Можно также выбрать до начала ис- следования один основной критерий оценки, который и будет определять окончательные выводы. Кроме того, существуют статистические методы (например, обобщение величины эффекта), позволяющие объединять раз- личные клинические исходы в один комбинированный критерий оценки. Более детальное обсуждение статистических методов, которые применя- ются в исследованиях с множественными критериями оценки, в данной книге не приводится. Однако те, кто заинтересовался данной проблемой, смогут найти необходимую информацию в других источниках [5]. ПРОБЛЕМЫ, С КОТОРЫМИ ПРИХОДИТСЯ СТАЛКИВАТЬСЯ ПРИ ПРОВЕРКЕ ГИПОТЕЗ Несомненно, что у некоторых врачей возник ряд вопросов, которые остались непонятыми. Почему, например, нужно использовать единст- венную точку разделения, когда ее выбор осуществляется произвольно? Почему на вопрос об эффективности лечения следует отвечать однознач- но —да или нет, когда можно рассматривать этот критерий оценки как непрерывную переменную (от ≪эффективность маловероятна≫ до ≪эф- фективность практически не вызывает сомнения≫)? Врачи, у которых возникли подобные вопросы, стоят на правильном пути. В главе 3 Лечение и понимание результатов исследования: довери- тельные интервалы дается объяснение, почему альтернативные подходы к анализу данных имеют преимущества перед проверкой гипотезы. Литература 1. Conn J.N, Johnson G., Ziesche S., et al. A comparison of enalapril with hydralazine-isosorbide dinitrate in the treatment of chronic congestive heart failure. N Engl J Med 1991;325:303—10. 2. DetskyA.S., Sackett D.L. When was a "negative" trial big enough? How many patients you needed depends on what you found. Arch Intern Med 1985; 145:709—715.
Дата добавления: 2015-04-24; Просмотров: 297; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |