КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Вероятностная диагностика по методу Байеса
Получение сводных таблиц. Часто удобно представлять итоговые данные, получаемые по запросу, сгруппированными сразу по нескольким полям, например, по заболеванию и по лечащему врачу. Такие итоги отображаются в виде таблицы, называемой сводной таблицей, а процесс получения таких таблиц называется кросс-табуляцией. По сводной таблице сразу видно, сколько, например, у каждого лечащего врача было больных по каждому виду заболевания, как эти больные распределялись по возрасту, срокам лечения и т.п.. · Для получения сводной таблицы установите указатель в первой строке базы данных и выполните команду <Данные> <Сводная таблица>, в результате на экран будет выведено окно «Мастер сводных таблиц». На 1 шаге должна быть выбрана установка «Создать таблицу на основе данных, находящихся в списке или базе данных Microsoft Excel» Нажмите кнопку [Далее]. На 2 шаге «Мастер сводных таблиц» автоматически определяет диапазон как Базу_данных. Нажмите кнопку [Далее]. На 3 шаге: - перетащите мышью кнопку [Пол] в область «Столбец» сводной таблицы, - перетащите мышью кнопку [Заболевание] в область «Строка» сводной таблицы, - перетащите мышью кнопку [К-Д] в область «Данные» сводной таблицы, там будет показано, что вычисляется Количество значений по полю К-Д. Если там указано другое действие, то установите указатель мыши на кнопку [К-Д] и дважды щелкните правой кнопкой мыши. В открывшемся окне «Вычисление поля сводной таблицы» установите операцию «Кол-во значений». - перетащите мышью кнопку поля [Лечащий врач] в область «Страница» сводной таблицы Нажмите кнопку [Далее]. На 4 шаге укажите «Поместить таблицу в новый лист». Нажмите кнопку [Параметры], выключите значок «Автоформат» (это делает таблицу более компактной по размерам), нажмите [ОК]. Нажмите кнопку [Готово], на новом листе отображается сформированная по вашему запросу таблица. (Одновременно появляется кнопочная панель для преобразований таблицы, если эта панель не появилась, то ее можно включить через меню <Вид> <Панели инструментов> <Сводные таблицы>). Таблица показывает распределение больных с разными заболеваниями по полу для всех врачей. С помощью указателя [Лечащий врач] выделите врача Лаута. Чтобы таблица полностью помещалась на экране и ее можно было бы легко просмотреть, можно через меню < Масштаб >, установить меньший масштаб отображения выводимой на экран информации (например 75%). Для этого же можно отрегулировать и ширину столбцов. . Определите, сколько мужчин и женщин с глаукомой лечилось у врача Лаута. Можно узнать, кто же были конкретно эти больные, для этого надо сделать двойной щелчок на клетке, в которой указано количество данных больных. Информация о больных будет выведена на отдельном листе. Переключитесь обратно на лист EXC_OFT. В сводной таблице можно получать различные показатели. Установите указатель мыши в центр сводной таблицы и щелкните правой клавишей мыши. В появившемся меню выберите команду < Поле>, затем в окне «Вычисление поля сводной таблицы» укажите операцию «Среднее » и нажмите [ОК]. В таблице появятся данные о средней длительности лечения больных разного пола с разными диагнозами. Аналогичным образом определите максимальные и минимальные сроки лечения. Вернетесь в окне «Вычисление поля сводной таблицы » опять к операции «Количество значений по полю К-Д и с помощью опции «Дополнительно» вычислите долю по строке. В таблице отобразится процентное распределение больных с разными диагнозами по полу. C помощью опции «Дополнительно» вычислите долю по столбцу. После вычисления доли по столбцу, будет получено распределение больных разного пола по диагнозам. · Сводную таблицу можно укрупнять, объединяя столбцы или строки. Выполните объединение всех заболеваний, кроме глаукомы, в одну группу под названием «Другие заболевания». Для этого: · Установите указатель врачей в положение «Все»; - выделите мышью клетки А6…А11 с названиями всех заболеваний, кроме глаукомы; - щелкните правой клавищей мышки по выделенному фрагменту сводной таблицы, активизируйте [Группа и структура], затем [Группировать]; - в клетку с названием «Группа 1» введите название «Другие заболевания»; - Клетку с названием «Заболевания» удалите из таблицы. Для этого установите указатель мыши на клетку «Заболевания» и, нажав клавишу мыши, выведите клетку за пределы сводной таблицы.
9. Критерий согласия хи-квадрат и критерий сопряженности (ассоциации Q). Рассматривая полученную таблицу, можно заметить, что глаукома относительно чаще встречалась среди мужчин, чем среди женщин. Другие заболевания - наоборот. На основании этих данных можно выдвинуть гипотезу о связи частоты встречаемости отдельных заболеваний и пола данных больных. Эта гипотеза может быть проверена с помощью специальных статистических критериев. В данном случае, можно применить критерий согласия хи-квадрат. Для вычисления значения критерия хи-квадрат в четырехпольной таблице, которая получилась в результате проведенных преобразований (В окне Вычисление поля сводной таблицы должна быть установленаоперация «Количество значений по полю возраст», т.к. критерий хи-квадрат вычисляется только на абсолютных данных!): В ячейку А10 введите текст: Критерий хи-квадрат. В ячейку В10 формулу: ==((B5*C6-B6*C5)^2*D7)/(B7*C7*D6*D5) В ячейку А11 введите текст: Значимость критерия хи квадрат, а в ячейку В11 формулу: ==ХИ2РАСП(B10;1) Итак, если значимость критерия больше 0,05, то необходимо принять нулевую гипотезу: все различия в распределении частот диагнозов статистически несущественны и могут быть объяснены действием случайных факторов. Если значимость критерия меньше 0,05, то нулевая гипотеза отвергается и следует принять утверждение, что распределение заболеваний зависит от пола. Самостоятельно попробуйте проверить это утверждение для больных, лечившихся у разных врачей. Примечание: Напрактике вычисление критерия хи-квадрат возможно только в случаях, когда число наблюдений в отдельно взятых клетках таблицы не менее 5, а общее число наблюдений в таблице приближается к 100. С помощью специальных статистических критериев, опираясь на табличные данные, можно установить не только факт наличия или отсутствия взаимосвязи (сопряженности) отдельных статистических признаков (факторов), но и оценить силу этой связи. Для этого в четырехпольной таблице можно использовать коэффициент ассоциации Юла Q. Для его расчета в ячейке А12 наберите формулу: =(B5*C6-B6*C5)/(B5*C6+B6*C5) Оценивается коэффициент ассоциации Юла Q в следующих пределах: от 0 до 0,5 связь слабая. Более 0,5 – связь сильная. В данном примере связь очень слабая, к тому же статистически не достоверная.
Накапливая информацию о больных в базах данных, в частности фиксируя в них наблюдаемые симптомы заболеваний и верифицированные диагнозы, затем на основе сводных таблиц можно получить так называемые диагностические таблицы, содержащие условные вероятности появления тех или иных симптомов у больных с разными видами заболеваний. Упрощенный пример такой диагностической таблицы и реализованной на ее основе диагностической процедуры по вероятностной стратегии Байеса содержится в файле с именем BAJES, хранящемся в папке "Мои документы". Откройте этот файл в программе Microsoft Excel и переключитесь на лист с названием «Диагностическая таблица». · В таблице рассматривается 4 диагноза и 20 бинарных симптомов (то есть симптомы могут иметь только два значения -да или нет). Основная часть таблицы содержит условные вероятности симптомов, показывающие как часто встречается тот или иной при симптом при каждом из заболеваний. Например, боли в грудной клетке наблюдались в 90% случаев инфаркта миокарда и лишь в 5% случаев перитонита. Кроме того, в таблице имеются априорные вероятности симптомов, показывающие как часто встречаются симптомы в общем, во всей совокупности больных со всеми рассматриваемыми диагнозами. Априорные вероятности диагнозов приняты одинаковыми. · Чем выше условная вероятность симптома по сравнению с его априорной вероятностью, тем больше информации дает данный симптом о соответствующем диагнозе. Например, рассчитайте, какое количество информации дает симптом Угнетение рефлексов относительно диагноза Тромбоэмболия легочной артерии. Количество информации (в битах) рассчитывается как двоичный алгоритм отношения условной и априорной вероятности). Поэтому введите в клетку H17 формулу: =LOG(E17/F17;2) Полученная величина информативности достаточно высока, она показывает, что условная вероятность почти в 4 раза превышает априорную вероятность, то есть, что данный симптом встречается при данном заболевании почти в 4 раза чаще, чем в среднем у всех больных. Рассчитайте самостоятельно в клетке H14 информативность симптома «Общая заторможенность» относительно диагноза «Перитонит», зафиксируйте результат в рабочей тетради. · Для выполнения диагностической процедуры переключитесь на лист Пациент. Пользуясь диагностической таблицей, промоделируйте по очереди все четыре диагноза, как бы имея перед собой больного с одним из указанных заболеваний. Для этого в клетки В4…В23 вводите цифру 1, если наличие соответствующего симптома весьма вероятно при данном заболевании, или цифру 0 - если проявление симптома при данном заболевании маловероятно. Например, представьте, что у больного предполагается инфаркт миокарда. Обратите внимание, как изменяются вероятности диагнозов (в ячейках C3…F3) по мере формирования набора симптомов. · Подберите для каждого из 4 диагнозов набор симптомов, дающий максимальную вероятность диагноза по сравнению с остальными. Зафиксируйте эти характерные симптомокомплексы и соответствующие вероятности диагнозов в рабочих тетрадях.
Дата добавления: 2015-05-10; Просмотров: 1166; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |