Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Вероятностная диагностика по методу Байеса




Получение сводных таблиц.

Часто удобно представлять итоговые данные, получаемые по запросу, сгруппированными сразу по нескольким полям, например, по заболеванию и по лечащему врачу. Такие итоги отображаются в виде таблицы, называемой сводной таблицей, а процесс получения таких таблиц называется кросс-табуляцией. По сводной таблице сразу видно, сколько, например, у каждого лечащего врача было больных по каждому виду заболевания, как эти больные распределялись по возрасту, срокам лечения и т.п..

· Для получения сводной таблицы установите указатель в первой строке базы данных и выполните команду <Данные> <Сводная таблица>, в результате на экран будет выведено окно «Мастер сводных таблиц».

На 1 шаге должна быть выбрана установка «Создать таблицу на основе данных, находящихся в списке или базе данных Microsoft Excel» Нажмите кнопку [Далее].

На 2 шаге «Мастер сводных таблиц» автоматически определяет диапазон как Базу_данных. Нажмите кнопку [Далее].

На 3 шаге:

- перетащите мышью кнопку [Пол] в область «Столбец» сводной таблицы,

- перетащите мышью кнопку [Заболевание] в область «Строка» сводной таблицы,

- перетащите мышью кнопку [К-Д] в область «Данные» сводной таблицы, там будет показано, что вычисляется Количество значений по полю К-Д. Если там указано другое действие, то установите указатель мыши на кнопку [К-Д] и дважды щелкните правой кнопкой мыши. В открывшемся окне «Вычисление поля сводной таблицы» установите операцию «Кол-во значений».

- перетащите мышью кнопку поля [Лечащий врач] в область «Страница» сводной таблицы

Нажмите кнопку [Далее].

На 4 шаге укажите «Поместить таблицу в новый лист». Нажмите кнопку [Параметры], выключите значок «Автоформат» (это делает таблицу более компактной по размерам), нажмите [ОК].

Нажмите кнопку [Готово], на новом листе отображается сформированная по вашему запросу таблица. (Одновременно появляется кнопочная панель для преобразований таблицы, если эта панель не появилась, то ее можно включить через меню <Вид> <Панели инструментов> <Сводные таблицы>). Таблица показывает распределение больных с разными заболеваниями по полу для всех врачей. С помощью указателя [Лечащий врач] выделите врача Лаута.

Чтобы таблица полностью помещалась на экране и ее можно было бы легко просмотреть, можно через меню < Масштаб >, установить меньший масштаб отображения выводимой на экран информации (например 75%). Для этого же можно отрегулировать и ширину столбцов.

.

Определите, сколько мужчин и женщин с глаукомой лечилось у врача Лаута. Можно узнать, кто же были конкретно эти больные, для этого надо сделать двойной щелчок на клетке, в которой указано количество данных больных. Информация о больных будет выведена на отдельном листе. Переключитесь обратно на лист EXC_OFT.

В сводной таблице можно получать различные показатели. Установите указатель мыши в центр сводной таблицы и щелкните правой клавишей мыши. В появившемся меню выберите команду < Поле>, затем в окне «Вычисление поля сводной таблицы» укажите операцию «Среднее » и нажмите [ОК]. В таблице появятся данные о средней длительности лечения больных разного пола с разными диагнозами. Аналогичным образом определите максимальные и минимальные сроки лечения.

Вернетесь в окне «Вычисление поля сводной таблицы » опять к операции «Количество значений по полю К-Д и с помощью опции «Дополнительно» вычислите долю по строке. В таблице отобразится процентное распределение больных с разными диагнозами по полу. C помощью опции «Дополнительно» вычислите долю по столбцу. После вычисления доли по столбцу, будет получено распределение больных разного пола по диагнозам.

· Сводную таблицу можно укрупнять, объединяя столбцы или строки. Выполните объединение всех заболеваний, кроме глаукомы, в одну группу под названием «Другие заболевания». Для этого:

· Установите указатель врачей в положение «Все»;

- выделите мышью клетки А6…А11 с названиями всех заболеваний, кроме глаукомы;

- щелкните правой клавищей мышки по выделенному фрагменту сводной таблицы, активизируйте [Группа и структура], затем [Группировать];

- в клетку с названием «Группа 1» введите название «Другие заболевания»;

- Клетку с названием «Заболевания» удалите из таблицы. Для этого установите указатель мыши на клетку «Заболевания» и, нажав клавишу мыши, выведите клетку за пределы сводной таблицы.

 

9. Критерий согласия хи-квадрат и критерий сопряженности (ассоциации Q).

Рассматривая полученную таблицу, можно заметить, что глаукома относительно чаще встречалась среди мужчин, чем среди женщин. Другие заболевания - наоборот. На основании этих данных можно выдвинуть гипотезу о связи частоты встречаемости отдельных заболеваний и пола данных больных. Эта гипотеза может быть проверена с помощью специальных статистических критериев. В данном случае, можно применить критерий согласия хи-квадрат.

Для вычисления значения критерия хи-квадрат в четырехпольной таблице, которая получилась в результате проведенных преобразований (В окне Вычисление поля сводной таблицы должна быть установленаоперация «Количество значений по полю возраст», т.к. критерий хи-квадрат вычисляется только на абсолютных данных!):

В ячейку А10 введите текст: Критерий хи-квадрат. В ячейку В10 формулу:

==((B5*C6-B6*C5)^2*D7)/(B7*C7*D6*D5)

В ячейку А11 введите текст: Значимость критерия хи квадрат, а в ячейку В11 формулу:

==ХИ2РАСП(B10;1)

Итак, если значимость критерия больше 0,05, то необходимо принять нулевую гипотезу: все различия в распределении частот диагнозов статистически несущественны и могут быть объяснены действием случайных факторов. Если значимость критерия меньше 0,05, то нулевая гипотеза отвергается и следует принять утверждение, что распределение заболеваний зависит от пола.

Самостоятельно попробуйте проверить это утверждение для больных, лечившихся у разных врачей.

Примечание: Напрактике вычисление критерия хи-квадрат возможно только в случаях, когда число наблюдений в отдельно взятых клетках таблицы не менее 5, а общее число наблюдений в таблице приближается к 100.

С помощью специальных статистических критериев, опираясь на табличные данные, можно установить не только факт наличия или отсутствия взаимосвязи (сопряженности) отдельных статистических признаков (факторов), но и оценить силу этой связи. Для этого в четырехпольной таблице можно использовать коэффициент ассоциации Юла Q. Для его расчета в ячейке А12 наберите формулу:

=(B5*C6-B6*C5)/(B5*C6+B6*C5)

Оценивается коэффициент ассоциации Юла Q в следующих пределах: от 0 до 0,5 связь слабая. Более 0,5 – связь сильная. В данном примере связь очень слабая, к тому же статистически не достоверная.

 

Накапливая информацию о больных в базах данных, в частности фиксируя в них наблюдаемые симптомы заболеваний и верифицированные диагнозы, затем на основе сводных таблиц можно получить так называемые диагностические таблицы, содержащие условные вероятности появления тех или иных симптомов у больных с разными видами заболеваний. Упрощенный пример такой диагностической таблицы и реализованной на ее основе диагностической процедуры по вероятностной стратегии Байеса содержится в файле с именем BAJES, хранящемся в папке "Мои документы".

Откройте этот файл в программе Microsoft Excel и переключитесь на лист с названием «Диагностическая таблица».

· В таблице рассматривается 4 диагноза и 20 бинарных симптомов (то есть симптомы могут иметь только два значения -да или нет). Основная часть таблицы содержит условные вероятности симптомов, показывающие как часто встречается тот или иной при симптом при каждом из заболеваний. Например, боли в грудной клетке наблюдались в 90% случаев инфаркта миокарда и лишь в 5% случаев перитонита.

Кроме того, в таблице имеются априорные вероятности симптомов, показывающие как часто встречаются симптомы в общем, во всей совокупности больных со всеми рассматриваемыми диагнозами. Априорные вероятности диагнозов приняты одинаковыми.

· Чем выше условная вероятность симптома по сравнению с его априорной вероятностью, тем больше информации дает данный симптом о соответствующем диагнозе.

Например, рассчитайте, какое количество информации дает симптом Угнетение рефлексов относительно диагноза Тромбоэмболия легочной артерии. Количество информации (в битах) рассчитывается как двоичный алгоритм отношения условной и априорной вероятности). Поэтому введите в клетку H17 формулу: =LOG(E17/F17;2) Полученная величина информативности достаточно высока, она показывает, что условная вероятность почти в 4 раза превышает априорную вероятность, то есть, что данный симптом встречается при данном заболевании почти в 4 раза чаще, чем в среднем у всех больных.

Рассчитайте самостоятельно в клетке H14 информативность симптома «Общая заторможенность» относительно диагноза «Перитонит», зафиксируйте результат в рабочей тетради.

· Для выполнения диагностической процедуры переключитесь на лист Пациент.

Пользуясь диагностической таблицей, промоделируйте по оче­реди все четыре диагноза, как бы имея перед собой больного с одним из указанных заболеваний. Для этого в клетки В4…В23 вводите цифру 1, если наличие соответствующего симптома весьма вероятно при данном заболевании, или цифру 0 - если про­явление симптома при данном заболевании маловероятно. Например, представьте, что у больного предполагается инфаркт миокарда. Обратите внимание, как изменяются вероятности диагнозов (в ячейках C3…F3) по мере формирования набора симптомов.

· Подберите для каждого из 4 диагнозов набор симптомов, дающий максимальную вероятность диагноза по сравнению с остальными. Зафиксируйте эти характерные симптомокомплексы и соответствующие вероятности диагнозов в рабочих тетрадях.




Поделиться с друзьями:


Дата добавления: 2015-05-10; Просмотров: 1148; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.017 сек.