КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Решающие правила экспертов
Граничные элементы классификации Основные идеи метода экспертной классификации Формальная постановка задачи классификации Экспертные знания в задачах классификации с явными признаками Задачи классификации объектов, описываемых многими признаками, широко распространены на практике. Приведем примера. 1. Наиболее часто встречающаяся профессиональная задача г повседневной деятельности врача — диагностика заболевания о совокупности клинических и инструментальных признаков, Дописывающих состояние пациента. 2. Одна из распространенных задач в геологии — поиск месторождения полезных ископаемых. Сбор информации позволяет характеризовать различные районы по совокупности при-. знаков, в той или иной степени типичных для месторождений. По этим признакам определяют наиболее перспективные районы [8]. 3. Поиск причин неисправностей, поломок в сложной машине или механизме. Каждая поломка может быть описана совокупностью признаков. Именно по этим признакам инженер определяет тип неисправности [8]. Что же общего в деятельности инженера, геолога, врача? Это общее можно представить в формальном виде следующим образом. Имеются объекты, описываемые многими признаками. Необходимо отнести эти объекты к определенным классам решений. Наиболее важная характеристика таких задач принятия решений - их повторяемость: люди решают данные задачи многократно, вырабатывая навыки наиболее успешного, эффективного решения. Количество повторных решений различно для разных областей профессиональной деятельности. Врач повседневно решает задачи распознавания одного и того же объекта — признаков заболеваний в различных их сочетаниях. Задачи, связанные с выбором района для разработки, решает многократно и геолог. В отличие от врача и геолога инженер имеет дело с изменяющимися объектами (новые конструкции машин, механизмов). Общим в приведенных выше примерах является то, что имеется полный для конкретной профессиональной задачи набор признаков, их значений и классов решений. Признаки, значения которых характеризуют объект и позволяют отнести его к тому или иному классу, заданы так, что и их измерения могут, как правило, осуществляться либо другим человеком, либо прибором. Так, измерение-процента содержания в почве какого-то минерала определяется по желанию эксперта-геолога, но он не обязательно участвует в этих измерениях. Врач-эксперт определяет состав признаков, необходимых для диагностики определенного заболевания, но он использует данные электрокардиограммы или эхокардиограммы, снятых его помощником. Он может также давать советы по телефону либо по Интернету, используя описание пациента, данное другим врачом. Совсем по-иному обстоит дело у шахматистов. Первичным материалом является расположение фигур. Анализируя расположение фигур, шахматист характеризует его для себя оценками по ряду признаков, таких как, например, возможность развития атаки, угрозы королю и т.д. Здесь даже измерение значений признаков — искусство (умение) эксперта. Назовем задачами классификации с явно заданными признаками такие задачи, в которых искусство эксперта проявляется в основном в умении «увидеть» через заданную совокупность значений отдельных признаков целостный образ объекта. Задачи классификации с явными признаками широко распространены в человеческой практике. Далее речь будет идти только о таких задачах. Задача классификации с явными диагностическими признаками может быть сформулирована следующим образом [7]. - Дано: N — число диагностических признаков; Si - число упорядоченных и, как правило, вербальных оценок качества на шкале i-го диагностического признака; множество оценок на шкале i-го признака; Q - количество диагностических классов (Рi,Р2,...,,Рq), к которым могут принадлежать классифицируемые объекты. Декартово произведение А шкал признаков определяет множество всех гипотетически возможных- состояний, описываемых диагностическими признаками. Состояние аi принадлежащее А, описывается вектором (аi1, аi2,...,аiN), где j-м "компонентом является одно из значений на шкале i-го диагностического признака. Требуется: на основе знаний эксперта классифицировать все векторы ai, отнеся каждый из них к одному или нескольким классам решений. Особенностью данной постановки задачи является следующее. Предположим, что эксперт (врач, геолог, инженер) определил полный набор диагностических признаков, необходимых ему при решении задачи классификации. Этим задано полное пространство всех возможных состояний объекта исследования (больного, месторождения, механизма и т.д.). В приведенной выше постановке задачи впервые ставится целью построение полной классификации, т.е. классификации всех возможных состояний объекта исследования. В отличие от этого в других постановках речь обычно идет о выявлении какой-то части знаний [9]. Данная постановка задачи основана на предположении, что эксперт обладает полнотой знаний. Необходим подход, позволяющий их выявить. Для решения поставленной выше задачи были разработаны методы, основанные на идеях [7], рассмотренных далее. 11.1. Структуризация проблем Чтобы передать знания компьютеру, нужен общий язык, характеризующий конкретную предметную область. Удобен язык признаков (или характеристик), описывающих объект исследования. Таким объектом при построении баз медицинских знаний является больной, обратившийся к врачу с жалобами на боли. Признаки или характеристики в данном случае описывают состояние больного: локализация болей, их характер, иррадиация, частота пульса, артериальное давление, температура и т.д. Как определить перечень признаков, адекватно представляющий состояние объекта исследования? Для этой цели разработана человекомашинная процедура АРИАДНА [10], которая имитирует диалог по телефону между неопытным специалистом, находящимся рядом с объектом исследования и проводящим измерения, и экспертом, находящимся далеко от объёкта. Диалог строится таким образом, что компьютер задает вопросы эксперту, использует его ответы для постановки новых вопросов и т.д. Приведем пример такого диалога. Компьютер: Вас просят помочь в постановке диагноза. Начинающий врач сообщает вам по телефону, что пациент без сознания и что подозревается диабетическая кома. Каким будет ваш первый вопрос? Эксперт: Начало заболевания - постепенное или внезапное? Компьютер: А что более характерно для диабетической комы? Эксперт: Постепенное начало. Компьютер: Предположим, что начало было постепенное. Каким будет ваш следующий вопрос? В ходе диалога эксперт называет признаки и их возможные значения, упорядочивает признаки по характерности для данного заболевания, решая привычные для себя задачи постановки диагноза. В системе АРИАДНА использованы идеи «диагностических игр», предложенные И.М. Гельфандом [11]. Итак, при подобном подходе процедуры структуризации могут быть представлены следующим образом. Компьютер ставит вопросы эксперту, приглашая его классифицировать объект исследования и называть один за другим признаки, используемые при классификации и их возможные значения для каждого класса решений. Результатом этого этапа является совокупность признаков, необходимая для полной классификации объектов определенного типа, все возможные значения этих признаков, а также перечень классов решений. 11.2. Классификация состояний объекта исследования Представленные выше характерные особенности экспертных знаний позволяют считать адекватным способом получения информации от эксперта тот, при котором эксперт решает привычную для себя задачу. Для проблем классификации с явными признаками такой задачей является анализ описания объекта исследований, данного как совокупность значений диагностических признаков. Этот анализ привычен для эксперта. Можно ожидать, что при таком анализе полностью проявляются его знания. В качестве примера приведем задачу дифференциальной диагностики тромбоэмболии легочной артерии (ТЭЛА) и острого инфаркта миокарда (ОИМ) [12,15]. Перечень диагностических признаков, указанных экспертами: 1) анамнез, факторы риска; 2) боль; 3) цвет кожи; 4) дыхание; 5) артериальное давление; 6) электрокардиограмма; 7) рентгенограмма грудной клетки; 8) эхокардиограмма; 9) ферменты крови. На шкале каждого из признаков эксперты выделили несколько значений, причем два из них наиболее характерны соответственно - одно для ТЭЛА, другое для ОИМ. Например, для первого диагностического признака шкала имеет вид: • в анамнезе операция, травма, роды, тромбофлебит, опухоли; • в анамнезе стенокардия, ишемическая болезнь сердца;. в анамнезе патологии нет. Описание проблемы вводится в компьютер. Комбинируя значения диагностических признаков, компьютер предъявляет эксперту одно из возможных состояний объекта исследования (больного) в виде клинической ситуации. Кроме того, эксперту предоставляется перечень классов решений, к одному или нескольким из которых он относит клиническую ситуацию. 11.3. Гипотеза о характерности При получении информации от эксперта активно используется гипотеза о различной характерности значений диагностического признака по отношению к каждому из классов. Иначе говоря, предполагается, что эксперт может упорядочить все значения каждого диагностического признака по их характерности для каждого из классов решений и что это упорядочение не зависит от значений других признаков. Возьмем i-й диагностический признак. Два любых значения на его шкале Xli и Xki находятся в следующем отношении характерности для класса Рj: Xli,Xki є Dpj
где DPj отношение доминирования по "характерности для класса Рj. Другими словами, мы ввели бинарное отношение доминирования для значений одного диагностического признака (Xli более характерен для класса Рj). Вернемся к проблеме дифференциальной диагностики тромбоэмболии легочной артерии и инфаркта миокарда. Одним из диагностических признаков, используемых врачом-экспертом, является цвет кожи в момент осмотра больного. Шкала данного признака имеет следующие значения; 1) резкий цианоз лица, шеи, верхней половины туловища; 2) бледность кожных покровов, акроцианоз; 3) нормальный цвет кожи. По характерности для ТЭЛА эти значения могут быть упорядочены так: 3—2—1. Для ИМ упорядочение по характерности иное: 2-3-1. Используя бинарные отношения характерности по отдельным признакам, можно построить отношение доминирования по характерности для каждого класса на множестве состояний (векторов аi):
(ai,ai)єDpi
если для каждого из диагностических признаков значение соответствующего компонента вектора аi не менее характерно по отношению к классу Рj, чем значение компонента вектора аi, и хотя бы для одного компонента более характерно, то выполняется условие доминирования по характерности, приведенное выше, Использование гипотезы о характерности позволяет существенно уменьшить число вопросов эксперту, необходимое для построения полной классификации. Пусть эксперт отнес к классу Рi какое-то состояние аi объекта исследования. Это означает, что сложившийся у него (по описанию) образ объекта характерен для данного класса. В то же время отдельные признаки не обязательно имеют самые характерные значения для класса Рi. Логично предположить, что другие состояния, описание которых совпадает с аi, кроме значений тех диагностических признаков, которые заменены на более характерные для класса Р^, также относятся к классу Pi На формальном языке можно утверждать, что использование сформулированной выше гипотезы доминирования по характерности позволяет построить на множестве состояний А конус доминирования по характерности. Один ответ эксперта позволяет классифицировать сразу группу состояний. Мы называем используемое правило гипотезой потому, что могут быть случаи, когда распространение по характерности некорректно. Подобные случаи возникают при зависимости диагностических признаков. Поэтому применение гипотезы о характерности должно сопровождаться ее проверкой (см. далее). 11.4. Проверка информации эксперта и гипотезы о характерности Как отмечалось, не ошибающихся экспертов не бывает. Поэтому информацию эксперта следует подвергать проверке, основанной на использовании условий доминирования по характерности. Формально такую проверку можно представить следующим образом. Пусть на каком-то этапе диалога «компьютер—эксперт» состояние аi: было отнесено к классу Рi: аi є Рi. После каждого ответа эксперта осуществлялось распространение по доминированию. Построенные конусы доминирования по характерности в общем случае пересекаются. Это означает, что некоторые состояния могут быть классифицированы несколько раз. Предположим, что при этом классификации какого-то состояния а„ различаются. Тогда, например, (аv,аj)єDPi, но aj єP1, т.е. ау более характерно для класса Р,, чем аj, однако аV оказалось отнесенным (при другом ответе эксперта) к классу Рl.Этот факт может быть как ошибкой эксперта, так и проявлением зависимости диагностических признаков. При выявлении противоречия в классификации компьютер предъявляет эксперту на экране описания двух состояний и просит еще раз их проанализировать. Если эксперт обнаруживает свою ошибку, он ее устраняет и опрос продолжается. Если эксперт подтверждает обе противоречивые классификации, то: · с помощью эксперта выделяется подмножество зависимых диагностических признаков; · с помощью эксперта выделяется подмножество зависимых диагностических признаков;
Аналитические оценки показывают, что в среднем около 25% ответов экспертов проверяются, что позволяет считать созданную базу знаний непротиворечивой и надежно отражающей экспертные знания.
11.5. Определение последовательности состояний для предъявления эксперту в процессе классификации
Как было показано выше, классификация состояния объекта исследования позволяет косвенно классифицировать ряд других состояний (либо уменьшить неопределенность). Это дает возможность построить полную классификацию, т.е. решить поставленную задачу, предъявив эксперту сравнительно небольшое число состояний. Для реализации такой возможности необходимо найти стратегию выбора очередного состояния для предъявления эксперту. Система КЛАСС [7], а также последовавшие за ней системы ДИФКЛАСС [13], СТЕПКЛАСС [14] и КЛАНШ [15] отличаются друг от друга стратегией предъявления состояний эксперту. Так, в системе КЛАСС осуществляется выбор наиболее информативного состояния. Предполагается, что все возможные ответы эксперта для любого неизвестного состояния объекта равновероятны. Для каждого неклассифицированного состояния вычисляются количества косвенно классифицируемых состояний при всех возможных ответах эксперта. Далее подсчитывается среднее количество, которое и характеризует информативность предъявления конкретного вектора. Компьютер осуществляет перебор всех неквалифицированных на данный момент состояний и выбирает то, для которого ожидаемое среднее количество косвенно классифицированных состояний максимально. Существенно более эффективными (по числу обращений к эксперту) являются методы ДИФКЛАСС и КЛАНШ.
11.6. Трудоемкость построения баз знаний
Компьютерные системы построения полных и непротиворечивых баз знаний ставят эксперту вопрос за вопросом до тех пор, пока все состояния (все векторы ai из множества А) не будут отнесены к одному или нескольким классам. Для создания таких баз знаний требуется от одной—двух недель до одного-двух месяцев работы с опытным экспертом (в зависимости от объема базы знаний). Приведем конкретные данные по системе КЛАСС [7]. Для - создания базы знаний по семи коматозным заболеваниям (классифицируются 2304 состояния пациента) потребовалось 12 ч работы эксперта, по 14 болезням, начинающимся с болевого синдрома в области живота (около 20 тыс. состояний), - 60 ч. Разработка первой базы знаний заняла примерно семь дней, второй — около месяца. Система ДИФКЛАСС позволяет классифицировать в среднем до 700 состояний объекта исследования в час [13].
11.7. Проверка качества баз знаний
Основным критерием проверки построенных баз знаний является степень совпадения решений, содержащихся в ней и принятых экспертом, который участвовал в создании этой базы знаний. Для небольших по размеру задач (порядка 100 диагностических правил) эксперт мог оценить каждую ситуацию. Через некоторое время (две - три недели) он строил ту же базу знаний с помощью разработанной человекомашинной системы. Появлялась возможность сравнить ответы экспертов, полученные двумя разными способами. Эксперты, решавшие задачу с малым числом противоречий, т.е. имевшие четкие правила, показали почти полное совпадение своих решений. Для больших баз знаний сравнение проводилось по отдельным ситуациям; совпадение было практически полным. Следовательно, созданная база знаний служит хорошим отражением личности эксперта, его «двойником» в определенной предметной области. Построенную классификацию можно охарактеризовать с помощью граничных элементов. Назовем граничным элементом состояние, которое в соответствии с построенной классификацией: а) принадлежит множеству Э-П; б) может оказаться в другом классе при изменении только одного значения одного диагностического признака. Граничные элементы называются так потому, что они находятся на границе между двумя классами решений (они имеют значения признаков, характерных для каждого из классов). Отметим, что при построении классификации граничные элементы не могут быть проверены при помощи отношения доминирования по характерности, поэтому они предъявляются эксперту повторно после построения классификации. Оказывается, что граничные элементы могут быть применены для описания правил классификации, подсознательно используемых экспертами.
Исследования показали [10], что граничные объекты классов могут быть достаточно точно описаны сравнительно небольшим числом правил, имеющих структуру дерева (рис. 9.1). На рис. 9.1 верхний кружок (корень дерева) представляет совокупность значений диагностических признаков, наиболее важных для данного класса (с точки зрения эксперта). К ним добавляется определенное количество характерных для данного класса значений менее важных признаков (нижние кружки). Например, при пяти диагностических признаках правило для класса Р, может иметь вид: характерные для первого класса значения второго и четвертого признаков (они обязательно присутствуют), к которым нужно добавить любые два характерных для Р, значения из оставшихся трех признаков.
Дата добавления: 2014-01-03; Просмотров: 470; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |