Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Стратегии получения знаний




 

При формировании поля знаний ключевым вопросом является сам процесс получения знаний, когда происходит перенос компетентности экспертов на инженеров по знаниям. Для названия этого процесса в литературе по ЭС получило распространение несколько терминов, приобретение, добыча, извлечение, получение, выявление, формирование знаний. В англоязычной специальной литературe в основном используются два: acquisition (приобретение) и elicitation (выявление, извлечение, установление).

Термин «приобретение» трактуется либо очень широко - тогда он включает весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура поля знаний заранее закладывает­ся в программу). В обоих случаях термин «приобретение» не касается самого таинства экстрагирования структуры знаний из потока информации о предметной области. Этот процесс описывается понятием «извлечение».

Авторы склонны использовать этот термин как более емкий и более точно выра­жающий смысл процедуры переноса компетентности эксперта через инженера по знаниям в базу знаний ЭС.

 

Извлечение знаний (knowledge elicitation) - это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений спе­циалистов при принятии решения и структура их представлений о предметной области.

 

В настоящее время большинство разработчиков ЭС отмечает, что процесс извлечения знаний остается самым «узким» местом при построении промышленных ЭС. При этом им приходится практически самостоятельно разрабатывать методы извлечения, сталкиваясь со следующими трудностями [Gaines, 1989]:

 

• организационные неувязки;

• неудачный метод извлечения, не совпадающий со структурой знаний в данной области;

• неадекватная модель (язык) для представления знаний.

 

Можно добавить к этому [Гаврилова, Червинская, 1992]:

 

• неумение наладить контакт с экспертом;

• терминологический разнобой;

• отсутствие целостной системы знаний в результате извлечения только «фраг­ментов»;

• упрощение «картины мира» эксперта и др.

 

Процесс извлечения знаний - это длительная и трудоемкая процедура, в которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной психологии, системному анализу, математической логике и пр., необходимо воссоздать модель предметной области, которой пользуются эксперты для принятия решения. Часто начинающие разработчики ЭС, желая упростить эту про­цедуру, пытаются подменить инженера по знаниям самим экспертом. По многим причинам это нежелательно.

Во-первых, большая часть знаний эксперта - это результат многочисленных на­слоений, ступеней опыта. И часто, зная, что из А следует В, эксперт не отдает себе отчета, что цепочка его рассуждений была гораздо длиннее, например А → D → С → В или А → Q → R → В.

Во-вторых, как было известно еще Платону, мышление диалогично. И поэтому диалог инженера по знаниям и эксперта - наиболее естественная форма изуче­ния лабиринтов памяти эксперта, в которых хранятся знания, частью носящие невербальный характер, то есть выраженные не в форме слов, а в форме нагляд­ных образов, например. И именно в процессе объяснения инженеру по знаниям эксперт на эти размытые ассоциативные образы надевает четкие словесные яр­лыки, то есть вербализует знания.

В-третьих, эксперту труднее создать модель предметной области вследствие глу­бины и объема информации, которой он владеет. Еще в ситуационном управле­нии [Поспелов, 1986] было выявлено: объекты реального мира связаны более чем 200 типами отношений (временные, пространственные, причинно-следственные, типа «часть-целое» и др.). Эти отношения и связи предметной области образуют сложную систему, из которой выделить «скелет» или главную структуру иногда доступнее аналитику, владеющему к тому же системной методологией.

Термин «приобретение» в рамках данного учебника оставлен за автомати­зированными системами прямого общения с экспертом. Они действительно непосредственно приобретают уже готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систем. Большинство этих ин­струментальных средств специально ориентировано на конкретные ЭС с жестко обозначенной предметной областью и моделью представления знаний, то есть не являются универсальными.

 

Приобретение знаний (knowledge acquisition) - процесс наполнения базы знаний экс­пертом с использованием специализированных программных средств.

 

Например, система TEIRESIAS [Davis, 1982], ставшая прародительницей всех инструментариев для приобретения знаний, предназначена для пополнения базы знаний системы MYCIN или ее дочерних ветвей, построенных на «оболочке» EMYCIN [Shortliffe, 1976] в области медицинской диагностики с использованием продукционной модели представления знаний. Три поколения и основные тен­денции СПЗ будут подробно описаны в параграфе 4.5. Более современные конк­ретные системы описаны далее в параграфе 4.6.

Термин формирование знаний традиционно закрепился за чрезвычайно перспек­тивной и активно развивающейся областью инженерии знаний, которая занима­ется разработкой моделей, методов и алгоритмов обучения. Она включает индук­тивные модели формирования знаний и автоматического порождения гипотез, например ДСМ-метод [Аншаков, Скворцов, Финн, 1986] на основе обучающих выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить причинно-следственные эмпирические зависимости в базах данных с неполной информацией, содержащих структурированные числовые и символьные объекты (часто в условиях неполноты информации).

 

Формирование знаний (machine learning) - процесс анализа данных и выявление скрытых закономерностей с использованием специального математического аппарата и программных средств.

 

Традиционно к задачам формирования знаний или машинного обучения отно­сятся задачи прогнозирования, идентификация (синтеза) функций, расшифров­ки языков, индуктивного вывода и синтеза с дополнительной информацией [Епифанов, 1984]. В широком смысле к обучению по примерам можно отнести и методы обучения распознаванию образов [Аткинсон, 1989; Schwartz, 1988].

Индуктивный вывод правил из фактов применен также в системах AQ, AQUINAS, KSSI, INSTIL и некоторых других.

Наиболее продвинутыми среди методов машинного обучения являются, по-ви­димому, методы распознавания образов, в частности, алгебраический подход, в котором предусматривается обогащение исходных эвристических алгоритмов с помощью алгебраических операций и построение семейства алгоритмов, гаран­тирующего получение корректного алгоритма для решения изучаемого класса задач, то есть алгоритма, правильно классифицирующего конечную выборку по всем классам [Берков, 1972]. Однако применение методов формирования зна­ний пока не стало промышленной технологией разработки баз знаний.

Для того чтобы эти методы стали элементами технологии интеллектуальных си­стем, необходимо решить ряд задач [Осипов, 1997]:

 

• обеспечить механизм сопряжения независимо созданных баз данных, имею­щих различные схемы, с базами знаний интеллектуальных систем;

• установить соответствие между набором полей базы данных и множеством элементов декларативной компоненты базы знаний;

• выполнить преобразование результата работы алгоритма обучения в способ представления, поддерживаемый программными средствами интеллектуаль­ной системы.

 

Помимо перечисленных существуют также и другие стратегии получения знаний, например, в случае обучения на примерах (case-based reasoning), ког­да источник знаний - это множество примеров предметной области [Оси­пов, 1997; Попов, Фоминых, Кисель, 1996]. Обучение на основе примеров (прецедентов) включает настройку алгоритма распознавания на задачу по­средством предъявления примеров, классификация которых известна [Иберла, 1980].

Обучение на примерах тесно связано с машинным обучением. Различие заключа­ется в том, что результат обучения в рассматриваемом здесь случае должен быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся факты и закономерности предметной области, и преобразован в способ представления, который допускает использование результата обучения в базе знаний, для моделирования рассуждений, для работы механизма объяснения и т. д., то есть делает результат обучения элементом соответствующей технологии.

Например, в системе INDUCE [Коов и др., 1988] порождается непротиворечивое описание некоторого класса объектов по множествам примеров и контр-приме­ров данного класса. В качестве языка представления используется язык переменно-значной логики первого порядка (вариант языка многозначной логики перво­го порядка).

Следует отметить также появление двух новых «флагов» в стане сторонников методов машинного обучения - это data mining и knowledge discovery. Оба подхо­да базируются на анализе данных и поиске закономерностей.

Таким образом, можно выделить три основные стратегии проведения стадии по­лучения знаний при разработке ЭС (рис. 3.6).

1. С использованием ЭВМ при наличии подходящего программного инструмен­тария, иначе приобретение знаний.

2. С использованием программ обучения при наличии репрезентативной (то есть достаточно представительной) выборки примеров принятия решений в пред­метной области и соответствующих пакетов прикладных программ, иначе фор­мирование знаний.

3. Без использования вычислительной техники путем непосредственного контак­та инженера по знаниям и источника знаний (будь то эксперт, специальная литература или другие источники), иначе извлечение знаний.

 

 

Рис. 3.6. Стратегии получения знаний

 

В учебнике подробно будут рассматриваться процессы извлечения и приобрете­ния знаний, так как на современном этапе разработки ЭС эти стратегии являются наиболее эффективными и перспективными. Формирование знаний, тяготеющее в большей степени к области machine learning, то есть индуктивному обучению, основываясь на хорошо исследованном аппарате распознавания образов [Гаек, Гавранек, 1983] и обнаружения сходства объектов [Гусакова, Финн, 1987], выхо­дит за рамки данного учебника. Также вне этой книги остались вопросы форми­рования знаний из данных (data mining, knowledge discovery) и др.

 

 




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 545; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.