Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Байесовская сеть представления и вывода вероятностных знаний




Ранее было показано, что полное совместное распределение вероятностей позволяет отвечать на любые вопросы о рассматриваемой проблемной области, но может приобретать по мере увеличения количества переменных настолько большие размеры, что вычисления становятся невозможными. Более того, сам способ задания вероятностей для атомарных событий является довольно неестественным и может оказаться весьма затруднительным при отсутствии большого объема данных, на основании которых накапливаются статистические оценки.

В настоящем разделе показана структура данных, называемая байесовской сетью (другие названия: сеть доверия, вероятностная сеть, причинная сеть, и схема знаний), которая позволяет представить связи между переменными и составить краткую спецификацию любого полного совместного распределения вероятностей.

Байесовская сеть — это ориентированный граф, в котором каждая вершина помечена количественной вероятностной информацией.

1. Вершинами сети является множество случайных переменных. Переменные могут быть дискретными или непрерывными.

2. Вершины соединяются попарно ориентированными ребрами, или ребрами со стрелками; ребра образуют множество ребер. Если стрелка направлена от вершины Х к вершине У, то вершина Х называется родительской вершиной вершины У.

3. Каждая вершина У характеризуется распределением условных вероятностей Рç Ра rents ( Хi )), которое количественно оценивает влияние родительских вершин на эту вершину.

4. Граф не имеет циклов, состоящих из ориентированных ребер (и поэтому является ориентированным деревом).

Интуитивный смысл стрелки в правильно составленной сети обычно состоит в том, что вершина Х оказывает непосредственное влияние на вершину У. Для специалиста в проблемной области задача определения того, какие непосредственные влияния существуют в этой проблемной области, обычно является довольно легкой; действительно, она намного легче по сравнению с фактическим определением самих вероятностей. После того как составлена топология байесовской сети, остается только указать распределение условных вероятностей для каждой переменной с учетом ее родительских переменных. В данном разделе на конкретном примере будет показано, что применение этой топологии и распределений условных вероятностей вполне позволяет (неявно) задать полное совместное распределение для всех переменных.

Пример: Житель пригорода установил в своем доме новую систему тревожной сигнализации для обнаружения взлома. Она довольно надежно обнаруживает взлом, но иногда также реагирует на небольшие землетрясения. У этого человека есть два соседа, Джон и Мэри, которые обещали звонить ему на работу, услышав тревожный сигнал. Джон всегда звонит, услышав тревожный сигнал, но иногда путает с ним телефонный звонок в доме соседа и в этих случаях также звонит. Мэри любит слушать довольно громкую музыку и поэтому иногда вообще пропускает тревожный сигнал. Получив факты о том, кто из этих соседей звонил или не звонил, необходимо оценить вероятность взлома. Байесовская сеть для этой проблемной области приведена на рис. 60.

Рис.60. Типичная байесовская сеть, на которой показаны и топология и таблицы условных вероятностей (СРТ)

На время отвлечемся от распределения условных вероятностей, показанных на этом рисунке, и сосредоточимся на топологии сети. В случае сети определения взлома топология показывает, что взлом и землетрясения непосредственно влияют на вероятность появления тревожного сигнала, а звонки Джона и Мэри зависят только от тревожного сигнала. Поэтому сеть подтверждает наши предположения, что соседи самостоятельно не обнаруживают какие-либо попытки взлома, не замечают незначительных землетрясений и не совещаются друг с другом перед звонками

Обратите внимание на то, что в этой сети нет вершин, соответствующих тем ситуациям, в которых Мэри в настоящее время слушала бы громкую музыку или звонил бы телефон и сбивал с толку Джона. Эти факторы подытожены в показателях неопределённости, связанных с рёбрами, направленными от вершины «ТРЕВОЖНЫЙ ЗВОНОК» к вершинам

«ДЖОН ЗВОНИТ» и «МЕРИ ЗВОНИТ». Такая структура сети служит примером проявления в действии не только экономии усилий, но и недостатка знаний, поскольку требовалось бы слишком много работы, чтобы узнать, по какой причине эти факты могут оказаться более или менее вероятными в каждом конкретном случае; к тому же все равно отсутствует приемлемый способ получения достоверной информации.

Вероятности, показанные на рисунке, фактически подытоживают потенциально бесконечное множество обстоятельств, которые либо могут вызвать нарушения при выработке тревожного звонка (высокая влажность, отказ сети электропитания, разрядка аккумулятора, обрыв проводов, дохлая мышь, застрявшая внутри звонка, и т.д.), либо станут причиной того, что Джон или Мэри не смогут о нем (звонке) сообщить (из-за того, что выйдут на обед, отправятся в отпуск, на время оглохнут, не слышат сигнал в шуме пролетающего самолёта и т.д.). Но именно благодаря использованию приближенных оценок смоделировать события, происходящие в проблемной области, по крайней мере, приблизительно. Степень приближения к истине или степень адекватности данной вероятностной модели может быть повышена по мере введения дополнительной достоверной информации.

Теперь обратимся к распределениям условных вероятностей, показанным на рис.60. На этом рисунке каждое распределение представлено в виде таблицы условных вероятностей, или сокращенно СРТ (Соnditional Probability Table). В таблицах СРТ буквами В, З, Т, Д и М обозначены следующие события «Взлом», «Землетрясение», «Тревожный звонок», «Джон звонит», «Мэри звонит». Каждая строка в таблице СРТ содержит условную вероятность каждого значения вершины для обусловливающего случая (соnditioning case), определяющего условную вероятность.

Обусловливающий случай представляет собой одну из возможных комбинаций значений родительских вершин (в принципе его можно рассматривать как миниатюрное атомарное событие). Каждая строка должна в сумме составлять 1, поскольку элементы этой строки представляют собой исчерпывающее множество случаев для данной переменной. А если речь идет о булевых переменных (как в данном примере), то после определения вероятности истинного значения, скажем Р, вероятность ложного значения должна быть равна 1-Р. Вообще говоря, любая таблица для булевой переменной с k булевыми родительскими переменными содержит 2 k независимо определяемых вероятностей. Таблица для вершины без родительских вершин имеет только одну строку, представляющую априорные вероятности каждого возможного значения соответствующей переменной.

Любая байесовская сеть представляет собой полное описание рассматриваемой проблемной области. Каждый элемент в полном совместном распределении вероятностей может быть рассчитан на основании информации, представленной в этой сети. Универсальным элементом в совместном распределении является вероятность конъюнкции конкретных присваиваний значений каждой переменной, такой как Р ( Х11 Ù …….. Ù Хn= хn). В качестве сокращенного обозначения для такой конъюнкции будет использоваться выражение Р ( х1 …….. хn). Значение этого элемента задается следующей формулой:

n

Р ( х1 …….. хn ) = Õ P(хi ç parents (хi)).

i=1

 

Где parents (хi) обозначает конкретные значения переменных в множестве вершин Рarents (Хi). Поэтому каждый элемент в совместном распределении представлен в виде произведения соответствующих элементов в таблицах условных вероятностей (СРТ) байесовской сети. Таким образом, таблицы обеспечивают распределённое представление совместного распределения.

Для иллюстрации описанных выше понятий рассчитаем вероятность того, что прозвучал тревожный звонок, но не произошли ни взлом, ни землетрясение, а звонили и Мэри, и Джон.

Р(Д Ù М Ù ТÙù В Ùù З) = Р(Д çТ) ´ Р(М çТ) ´Р(Т çù В Ùù З) Р(ù В) Р(ù З) = 0,9 ´ 0,7 ´ 0,001 ´ 0, 999 ´ 0,998 = 0,00062

Таким образом, так как байесовская сеть служит представлением совместного распределения вероятностей, то она может также применяться для получения ответа на любой запрос о данной проблемной области. В этом и заключается вывод вероятностных знаний на байесовских сетях.

7.3. Другие способы представления и вывода неопределённых знаний.

Субъективный байесовский подход получил широкое распространение благодаря своей простоте. Ктому же он достаточно обоснован теоретически. Однако этот подход, имеетнерешенные проблемы: например, сумма вероятностей опровергающих друг друга событий может оказаться больше 1. Сложной задачей для экспертов является назначение априорных вероятностей условных событий. Теоретические исследования в данном направлении активно продолжаются, и в распоряжении проектировщиков экспертных систем уже имеются такие мощные средства, как вероятностная логика, нечеткая логика, теория Демпстера—Шафера и т.п.

Абсолютно полных знаний небывает, поскольку процесс познания бесконечен. В связи с этим состояние базы знаний должно изменяться с течением времени. Вотличие от простого добавления информации, как вбазах данных, при добавлении новых знаний возникает опасность получения противоречивых выводов, т.е. выводы, полученные с использованием новых знаний, могут опровергать те, что были получены ранее. Еще хуже, если новые знания будут находиться в противоречии со «старыми», тогда механизм вывода может стать неработоспособным. Многие экспертные системы первого поколения были основаны на модели закрытого мира, обусловленной применением аппарата формальной логики для обработки знаний. Модель закрытого мира предполагает жесткий отбор знаний, включаемых в базу, а именно: БЗ заполняется исключительно верными понятиями, а все, что ненадежно или неопределенно, заведомо считается ложным. другими словами, все, что известно базе знаний, является истиной, а остальное — ложью.

Такая модель имеет ограниченные возможности представления знаний и таит в себе опасность получения противоречий при добавлении новой информации. Тем не менее эта модель достаточно распространена; например, на ней базируется язык РROLOG. Недостатки модели закрытого мира связаны с тем, что формальная логика исходит из предпосылки, согласно которой набор определенных в системе аксиом (знаний) является полным(теория является полной, если каждый ее факт можно доказать, исходя из аксиом этой теории) для полного набора знаний справедливость ранее полученных выводов не нарушается с добавлением новых фактов.

Это свойство логических выводов называется монотонностью. К сожалению, реальные знания, закладываемые в экспертные системы, крайне редко бывают полными.

Рассмотрим простой пример. допустим, в БЗ содержатся следующие утверждения:

<Птицы летают>.

<Пингвин нелетает>.

<Лолоптица>.

На основеэтих знаний можно получить заключение < Лоло летает > и сделать вывод о том, что < Пингвин не является птицей >. Если в БЗ добавить факт «Лоло — пингвин», то получим противоречащие предыдущим заключения: «Лоло не летает» и «Лоло не является птицей».

В качестве средств формальной обработки неполных знаний, для которых необходимы немонотонные выводы, разрабатываются методы немонотонной логики: немонотонная логика Макдермотта и Доула, в которой вводятся условные логические операции, логика умолчания Рейтера, немонотонная логика Маккарти и т.п. Многие из этих теорий еще не полностью отработаны, но предложенные в них элементы уже нашли применение в практических разработках (проверка и учет непротиворечивости элементов знаний, установление значений по умолчанию во фреймовых системах и тп.).

Для организаиии логических выводов в интеллектуальных системах с неполными знаниями вместотрадиционной дедукции применяется абдукция. Абдукцией называется процесс формирования объясняющей гипотезы на основе заданной теории и имеющихся наблюдений (фактов). Рассмотрим простейший пример абдуктивного вывода. Предположим, теория содержит правило: «ЕСЛИ студент отлично знает математику ТО он может стать хорошим инженером» и факт: «Студент Иванов отлично знает математику». Кроме того, имеется наблюдение: «Студент Иванов стал хорошим экономистом», которое не выводится из заданной теории. для того чтобы его вывести, необходимо сформировать абдуктивную (объясняющую) гипотезу, которая не будет противоречить вышеприведенной теории. Такой гипотезой может быть, например, следующая: «Хороший математик может стать хорошим экономистом».

Целью абдуктивного вывода является формирование одного (или более) объяснения D наблюдаемого факта W на основе информации, хранящейся в БЗ интеллектуальной системы (теория T). Объяснение D должно быть таким, чтобы TÈDÞWи чтобы TÈD было непротиворечиво. Другими словами, наблюдение W можно вынести из теории Т лишь при ее расширении некоторым множеством гипотез D. В большинстве случаев абдуктивные гипотезы выбираются из заранее определенного множества предложений, отражающих определенный аспект знаний конкретной предметной области. Теорию Т можно рассматривать как основу всех возможных расширений TÈD для каждой абдуктивной гипотезы.

Абдуктивные выводы используются в задачах диагностики для обнаружения причин наблюдаемого неправильного поведения систем, в задачах, связанных с пониманием естественного языка, для решения проблем накопления и усвоения знаний и тд.

Для работы с неполными знаниями предназначена также система поддержания значений истинности, в которой все знания делятся на достоверные и недостоверные, при этом предусматривается систематическое упорядочение БЗ в целях устранения недостоверных знаний, достоверные на данный момент знания относят к классу IN, а сомнительные и недостоверные — к классу OUT. Если при добавлении новых знаний возникает противоречие, то выполняется проверка классов знаний, при этом возможны миграции из класса в класс. Исследования в области немонотонных выводов — это попытки расширить границы формальной логики, в которые не вписываются реальные знания, необходимые интеллектуальным системам.




Поделиться с друзьями:


Дата добавления: 2015-06-27; Просмотров: 2541; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.024 сек.