Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Онтологический анализ




Пользователь – человек и система искусственного интеллекта должны иметь до некоторой степени общие язык, знания и методы мышления. Онтология обеспечивает общий словарь для решения задач управления, определяет семантику сообщений и отвечает за интерпретацию контекста сообщения. Таким образом, онтология создает основу для того, чтобы при управлении сложными системами стороны, обменивающиеся информацией, могли правильно понимать друг друга.

Онтологический анализ – аналитическая работа с целью определения и объединения релевантных информационно-логических и функциональных аспектов исследуемой системы в соответствующей содержательной онтологии [Гаврилова]. Онтологический анализ направлен на исследование и интерпретацию системных связей в сложных предметных областях с применением методов и средств компьютерного моделирования.

Онтологический анализ используется в системах искусственного интеллекта, так как необходим для исследования плохо структурированных предметных областей, какой является, например, область управления сложными системами в проблемных ситуациях. Современное определение термина “онтология” в теории искусственного интеллекта неоднозначно; для практического использования наиболее подходящим является определение онтологии как знаний, формально представленных на базе концептуализации. Концептуализация предполагает описание множества объектов и понятий, знаний о них и связей между ними. Для структурирования знаний о предметной области предложено использовать три основные категории [26]:

· статическая онтология – в нее входят сущности предметной области, их свойства и отношения;

· динамическая онтология – определяет состояния, возникающие в процессе решения проблемы, и способ преобразования одних состояний в другие;

· эпистемическая онтология – описывает знания, управляющие процессом перехода из одного состояния в другое.

Под формальной моделью MO онтологической системы [3] понимается триада вида:

M O = < O meta, {O app}, Inf F>,

где O meta – онтология верхнего уровня (метаонтология);

{O app} – множество предметных онтологий и онтологий задач предметной области;

Inf F – модель машины вывода, ассоциированной с онтологической системой M O.

Формально предметная онтология состоит из множества терминов предметной области, организованных в таксономию, их определений и атрибутов, а также связанных с ними аксиом и правил вывода [52], то есть модель предметной онтологии - это упорядоченная тройка вида:

O app = < >,

где T – конечное множество концептов (понятий, терминов) предметной области, которую представляет онтология O app;

R – конечное множество отношений между концептами (понятиями, терминами) заданной предметной области;

F – конечное множество функций интерпретации (аксиоматизация), заданных на концептах и/или отношениях онтологии O app.

Естественным ограничением, накладываемым на множество T, является его конечность и не пустота. Множества R и F также должны быть конечными, а граничные случаи, связанные с их пустотой, являются следующие.

При R = 0 и F = 0 онтология O app трансформируется в словарь (V):

O app = V = <T,{},{}>.

При R ¹ 0 и F = 0 онтология представляет собой тезаурус (Th), состоящий из множества концептов и множества отношений, отражающих специфику конкретной предметной области [67].

O app = Th = <T,R,{}>.

В случае единственного типа отношений is_a («быть элементом класса») тезаурус трансформируется в таксономию, используемую для представления иерархии понятий.

Тезаурус. Термин тезаурус (от греч. thesauros - сокровищница, богатство, клад, запас и т. п.) в общем случае характеризует «совокупность научных знаний о явлениях и законах внешнего мира и духовной деятельности людей, накопленную всем человеческим обществом» [Д3].

Этот термин был введен в современную литературу по языкознанию и информатике в 1956 г. Кембриджской группой по изучению языков. В то же время термин существовал раньше: в эпоху Возрождения тезаурусами называли энциклопедии. Тезаурус - словарь, который очищен от неоднозначности, т. е. в нем каждому слову может соответствовать лишь единственное понятие, хотя в обычном словаре одному слову могут соответ­ствовать несколько понятий. На основе тезауруса разрабатывается онтология предметной области, которая является ясным описанием основных понятий объектов предметной области и отношений между ними.

В математической лингвистике и семиотике термин тезаурус используется в более узком смысле, для характеристики конкретного языка, его многоуровневой структуры. Для этих целей удобно пользоваться одним из принятых в лингвистике определений тезауруса как «множества смысловыражающих элементов языка с заданными смысловыми отношениями.» [Д4].

Это определение позволяет представить структуру языка в виде уровней (страт) множеств (например, слов, словосочетаний, предложений, абзацев и т. п.), смысловыражающие элементы каждого из которых формируются из смысловыражающих элементов предшествующих структурных уровней (см. рисунок 5.1).

Рис. 5.1. Уровни структуры языка.

Правила (Gl, G2) формирования смысловыражающих элементов второго и третьего уровней в тезаурус не входят, в тезаурусе определяется только вид и наименование уровня, характер и вид смысловыражающих элементов.

Иногда вместо термина смысловыражающие элементы используется термин синтаксические единицы тезауруса. На наш взгляд, это менее удачный термин, так как при формировании элементов нового множества смысловыражающих элементов каждого последующего уровня (при образовании слов из букв, фраз и предложений из слов, и т. д.) у элементов вновь образованного множества появляется новый смысл, т. е. как бы проявляется закономерность целостности, и это хорошо отражает термин «смысловыражающий элемент».

В таком толковании понятие тезауруса можно конструктивно использовать при создании искусственных языков - языков моделирования, автоматизации проектирования, информационно-поисковых языков. Оно позволяет охарактеризовать язык с точки зрения уровней обобщения, ввести правила их использования при индексировании информации.

Можно говорить о глубине тезауруса того или иного языка, характеризуемой числом уровней, о видах уровней обобщения и, пользуясь этими понятиями, сравнивать языки, выбирать более подходящий для рассматриваемой задачи или, охарактеризовав структуру языка, организовать процесс его разработки.

Сущностями метаонтологии Ometa являются такие понятия, как «объект», «атрибут», «значение», «отношение» и т.п. В качестве базового модуля онтологии используется модель метаонтологии. Онтология высшего порядка, в общем случае, является графом, порожденным включенными в нее отношениями, такими как is_a (быть элементом класса), part_of (являться частью), connected_with (быть связанным с), "роль-событие" и другими отношениями.

Из приведенного определения онтологической системы следует, что разработку онтологии следует начинать с простейшей понятийной модели - словаря терминов предметной области, совместно используемого для упрощения коммуникации, общения, запоминания и представления. Словарь V разрабатывается на этапе объектного моделирования предметной области, при этом используются словари, уже существующие в данной области. Разработанный словарь служит материалом для представления лингвистической компоненты системы поддержки принятия решений. Для более полного и системного лингвистического описания предметной области нужен тезаурус Th, разработка которого потребует создания специальных методов и алгоритмов анализа и моделирования. Предметом дальнейших исследований является определение множества функций интерпретации F, заданных на концептах и отношениях онтологии предметной области O app. В большинстве предметных областей управления сложными системами (авиация, энергетика, вычислительные сети) существует значительное количество текстовых документов, содержащих описания конкретных критических ситуаций, устанавливающих регламент и стандарты управления объектами в критических ситуациях. Однако использование только текстовой базы предметной области для разработки тезауруса привносит инородные контекстуальные связи, не относящиеся к рассматриваемой проблеме. Тем не менее, при разработке баз знаний в качестве источников знаний чаще всего рассматриваются знания, содержащиеся в текстах, относящихся к предметной области, и знания экспертов, выявляемые инженерами знаний в процессе диалогов. Предлагается использовать третий источник знаний –визуальную модель процесса, разработанную с использованием UML, в качестве средства, аккумулирующего знания экспертов, описания процесса управления и опыт проектирования информационных систем. Следовательно, предметно – ориентированный тезаурус системы поддержки принятия решений должен объединять тезаурус экспертов в данной предметной области, тезаурус, формируемый на основе лингвистического анализа методических, нормативных, регламентирующих документов, а также тезаурус, формируемый по результатам моделирования процессов управления в проблемных ситуациях.

Эффективным подходом к построению предметно-ориентированного тезауруса является использование результатов объектно–ориентированного анализа и моделирования для последующего семантического анализа.

Представление тезауруса можно осуществить с использованием средств визуального моделирования требований к разрабатываемой интеллектуальной информационной системе в среде RequisiteProfessional.

Таким образом, наиболее предпочтительным является подход к построению предметно-ориентированного тезауруса на основе интеграции лингвистического анализа текстов, регламентирующих процесс управления сложными системами в проблемных ситуациях, и результатов объектного моделирования.

У каждого эксперта предметной области есть свой специфический научный словарь (общей терминологии не существует). Так, например, в образовательном процессе некоторые термины используются в нескольких дисциплинах со сходными, но не идентичными значениями, существуют синонимы, антонимы, омонимы. Поэтому крайне актуальным является решение проблемы представления естественно-языковой информации в машинно-интерпретируемом виде. Существует необходимость в разработке унифицированной, детальной и непротиворечивой терминологии, которую можно использовать в различных формальных контекстах и приложениях, в системах искусственного интеллекта - для разработки моделей представления знаний (правил или прецедентов). Онтология является удобным способом создания такой терминологии с учетом контекста предметной области. Онтология учитывает парадигматические отношения понятий, независимые от контекста решения задачи, и правила формирования переменных синтагматических отношений понятий, возникающих в некотором контексте решения задачи. Она позволяет систематизировать знания на основе многоаспектной таксономии. Онтология позволяет реализовать метамодельную функциональность для конструирования. Она снабжает необходимыми понятиями, отношениями и ограничениями, которые используются как строительные блоки для построения конкретной модели решения задачи. Кроме этого, онтология способствует повышению интеллектуальности систем управления знаниями на основе представления того, что часто остается неявным или неопределенным. Онтология решает задачу совместного и повторного использования знаний различными пользователями и/или компьютерными программами. Таким образом, разработка онтологии позволит повысить качество принимаемых решений. В основе формализации онтологии лежат методы исчисления предикатов и результаты объектно-ориентированного моделирования.

Онтология определяет общие слова и концепты (значения), используемые для описания и представления знаний и стандартизирует значения. Онтологии используются людьми, базами данных и приложениями, которым необходимо совместно использовать информацию о предметной области. Онтологии включают машинно-интерпретируемые определения базовых концептов предметной области и отношений между ними. Они кодируют знания о предметной области и о том, что ее окружает.

Крайне важной частью любого способа представления знаний является классификация объектов по категориям. Хотя взаимодействие с миром происходит на уровне отдельных объектов, формирование рассуждений происходит в основном на уровне категорий. Кроме того, категории позволяют многое предсказывать в отношении объектов после того, как эти объекты вошли в состав классификации. При этом делается заключение о наличии некоторых объектов на основании сенсорных входных данных, определяется принадлежность к категории из воспринятых свйоств объектов, а замет информация о категории используется для составления прогнозов, касающихся этих объектов.Структура рассматриваемых предметных областей предполагает наличие в онтологии нескольких типов ассоциативных парадигматических отношений: причинно-следственных отношений, отношений сходства, отношений семантического подобия. Набор отношений фиксирован и фактически «дублируется» в онтологии высшего порядка и предметной онтологии в отличие от сущностей, коими оперируют предметные онтологии. Метаонтология «задает» возможные типы отношений, которые могут быть по необходимости использованы в предметной онтологии. Отношение is_a определяет наследование свойств между объектами, а значит, предрешает иерархичность онтологии. Иерархическая модель онтологии может расширяться за счет добавления новых модулей, соответствующих новым разделам предметной области.

Онтология Ontoapp оперирует понятиями, характеризующими предметную область проведения исследований, и организуется по образцу метаонтологии Ometa. Предметная онтология Ontoicont содержит понятия, характеризующие семантику особенностей объекта исследований, структурированные в соответствии с иерархией, установленной для соответствующей предметной области предметных исследований. Наполненная предметная онтология Ontoicont может рассматриваться как статическая компонента базы знаний при работе с конкретной предметной областью и являться, в свою очередь, шаблоном для построения динамической компоненты базы знаний, изменяющейся при переходе от исследования одной конкретной задачи к другой.

Модель онтологического анализа есть модель машины вывода Inf F, ассоциированной с онтологической системой. На машину вывода возлагаются задачи активации сущностей и отношений, описывающих конкретную задачу, то есть организация динамической компоненты базы знаний.

Разработанный подход предусматривает создание модели онтологии в виде совокупности модулей, где каждый модуль описывает терминологию некоторого раздела предметной области.

Таким образом, в процессе структуризации стратегического управления предприятием, включающая онтологию делового процесса, представляется в виде иерархической системы (рис. 5.2).

 

Рис. 5.2.. Иерархия уровней онтологии стратегического управления предприятием

 

Разрабатываемая онтология состоит из:

• классов ПрО (classes);

• экземпляров (individuals, instances);

• отношений между классами и экземплярами (properties, slots). Основные типы отношений в разрабатываемой онтологии: «часть-целое» (part-of), «экземпляр класса» (instance of), «иерархия» (is-a));

• ограничений и условий принадлежности, относящихся к классам и экземплярам (axioms and facts).

Методика разработки онтологии в силу ее сложности специфична для каждой задачи. В соответствии с этим и происходит разработка предметной онтологии. Существуют основные этапы, стандартные для разработки любой онтологии, а методы и средства, которые используются, выбираются в работе с учетом специфики предметной области и анализа существующих в этой области разработок. Этап Iвключает разработку концептуальной структуры онтологии и предварительную идентификацию концептов, таксономии, связей, функций и аксиом. Этап IIвключает формализацию знаний и концептуально структурирует экземпляры классов. Подразделяется на следующие под этапы: формализация онтологического языка: представление объектов в форме классов и атрибутов, представление свойств и отношений; программная реализация интерфейса пользователя для доступа к онтологии.

Потенциальными пользователями онтологии являются управляющие (ЛПР), аналитики, технологи ГТМ, специалисты в области информационных технологий и инженерии знаний. Были проанализированы существующие за рубежом методики разработки онтологии и выявлено, что может являться исходными данными для этого:

  • предметный тезаурус; ключевые слова от экспертов;
  • документы из Internet (с автоматической разметкой);
  • словари (форматы XML или SGML) - полуструктурированные исходные данные;
  • web- документы, составленные на естественном языке;
  • тексты предметной области; аннотированные тексты; концепты-примитивы от экспертов;
  • аннотированные документы;
  • управляемый словарь;
  • схема базы данных;
  • запросы пользователя.

В случае управления производственным предприятием к исходным данным для разработки онтологии отнесены экспертные знания, тексты регламентирующих документов по управлению бизнес-процессом и комплекс объектных моделей.

В процессе разработки онтологии был проанализирован ряд методов извлечения концептов и выделены основные шаги: поверхностный синтаксический анализ; извлечение дескрипторов из текстов; поиск по шаблонам; алгоритм ранжирования страниц; морфологический анализ; распознавание имен; частей речи; категоризация существительных; концептуальная кластеризация и индукция; поверхностная естественно-языковая обработка; разметка частей речи (синтаксические и лексические правила); предметные заголовки из управляемого словаря; вручную уточненные концепты.

Для разрабатываемой онтологии предложен комплексный метод извлечения концептов. Он включает автоматизированный лингвистический анализ текстов, анализ комплекса объектных моделей с учетом знания и опыта экспертов.

Для разрабатываемой онтологии предложен комплексный метод извлечения отношений: отношения выделяются на основании проведенного автоматизированного лингвистического анализа текстов, из комплекса объектных моделей и от экспертов. Следующим шагом разработки онтологии является определение множеств фактов и аксиом для представления ограничений, накладываемых на объекты и свойства онтологии. В работе они формируются с экспертами на основании разработанной концептуальной модели онтологии и проведенного кластерного анализа данных проблемных ситуаций конкретного бизнес-процесса, что позволяет выявить количественные характеристики отношений между экземплярами.

Модель онтологии не лишена недостатков. Она «работает» с общими знаниями и не позволяет учитывать опыт экспертов в конкретных проблемных ситуациях. Для формализации конкретных суждений предназначены базы знаний.

Рассмотрим процесс разработки онтологии на примере онтологии в стратегическом управлении.

В качестве редактора разрабатываемой онтологии было выбрано средство построения онтологии Stanford’s Protégé 3.1.1 с OWL – дополнением для кодирования онтологии и базы знаний. Protégé располагает интуитивно понятным интерфейсом для построения иерархии классов, а также позволяет определить характеристики (свойства) классов данных и объектов и отношения между ними. Преимущества редактора онтологий Protégé 3.1.

  • Графическое представление. Позволяет с помощью средств визуализации создавать, редактировать, отлаживать онтологии.
  • Проверка полноты знаний и степени логической корректности и непротиворечивости ссылок в онтологии производится автоматически.
  • Предоставляется возможность разработки онтологии параллельно несколькими пользователями.
  • Функция слияния. Осуществляет поддержку при объединении разных онтологии в одну и возможность их сравнения.
  • Лексическая поддержка. Поддержка лексических ссылок онтологических элементов (например, синонимов) и обработки лексического содержания (например, поиск/ фильтрация онтологических терминов).
  • Извлечение информации. Возможность генерации онтологии из массива данных с последующей корректировкой и уточнением.
  • Соответствие требованиям стандартов Semantic Web [14].

На рис. 5.3 показан фрагмент онтологии стратегического управления, разработанный с использованием Protege 3.1. Онтология, разработанная в Protege 3.1, может быть экспортирована в различные форматы, например RDF(S), OWL, XML Schema в соответствии со стековой архитектурой Semantic Web (рис.4.1). Это позволяет широко использовать онтологию как пользователями, так и делает её машинно-читаемой и совместимой с другими онтологиями и программами.

 

 

Рис. 5.3. Фрагмент онтологии управления бизнес-процессами в Protégé 3.1.1.

Результаты онтологического анализа используются при формализации знаний об управлении бизнес-процессами в базе знаний, в частности для определения терминологии суждений экспертов и выбора наименований переменных в условной и заключительной части правил.

Другим приложением онтологии является ее использование в системах информационного поиска.

Для представления категорий в логике первого порядка могут применяться два основных способа: представление с помощью предикатов или с помощью объектов. Категории служат для организации и упрощения базы знаний с помощью наследования. Например, если известно, что все экземпляры категории «Еда» съедобны, и сформулировано утверждение, что класс «Фрукты» - это подкласс класса «Еда», а яблоки – подкласс класса «Фрукты», то становится известным, что каждое яблоко съедобно. Отдельные яблоки наследуют свойство съедобности в силу своей принадлежности к категории «Еда».

Отношения между классами и подклассами позволяют организовывать категории в виде некоторой таксономии, или таксономической иерархии. Явно заданные таксономии использовались в прикладных науках в течение многих столетий (биология, таксономия профессий, товаров).

Логика первого порядка позволяет легко формулировать факты о категориях, либо связывая объекты с категориями, либо применяя кванторы к их элементам, как описано ниже.

1. Любой объект – элемент некоторой категории: BB2 Basketballs

2. Любая категория – подкласс другой категории, например: Basketballs

3. Все элементы категории имеют некоторые свойства, например

X Basketballs→Round (X)

4. Элементы категории могут быть распознаны по некоторым свойствам, например:

Orange(X) ∩ Round (X) ∩Diameter (X)=”9.5” ∩X Balls→ X Basketballs

5. Вся категория в целом имеет некоторые свойства, например:

Dogs Domesticalspecies

Хотя отношения между подклассами и классами, а также между элементами и множествами являются для категорий наиболее важными, необходимо также иметь возможность формулировать отношения между категориями, которые не являются подклассами друг друга. Такими отношениями являются, например, ассоциативные отношения, в частности, агрегативные (part_of).




Поделиться с друзьями:


Дата добавления: 2017-02-01; Просмотров: 380; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.062 сек.