КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Формализм представления и машина вывода
Спецификации онтологий и инструментарий SHOE Общая характеристика проекта Проект SHOE - спецификация онтологий и инструментарий
Проект SHOE {Simple HTML Ontology Extensions) ориентирован на решение проблемы добавления к Web-страницам семантической информации и соотнесения ее с онтологиями соответствующих предметных областей. Предполагается, что, используя эту информацию, поисковые системы смогут обеспечивать более релевантные ответы на запросы, чем это возможно сейчас на базе использования машин поиска, функционирующих в Интернете. Для поддержки процессов аннотирования в рамках проекта SHOE разрабатывается специальный набор инструментальных средств (suite of tools), а основой их является язык Интернет-совместимого представления знаний, который, собственно, и дал название всему проекту. В настоящее время в проекте SHOE выделены следующие главные направления исследований:
• Разработка множества повторно используемых онтологий (reusable ontologies) для концептов, которые наиболее частотны для Web-ресурсов. • Создание средств проектирования онтологий - аннотаторов знаний (Knowledge Annotator), которые бы упростили этот процесс.
Предполагается также, что в SHOE-инструментарий будет включена «несложная» обработка естественного языка (lightweight natural language processing techniques), которая обеспечит представление пользователям аннотаций документов.
В данном подразделе мы сосредоточимся не столько на самих онтологиях, разрабатываемых в рамках проекта SHOE [Luke et al., 1996], сколько на языке представления онтологических знаний и средствах поддержки процессов проектирования онтологий.
Следует сразу отметить, что SHOE по своей идее близок к уже обсуждавшейся выше инициативе (КА)2. Но концепция языка представления знаний здесь другая, хотя и она лежит в русле расширения HTML специальными тегами. А основное отличие языка SHOE в том, что здесь, по существу, предлагается «полномасштабное» расширение HTML. Для этого SHOE вводит в HTML-стандарт следующие новые теги для спецификации онтологий: ONTOLOGY, USE-ONTOLOGY, DEF-CATEGORY, DEF-RELATION, DEF-ARG, DEF-RENAME, DEF-CON-STANT, DEF-TYPE, DEF-INFERENCE, INF-IF, INF-THEN, COMPARISON, CATEGORY, RELATION, ARG и некоторые другие. Для аннотирования HTML-документов используется часть из уже перечисленных тегов и, кроме того, вводятся новые, например INSTANCE. И наконец, в SHOE вводится метатег вида <МЕТА НТТР-EQUIV =...">.
Для определенности в рамках спецификации языка SHOE предполагается, что онтология представляется в виде is_a иерархии классов/категорий, множества атомарных отношений между категориями и множества правил вывода в форме простых клауз Хорна.
Термами языка являются термы HTML и дополнительно к этому понятия Category (Class), Data (причем с типами STRING, NUMBER, DATE, TRUTH), Element, Instance, Instance Key, Name, Ontology, Relation (Relationship), Rule и некоторые другие.
Декларации онтологий задаются внутри тела HTML-документа и не могут перекрываться с другими тегами HTML. В одном документе может быть определено несколько онтологии, но такие определения тоже не может перекрываться или быть вложенными. Общая схема определения онтологии следующая:
<ONTOLOGY ID=" идентификатор-онтологии" VERSION=" версия " [BACKWARD-COMPATIBLE-WITH=" список-версий "] [DESCRIPTION=" текст "] [DECLARATORS=" список-деклар. - экземпляров"]> собственно-декларация-онтологии </ONTOLOGY>
Для указания того, что данная онтология расширяет другую, уже существующую, используется специальный тег:
<USE-ONTOLOGY ID=" идентификатор-онтологии" VERSION =" версия" PREFIX =" префикс" [URL="URL"]>
Внутри определения онтологии могут специфицироваться новые категории, для чего используется специальный тег вида:
<DEF-CATEGORY NAME=" имя-категории" [ISA="список-родительских-категорий"] [DESCRIPTION= "текст" ][SHORT= " текст "]>
Аналогичный подход применяется и для определения отношений:
<DEF-RELATION NAME =" имя-отношения" [DESCRIPTION=" текст "] [SHORT= " текст" ]> список-аргументов </DEF-RELATION>
Возможно определение тех же понятий и с помощью тега ONTDEF с параметрами. Одним из важнейших компонентов определения онтологии являются правила вывода. В SHOE такие правила «похожи» на Хорновские клаузы по сути, но отличаются от них по форме:
<DEF-INFERENCE [DESCRIPTIONS " текст " ]> <INF-IF> тело </INF-IF> <INF-THEN> голова </INF-THEN> </ DEF-INFERENCE >
Для примера, ниже обсуждается фрагмент определения онтологии в формализме SHOE, коррелирующий с уже обсуждавшимся фрагментом определения аналогичной онтологии в формализме Ontobroker. Пусть нас интересуют исследователи, имеющие в Интернете свои домашние страницы. Для работы с такими страницами можно воспользоваться уже существующей в рамках SHOE онтологией общих понятий (organization-ontology version 2.1) по адресу http://www.ont.org/orgont.html. Однако предположим для определенности, что существующую онтологию необходимо расширить понятиями Person и Organization. Тогда спецификация фрагмента новой онтологии (НоmePageOntology) может быть представлена в формализме SHOE следующим образом:
<ONTOLOGY ID ="HomePageOntology" VERSION= "1. 0"> <ONTOLOGY-EXTENDS "organization-ontology" VERSION= "2. 1 " PREFIX= " org " URL="http://www. ont. org/orgont. html"> <ONTDEF CATEGORY=" Person" ISA="org.Thing"> <ONTDEF RELATION=" lastNam e" ARGS=" Person STRING"> <ONTDEF RELATION= " firstName" ARGS=" Person STRING"> <ONTDEF RELATION ="marriedTo" ARGS ="Person Person"> <ONTDEF RELATION ="employee" ARGS= "org. Organization Person"> ……………………………………………… </ ONTOLOGY >
Аннотация Web-документов на базе онтологии Аннотация HTML-документов в SHOE осуществляется также с использованием тегов. В частности, для этого служат теги USE-ONTOLOGY, INSTANCE, CATEGORY, RELATION. Последние три тега имеют следующие форматы:
<INSTANCE KEY=" значение-ключа" [DELEGATE-TO=" список-примеров" ]>... </INSTANCE> <CATEGORY NAME=" префикс. категория" [FOR="Kлюч"]> <RELATION NAME=" префикс. отношение">список-аргументов </RELATION>
Для поиска и обработки домашних страниц с помощью специфицированной выше онтологии необходимо, чтобы авторы Web-публикаций сами (или на основе инструментария SHOE) проаннотировали свои документы. Так, например, фрагмент аннотации персональной страницы исследователя Иванова в формализме SHOE выглядит следующим образом:
<BODY> <МЕТА HTTP-EQUIV= "Instance" CONTENT="http://www. anywhere. ru/~ivanov"> <USE-ONTOLOGY "HomePageOntology" VERSION=" 1.0 " PREFIX="our" URL =" http://www.ont.org/HomePageOntology html"> <CATEGORY "our. Person"> <RELATION "our.firstName" TO=" Ivan"> <RELATION "our.lastName" TO="Ivanov"> <RELATION "our.marriedTo" TO=" http://www. somewhere. ru/~Mariya"> <RELATION "our. employee FROM=" http.//www. ccas. ru"> ………………………………………. </BODY>
Анализ приведенного HTML-текста показывает, что даже в таком, казалось бы, простом случае задача аннотации Web-документа достаточно сложна. Ситуация становится еще более сложной при аннотировании реальных HTML-документов. Во-первых, уже выбор объектов текста, подлежащих аннотированию, не тривиален, особенно, если Web-документ представляет объекты реального мира. Во-вторых, гиперссылки часто фиксируют лишь наличие определенных отношений между объектами, но не их семантику. И, наконец, можно, конечно, аннотировать каждую именную группу в естественно-языковом представлении HTML-страницы, но для реальных документов это слишком трудоемкая задача, которая, к тому же, чревата большим количеством ошибок. Поэтому в рамках проекта SHOE для автоматизации процессов аннотирования Web-документов разработана специальная система Knowledge Annotator [KA, 1999], одна из экранных форм которой представлена на рис. 8.12.
Рис. 8.12. Экранная форма системы Knowledge Annotator
Основными информационными блоками в приведенной выше экранной форме являются экземпляры (instances), онтологии (ontologies) и утверждения (claims). Пользователь может добавлять, редактировать и/или удалять любой из элементов этих блоков. При создании новых объектов пользователю выдаются соответствующие подсказки в виде, например, списка доступных онтологий, описанных в них категорий, отношений и т. п. Для визуализации знаний, содержащихся в обрабатываемом документе, Knowledge Annotator использует различные методы, начиная с аннотированного HTML-текста и заканчивая описаниями утверждений на естественном (английском) языке. Кроме того, система осуществляет проверку корректности действий пользователя и транслирует его выборы в синтаксически правильные конструкции SHOE.
Дата добавления: 2015-07-02; Просмотров: 401; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |