Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Формализм представления и машина вывода




Спецификации онтологий и инструментарий SHOE

Общая характеристика проекта

Проект SHOE - спецификация онтологий и инструментарий

 

Проект SHOE {Simple HTML Ontology Extensions) ориентирован на решение про­блемы добавления к Web-страницам семантической информации и соотнесения ее с онтологиями соответствующих предметных областей. Предполагается, что, используя эту информацию, поисковые системы смогут обеспечивать более реле­вантные ответы на запросы, чем это возможно сейчас на базе использования ма­шин поиска, функционирующих в Интернете.

Для поддержки процессов аннотирования в рамках проекта SHOE разрабатыва­ется специальный набор инструментальных средств (suite of tools), а основой их является язык Интернет-совместимого представления знаний, который, собствен­но, и дал название всему проекту.

В настоящее время в проекте SHOE выделены следующие главные направления исследований:

 

• Разработка множества повторно используемых онтологий (reusable ontolo­gies) для концептов, которые наиболее частотны для Web-ресурсов.

• Создание средств проектирования онтологий - аннотаторов знаний (Know­ledge Annotator), которые бы упростили этот процесс.

 

Предполагается также, что в SHOE-инструментарий будет включена «неслож­ная» обработка естественного языка (lightweight natural language processing te­chniques), которая обеспечит представление пользователям аннотаций докумен­тов.

 

 

В данном подразделе мы сосредоточимся не столько на самих онтологиях, разра­батываемых в рамках проекта SHOE [Luke et al., 1996], сколько на языке пред­ставления онтологических знаний и средствах поддержки процессов проектиро­вания онтологий.

 

 

Следует сразу отметить, что SHOE по своей идее близок к уже обсуждавшейся выше инициативе (КА)2. Но концепция языка представления знаний здесь дру­гая, хотя и она лежит в русле расширения HTML специальными тегами. А основ­ное отличие языка SHOE в том, что здесь, по существу, предлагается «полномасш­табное» расширение HTML. Для этого SHOE вводит в HTML-стандарт следующие новые теги для спецификации онтологий: ONTOLOGY, USE-ONTOLOGY, DEF-CATEGORY, DEF-RELATION, DEF-ARG, DEF-RENAME, DEF-CON-STANT, DEF-TYPE, DEF-INFERENCE, INF-IF, INF-THEN, COMPARISON, CATEGORY, RELATION, ARG и некоторые другие. Для аннотирования HTML-документов используется часть из уже перечисленных тегов и, кроме того, вводятся новые, на­пример INSTANCE. И наконец, в SHOE вводится метатег вида <МЕТА НТТР-EQUIV =...">.

 

Для определенности в рамках спецификации языка SHOE предполагается, что онтология представляется в виде is_a иерархии классов/категорий, множества атомарных отношений между категориями и множества правил вывода в форме простых клауз Хорна.

 

Термами языка являются термы HTML и дополнительно к этому понятия Cate­gory (Class), Data (причем с типами STRING, NUMBER, DATE, TRUTH), Element, In­stance, Instance Key, Name, Ontology, Relation (Relationship), Rule и некоторые дру­гие.

 

Декларации онтологий задаются внутри тела HTML-документа и не могут пере­крываться с другими тегами HTML. В одном документе может быть определено несколько онтологии, но такие определения тоже не может перекрываться или быть вложенными. Общая схема определения онтологии следующая:

 

<ONTOLOGY ID=" идентификатор-онтологии"

VERSION=" версия "

[BACKWARD-COMPATIBLE-WITH=" список-версий "]

[DESCRIPTION=" текст "]

[DECLARATORS=" список-деклар. - экземпляров"]>

собственно-декларация-онтологии

</ONTOLOGY>

 

Для указания того, что данная онтология расширяет другую, уже существующую, используется специальный тег:

 

<USE-ONTOLOGY ID=" идентификатор-онтологии"

VERSION =" версия" PREFIX =" префикс" [URL="URL"]>

 

Внутри определения онтологии могут специфицироваться новые категории, для чего используется специальный тег вида:

 

<DEF-CATEGORY NAME=" имя-категории"

[ISA="список-родительских-категорий"]

[DESCRIPTION= "текст" ][SHORT= " текст "]>

 

Аналогичный подход применяется и для определения отношений:

 

<DEF-RELATION NAME =" имя-отношения"

[DESCRIPTION=" текст "] [SHORT= " текст" ]>

список-аргументов

</DEF-RELATION>

 

Возможно определение тех же понятий и с помощью тега ONTDEF с парамет­рами.

Одним из важнейших компонентов определения онтологии являются правила вывода. В SHOE такие правила «похожи» на Хорновские клаузы по сути, но от­личаются от них по форме:

 

<DEF-INFERENCE [DESCRIPTIONS " текст " ]>

<INF-IF> тело </INF-IF>

<INF-THEN> голова </INF-THEN>

</ DEF-INFERENCE >

 

Для примера, ниже обсуждается фрагмент определения онтологии в формализме SHOE, коррелирующий с уже обсуждавшимся фрагментом определения анало­гичной онтологии в формализме Ontobroker.

Пусть нас интересуют исследователи, имеющие в Интернете свои домашние стра­ницы. Для работы с такими страницами можно воспользоваться уже существую­щей в рамках SHOE онтологией общих понятий (organization-ontology ver­sion 2.1) по адресу http://www.ont.org/orgont.html. Однако предположим для определенности, что существующую онтологию необходимо расширить понятия­ми Person и Organization. Тогда спецификация фрагмента новой онтологии (НоmePageOntology) может быть представлена в формализме SHOE следующим об­разом:

 

<ONTOLOGY ID ="HomePageOntology" VERSION= "1. 0">

<ONTOLOGY-EXTENDS "organization-ontology"

VERSION= "2. 1 " PREFIX= " org "

URL="http://www. ont. org/orgont. html">

<ONTDEF CATEGORY=" Person" ISA="org.Thing">

<ONTDEF RELATION=" lastNam e" ARGS=" Person STRING"> <ONTDEF RELATION= " firstName" ARGS=" Person STRING"> <ONTDEF RELATION ="marriedTo" ARGS ="Person Person">

<ONTDEF RELATION ="employee" ARGS= "org. Organization Person">

………………………………………………

</ ONTOLOGY >

 

Аннотация Web-документов на базе онтологии

Аннотация HTML-документов в SHOE осуществляется также с использованием тегов. В частности, для этого служат теги USE-ONTOLOGY, INSTANCE, CATEGORY, RELATION. Последние три тега имеют следующие форматы:

 

<INSTANCE KEY=" значение-ключа"

[DELEGATE-TO=" список-примеров" ]>... </INSTANCE>

<CATEGORY NAME=" префикс. категория" [FOR="Kлюч"]>

<RELATION NAME=" префикс. отношение">список-аргументов </RELATION>

 

Для поиска и обработки домашних страниц с помощью специфицированной вы­ше онтологии необходимо, чтобы авторы Web-публикаций сами (или на основе инструментария SHOE) проаннотировали свои документы.

Так, например, фрагмент аннотации персональной страницы исследователя Ива­нова в формализме SHOE выглядит следующим образом:

 

<BODY>

<МЕТА HTTP-EQUIV= "Instance"

CONTENT="http://www. anywhere. ru/~ivanov">

<USE-ONTOLOGY "HomePageOntology"

VERSION=" 1.0 " PREFIX="our"

URL =" http://www.ont.org/HomePageOntology html">

<CATEGORY "our. Person">

<RELATION "our.firstName" TO=" Ivan">

<RELATION "our.lastName" TO="Ivanov">

<RELATION "our.marriedTo"

TO=" http://www. somewhere. ru/~Mariya">

<RELATION "our. employee FROM=" http.//www. ccas. ru">

……………………………………….

</BODY>

 

Анализ приведенного HTML-текста показывает, что даже в таком, казалось бы, простом случае задача аннотации Web-документа достаточно сложна. Ситуация становится еще более сложной при аннотировании реальных HTML-документов. Во-первых, уже выбор объектов текста, подлежащих аннотированию, не три­виален, особенно, если Web-документ представляет объекты реального мира. Во-вторых, гиперссылки часто фиксируют лишь наличие определенных отношений между объектами, но не их семантику. И, наконец, можно, конечно, аннотировать каждую именную группу в естественно-языковом представлении HTML-страни­цы, но для реальных документов это слишком трудоемкая задача, которая, к тому же, чревата большим количеством ошибок.

Поэтому в рамках проекта SHOE для автоматизации процессов аннотирования Web-документов разработана специальная система Knowledge Annotator [KA, 1999], одна из экранных форм которой представлена на рис. 8.12.

 

 

Рис. 8.12. Экранная форма системы Knowledge Annotator

 

Основными информационными блоками в приведенной выше экранной форме являются экземпляры (instances), онтологии (ontologies) и утверждения (claims). Пользователь может добавлять, редактировать и/или удалять любой из элемен­тов этих блоков. При создании новых объектов пользователю выдаются соответ­ствующие подсказки в виде, например, списка доступных онтологий, описанных в них категорий, отношений и т. п.

Для визуализации знаний, содержащихся в обрабатываемом документе, Know­ledge Annotator использует различные методы, начиная с аннотированного HTML-текста и заканчивая описаниями утверждений на естественном (англий­ском) языке. Кроме того, система осуществляет проверку корректности действий пользователя и транслирует его выборы в синтаксически правильные конструк­ции SHOE.

 




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 401; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.