Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Другие подходы и тенденции




Формализм запросов

 

В настоящее время существуют различные примеры языков запросов к докумен­там, проаннотированным на основе формализмов SHOE, рассмотренных выше. Так, в университете Мэриленд (University of Maryland at College Park) разрабо­тан робот Expos, который обрабатывает SHOE-документы и добавляет их в свою базу знаний, используя систему представления знаний PARKA [Stoffel et al, 1997].

Пример PARKA-запроса для поиска домашних страниц может быть специфици­рован следующим образом:

 

(query! "(:and

(#!instance Of?X #!Person) (#! instance Of?Y #!Person)

(#!instance Of?Z#!Organization)

(#!lastName?X "Ivanov") (#!lastName?Y "Ivanova")

(#!employee?Z?X) (#!employee?Z?Y)

(#!marriedTo?X?Y)

(#!involved In?Z"РФФИ-проекты")))

 

По существу, это достаточно простой SQL-запрос, расширенный за счет исполь­зования понятий онтологии, переменных и ограниченных по мощности образцов.

 

Оценивая формализм представления онтологических знаний SHOE и поддержку процессов аннотирования Web-ресурсов в этом проекте в целом, можно конста­тировать, что это достаточно мощная система методов и средств, которая вместе с тем сложнее для пользователя, чем Ontobroker.

 

В заключение настоящего параграфа необходимо, хотя бы в общих чертах, рас­смотреть усилия World Wide Web Consortium (W3C) по созданию и внедрению средств маркировки Интернет-ресурсов.

До недавнего времени в распоряжении Интернет-авторов для этого почти исклю­чительно использовался уже обсуждавшийся выше язык HTML. Однако с точки зрения семантической разметки Интернет-документов этот язык обладает рядом недостатков, основными среди которых являются следующие [Johnson, 1999]:

 

• жесткая ориентация на визуализацию;

• единственная «точка зрения» на данные;

• нерасширяемость;

• весьма ограниченные средства спецификации семантической структуры доку­ментов.

 

Справедливости ради следует заметить, что еще в конце 60-х годов в рамках ис­следований по представлению документов компанией IBM был разработан язык SGML (Standard Generalized Markup Language), который лишен многих из пере­численных недостатков. К середине 80-х годов этот язык стал стандартом для многих промышленных компаний и правительственных учреждений США, но, по мнению специалистов рабочей группы SGML W3C [Bosak, 1997], он слишком сложен для широкого использования Интернет-авторами. Вот почему в рамках W3C, начиная с 1996 года, предпринимаются усилия по разработке средств раз­метки документов, сравнимых по мощности с SGML, а по простоте использова­ния - с HTML. И среди работ данного направления в первую очередь следует отметить язык XML (extensible Markup Language) [XML, 1998].

В языке XML «сняты» многие ограничения HTML, язык разметки стал суще­ственно мощнее. И одновременно XML-тексты остаются понятными для всех, кто работал с языком HTML. Отличительные свойства XML и в том, что здесь фикси­руется стандарт на определение синтаксиса и единообразные средства введения в языки разметки (Markup Language) новых тегов. А это, в свою очередь, позволяет конструировать на основе XML новые языки маркировки Web-документов и, кроме того, обеспечивает возможность различным приложениям (и, в частности, программным агентам) «понимать» и обрабатывать XML-документы.

Каждый XML-документ обладает определенной логической и физической струк­турой. Физически это композиция элементов, называемых единицами (entities), которые могут быть связаны взаимными ссылками. Логически документ состоит из деклараций, единиц, комментариев, собственно текстов и инструкций обработ­ки, причем каждая конструкция XML маркируется специальными тегами явным образом. Все теги XML - парные, а конструкции могут быть вложены друг в дру­га, образуя правильно построенное дерево. Так, например, конструкция <ltem Attribute1=«Value1»> </ltem> определяет единицу с именем Item и списком пар ат­рибут-значение, который в нашем случае представлен единственным атрибутом с именем Attributel, имеющим значение «Value1».

Для иллюстрации возможностей этого языка рассмотрим содержательный при­мер XML-документа, описывающего домашнюю страницу исследователя Ивано­ва.

 

<?xml version="1.0"?>

<Homepage>

<Name>Домашняя страница Иванова< Name >

<Person>

<FirstName>Ivan</firstName >

<LastName>Ivanov</lastName >

<marriedTo Homepage=" http://www.anywhere.ru ">

Mariya Ivanova</marriedTo>

<employee Homepage=" http://www.ccas.ru ">

CCAS of Russia</employee>

<publications>

<book title="First Book"/>

<book title="Second Book"/>

………………………………..

</publications>

</Person>

</Homepage>

 

Этот XML-документ структурирован существенно лучше, чем был бы аналогич­ный ему HTML-текст, но пока не имеет «смысла», так как из него не следует, как интерпретируются единицы типа Person, publications, book и т. п. Для решения этого вопроса используется специальная спецификация определения типа доку­мента DTD (document type definition). По сути дела, это грамматика языка раз­метки, в рамках которой определяются, какие элементы могут присутствовать в документе, какие атрибуты они имеют и как элементы соотносятся друг с другом. Понятно, что для стандарта XML такие спецификации уже разработаны самими авторами языка, но в нашем случае используется специальный его диалект, и по­тому именно мы должны специфицировать DTD нашего документа. Такая спе­цификация может быть следующей:

 

<!ELEMENT Homepage (Name, Person)>

<!ELEMENT Name (#PCDATA)>

<!ELEMENT Person (firstName, lastName, marriedTo?, employee?,

publications?, Homepage?)>

 

<!ATTLIST Person Homepage xml:link CDATA>

<! ELEMENT firstName (#PCDATA)>

<! ELEMENT lastName (#PCDATA)>

<! ELEMENT marriedTo (Person)>

<! ELEMENT employee (organization)>

<!ATTLIST organization Homepage xml:link CDATA>

<!ELEMENT publications (book*, paper*, report*)>

<!ATTLIST book title CDATA «REQUIRED, coauthor Person,

publisher CDATA, year CDATA)>

<! ELEMENT paper (title, coauthor*, journal, year, vol?, number?)>

<! ELEMENT report (title, coauthor*, organization, year)>

 

Как следует из приведенного описания, в DTD специфицировано «сведение» конструкций нашего XML-документа к стандартным XML-конструкциям, пони­маемым броузерами нового поколения.

 

В настоящее время уже разработаны DTD для различных предметных областей, и каждая такая спецификация, по сути дела, определяет новый язык разметки. Известным примером развития DTD для спецификации общих ресурсов являет­ся RDF (Resource Description Framework) [RDF, 1999], разрабатываемый W3C. Этот формат может использоваться для добавления в документы метаинформации, которая, в частности, может быть представлением семантики документа.

 

Использование собственных диалектов XML является важным шагом на пути формирования пространств знаний в сети Интернет. Но, по сути дела, это лишь первый шаг в этом направлении. Действительно, какие средства дает язык XML для представления знаний? Очевидно, что это, в первую очередь, средства специ­фикации декларативной компоненты развитых систем представления знаний. И то в ограниченном объеме. Каким же образом авторы этого языка и его расши­рений предполагают подключение процедур обработки XML-конструкций? На сегодняшний день в предложениях W3C явно прослеживается лишь одна идея: поскольку XML-документы не что иное, как портабельные данные, а язык Java имеет портабельный код, следует их использовать совместно. Для этого предла­гаются специальные интерфейсы, например SAX (Simple API for XML), которые уже сейчас могут поддерживать многие Java-анализаторы. Основная идея здесь достаточно проста - анализатор просматривает узлы дерева документа из XML-файла и вызывает соответствующие методы, определенные пользователем. Для того чтобы этот механизм работал, программист должен создать класс, реализу­ющий соответствующий интерфейс. Методы этого класса будут вызываться вся­кий раз, когда на входе распознавателя появляется нужная конструкция (тег, входная строка и т. п.). Собственно обработка информации при этом целиком в руках программиста, а среда лишь поддерживает общее функционирование и об­работку исключительных ситуаций.

 

Такой подход имеет много общего и с подходом Ontobroker, и с подходом SHOE. Авторы обоих этих проектов активно приветствуют усилия W3C, но вместе с тем отмечают, что в предложениях соответствующих рабочих групп еще много недо­статков. В первую очередь - это отсутствие стандартов на интеллектуальную об­работку XML-конструкций, сравнительно небольшой практический опыт семан­тической разметки Интернет-документов и достаточно ограниченные средства логической обработки, используемые при этом.

 

Вот почему, как показывает анализ литературы и Интернет-ресурсов по данной тематике, в настоящее время:

• эффективная обработка информации на Web связывается, в первую очередь, с использованием ИИ-технологий;

• основные подходы в этой области ориентированы на решение проблемы из­влечения из Web-ресурсов эксплицитных знаний на основе семантического маркирования таких ресурсов;

• во всех исследовательских и многих коммерческих проектах данного направ­ления активно используются (или, по крайней мере, декларируется использо­вание) агентно-ориентированные вычисления и технологии.

 

Учитывая вышесказанное, в следующей главе обсуждаются мультиагентные сис­темы и системы интеллектуальных агентов.

 




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 380; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.