Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Лингвистический аспект

Семантическая репрезентативность

Эта проблема подразумевает подход, исключающий традиционное навязы­вание эксперту некой модели представлений (например, продукционной или фреймовой), и, напротив, заставляет инженера по знаниям последова­тельно воссоздавать модель мира эксперта, используя как неформальные методы, так и математический аппарат, например многомерное шкалирова­ние [Петренко, 1988; Воинов, Гаврилова, 1996]. Проблема семантической репрезентативности ориентирована на достижение когнитивной адекватно­сти поля знаний и концептуальной модели. В настоящий момент она может быть сформулирована как проблема "испорченного телефона" [Гаврилова, Червинская, 1992] (см. разд. 2.1, рис. 2.4) — возможные трансформации и потери в цепи передачи информации.

Лингвистический аспект касается исследований языковых проблем, т. к. язык — это основное средство общения в процессе извлечения знаний.

Сразу же следует оговорить, что поскольку лекция посвящена проблемам разработки ЭС, то область разработки естественно-языковых интерфейсов и весь спектр проблем, связанных с ней — лексических, синтаксических, семантических, прагматических и т. д. [Мальковский, 1985; Попов, 1982], не рассматривается.

В инженерии знаний можно выделить три слоя лингвистических проблем (рис. 2.11):

Ø "общий код";

Ø понятийная структура;

Ø cловарь пользователя.

Рис. 2.11. Лингвистический аспект извлечения знаний

"Общий код"

"Общий код" решает проблему языковых ножниц между профессиональной терминологией эксперта и обыденной литературной речью инженера по знаниям и включает следующие компоненты:

Ø общенаучная терминология;

Ø специальные понятия из профессиональной литературы;

Ø элементы бытового языка;

Ø неологизмы, сформированные за время совместной работы;

Ø профессиональный жаргон и др.

Детализируя схему общения (см. рис. 2.8), можно представить средства об­щения как два потока [Горелов, 1987], состоящих из компонентов V1 и V2 — соответственно языки, на которых говорят аналитик и эксперт (V1 и V2 — невербальные компоненты). Различия языков V1 и V2 и обуславливает "языковый барьер" или "языковые ножницы" в общении инженера по знаниям и эксперта.

Эти два языка являются отражением "внутренней речи" эксперта и аналити­ка, поскольку большинство психологов и лингвистов считают, что язык — это основное средство мышления, наряду с другими знаковыми система­ми "внутреннего пользования" (универсальный семантический код — УСК [Мартынов. 1977], языки "смысла" [Мельчук, 1974], концептуальные языки [Шенк, 1980] и др.).

Язык аналитика V1 состоит из трех компонентов:

Ø общенаучной терминологии из его "теоретического багажа";

Ø терминов предметной области, которые он почерпнул из специальной литературы в период подготовки;

Ø бытового разговорного языка, которым пользуется аналитик.

Язык эксперта V2 включает:

Ø общенаучную терминологию;

Ø специальную терминологию, принятую в предметной области;

Ø бытовой язык;

Ø неологизмы, созданные экспертом за время работы, т. е. его профессиональный жаргон.

Если считать, что бытовой и общенаучный язык у двух участников общения примерно совпадает (хотя реально объем второго компонента у эксперта существенно больше), то некоторый общий язык или код, который необходимо выработать партнерам для успешного взаимодействия, будет склады­ваться из потоков, представленных на рис. 2.12.

В дальнейшем этот общий код преобразуется в некоторую понятийную (семантическую) сеть, которая является прообразом поля знаний предметной области.

Выработка общего кода начинается с выписыванием аналитиком всех тер­минов, употребляемых экспертом, и уточнения их смысла. Фактически это составление словаря предметной области. Затем следует группирование тер­минов и выбор синонимов (слов, означающих одно и то же). Разработка общего кода заканчивается составлением словаря терминов предметной об­ласти с предварительной группировкой их по смыслу, т. е. по понятийной близости (это уже первый шаг структурирования знаний).

На этом этапе аналитик должен с большим вниманием отнестись ко всем специальным терминам, пытаясь максимально вникнуть в суть решаемых проблем и терминологию. Освоение аналитиком языка предметной облас­ти — первый рубеж на подступах к созданию адекватной базы знаний.

Рис. 2.12. Структура общего кода

Рис. 2.13 дает представление о процессе неоднозначности интерпретации терминов двумя специалистами. В семиотике, науке о знаковых системах, проблема интерпретации является одной из центральных. Интерпретация связывает "знак" и "означаемый предмет". Только в интерпретации знак по­лучает смысл. Так, на рис. 2.13 слова "прибор X" для эксперта означают не­которую конкретную схему, которая соответствует схеме оригинала прибо­ра, а в голове начинающего аналитика слова "прибор X" вызывают пустой образ или некоторый черный ящик с ручками

 

Рис. 2.13. Неоднозначность интерпретации

Внимание к лингвистическому аспекту проблемы извлечения знаний спо­собствует сближению образа 1 с образом 2 и интерпретации I1 с интерпре­тацией I2, а слова "прибор X" перейдут в действительно "общий" код.

<== предыдущая лекция | следующая лекция ==>
Когнитивный стиль | Понятийная структура
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 1111; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.015 сек.