Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Лингвистический аспект




 

Лингвистический (А2) аспект касается исследований языковых проблем, так как язык - это основное средство общения в процессе извлечения знаний. Сразу же следует оговорить, что поскольку тема данной книги ограничена изло­жением теории и технологии инженерии знаний, то область разработки есте­ственно-языковых интерфейсов и весь спектр проблем, связанных с ней - лекси­ческих, синтаксических, семантических, прагматических и т. д. [Виноград, 1976; Мальковский, 1985; Попов, 1982], - не рассматривается.

В инженерии знаний можно выделить три слоя лингвистических проблем (рис. 3.11):

А2 = {S21, S22, S23} - {«общий код», понятийная структура, словарь пользователя}.

 

 

Рис. 3.11. Лингвистический аспект извлечения знаний

 

 

«Общий код» (S21)

 

«Общий код» решает проблему языковых ножниц между профессиональной тер­минологией эксперта и обыденной литературной речью инженера по знаниям и включает следующие компоненты:

 

S21 = {s21_i} = {общенаучная терминология; специальные понятия из профессио­нальной литературы; элементы бытового языка; неологизмы, сформированные за время совместной работы; профессиональный жаргон и др.}.

Детализация схемы общения (см. рис. 3.8) на рис. 3.11 позволяет представить средства общения как два потока [Горелов, 1987], в которых нас интересуют ком­поненты V1 и V2 - языки, на которых говорят аналитик и эксперт (V1', V2' - невербальные компоненты). Различие языков V1 и V2 и обусловливает «языко­вый барьер» или «языковые ножницы» в общении инженера по знаниям и экс­перта.

Эти два языка являются отражением «внутренней речи» эксперта и аналитика, поскольку большинство психологов и лингвистов считают, что язык - это ос­новное средство мышления наряду с другими знаковыми системами «внутрен­него пользования» (универсальный семантический код - УСК [Мартынов, 1977], языки «смысла» [Мельчук, 1974], концептуальные языки [Шенк, 1980] и др.).

 

Язык аналитика V1 состоит из трех компонентов:

• s21_l — общенаучной терминологии из его «теоретического багажа»;

• s21_2 — терминов предметной области, которые он почерпнул из специальной литературы в период подготовки;

• s21_3 — бытового разговорного языка, которым пользуется аналитик.

 

Язык эксперта V2 включает:

• s21_l — общенаучную терминологию;

• s21_2 — специальную терминологию, принятую в предметной области;

• s21_3 — бытовой язык;

• s21_4 — неологизмы, созданные экспертом за время работы, то есть его про­фессиональный жаргон.

 

Если считать, что бытовой и общенаучный языки у двух участников общения примерно совпадают (хотя реально объем второго компонента у эксперта суще­ственно больше), то некоторый общий язык или код, который необходимо выра­ботать партнерам для успешного взаимодействия, будет складываться из пото­ков, представленных на рис. 3 12.

В дальнейшем этот общий код преобразуется в некоторую понятийную (семан­тическую) сеть, которая является прообразом поля знаний предметной области.

Выработка общего кода начинается с выписыванием аналитиком всех терминов, употребляемых экспертом, и уточнения их смысла. Фактически это составление словаря предметной области. Затем следует группирование терминов и выбор синонимов (слов, означающих одно и то же). Разработка общего кода заканчивается составлением словаря терминов предметной области с предварительной группировкой их по смыслу, то есть по понятийной близости (это уже первый шаг структурирования знаний).

На этом этапе аналитик должен с большим вниманием отнестись ко всем специ­альным терминам, пытаясь максимально вникнуть в суть решаемых проблем и терминологию. Освоение аналитиком языка предметной области - первый ру­беж на подступах к созданию адекватной базы знаний.

 

Рис. 3.12. Структура общего кода

 

Рисунок 3.12 дает представление о процессе неоднозначности интерпретации терминов двумя специалистами. В семиотике, науке о знаковых системах, проблема интерпретации является одной из центральных. Интерпретация свя­зывает «знак» и «означаемый предмет». Только в интерпретации знак получает смысл. Так, на рис. 3.13 слова «прибор X» для эксперта означает некоторую кон­кретную схему, которая соответствует схеме оригинала прибора, а в голове начи­нающего аналитика слова «прибор X» вызывают пустой образ или некоторый черный ящик с ручками.

 




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 654; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.