Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Идентификация смысла




Локально-семантическая структура предложения

Одним из основных этапов смыслового анализа текста является понимание смысла входного предложения, включающее в себя описание сущностей входного текста, описанных в предложении, определение их свойств и отношений между ними.

Смысл предложения выражается предикатной структурой. В предикатах указывается не только аргументная структура и количество, но и их семантическое содержание (роли). Разные исследователи используют разные системы отношений (ролей). Филмор выделяет следующие семантические роли: агент, контрагент, объект, адресат, пациенс (объект действия, жертва), результат, инструмент, источник. Каждое понятие расщепляется на две сущности: значение и пресуппозицию. Различия между пресуппозицией и значением в собственном смысле слова проявляются, например, в различном влиянии на них отрицания. В область действия отрицания попадает только значение, а не пресуппозиция. Единственным существенным критерием выбора системы ролевых отношений является критерий возможности их автоматичского установления в предложениях текста по лингвистическим меткам.

Предикатные отношения между сущностями, представленными в предложениях, выстраиваются в цепочку, как и предложения текста, в которых они содержатся. Это квазиграф, подобный размеченному ориентированному графу, в котором, кроме бинарных отношений, есть тернарные и квартернарные.

 

Идентификация смысла в этом случае осуществляется по образцам. Квазиграфы ключевых понятий текста с их отношениями для всех текстов предметной области составляют некоторое первоначальное множество, которое кластеризуется, возможно даже с дроблением на более мелкие подграфы, с формированием множества образцов (шаблонов), имеющих конкретный смысл. В посл6едствие любой входной текст отображается на множество таких шаблонов (интерпретируется) с возможностью перечисления названий шаблонов – тем и подтем, содержащихся в тексте.

В подобных моделях текст характеризуется следующими сущностями: смыслами слов, сообщениями, фрагментами текста и семантической совместимостью. Сообщение рассматривается как теоретический конструкт, посредством которого для каждого слова, входящего во фрагмент текста, может быть выбран один из смыслов слова, посредством чего снимается многозначность. Слову назначается тот из его многих смыслов, который образует «сообщение», согласующееся, в конце концов, с рассматриваемым фрагментом текста. Если слово может подойти к нескольким сообщениям, то выбирается такое, которое согласуется с рассматриваемым текстом.

 




Поделиться с друзьями:


Дата добавления: 2014-01-11; Просмотров: 387; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.