Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Проблема чрезмерности данных




Проблема недостаточности данных

Вопрос объема корпуса

Порог отображения данных, репрезентативность и полнота корпуса

Единица хранения и уровень разметки

Проблемная область

Понятия корпусной лингвистики

Раньше конкорданс можно было представить на карточках словарной коллекции.

Новая эпоха лексикографии началась с появлением баз данных и корпусов

Качественная дефиниция в словаре

Построение словарей на основе корпуса

Корпус

Язык Речь

Работа с огромными объемами информации.

Появление корпусов изменило философию лингвистического исследования

Корпус vs. программа АОТ

Корпус vs. текстовый процессор

Корпус vs. поисковая машина

Корпус vs. электронная библиотека

Корпусная лингвистика

Что такое корпус?

Wikipedia: Лингвистическим корпусом называют совокупность текстов, собранных в соответствии с определёнными принципами, размеченных по определённому стандарту и обеспеченных специализированной поисковой системой.

Иногда корпусом называют просто любое собрание текстов, объединённых каким-то общим признаком (языком, жанром, автором, периодом создания текстов).

«Родственники» корпуса

Плунгян Владимир Александрович,
д-р филол. наук, координатор проекта «Национальный корпус русского языка»

нет, а это означает, что в распоряжении исследователя оказываются колоссальные массивы текстов самого разного типа. Это не замедлило сказаться на развитии наших знаний о языке <…> подлинно научные описания грамматического строя языков, а также авторитетные академические словари — практически все без исключений — должны составляться на основе корпусов этих языков.»

Влияние корпусной лингвистики на традиционные взгляды: наличие корпусов не только подтверждает научные гипотезы, но и ставит оригинальные проблемы перед теоретической лингвистикой.

Дихотомия → триада

Конкорданс – массив употреблений одной единицы.

В настоящее время Supermicro выпускает материнские платы, корпуса и серверы.

Старайся держать корпус как можно прямее.

Сегодня информационные технологии не дополняют, а компенсируют последствия отчуждения общества от корпуса текстов.

Впечатление не портила даже проходящая стройка новых корпусов

Корпус бюрократов растёт из года в год.

… … … всего 21 489 контекстов из НКРЯ.

Залог качественной, «неумозрительной» выборки материала

Он не был репрезентативен…

На него уходила масса времени и усилий…

Корпус данных (чаще текстов)

Порог отображения данных: пропорциональное сужение




Поделиться с друзьями:


Дата добавления: 2015-07-02; Просмотров: 425; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.009 сек.