Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Е: первые шаги




Машинный перевод

История машинного перевода

1.4.1. Машинный перевод: элементы хронологии. Начало работ по ма­шинному переводу (МП) или автоматическому переводу (АП) относят к 50-м гг. XX в. Идея машинного перевода обязана своим происхождением чисто практическим нуждам. В начале 50-х гг. происходит информационный взрыв — существенно возрастают объемы научно-технической информации. Перевод всей научной и технологической периодики оказывается невозможным. Дополнительный импульс исследованиям в области МП дала «холодная война»: противостоящие общественно-политические системы внимательно следили за развитием научно-технического потенциала друг друга. Именно по этой причине многие первые зарубежные системы МП работают с русским языком.

Формальная дата начала эры машинного перевода — 1949 г. В этом году известный американский специалист по дешифровке Уоррен Уивер составил меморандум, в котором теоретически обосновал принципиальную возможность создания систем МП.Он исходил из того, что структурное сходство между языками может быть формально описано, а это является необходимым условием разработки алгоритмов для ЭВМ.

 

Меморандум был разослан двумстам специалистам в области лингвистики, дешифровки и теории программирования. С этого времени в США появляются коллективы разработчиков МП (в Массачусетском технологическом институте — MIT, в Калифорнийском университете, в Национальном бюро стандартов в Лос-Анджелесе, в Техасском университете). Первая международная конференция по МП организуется в 1952 г. в MIT. Наконец, в 1954 г. проводится известный Джорджтаунский эксперимент, в про­цессе которого осуществляется перевод с русского языка на английский. Хотя программа работала со словарем всего лишь в 250 слов, успех этого эксперимента стимулировал дальнейшие исследования в области МП.

В марте 1947 г. Уоррен Уивер (Warren Weaver), директор отделения естественных наук Рокфеллеровского фонда (Rockefeller Foundation), в переписке с Эдрю Бутом (Andrew D. Booth) и Норбертом Винером (Norbert Wiener) впервые сформулировал концепцию машинного перевода, которую несколько позже (в 1949 г.) развил в своем меморандуме, адресованном Фонду.

У.Уивер писал: "I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text.''

("У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно — это взломать код чтобы извлечь информацию, заключенную в тексте."). Аналогия между переводом и дешифрованием была естественной в контексте послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны.

Первые эксперименты по машинному переводу, подтвердившие принципиальную возможность его реализации, были проведены в 1954 г. в Джорджтаунском университете (г. Вашингтон, США).

 

В качестве пионеров машинного перевода в России выступили такие ученые как Панов Д.Ю., Ляпунов А.А., Мухин И.С., Бельская И.К [76, 77]. За ними последовали. Кулагина О.С., Мельчук И.А., Моторин Ю.А.,. Марчук Ю.Н.,. Пиотровский Р.Г. и многие другие.

В СССР первый эксперимент по МП прошел в 1955 г.: был осу­ществлен перевод на русский язык текстов по прикладной математике. К этому времени относится начало работ по МП в Институте прикладной математики АН СССР под руководством О. С. Кулагиной и И. А. Мель­чука. Коллектив разработчиков создал три экспериментальные систе­мы МП — с французского языка на русский (ФР-1), с английского на русский и с французского на русский (в новом варианте) [Кулагина 1979]. В 1959 г. открывается Лаборатория машинного перевода в МГПИ-ИЯ им. М. Тореза (ныне Московский государственный лингвистический университет), в которой возникли идеи, во многом предвосхитившие дальнейшее развитие теории МП и в какой-то степени систем искус­ственного интеллекта — концепция языка-посредника, понятие модели управления слова, роль словаря в МП и т. д. Серия публикаций этой лаборатории под общим названием «МП и ПЛ» (Машинный перевод и прикладная лингвистика), оказала существенное влияние не только на прикладную, но и на теоретическую лингвистику.

 

 

Изначально предполагалось, что системы МП не должны быть огра­ничены проблемной сферой. Иными словами, машинный перевод должен осуществляться на текстах любых типов — от научно-технических до худо­жественных. Однако довольно быстро обнаружилось, что это невозможно. Выявились две группы причин — лингвистические и экстралингвистичес­кие.

 

1. Лингвистические — сводились к тому, что для разработки систем МП недостаточно имеющихся знаний о функционировании языковой систе­мы. Нужны фундаментальные теоретические разработки в области изуче­ния языка, поскольку традиционной лингвистике (за очень небольшими исключениями) была чужда сама постановка задачи машинного перевода, предполагавшая создание компьютерных моделей анализа и синтеза вы­сказываний. Кроме того, многообразие функций языка, преимуществен­но имплицитный характер языковой способности человека существенно затрудняли формализацию знаний о языковой системе.

2. К экстралингви­стическим причинам можно отнести осознание того факта, что процесс понимания — важнейшая составляющая естественного перевода — далеко не обеспечивается чисто лингвистическим анализом речевого сообщения. Понимание основывается на знаниях адресата, его способности делать выводы и умозаключения, кроме того оно связано с коммуникативной установкой адресата в данной ситуации общения и т. д.

1. ЭТАП на первом этапе делалась ставка прежде всего на грамматически правильный пословный перевод, а полисемия слов разрешалась в основном процедурными средствами на основе учета их синтаксических и семантических признаков. Поэтому системы МП пе рвых трех десятилетий их развития можно охарактеризовать как системы семантико-синтаксического преимущественно пословного перевода. Словосочетания здесь также использовались, но в меньшей степени.

 

Первые си­стемы МП характеризуются стратегией «прямого перевода». Сущность этого подхода к построению МП заключается в том, что исходный текст на языке L1 (= «входной язык») постепенно через ряд этапов преобразует­ся в текст языка L2 (= «выходной язык»). Преобразования сводятся к тому, что слово (словосочетание) на входном языке заменяется на его словар­ный эквивалент на выходном языке.

 

Семантико-синтаксический преимущественно пословный машинный перевод текстов не имеет перспективы, так как в естественных языках смысл словосочетаний, как правило, не сводим или не полностью сводим к смыслу составляющих их слов, и при переводе он не может быть "вычислен" на основе синтаксических и семантических признаков этих слов.




Поделиться с друзьями:


Дата добавления: 2017-01-14; Просмотров: 279; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.