КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
На втором этапе стал использоваться термин автоматизированный перевод
В современной форме идея АП была развита в статье Мартина Кея 1980 года [2], который выдвинул следующий тезис: «by taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human» (компьютер берет на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления). НА СОВРЕМЕННОМ ЭТАПЕ РАЗЛИЧАЮТ: В настоящее время различают три вида систем АВТОМАТИЗИРОВАННОГО перевода:
1. Системы на основе грамматических правил (RuleBased Machine Translation, RBMT); 2. Статистические системы (Statistical Machine Translation, SMT); 3. Гибридные системы;
Системы на основе грамматических правил производят анализ текста, который используется в процессе перевода. Перевод производится на основе встроенных словарей для данной языковой пары, а так же грамматик, охватывающих семантические, морфологические, синтаксические закономерности обоих языков. На основе всех этих данных исходный текст последовательно, предложение за предложением, преобразуется в текст на требуемом языке. Основной принцип работы таких систем — связь структур исходного и конечного текстов. Преимуществами систем на основе грамматических правил являются грамматическая и синтаксическая точность, стабильность результата, возможность настройки на специфическую предметную область. К недостаткам систем на основе грамматических правил относят необходимость создания, поддержки и обновления лингвистических баз данных, трудоемкость создания такой системы, а так же ее высокая стоимость. Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT). Основной принцип работы состоит в связи структур исходного и переводимого текста. Перевод осуществляется на базе встроенных словарей, грамматике, охватывающей морфологические, синтаксические и семантические закономерности исходного и переводимого текста. На основе этих данных исходный текст последовательно преобразуется в текст на требуемом языке.
Статистические системы при своей работе используют статистический анализ. В систему загружается двуязычный корпус текстов (содержащий большое количество текста на исходном языке и его «ручной» перевод на требуемый язык), после чего система анализирует статистику межъязыковых соответствий, синтаксических конструкций и т. д. Система является самообучаемой — при выборе варианта перевода она опирается на полученную ранее статистику. Чем больший словарь внутри языковой пары и чем точнее он составлен, тем лучше результат статистического машинного перевода. С каждым новым переведенным текстом улучшается качество последующих переводов. Статистические системы отличаются быстротой на- стройки и легкостью добавления новых направлений перевода. Среди недостатков наиболее значительными являются наличие многочисленных грамматических ошибок и нестабильность перевода. Статистические системы (Statistical Machine Translation, SMT). Статистический машинный перевод - это разновидность машинного перевода текста, основанная на сравнении больших объёмов языковых пар. Языковые пары - тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком - носителем двух языков, так и переводом с исходного на язык перевода, выполненный человеком. Таким образом статистический машинный перевод обладает свойством «самообучения». Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучший результат статистического машинного перевода. Гибридные системы сочетают в себе подходы, описанные ранее. Ожидается, что гибридные системы машинного перевода позволят объединить все преимущества, которыми обладают статистические системы и системы, основанные на правилах. В настоящее время наиболее распространенными способами использования компьютеров при письменном переводе является работа со словарями и глоссариями, памятью переводов ( англ. Translation Memory, TM ), содержащей примеры ранее переведенных текстов, терминологическими базами, а также использование так называемых корпусов, больших коллекций текстов на одном или нескольких языках, что дает сжатое описание того, как слова и выражения реально используются в языке в целом или в конкретной предметной области. ТМ – это база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами. Если идентичный или подобный исходному сегмент найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается перевести только новые сегменты и отредактировать частично совпадающие. Каждое изменение или новый перевод сохраняются в ТМ. А в результате нет необходимости дважды переводить одно и то же предложение. С другой стороны, при работе с крупными проектами переводчик сталкивается с проблемой согласованного применения терминологического глоссария в ходе длительного проекта или быстрого повторного использования ранее переведенного текста. По своей природе подобные рутинные задачи сравнительно легко (в отличие от машинного перевода) формализуются и программируются. CAT-tools (от английского Computer Aided or Assistant Translation) представляют собой средства автоматизированного перевода. Отличие CAT-tools от программ машинного перевода (например, Promt или Google Translate) состоит в том, что они не пытаются заменить переводчика, а лишь помогают его деятельности, унифицируя перевод лексики и облегчая работу над текстами повторяющейся тематики. В настоящее время базы памяти переводов являются уникальным продуктом, представляющим огромную ценность, особенно для специалистов перевода технических текстов. В таком случае при работе нескольких переводчиков над одним проектом не стоит опасаться того, что слово «motor» будет переведено в одном случае как «двигатель», а в другом как «мотор» - работа с CAT-инструментами помогает сохранить единообразие перевода. Подобные программы также позволяют существенно сократить время на перевод технических текстов за счет того, что больше не придется переводить одинаковые сегменты текста - осуществив перевод лишь один раз, в будущем программа сама будет подставлять перевод к уже переведенным частям документа. Польза от использования средств CAT-tools неоспорима, остается только научиться работать с конкретными программами, каждая из которых имеет свои особенности. Наиболее мощным продуктом и беспрекословным лидером среди программ автоматизированного перевода является SDL Trados. При этом бесспорным остается тот факт, что знание средств CAT-tools на сегодняшний день является не просто еще одним дополнительным требованием переводческих фирм - это ключевой аспект выживания переводчиков на конкурентном рынке труда. НАИБОЛЕЕ ИЗВЕСТНЫЕ СИСТЕМЫ МАШИННОГО ПЕРЕВОДА:
Дата добавления: 2017-01-14; Просмотров: 1109; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |