Volume 15, No. 1 
January 2011

 
  Ilya Ulitkin



 
 

Front Page

 
 
Select one of the previous 54 issues.

 
Index 1997-2011

 
TJ Interactive: Translation Journal Blog

 
  Translator Profiles
Another Accidental Translator
by Denzel Dyer

 
  The Profession
The Bottom Line
by Fire Ant & Worker Bee
 
We want a discount…
by Danilo Nogueira and Kelli Semolini
 
Time management by the Freelance Translator: Practical rules to schedule your workday and activities
by Maria Antonietta Ricagno

 
  In Memoriam
In Memoriam: Paulo Wengorski, 1951 - 2010
by Gabe Bokor

 
  Translator Education
Translator Training: The Need for New Directions
by Eileen B. Hennessy
 
Teaching Translation
by Mahtab Daneshnia

 
  Book Reviews
English Prepositions Explained (EPE) by Seth Lindstromberg
reviewed by Gabe Bokor

 
  Translators and the Computer
Overcoming the Digital Divide through Machine Translation
by Preeti Dubey
 
Computer-assisted translation tools: A brief review
Автор Илья Улиткин

 
  Interpreting
Interpreting the Remarks of World Leaders: The case of the interpreters for the Indonesian and Mexican Presidents
by Isak Morin

 
  Literary Translation
Into Brazilian Portuguese: Culture and the Translation of The Glass Menagerie
by Marco Túlio Túlio de Urzêda Freitas and Dilys Karen Rees

 
  Caught in the Web
Web Surfing for Fun and Profit
by Cathy Flick, Ph.D.
 
Translators’ On-Line Resources
by Gabe Bokor
 
Translators’ Best Websites
by Gabe Bokor

 
  Translators' Tools
Translators’ Emporium

 
Call for Papers and Editorial Policies
  Translation Journal
The Translator & the Computer
 

Машинный перевод:

Краткий обзор

Автор Илья Улиткин

Два или три десятилетия назад орудиями труда переводчиков служили печатная машинка и коллекция словарей, которые было несложно носить с собой. Однако, как результат невероятно быстрого прогресса в сфере электронного оборудования и программного обеспечения, в наши дни важной составляющей профессиональной компетентности любого переводчика является технические составляющие, которые в первую очередь предполагают навыки в работе с электронным ресурсами и инструментами [1].

Сегодня, когда мы слышим фразу «орудия труда переводчика», первое, что приходит на ум – это персональный компьютер или ноутбук в зависимости от личных предпочтений) и, конечно же, Интернет. Никто не занимается переводами так, как обычно переводили раньше, тридцать или сорок лет назад, так как доступны удобные электронные словари, специальные переводческие программы и Интернет ресурсы, которые позволяют идти в ногу со временем. Это особенно важно, если мы берем в расчет факт того, что живем в 21 веке, и фактически все переводчики используют Интернет, компьютеры и другие электронные средства в своей работе [2].

Несмотря на их эффективность и перспективы, перевод с помощью программного обеспечения не может заменить человеческого переводчика и гарантировать высокое качество перевода.
Идею машинного перевода можно проследить уже в 17 веке. В 1629 Рене Декарт предложил универсальный язык с эквивалентными идеями в разных языках, которые имеют один символ. Тем не менее, развитие машинного перевода началось лишь в 1940-х, когда были разработаны первые электронные компьютеры. В марте 1949 Уоррен Уивер, руководитель естественных наук в Фонде Рокфеллера, заинтригованный тем, как британцы использовали свой новаторский компьютер Colossus для взлома военных кодов, произведенных немецкой шифровальной машиной Enigma, сформулировал понятие машинного перевода. Он писал: «Передо мной лежит текст, написанный на русском, но я притворюсь, что он на самом деле написан на английском, но был зашифрован некими странными символами. Все, что мне нужно сделать, это содрать код для того, чтобы извлечь информацию, содержащуюся в тексте».

Заметка Уивера привлекла внимание к проблеме машинного перевода, особенно среди военных. Они были первыми, кто активно поддержал разработку переводческого машинного программного обеспечения. В США было уделено много внимания переводу с русского языка на английский, в то время как в СССР – переводу с английского языка на русский.

Сегодня мы можем говорить о трех подходах к письменному переводу: первый подход – это машинный перевод, основанный на правилах исходного и конечного языков, второй подход включает в себя статистический машинный перевод, и третий – это перевод с помощью компьютера (или автоматизированный перевод).

Самые ранние «переводческие орудия» машинных переводов были основаны на прямом, так называемом «преобразовательном», подходе. Предложения исходного языка преобразовывались напрямую в предложения языка, на который требовался перевод, используя простую форму грамматического разбора. Синтаксический анализатор делал грубый анализ исходного предложения, деля его на подлежащее, сказуемое, глагол и пр. Исходные слова были, затем, заменены конечными словами, отобранными из словаря, и их порядок переустраивался таким образом, чтобы соблюсти правила конечного языка. Этот подход использовался в течение долгого времени и, в конце концов, был заменен менее прямым подходом, который называется «лингвистические знания». Современные компьютеры, которые имеют большую вычислительную мощность и память, способны на то, что было невозможно в 1960-х. Программы, основанные на этом подходе, имеют два набора грамматических правил: один для исходного языка, другой для языка, на который будет выполняться перевод. Кроме того, современные компьютеры анализируют не только грамматику (морфологическую и синтаксическую структуры) исходного текста, но и семантическую информацию. Они также имеют информацию об идиоматических различиях между языками, что не дает им сделать глупые ошибки. Тем не менее, над многим еще стоит поработать.

Второй подход основан на статистическом методе: с помощью анализа большого количества параллельных текстов (идентичные тексты исходного и конечного языков) программа отбирает варианты, совпадающие чаще всего и использует их в переводе. Программа не применяет грамматические правила, так как алгоритмы больше основаны на статистическом анализе, чем на том, что основан на правилах грамматики. Кроме того, лексическими единицами здесь являются не столько слова, сколько словосочетания. Одним из более известных примеров такого подхода является «Google Translate», основанный на подходе, называемом статистический машинный перевод, и, точнее говоря, на исследовании Франца-Йозефа Оха, который выиграл конкурс АПОИП за ускоренный машинный перевод в 2003 году. Согласно речи Оха на Саммите Машинного Перевода в 2005 году, прочная основа для развития практичных статистических машинных переводческих систем для новой пары языков будет существовать в двуязычных текстовых корпусах, из более миллиона слов и двух многоязычных текстовых корпусов более чем миллиарда слов. Статистические модели, взятые из этой базы данных, используются затем для перевода между двумя языками. Однако, переведенные предложения порой настолько неблагозвучны, что невозможно их понять.

Автоматизированный перевод – это немного другой подход. Согласно "Википедии", автоматизированный перевод – это вид перевода, где человек переводит текст, используя компьютерное программное обеспечение, предназначенный, чтобы поспособствовать и посодействовать переводческому процессу [3].

Идея автоматизированного перевода появилась вместе с новыми компьютерами: многие переводчики были против машинного перевода, - который являлся объектом многих исследований в компьютерной лингвистике – но активно поддерживали использование компьютеров как «рабочий инструмент» переводчика.

В действительности современная идея автоматизированного перевода была выдвинута Мартином Кейем. В его памятной записке в 1980 году он объединил критику современного подхода к машинному переводу, а именно цель произвести систему, которая полностью заменит людей-переводчиков или понизит их до функции постредактирования и обновления словарей, и спор о развитии переводческих инструментов, которые действительно послужили бы орудиями для переводчиков. Так как это было до развития микропроцессов и персональных компьютеров, контекстом являлась сеть терминалов, связанных с главным компьютером. Основной идеей Кея была такова, что существующие инструменты по обработке текстов могут быть постепенно дополнены переводческими оборудованиями. Основной потребностью были многоязычный текстовый редактор и терминал с разделенным экраном. Дополнительно к ним была бы установлена функция автоматического поиска всех слов или фраз в словаре, а так же возможность прибегать к предыдущим решениям переводчика для осуществления согласованности в переводе. И, наконец, чтобы обеспечить автоматический перевод текстовых частей, которые переводчик мог бы выбрать, чтобы позволить машине работать без вмешательства и редактировать конечный результат, или который мог бы быть выполнен интерактивно – компьютер мог бы просить переводчика разрешить двусмысленности [4].

В настоящее время самыми распространенными способами использования компьютера для перевода являются программные обеспечения, предоставляющее автоматизацию процесса перевода, а именно:

(i) Электронные словари (iFinger, Abbyy Lingvo, Collins-Ultralingua, Mobile Systems, Paragon Software и т.д.) и корпусы национальных языков (British National Corpus, American National Corpus, Russian National Corpus, English-Norwegian Parallel Corpus и т.д.);

(ii) Инструменты автоматизированного перевода или «накопитель переводов» (SLD Trados, MemoQ, Déjà vu, StarTransit, Wordfast и т.д.);

(ii) Программы-редакторы (SpellChecker, StyleWriter и т.д.)

Электронные словари могут быть одноязычными, двуязычными и многоязычными. Кроме того, они содержат информацию о словоформах, произношении (часто озвученные профессиональными дикторами) и другие словосочетания. Они так же могут включать в себя словари по конкретной сфере науки (прикладная математика, физика, биология, медицина, религия, машиностроение и т.д.), идиомам, сленгам и т.д.

Все электронные словари могут быть условно разделены на онлайн и автономные словари. Онлайн словари требуют доступ к Интернету, в то время как автономные словари могут быть установлены на компьютер и использоваться без подключения к Интернету.

Электронные словари, как правило, превышают по словарному объему обычные книжные словари. Многие издатели традиционных печатных словарей, такие как Langenscheidt, Collins-Reverso, Oxford English Dictionary, Duden, American Heritage и Hachette, предоставляют свои ресурсы для использования на компьютерах. Эти программы так же можно скачать либо купить на CD-ROM и установить на ПК. Другие словарные программные обеспечения доступны через специализированных электронных словарных издателей, таких как iFinger, Abbyy Lingvo, Collins-Ultralingua, Mobile Systems and Paragon Software. Некоторые электронные словари предоставляют онлайн обсуждения в форумах, разработанные создателями словарей и лексикографами [5].

Преимущество электронных словарей заключается в их удобстве использования, высокой скорости обработки информации, возможности быстро импортировать эквивалент искомого слова в текст, а так же их компактность. Однако некоторые онлайн словари основаны на принципе «вики». Это значит, что пользователи сами постоянно обновляют его. Примером может послужить Urban Dictionary [6]. Однако Б. Осимо утверждает, что преимущество постоянного обновления имеет обратную сторону: напечатанный текст обычно более точный; перед тем, как инвестировать время и деньги в бумажные публикации, авторы и издатели, как правило, стараются создать приемлемый продукт. Как хорошо известно, с помощью Интернета любой может публиковаться на своем собственном сайте (при условии, что они не нарушают национальные и международные законы), даже без советчика, редактора или издателя [7].

Как результат, отношение многих лексикографов к электронным словарям довольно скептичны, так как их использование может ухудшить качество перевода.

Тем не менее, польза электронных словарей очевидна. Во-первых, они не настолько консервативны как напечатанные словари, так как постоянно обновляются. Это особенно важно, когда мы имеем дело с такими многообещающими и быстро развивающимися науками, как телекоммуникационные системы, нанотехнологии, компьютеры и т.д. Печатные словари очень быстро устаревают, и единственный способ предоставлять актуальные научному и технологическому прогрессу версии – это использовать электронные словари.

Во-вторых, электронные словари предоставляют простой доступ в лексикографическим ресурсам и быстрый поиск лингвистической информации не только в словарях, но и в Интернете. Например: печатная версия Oxford English Dictionary имеет 12 томов, и найти нужное слово довольно непростая задача, в то время как время, требуемое для поиска необходимого слова займет считанные секунды в его CD-ROM версии.

В-третьих, электронные словари имеют опцию добавления словаря пользователя, что помогает расширить основную версию.

В-четвертых, электронные двуязычные и многоязычные словари позволяют менять порядок перевода [2].

Еще один способ улучшить ваш перевод это использовать корпусы национальных языков. Это особенно важно при переводе из родного на иностранный язык.

Лингвистический корпус представляет собой набор текстов, которые собираются и накапливаются в соответствии с определенными принципами, отмечаются, анализируются и имеют специальную поисковую систему. Выгода корпусов для переводчика объясняется следующим образом:

(i) корпусы представляют собой набор образцов письменной и устной речи от широкого круга источников (литературы, научных публикаций, журналов, научных отчетов и диалогов). Они полезны, в случае если вы не уверены, действительно ли слово можно использовать в данном контексте;

(ii) тексты, предоставленные в корпусах, имеют репрезентативные данные, так как почти все корпусы имеют более 100 миллионов слов и словосочетаний;

(iii) корпусы могут помочь решить различные языковые проблемы, в том числе в переводе.

Тем не менее, несмотря на большие и точные репрезентативные данные, корпусы не способны охватить все сферы человеческой деятельности, что делает их непригодными для таких сфер, как наука.

Продукции, основанные на «накопителе переводов» (НП) предназначены для профессиональных переводчиков и переводческих агентов.

Такие инструменты компьютерного перевода, как SDL Trados, Déjà vu, StarTransit, Wordfast и т.д. в настоящее время являются неотъемлемой частью современного процесса перевода. Их использование также целесообразно, когда некоторые работы должны быть сделаны группой переводчиков, поскольку это важно обеспечить последовательный перевод в рамках одного проекта. В результате, перевод хранится в одной базе данных, доступной для всех участников процесса перевода. Переводчики «видят» результаты своих переводов в реальном времени. В этом случае они могут быть подключены к одной сети локально или удаленно. Это особенно удобно для компаний с отраслями в разных странах.

Накопитель переводов, так же известная как база данных переводов, представляют собой собрание записей, где исходный текст связан с его соответствующим переводом на одном или нескольких конечных языков. Как правило, НП используется с переводческими инструментами: программа делит текст на части, которые могут быть блоками, абзацами, предложениями и даже фразы. Когда переводчик открывает часть текста, приложение ищет эквивалентный исходный текст в базе данных. Результат представляет собой список соответствий, упорядоченных по счету, выражающей сходства между исходным текстом в документе и НП [точное соответствие (100%) или неточное соответствие (менее чем 100%)].

Некоторые преимущества использования НП включают в себя:

(i) Перевод может быть выполнен намного быстрее: необязательное перепечатывание существующих переводов, и в большинстве требуется изменить лишь часть текста.

(ii) НП также позволяют лучше контролировать качество, предлагая варианты, которые уже были одобрены, с правильной терминологией.

Накопители переводов это мощная технология, которая может помочь снизить затраты на поиск. Тем не менее, использование НП требуется взвесить и принять все факторы во внимание, так как применение НП является оправданным и эффективным в переводе текстов с высокой степенью повторений.

Конечный этап в процессе перевода – это редактирование. Многие переводчики извлекают выгоду из тщательного редактирования для повышения читаемости текстов, так как они часто могут быть засорены многословными фразами, ненужными повторами, клише, избитыми выражениями, расплывчатостью, избыточностью, претенциозным языком, нелогичными предложениями, путаница с омонимами, жаргонами, ошибками в терминах, ошибками во множественном числе и притяжательном падеже и другими распространенными ошибками. Чтобы улучшить перевод, переводчик может использовать как человеческий редактор, так и программное обеспечение для редактирования. В настоящее время, почти все текстовые программы имеют опцию исправления ошибок: при допущении грамматических или стилистических ошибок всплывает окно с советом или заметкой. Мы можем найти информацию и инструкции о том, как иметь дело с подобного рода проблемами, в грамматических и стилистических справочниках, пособиях по редактированию, орфографических словарях и подобных справках. Однако для неопытного переводчика подобные ресурсы имеют практически фатальный недостаток: они могут улучшить перевод только в том случае, если переводчик знает, что искать. Кроме того, легко не заметить отсутствие знаков препинания и орфографические ошибки, неправильный выбор слов, фразировки и стиля. Таким образом, переводчику требуется программное обеспечение, которое будет сочетать в себе инструменты исправления как грамматических ошибок, так и стилистических, которые будут исправлять и «очищать» черновики на уровне слов и фраз. Примерами редакторов могут послужить программы Editor и StyleWriter, которые находят тысячи письменных ошибок, включая сложных слов, жаргонов и абстрактных слов, многосложных фраз, скрытых глаголов, пассивных глаголов, клише и длинных предложений. После анализа текста, программа обеспечивает подсказки, показывающие, как редактировать каждое предложение. Первоначально, подобные программные обеспечения для редактирования были разработаны, чтобы помочь профессиональным группам улучшить качество и четкость письменной коммуникации. However, translators can also use this software to write in an International English Style—a style that is clear, concise and readable.

В заключение отметим, что использование электронных технологий является универсальным средством для решения всех проблем при переводе. Несмотря на их эффективность и перспективы, перевод с помощью программного обеспечения не может заменить человеческого переводчика и гарантировать высокое качество перевода. Их цель заключается в том, чтобы ускорить и облегчить процесс перевода, чтобы помочь решить многие проблемы, возникающие в ходе процесса и свести к минимуму время, необходимое для перевода [2].

A high-quality translation results from the combination of electronic technologies and the translator's skills, of good knowledge of a foreign language and theory of translation because programs and translation software will not replace humans even in the long-term future—at least not until actual high-performance artificial intelligence is created. Таким образом, многое зависит от личности переводчика и его профессионального опыта, в то время как электронные системы – это полезные, важные и иногда необходимые приложения.

References:

[1] Komissarov, V.N. (1997). Теоретические основы методики обучения переводу (Theoretical Foundations of the Method of Training of Translators), Moscow: Rema [in Russian].

[2] Shevchuk, V.N. (2010). Электронные ресурсы переводчика (Translator's Electronic Resources), Moscow: Librait, [in Russian].

[3] http://en.wikipedia.org/wiki/Computer-assisted_translation .

[4] Hutchins, J. (1998). Machine Translation 13 (4): 287-307.

[5] http://en.wikipedia.org/wiki/Electronic_dictionary.

[6] http://www.urbandictionary.com/.

[7] Osimo, B. Translation Course - http://courses.logos.it/EN/5_13.html.