Программы переводческой памяти — КиберПедия 

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Программы переводческой памяти

2022-11-14 58
Программы переводческой памяти 0.00 из 5.00 0 оценок
Заказать работу

В наш век стремительного развития информационных технологий и невиданного до сих пор тесного взаимодействия самых, казалось бы, отдалённых культур потребность в предоставлении быстрых и качественных переводческих услуг становится особенно актуальной. И не удивительно, что сфера письменного перевода, считавшаяся до недавнего времени территорией приложения исключительно человеческого интеллекта, с появлением уже первых компьютеров начала медленно, но заметно видоизменяться. И не могло быть иначе, ведь облегчение труда и постоянный поиск новых решений заложен в самой сути человека.

Как это часто бывает, технический прогресс в сфере коммуникаций не только поставил перед человечеством новые задачи, но и принёс с собой средства для их решения. В сфере письменных переводов одним из таких решений стала технология под названием Translation Memory (ТМ) и использующие её средства автоматизированного перевода (CATcomputer assisted translation).

Важно заметить, что средства автоматизированного перевода ни в коем случае нельзя путать с машинным переводом. Это два совершенно разных подхода к автоматизации перевода компьютерными средствами, две совершенно разные «философии» переводческого процесса. В случае машинного перевода весь перевод – от начала и до конца – делает машина, компьютер, используя для этого имеющиеся в её распоряжении словари и алгоритмы перевода. Как следствие, результат такой работы далёк от того, что можно назвать «качественным переводом» ровно по той причине, что искусственный интеллект до сих не изобретен человечеством.

Во втором же случае речь идёт только об инструментах, облегчающих и ускоряющих традиционный процесс человеческого перевода, который выполняется и контролируется непосредственно переводчиком.

Автоматизированный перевод (АП, англ. Computer-Aided Translation) –перевод текстов на компьютере с использованием компьютерных технологий. Идея АП появилась с момента появления компьютеров: переводчики всегда выступали против стандартной в те годы концепции МП, на которую было направлено большинство исследований в области компьютерной лингвистики, но поддерживали использование компьютеров для помощи переводчикам. В 1960-е годы Европейское объединение угля и стали (предшественник современного Евросоюза) стало создавать терминологические базы данных под общим названием Eurodicautom. В Советском Союзе для создания баз такого рода был создан ВИНИТИ.

В современной форме идея АП была развита в статье Мартина Кея 1980 года, который выдвинул следующий тезис: "by taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human" (компьютер берет на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления).

Профессиональная работа невозможна без надежных инструментов. Перевод и локализация как область профессиональной активности в этом смысле не являются исключением. Любой переводчик сталкивается с проблемой согласованного применения терминологического глоссария в ходе длительного проекта или быстрого повторного использования ранее переведенного текста. По своей природе подобные рутинные задачи сравнительно легко (в отличие от машинного перевода) формализуются и программируются, поэтому оснащение рабочего места локализатора автоматизированными средствами является нормой в отрасли, а некоторые из таких средств по существу представляют собой отраслевые стандарты.

Большинство таких средств построены на основе концепции памяти перевода (translation memory) – простой базы данных, каждая запись которой представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках).

Translation Memory (TM) или «память переводов» (ПП) представляет собой базу данных, где хранятся все ранее выполненные переводы с её использованием. Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому.

Идея сохранять для дальнейшего использования ранее переведенные тексты принадлежит японскому ученому Макото Нагао, который в 1982 году в одной из своих статей предложил новую концепцию машинного перевода. Она была основана на утверждении, что тексты должны переводиться по аналогии с текстами, ранее переведенными вручную.

Использование технологии ТМ повышает скорость перевода за счет уменьшения объема механической работы. Однако TM не выполнит перевод за переводчика, но значительно облегчит его работу. Принцип работы технологии ТМ довольно прост – в процессе перевода пары «исходный текст (англ. source) – конечный (переведенный) текст (англ. target)» накапливаются в базе (или базах) данных и затем используются для перевода новых документов.

 Для удобства переводчика программы, использующие технологию Translation Memory, разбивают переводимый текст на так называемые сегменты – фрагменты текста, оригинал и перевод которых и хранится в памяти. За единицу сегментирования (минимальную единицу перевода) такие программы обычно принимают предложение или часть сложноподчинённого предложения, но в зависимости от настроек ею также могут быть слово, фраза либо целый абзац.

Принцип работы большинства средств автоматизированного перевода прост. Во время перевода программа, во-первых, «запоминает» все переводы сегментов, подтверждённые переводчиком, а во-вторых, постоянно сверяет каждый новый непереведённый сегмент с уже имеющимися в памяти переводов и в случае обнаружения идентичного или похожего сегмента «напоминает» его перевод. Таким образом, переводчику остаётся только подтвердить предложенный программой перевод или исправить/дополнить его в соответствии с контекстом.

Кроме собственно создания и работы с памятью переводов, современные программы автоматизированного перевода позволяют также:

- создавать и использовать глоссарии и словари пользователей;

- создавать памяти переводов из пар уже ранее переведенных текстов без использования средств автоматизированного перевода;

- проводить анализ текста и делать выборку из его ключевых слов, которые потом можно добавлять в глоссарии;

- осуществлять так называемый «предварительный перевод» (pretranslation) на основе уже имеющихся баз ПП.

Наиболее эффективно применение данной технологии для перевода:

- больших проектов, содержащих много однотипных фрагментов и терминов: разного рода научных и технических текстов, документаций, финансовых и юридических текстов;

- одного проекта группой из нескольких переводчиков – в этом случае технология ПП позволяет добиться единообразия терминологии и стиля; новых версий уже ранее переведённых текстов – это значительно сокращает время на поиск и перевод новых фрагментов;

- файлов, содержащих разметку: файлы с веб-контентом (HTML, XML и др.) и файлы издательских систем (FrameMaker, Interleaf, Pagemaker и др.).

В то же время эта технология оказывается практически бесполезной при переводе художественных, публицистических и рекламных текстов. Другими словами, всего того, что требует творческого подхода и незаурядных решений.

Сегодня на рынке представлено несколько десятков программ, поддерживающих работу с технологией Translation Memory. Самыми известными из них являются SDL Trados, Déjà vu, Wordfast, MultiTrans,STAR Transit, MemoQ и Omega-T.

Translations Workbench (или Trados)–служебным редактором даннойпрограммы является Microsoft Word, что весьма приблизило Trados к возможности стать всемирным стандартом.

Translation Manager–считается максимально эффективной программой,очень сильно повышающей производительность переводческой деятельности.

Transit –программа отлично работает с кириллицей.

Deja vu–данная программа имеет максимальный перечень функций присравнительно невысокой цене.

Word Fisher–простейшая в использовании программа,обладающаяневысокой ценой и целым набором макрокоманд для перевода текстов в Microsoft Word.

Wordfast -работает на различных платформах,но при этом используетсовместимые форматы памяти переводов, и часто имеет аналогичные интерфейсы.

Кроме самого очевидного – цены (например, программа Omega-T является полностью бесплатной) – эти программные среды отличаются:

- интерфейсом редактирования текста: некоторые программы интегрируются в MS Word (например, все версии SDL Trados до версии SDL Trados 2007 включительно), другие же имеют свой собственный интерфейс;

- алгоритмами разбиения текста на сегменты (сегменты состоят из предложений, фраз или слов);

- наличием дополнительных функций (например, в программе MemoQ, в отличии от других, существует возможность оценки в процентном отношении однородности текста, т.е. наличия в нём повторяющихся элементов на уровне слов и фраз);

- возможностью интеграции средств машинного перевода;

- количеством поддерживаемых форматов файлов;

- наличием возможности работать с памятью переводов в режиме он-лайн.

В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который может генерироваться практически всеми системами ПП. Благодаря этому сделанные переводы можно использовать в разных приложениях, то есть переводчик, работающий с OmegaT, может использовать ПП, созданную в Trados и наоборот.

Выбор CAT-программы часто зависит больше от личных предпочтений переводчика или требований бюро переводов, с которым он сотрудничает (к примеру, многие западные бюро переводов работают с форматом TTX, а он полноценно поддерживается только средой SDL Trados)

Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

Преимущества программ ПП:

- сокращение времени и объема работы переводчика;

- создание преемственности рабочего процесса;

- улучшение последовательности перевода, особенно при работе группы переводчиков над одним проектом;

- увеличение прибыли за счет увеличения производительности труда переводчика, группы переводчиков;

- повышение качества услуг за счет увеличения точности и единообразия перевода терминов, особенно в специализированных текстах.

Недостатки программ ПП:

- может делать перевод более «сухим»; утрачивается сама суть текста, если перевод с использованием накопителя переводов выполняется переводчиком низкой квалификации;

- часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом;

- оригинал должен быть в электронном виде. Одна незамеченная ошибка может распространиться на весь проект;

- необходимо обучение самой программе, а при смене работы — возможно, и не один раз (если работодатели работают с разными программами ТМ);

- подходит не ко всем видам текстов;

- большой обьем ручной работы;

- высокая стоимость лицензионного ПО.

Компании-производители систем TM: PROMT, SDL Trados, Atril (системы Déjà Vu), OmegaT.

Для перевода больших объемов типовой документации принято использовать технологии TM и МТ вместе, так как каждая из них решает разные подзадачи в рамках общей задачи: базы TM обеспечивают извлечение и подстановку переведенного ранее контента, а с помощью MT производится перевод нового контента.

Таблица 1 – Использование различных решений при переводе

Решение Сильные стороны Слабые стороны
Translation Memory 1. Повторное использование ранее сделанных переводов. 2. Постредактирование требуется в минимальном объеме. 1. Требуется предварительное наполнение баз. 2. Повторное использование зависит от похожести переводимого контента и баз ТМ; перевод нового контента невозможен.
Машинный перевод 1. Может использоваться на новом контенте. 2. Высокая скорость. 1.Для высокой эффек-тивности (малый объем постредактирования) требуется предваритель-ная настройка. 2. Качество перевода и настройка зависит от качества исходного текста
TM + MT Высокая скорость при переводе любого контента с минимальным объемом постредактирования  

 

 

Контрольные вопросы:

1 В чём отличие автоматизированного перевода от машинного перевода?

2 Кто развил современную форму идеи автоматизированного перевода?

3 Что представляет собой «translation memory»?

4 Каковы функции современных программ автоматизированного перевода?

5 В каких случаях применение автоматизированного перевода наиболее эффективно?

6 Назовите самые известные программы, поддерживающие работу с технологией «translation memory».

7 Назовите преимущества и недостатки систем памяти перевода.

 

4 Современный уровень развития переводческих информационных технологий

Основные современные переводческие электронные инструменты можно объединить в три группы (классификация, предложенная Ларри Чайлдсом):

FAMT(Fully-Automated Machine Translation)–инструменты полностьюавтоматизированного машинного перевода. Такие системы пока находятся в стадии разработки, поскольку проблемы автоматического понимания, перевода и синтеза «живых» текстов еще не решены. Одним из видов FAMT-программ являются уже существующие системы перевода устной речи «на лету»... Но их возможности пока чрезвычайно ограничены.

HAMT(Human-Assisted Machine Translation)–приложения дляавтоматизированного машинного перевода текстов, выполняемого при участии человека; причем в эту группу входят как продукты, «выросшие» из ТМ-систем и программ машинного перевода, так и базирующиеся на иных принципах – статистическом, фразеологическом и т.д., и комплексные решения. HAMT-системы немногочисленны и пока далеко не универсальны, поскольку их реализацию сдерживают все те же объективные факторы. В этой области добилась больших успехов российская фирма ПРОМТ; интересные разработки есть и у других компаний

MAHT(Machine-Assisted Human Translation)–вспомогательные средствадля выполнения перевода человеком с использованием компьютера. К категории MAHT-приложений сегодня относится абсолютное большинство «электронных переводчиков» и компьютерных словарей – как программных, так и онлайновых.

Современные технологии ушли далеко вперед от первых попыток «засунуть переводчика в компьютер». FAMT- и НАМТ-системы машинного перевода находятся в шаге от того, чтобы именоваться системами искусственного интеллекта, поскольку они уже выполняют отдельные функции человеческого мозга: в частности, конструируют текст на выходном языке на основе входного, пользуясь сводом определенных правил, заданных в виде структур данных и алгоритмов.

 


Поделиться с друзьями:

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.041 с.