Автоматические переводные словари. — КиберПедия 

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Автоматические переводные словари.

2017-06-26 1012
Автоматические переводные словари. 0.00 из 5.00 0 оценок
Заказать работу

Память переводов — Translation Memory.

Два фактора — большой объем требующих перевода документов и их высокая повторяемость — послужили стимулом к созданию технологии Translation Memory (сокращенно именуется TM, общепринятый русский перевод этого термина отсутствует). Суть технологии TM можно образно передать одной фразой: «Не переводить один и тот же текст дважды». Иначе говоря, Translation Memory используется для повторного использования ранее сделанных переводов. Это позволяет серьезно сократить время на подготовку перевода, особенно при работе с текстами, имеющими высокую степень повторяемости.

Технологию Translation Memory часто путают с машинным переводом (Machine Translation), которая, безусловно, тоже полезна и интересна, но ее описание не является целью настоящей статьи. Использование технологии ТМ повышает скорость перевода за счет уменьшения объема механической работы. Однако важно отметить, что TM не выполняет перевод за переводчика, а является мощным инструментом для сокращения затрат при переводе повторяющихся текстов.

Технология ТМ работает по принципу накопления результатов перевода: в процессе перевода в базе ТМ сохраняются исходный текст и его перевод. Для облегчения обработки информации и сравнения различных документов система Translation Memory разбивает весь текст на отдельные кусочки, которые называются сегментами. Такими сегментами чаще всего являются предложения, но могут быть приняты и другие правила сегментации. При загрузке нового текста система TM осуществляет сегментирование и сравнивает сегменты исходного текста с уже имеющимися в подключенной базе переводов. Если системе удается найти полностью или частично совпадающий сегмент, то его перевод отображается с указанием совпадения в процентах. Сегменты, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается только перевести новые сегменты и отредактировать частично совпадающие.

Как правило, задается порог совпадений на уровне не ниже 75%, так как если установить меньший процент совпадений, то увеличатся затраты на редактирование текста. Каждое изменение или новый перевод сохраняются в ТМ, так что нет необходимости переводить одно и то же дважды!

Важно также постоянно пополнять базу Translation Memory, сохраняя в базе (или в базах, если перевод выполняется по различным тематикам) пары сегментов «исходный текст — правильный перевод». Это позволит значительно сократить время, необходимое для перевода сходных текстов. Помимо снижения трудоемкости перевода система TМ позволяет выдержать единство терминологии и стиля во всей документации.

Использование технологии ТМ обеспечивает переводчику следующие преимущества:

  • повышение производительности труда. Подстановка даже на 80% совпадающих сегментов из базы переводов может сократить время работы над переводом на 50-60%. Как показывает практика, гораздо эффективнее править уже готовый перевод, чем переводить заново — «с нуля»;
  • единство терминологии и стиля при наличии базы переводов по тематике переводимого документа. Это особенно важно при переводе узкоспециальной документации;
  • организация работы коллектива переводчиков с гарантированным качеством перевода благодаря доступу к общей базе Translation Memory.

Отдельно отметим, что в западных странах, где технология Translation Memory давно уже стала де-факто обязательным инструментом переводчика, средства, потраченные на создание базы переводов, рассматриваются не как затраты, а, скорее, как инвестиции в стабильную и качественную работу, что увеличивает не только прибыль, но и стоимость самой компании.

Правила сегментации текста

Одна из основных задач во время настройки системы — правильное сегментирование текста. Успех поиска совпадающих сегментов в базе зависит от того, насколько правильно заданы правила сегментации текста

Существует два типа условий сегментации:

· правило — задает условия, при которых определенные символы (точка, запятая и т.д.) являются границами сегментов;

· исключение — задает условия, при которых определенные символы не являются границами сегментов.

Базовый набор правил сегментации автоматически добавляется в каждый проект перевода при его создании. Для того чтобы получить возможность редактирования этих правил, необходимо выбрать команду Свойства в контекстном меню искомого проекта (второй способ: меню Проект -> Все проекты -> Свойства -> Правила сегментации).

В системе можно задать две группы правил сегментации: простые правила и правила с регулярными выражениями.

Простые правила задают условия, определяющие последовательность символов, которые надо или не надо считать границей сегмента. К простым правилам относится строка до разделителя (возможна пустая или определенная последовательность символов), символ разделителя (всегда один!) и строка после разделителя.

Правила с регулярными выражениями существуют для создания более гибких условий сегментации, что также отнюдь не лишне. Если должным образом не задать такие условия, то, например, предложение «Команда выиграла матч со счетом 3:1» может быть неправильно сегментировано. В данном случае необходимо задать исключение (то есть символ, который система не будет считать границей сегмента) в виде строки до разделителя с помощью регулярного выражения «\d+» (обозначает любое количество цифр), символа разделителя «:» и строки после разделителя с помощью регулярного выражения «\d+» (любое количество цифр). В этом случае система не обратит внимание на двоеточие между цифрами.

Импорт баз переводов

Одна из наиболее полезных опций системы PROMT Translation Suite — возможность импорта баз переводов (во внутреннем формате программы (*.pts) и баз переводов ассоциированной памяти PROMT (*.apd)), а также сегментов из файлов (во внутреннем формате *.pts и в формате TMX Level 1 (*.tmx)). Используя эту возможность системы, можно избавить себя от составления базы переводов с нуля в том случае, если база ТМ по необходимой тематике уже создана, например, другими сотрудниками компании.

Процесс импорта баз переводов PROMT Translation Suite сравнительно прост. Необходимо открыть меню База -> Импортировать и выбрать команду База переводов, а затем найти нужный файл базы и обязательно указать тип файла *.pts.

Особое внимание следует уделить возможности импорта сегментов файлов TMX.

Файлы TMX — это универсальный формат обмена данными для систем Translation Memory, поэтому с их помощью вы можете переносить содержимое баз данных, даже если раньше работали с другой системой ТМ. Чтобы импортировать сегменты из файла ТМХ, нужно выбрать в том же меню База -> Импортировать команду Сегменты и необходимый ТМХ-файл. После этого следует выбрать ту базу переводов, в которую необходимо добавить сегменты из ТМХ-файла, и нажать кнопку Выбрать.

В заключение отметим, что технология Translation Memory является мощным инструментом для решения проблемы эффективного перевода повторяющихся текстов. В этом обзоре мы не только рассказали о сути технологии TM, но и описали представленные на рынке системы. В частности, российским пользователям можно порекомендовать обратить внимание на систему PROMT Translation Suite, разработанную российской компанией ПРОМТ.

Важным преимуществом системы PROMT Translation Suite, по сравнению с зарубежными аналогами, является наличие интегрированной технологии машинного перевода. Это позволяет значительно ускорить создание собственных баз Translation Memory и повысить эффективность работы с системой.

Постоянное пополнение баз переводов новыми сегментами сведет к минимуму работу переводчика вручную при переводе текстов схожей тематики.

 

Преимущества

Сокращение времени и объема работы переводчика

Улучшение последовательности перевода, особенно при работе группы переводчиков над одним проектом.

Увеличение прибыли за счет увеличения производительности труда переводчика, группы переводчиков

Повышение качества услуг за счет увеличения точности и единообразия перевода терминов, особенно в специализированных текстах.

Недостатки

Может делать перевод более «сухим»; утрачивается сама суть текста, если перевод с использованием накопителя переводов выполняется переводчиком низкой квалификации

Часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом

Оригинал должен быть в электронном виде

Одна незамеченная ошибка может распространиться на весь проект

Необходимо обучение работе в самой программе, а при смене работы — возможно, и не один раз (если работодатели работают с разными программами ТМ)

Подходит не ко всем видам текстов

Высокая стоимость лицензионного ПО

Автоматические переводные словари.

Баранов Анатолий Николаевич Введение в прикладную лингвистику: Учебное пособие. — М.: Эдиториал УРСС, 2001

1.4.1. Машинный перевод: элементы хронологии. Начало работ по машинному переводу (МП) или автоматическому переводу (АП) относят к 50-м гг. XX в. Идея машинного перевода обязана своим происхождением чисто практическим нуждам. В начале 50-х гг. происходит информационный взрыв — существенно возрастают объемы научно-технической информации. Перевод всей научной и технологической периодики оказывается невозможным. Дополнительный импульс исследованиям в области МП дала «холодная война»: противостоящие общественно-политические системы внимательно следили за развитием научно-технического потенциала друг друга. Именно по этой причине многие первые зарубежные системы МП работают с русским языком (см. ниже). Формальная дата начала эры машинного перевода — 1949 г. В этом году известный американский специалист по дешифровке Уоррен Уивер составил меморандум, в котором теоретически обосновал принципиальнуювозможность создания систем МП. Он исходил из того, что структурное сходство между языками может быть формально описано, а это является необходимым условием разработки алгоритмов для ЭВМ. Меморандум был разослан двумстам специалистам в области лингвистики, дешифровки и теории программирования. С этого времени в США появляются коллективы разработчиков МП (в Массачусетском технологическом институте — MIT, в Калифорнийском университете, в Национальном бюро стандартов в Лос- Анджелесе, в Техасском университете). Первая международная конференция по МП организуется в 1952 г. в MIT. Наконец, в 1954 г. проводится известный Джорджтаунский эксперимент, в процессе которого осуществляется перевод с русского языка на английский. Хотя программа работала со словарем всего лишь в 250 слов, успех этого эксперимента стимулировал дальнейшие исследования в области МП. В СССР первый эксперимент по МП прошел в 1955 г.: был осуществлен перевод на русский язык текстов по прикладной математике. К этому времени относится начало работ по МП в Институте прикладной математики АН СССР под руководством О. С. Кулагиной и И. А. Мельчука. Коллектив разработчиков создал три экспериментальные системы МП — с французского языка на русский (ФР-1), с английского на русский и с французского на русский (в новом варианте) [Кулагина 1979]. В 1959 г. открывается Лаборатория машинного перевода в МГПИ-ИЯ им. М. Тореза (ныне Московский государственный лингвистический университет), в которой возникли идеи, во многом предвосхитившие дальнейшее развитие теории МП и в какой-то степени систем искусственного интеллекта — концепция языка-посредника, понятие модели управления слова, роль словаря в МП и т. д. Серия публикаций этой лаборатории под общим названием «МП и ПЛ» (Машинный перевод и прикладная лингвистика), оказала существенное влияние не только на прикладную, но и на теоретическую лингвистику. Многие из этих идей нашли отражение в проекте системы англо-русского автоматического перевода (АРАП), которая, однако, не была завершена. Изначально предполагалось, что системы МП не должны быть ограничены проблемной сферой. Иными словами, машинный перевод должен осуществляться на текстах любых типов — от научно-технических до художественных. Однако довольно быстро обнаружилось, что это невозможно. Выявились две группы причин — лингвистические и экстралингвистические. Лингвистические — сводились к тому, что для разработки систем МП недостаточно имеющихся знаний о функционировании языковой системы. Нужны фундаментальные теоретические разработки в области изучения языка, поскольку традиционной лингвистике (за очень небольшими исключениями) была чужда сама постановка задачи машинного перевода, предполагавшая создание компьютерных моделей анализа и синтеза высказываний. Кроме того, многообразие функций языка, преимущественно имплицитный характер языковой способности человека существенно затрудняли формализацию знаний о языковой системе. К экстралингвистическим причинам можно отнести осознание того факта, что процесс понимания — важнейшая составляющая естественного перевода — далеко не обеспечивается чисто лингвистическим анализом речевого сообщения. Понимание основывается на знаниях адресата, его способности делать выводы и умозаключения, кроме того оно связано с коммуникативной установкой адресата в данной ситуации общения и т. д. Возникшее разочарование было даже формально зафиксировано в 1966 г. в докладе консультативного комитета по автоматической обработке естественных языков (ALPAC) при Национальной академии наук США. Основной упор в докладе делался на том, что ни одна из систем МП не оправдала возлагавшихся на нее надежд ни в аспекте качества перевода, ни в аспекте экономичности. По приводившимся там данным, «естественный» перевод оказывался существенно дешевле машинного. Доклад привел к свертыванию государственного финансирования проектов создания систем МП в США, что прямо повлияло на позицию государственных структур по отношению к поддержке разработок в области машинного перевода во все мире. Однако несмотря на скепсис относительно перспектив МП, многие из первых систем МП, созданных в 60-е гг., продолжали эксплуатироваться заказчиками. Большинство конечных пользователей мало интересовало качество перевода (низкое качество — один из важнейших пунктов обвинения в докладе комитета ALPAC). Для потребителей было важнее быстро в общих чертах оценить информационный поток в научной и технической периодике, а затем материал, который вызвал интерес, переводился обычным способом — с участием переводчика. Кроме того, не прекратилось финансирование исследований в сфере МП частными компаниями, заинтересованными не только в отслеживании мировых тенденций научно-технического прогресса, но и в переводе огромных объемов технической документации, требующемся при экспорте и импорте различной продукции, в том числе и высокотехнологичной. С середины семидесятых годов во всем мире наблюдается устойчивое возрастание интереса к МП. В Москве в 1974 г. в институте ИНФОРМ- ЭЛЕКТРО начались работы по созданию системы франко-русского перевода (ЭТАП-1) и системы англо-русского перевода (ЭТАП-2). В этом же году создается Всесоюзный центр переводов (ВЦП), в котором ряд научных коллективов работает над системами машинного перевода — АМПАР (англо-русский перевод), НЕРПА (немецко-русский перевод) и ФРАП (французско-русский перевод). С этого времени промышленные системы машинного перевода разрабатываются и широко используются в США, Европе и Японии.

1.4.2. Машинный перевод: элементы периодизации стратегий. Первые системы МП характеризуются стратегией «прямого перевода». Сущность этого подхода к построению МП заключается в том, что исходный текст на языке L1 (= «входной язык») постепенно через ряд этапов преобразуется в текст языка L2 (= «выходной язык»). Преобразования сводятся к тому, что слово (словосочетание) на входном языке заменяется на его словарный эквивалент на выходном языке. Понятно, что в системах первого поколения, использующих стратегию прямого перевода, нет необходимости моделировать функционирование языковой системы в целом. Для работы таких систем оказывается вполне достаточно правил словарных соответствий. В редких случаях проводится анализ контекста для перевода неоднословных выражений, опять-таки представленных в словаре системы. Важно иметь в виду, что стратегия прямого перевода не делает различий между пониманием (анализом) и синтезом (порождением), поскольку они фактически исключены из преобразований по правилам словарных соответствий. Прямой перевод всегда привязан к конкретной паре языков. Например, неоднозначность выражений входного языка разрешается только в той степени, в которой это оказывается необходимым для выходного языка. Стратегия прямого перевода в принципе неприменима для проектирования систем МП на более, чем один язык. По временным рамкам системы первого поколения в основном создавались в период с конца 40-х до середины 60-х гг. Один из типичных примеров системы такого типа — разбираемая ниже программа GAT. Существенная модификация стратегии «прямого перевода» обнаруживается в системах с «трансфером» — этапом межъязыковых операций, не сводимых только к замене лексем входного языка на словарные соответствия выходного языка. Наличие этапа трансфера предполагает построение «промежуточного» или «внутреннего» представления, которое далее «приспосабливается» к структуре предложения выходного языка. В отличие от первой стратегии, в архитектуре систем МП с трансфером анализ (понимание) и синтез существуют как особые процедуры и обслуживаются различными алгоритмами. В некотором смысле системы с трансфером оказываются промежуточным звеном между стратегией прямого перевода и последующей стратегией языка-посредника (см. ниже систему TAUM). Критика стратегии прямого перевода привела к созданию «стратегии перевода через язык-посредник» или «стратегии языка-посредника». Главная особенность этой стратегии заключаются в том, что между структурами входного языка и структурами выходного языка находится один или несколько промежуточных языков, на которые по соответствующим правилам последовательно «переписываются» выражения языка L1 l3). Анализ и синтез при использовании языка-посредника принципиально разделяются. Анализ ведется в категориях входного языка, а синтез — в категориях выходного. В качестве языка (языков)-посредников могут выступать языки представления синтаксической и семантико-синтакси-ческой структуры, чисто семантические языки, языки глубинной семантики, приближающиеся к концептуальному представлению в категориях теории знаний (фреймов, сценариев, планов). Системы машинного перевода, основанные на знаниях (knowledge-based systems), возникшие в 80-х гг., рассматриваются как часть систем искусственного интеллекта. Достаточно условно эта стратегия соответствует второму поколению систем МП с тем уточнением, что системывторого поколения используют почти исключительно синтаксические и семантико-синтаксические языки-посредники (см. ниже систему СЕТА). Последовательное проведение идеи языка-посредника привело к возникновению стратегии «универсального семантического языка», независимого от конкретного входного и выходного языка. Преимущества такой стратегии очевидны. Однако современное состояние семантической теории не оставляет надежд на успешную реализацию этой стратегии в ближайшем будущем. Таким образом, системы МП третьего поколения остаются в настоящее время весьма отдаленной перспективой. Как компенсация проблем, возникших со стратегией универсального семантического языка, развивается несколько промежуточных стратегий, позволяющих существенно улучшить параметры промышленных систем МП. Стратегия «сужения проблемной области» предлагает разработчикам МП ориентироваться на узкие тематические сферы текстов. Это позволяет существенно облегчить словарь системы МП и ограничиться только теми особенностями устройства языковой системы, которые реально представлены в данном подъязыке. Эта стратегия универсальна 13)Уместно вспомнить известный тезис Романа Якобсона о том, что «Наука о языке не может интерпретировать ни одного лингвистического явления без перевода его знаков в другие знаки той же системы или в знаки другой системы» [Якобсон 1985 в, с. 363]. для многих сфер прикладной лингвистики — от лексикографии до лингвистического обеспечения информационно-поисковых систем и систем искусственного интеллекта. Стратегия «ограниченного машинного перевода» позволяет включать в технологическую цепочку автоматического перевода человека — на этапе предредактирования, постредактирования или в режиме обработки текста (например, для разрешения синонимии и омонимии).

1.4.3. Машинный перевод: элементы типологии систем. Компьютерные средства перевода обычно разделяют на три больших группы: системы машинного перевода, системы человеко-машинного перевода (ЧМП) и терминологические базы/банки данных (ТБД). Системы собственно машинного перевода не исключают (даже, как правило, предполагают) участие человека на этапе предредактирования и постредактирования. В данном случае существенно, что после ввода текста в систему перевод осуществляется без вмешательства человека. Используются только алгоритмы и словари, введенные в ЭВМ. Системы человеко-машинного перевода, в свою очередь, разделяются на две подгруппы: системы машинного перевода с участием человека и системы человеческого перевода с участием машины. В первом случае компьютерная программа сама осуществляет перевод, однако на определенных этапах она может обратиться к человеку, предложив ему, например, выбрать наиболее подходящее слово для перевода, дать синоним для неизвестного выражения или определить структуру сложной синтаксической конструкции. Наконец, человеческий перевод с участием машины всегда осуществляется в режиме реального времени, причем основную часть работы по переводу берет на себя человек. Переводчик обращается к компьютеру для автоматической обработки отдельных фрагментов текста, для вызова информации из терминологических банков данных (часто удаленных), для автоматического форматирования результирующего текста, проверки орфографии и пунктуации и т. д. Компьютерные системы такого рода иногда называют автоматизированным рабочим местом переводчика. Терминологические банки данных удобны тем, что они легко модифицируются и позволяют фиксировать самую последнюю словарную информацию по выбранной проблемной области. Часто они используются для создания обычных двуязычных и многоязычных словарей, а также для разработки автоматизированных словарей систем МП. ТБД составляют важную часть рабочего места переводчика. 1.4.4. Основные области использования машинного перевода. Первоначальные иллюзии об универсальности применения МП быстро рассеялись. Собственно, и спрос на машинный перевод художественных текстов практически отсутствовал. Между тем область текстов научно- технической информации настолько велика, что человеческий перевод просто не в состоянии ее охватить. В службах научно-технической информации различных ведомств и организаций использование систем МП показало высокую эффективность. Требования к качеству перевода оказались довольно низкими, что позволило использовать в этой сфере системы МП первого поколения. Вторая сфера применения МП — крупные международные организации, использующие документы на многих языках. К числу таких организаций относится, например, ООН и официальные структуры Европейского Союза, в которых документы должны появляться практически одновременно на всех языках членов ЕС. Однако требования к качеству перевода здесь довольно высоки и этап постредактирования необходим даже для систем МП с хорошими характеристиками. Третья большая область использования МП — техническая документация. Экспорт продукции — особенно высокотехнологичной — требует перевода больших массивов технических описаний и инструкций. Так, эксплуатационная документация к самолетам достигает 100 и более тыс. страниц. Компании, связанные с экспортом, готовы даже нормировать внутренний язык, используемый для технической документации, чтобы облегчить автоматический перевод этих документов на выходной язык. Например, в Европейской ассоциации авиапроизводителей (European Association of Aerospace Manufactures) под руководством Ван Дейка был разработан специальный стандарт АЕСМА «упрощенного английского языка», налагающий серьезные ограничения на используемую в документации лексику и синтаксические конструкции. Этот стандарт используется, в частности, в корпорации «Боинг» (см. по этому поводу [Wojcik 1997]). В целом можно сделать вывод, что в настоящее время системы МП успешно функционируют в тех областях, где либо не требуется абсолютнаяточность перевода, либо существуют существенные ограничения на использование структур естественного языка, где входной язык нормирован и упрощен. К числу проблемных областей последнего типа относится, например, подъязык метеосводок. В Канаде с 1975 г. в промышленном режиме функционирует система МП TAUM-METEO, переводящая тексты метеосводок с английского языка на французский

 

Следующие ученые внесли огромный вклад в развитие отечественной переводной лексикографии:

· Юрий Дереникович Апресян, Москва (русская и английская лексикография);

· Валерий Павлович Берков, СПб (германская лексикография, теория переводной лексикографии);

· Владимир Карлович Мюллер, (русская и английская лексикография);

· Александр Иванович Смирницкий, Москва (русская и английская лексикография);

· Марина Рафаиловна Кауль, Москва (русская и английская лексикография);

· Владимир Григорьевич Гак, Москва (лексикография французского языка);

· Михаил Яковлевич Цвиллинг, Москва (лексикография немецкого языка);

· Дмитрий Олегович Добровольский, Москва (лексикография немецкого языка).

переводной словарь – это словарь, представляющий планомерное сопоставление словарных составов двух и более языков (в той или другой их части или во всей их совокупности) [Нелюбин, 2006].

Характеристика переводных словарей осуществляется по следующим основным параметрам:

1) количество языков и способ их описания;

2) обратимость / необратимость словаря;

3) адресация словаря;

4) состав словника;

5) типы эквивалентов, включенные в микроструктуру словаря;

6) использование дефиниций в словарной статье переводного словаря.

Рассмотрим указанные выше лексикографические параметры в порядке их следования.

Языки, включенные в переводной словарь делятся на входные (языки, с которых происходит перевод) и выходные (языки, на которые переводят).

Словарь, имеющий один входной и один выходной язык – двуязычный. С. Ландау делит двуязычные словари на однонаправленные, содержащие словник на входном языке с эквивалентами на выходном (например, англо-русский словарь), и двунаправленные, фактически совмещающие два словаря (например, англо-русский, русско-английский словарь) [Landau, 1996].

Если мы имеем дело с многоязычным словарем, то он может иметь более одного входного и более одного выходного языка [Берков, 1996]. При этом «в многоязычном словаре намеренно или ненамеренно проявляется один язык, «стержневой», или тот, для которого такой словарь составляется» [Марчук 1992, с. 66]. Многоязычная лексикография представляет собой гораздо менее разработанную часть переводной лексикографии и терминографии по сравнению с одно - и двуязычной лексикографией. Это обусловлено тем, что перевод происходит обычно в двуязычной ситуации и редко в многоязычной [Марчук 1992]. отмечает, что «…коренное отличие двуязычных словарей от многоязычных заключается в том, что трех-, четырех, пяти - и т. п. многоязычные словари на практике выполняют, пожалуй, лишь пассивную функцию и, как правило, используются лишь в качестве справочных пособий» [Дубичинский, 1997, с. 117].

Возможность по желанию пользователя менять входной и выходной языки местами называется по терминологии обратимостью словаря. Составители терминологических словарей используют различные методы и приемы для преобразования традиционных необратимых переводных словарей в обратимые. Это достигается за счет обеспечения дополнительных входов в словари. Например, в словарной статье многоязычного словаря, где заголовком является лексическая единица стержневого языка, лексические единицы остальных языков приводятся как переводные эквиваленты заглавного слова. Обратимость в данном случае обеспечивается за счет приложений к основной части словаря – алфавитных списков лексических единиц всех языков, кроме стержневого, с отсылками к основным словарным статьям [Убин, 1992]. Печатная версия двуязычного итальяно-английского тезауруса EARTh, 2002 характеризуются обратимостью, так как помимо алфавитного входа она имеет еще и вход через двуязычный тематический список.

Автоматизация словарного дела дала возможность выделять не только обратимость на уровне языков, но и обратимость на уровне отдельных лексических единиц.

В автоматических или электронных переводных словарях языковая обратимость означает, что «языки, входящие в состав этого словаря, могут выступать как в качестве языков запроса, так и в качестве языков ответа». Если все языки из состава словаря могут быть как входными, так и выходными, словарь является полностью обратимым на уровне языков. Если только некоторые из языков выступают в качестве входных и выходных, то словарь является частично обратимым [Убин, 1992, с. 89].

Лексическая обратимость переводного словаря означает, что каждая лексическая единица может выступать в качестве запроса и в качестве ответа. «При полной лексической обратимости словаря каждая лексическая единица, выступая в качестве единицы входного языка, должна иметь переводные эквиваленты на всех отдельных языках, входящих в состав многоязычного словаря». Полная лексическая обратимость словаря зависит также от качественного состава его лексического массива. Такой уровень обратимости возможен при условии, что в качестве заглавных слов и их переводных эквивалентов выступают слова или словосочетания. В случае, когда в качестве переводных эквивалентов используются не лексические единицы, а развернутые переводные эквиваленты, которые передают значение заглавной лексической единицы описательным способом, сложно говорить о лексической обратимости словаря [Убин, 1992, с. 90].

 

В зависимости от того, кому адресован словарь, переводные словари делятся на активные и пассивные (понятия введены). Двуязычный словарь является активным, если он используется для перевода с родного языка на иностранный, например, Русско-французский социально-экологический словарь и др. (2002). И наоборот, если он используется для перевода с иностранного на родной, то словарь – пассивный, например, Англо-русский экологический словарь (1996, 1999). В соответствии с этим делением можно говорить и об активном или пассивном пользователе словарем. В идеале, по мнению и С. Ландау, переводной словарь должен иметь одного адресата, так как выбор адресата словаря определяет состав словника и характер эквивалентных соответствий. Однако на практике оказывается, что подавляющее большинство двуязычных словарей имеет одновременно двух адресатов [Берков, 1996, с. 8; Landau S. I., 1996].

Взаимосвязь адресации словаря и способа описания включенных в словарь иноязычных эквивалентов позволила выделить два типа переводных словарей с лингводидактической точки зрения:

а) монофункциональные переводные словари, описывающие один язык посредством других. Англо-русский словарь, составленный для носителей русского языка, изучающих английский, с пометами, объяснениями и уточнениями английских заголовочных единиц на русском языке является примером монофункционального словаря;

б) би-, три-, полифункциональные переводные словари, в которых объектом исследования являются языковые единицы всех или некоторых языков словаря. Англо-русский словарь, содержащий параллельные переводы английских лексических единиц на русский язык и наоборот, двуязычные толкования и комментарии, пометы на двух языках, англо-русские и русско-английские алфавитные указатели, является бифункциональным [Дубичинский, 1997, с. 112-113].

Одной из центральных проблем переводной лексикографии является проблема эквивалентности. Переводные эквиваленты выполняют семантизирующую функцию в переводном словаре. Под словарным эквивалентом подразумевается перевод, приписываемый автором словаря лексеме входного языка [Берков, 1996]. Традиционно выделяется три типа эквивалентности: полная, частичная и ложная (безэквивалентность).

Полная эквивалентность наблюдается в том случае, когда лексемы сравниваемых языков имеют сходную внешнюю форму и полностью совпадают семантически [Дубичинский, 1997].

Частичная эквивалентность имеет место в случае совпадения одних и несовпадения других значений семантических структур внешне сходных лексем. В таком случае совпадающие значения называет интерлексами – «интернациональными лексико-семантическими вариантами лексем». Несовпадающие значения, «специфические лексико-семантические варианты, отражающие национально-культурное своеобразие лексем», называются идиолексами. Таким образом, семантическая структура частичных эквивалентов включает интерлексы и идиолексы [Дубичинский, 1997].

добавляет две разновидности частичных эквивалентов: а) свободные частичные, используемые независимо от окружения, и б) связанные частичные, сочетаемость которых ограничена [Берков, 1996].

 

Развитие вычислительной техники оказывает влияние на развитие вычислительной лексикографии и сейчас. Создание разнообразных, простых в обращении и дешевых компьютеров с достаточно большими возможностями привело к появлению нового направления в разработке автоматических переводных словарей в помощь человеку - словарей индивидуального пользования.

В настоящее время существует большой выбор компьютерных переводных словарей, выпускаемых на СВ, которые по полноте содержащейся информации ни в чем не уступают своим традиционным аналогам (т.е. классическим бумажным словарям). Все переводчики, за редким исключением, являются активными пользователями персонального компьютера, что само по себе располагает скорее к работе с компьютерным вариантом словаря, нежели с книгой. Разработчики охватывают все более широкий спектр специальных областей перевода, что позволяет компьютерным словарям отвечать требованиям все большего числа пользователей. Свойство «обратимости» делает возможным поиск переводных эквивалентов в обратном направлении, что не только увеличивает ассортимент словарей в нашем пользовании, но и повышает качество перевода, так как в результате поиска мы получаем весьма большое число вариантов технического перевода с самыми различными оттенками значения в зависимости от контекста.

Другими важными атрибутами компьютерных словарей, о которых нельзя не упомянуть, являются:

- совместимость с текстовым редактором Word и другими приложениями (в соответствии с конкретным продуктом) и запуск поиска непосредственно из этих приложений; - возможность поиска слова в его текстовой форме;

- поиск словосочетаний и устойчивых выражений;

- удобство просмотра искомого слова или словосочетания во всем множестве контекстов (сбор информации из корпуса различных словарных статей);

- формирование истории запросов;

- пометка выборочных словарных статей для быстрого доступа ним в последующей работе;

- пополнение содержания словарей в форме комментариев к словарным статьям;

- создание пользовательских словарей любого направления перевода и любой тематики по заданным шаблонам;

- возможность прослушивания произношения иностранных слов и устойчивых словосочетаний.

Таковым является базовый набор свойств компьютерных переходных словарей, которым отдают предпочтение сегодняшние пользователи. Хотя не все переводчики перешли на компьютеризированную работу со словарями, и традиционные бумажные словари еще сохраняют свою актуальность, тем не менее автоматизация поиска переводных эквивалентов существенно сокращает вр


Поделиться с друзьями:

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.069 с.