Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...
Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...
Топ:
Процедура выполнения команд. Рабочий цикл процессора: Функционирование процессора в основном состоит из повторяющихся рабочих циклов, каждый из которых соответствует...
Методика измерений сопротивления растеканию тока анодного заземления: Анодный заземлитель (анод) – проводник, погруженный в электролитическую среду (грунт, раствор электролита) и подключенный к положительному...
Интересное:
Наиболее распространенные виды рака: Раковая опухоль — это самостоятельное новообразование, которое может возникнуть и от повышенного давления...
Национальное богатство страны и его составляющие: для оценки элементов национального богатства используются...
Лечение прогрессирующих форм рака: Одним из наиболее важных достижений экспериментальной химиотерапии опухолей, начатой в 60-х и реализованной в 70-х годах, является...
Дисциплины:
2022-11-14 | 130 |
5.00
из
|
Заказать работу |
Содержание книги
Поиск на нашем сайте
|
|
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ В ПЕРЕВОДЕ
Рекомендовано Ученым советом федерального государственного
бюджетного образовательного учреждения высшего образования «Оренбургский государственный университет» в качестве учебного пособия
для студентов, обучающихся по программам высшего образования по направлению подготовки 45.03.02 Лингвистика (бакалавриат)
Оренбург
2016
УДК 81’25:004.42 (075.8)
ББК 81.184я73
З 38
Рецензент - кандидат педагогических наук, доцент Л.А. Пасечная
Захарова, Т.В.
З 38 Теоретические основы компьютерных технологий в переводе: учебное пособие / Т.В. Захарова; Оренбургский гос. ун-т. – Оренбург: ОГУ, 2016. – 111 с.
В учебном пособии рассмотрен современный уровень развития переводческих информационных технологий, представлены программы, необходимые для переводчика: программы, используемые для собственно перевода, для информационной поддержки и связи, программы для административного сопровождения; рассмотрена работа с текстовым редактором; концепции закрытого и открытого программного обеспечения, форматы файлов; даны практические рекомендации по обеспечению и контролю качества перевода.
Учебное пособие предназначено для студентов I курса направления подготовки 45.03.02 Лингвистика (бакалавриат)
УДК 81’25:004.42 (075.8)
ББК 81.184я73
© Захарова Т.В.
© ОГУ, 2016
Содержание
Введение………………………………………………………………….…. | 4 | |
1 | История машинного перевода………………………………………….….. | 6 |
2 | Системы машинного перевода………………………………………….….. | 14 |
3 | Программы переводческой памяти………………………………………... | 17 |
4 | Современный уровень развития переводческих информационных технологий……………………………………………………………………… | 25 |
5 | Техническая составляющая рабочего места переводчика………………….. | 26 |
6 | Программы, необходимые для переводчика……………………………….. | 30 |
6.1 | Программы, используемые для собственно перевода……………………... | 30 |
6.2 | Программы для информационной поддержки и связи…………………….. | 38 |
6.3 | Программы для обработки и подготовки исходных файлов и формирования и доработки конечных файлов……………………………… | 40 |
6.4 | Программы для административного сопровождения………………………. | 44 |
7 | Работа с текстовым редактором……………………………………………… | 48 |
7.1 | Офисный пакет Microsoft Office…………………………………………….. | 48 |
7.2 | Назначение текстового редактора. Текстовый редактор Microsoft Word для переводчика………………………………………………………………. | 49 |
7.3 | Основные функции текстового редактора. Форматирование……………… | 51 |
7.4 | Дополнительные рекомендации при работе с Microsoft Word……………. | 53 |
8 | Аннотирование и реферирование……………………………………………. | 75 |
9 | Двуязычные электронные словари………………………………………….. | 79 |
10 | Одноязычная компьютерная лексикография………………………………. | 87 |
11 | Корпусная лингвистика и перевод………………………………………….. | 93 |
12 | Обеспечение и контроль качества перевода……………………………….. | 108 |
Список использованных источников ………………………………………. | 110 |
Введение
|
За последние 10-15 лет характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись перевода научно-технической, официальной и деловой документации. Сегодня уже недостаточно просто перевести текст, пользуясь компьютером как пишущей машинкой. Заказчик ожидает от переводчика, что оформление готового документа будет соответствовать внешнему виду оригинала настолько точно, насколько это возможно, при этом удовлетворять принятым в данной стране стандартам. От переводчика требуется также умение эффективно использовать ранее выполненные заказы на ту же тему, а работодатель, в свою очередь, рассчитывает на заметную экономию времени и средств при переводе повторяющихся или похожих фрагментов текста. Эти жесткие, зачастую противоречивые условия можно соблюсти лишь в том случае, если переводчик не только в совершенстве владеет родным и иностранным языком и глубоко изучил выбранную им предметную область, но и уверенно ориентируется в современных компьютерных технологиях.
|
Владение современными компьютерными программами, направленными на оптимизацию деятельности переводчика, готовность и способность осваивать эти программные продукты с целью повышения привлекательности для работодателя и уменьшения затрат на «производственный процесс» письменного перевода – вот главные требования, предъявляемые рынком сегодня. Если переводчик уверенно ориентируется в современных компьютерных технологиях, то умение эффективно использовать ранее выполненные заказы помогает и ему, и работодателю рассчитывать на заметную экономию времени и средств при переводе повторяющихся или похожих фрагментов текста.
В связи с этим целью пособия является помощь в приобретении основополагающих знаний, умений, навыков в области компьютерного перевода с иностранного языка на русский и с русского языка на иностранный.
Книга состоит из 12 разделов, содержащих сведения об истории машинного перевода, программах, необходимых для перевода, работе с текстовым редактором, двуязычных электронных словарях, корпусной лингвистике.
История машинного перевода
Е: первые шаги
История машинного перевода (МП) как научно-прикладного направления началась в конце 40-х годов прошлого века (если не считать механизированное переводное устройство П.П. Смирнова-Троянского, своего рода лингвистический арифмометр, изобретенный в 1933 году). В марте 1947 г. Уоррен Уивер (Warren Weaver), директор отделения естественных наук Рокфеллеровского фонда (Rockefeller Foundation), в переписке с Эдрю Бутом (Andrew D. Booth) и Норбертом Винером (Norbert Wiener) впервые сформулировал концепцию машинного перевода, которую несколько позже (в 1949 г.) развил в своем меморандуме, адресованном Фонду.
|
У.Уивер писал: "I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text.’’ ("У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно — это взломать код чтобы извлечь информацию, заключенную в тексте."). Аналогия между переводом и дешифрованием была естественной в контексте послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны.
Идеи Уивера легли в основу подхода к МП, основанного на концепции interlingva: стадия передачи информации разделена на два этапа: на первом этапе исходное предложение переводится на язык-посредник (созданный на базе упрощенного английского языка), на втором этапе результат этого перевода представляется средствами выходного языка.
Меморандум Уивера вызвал самый живой интерес к проблеме МП. В 1948 г. А. Бут и Ричард Риченс (Richard Richens) произвели некоторые предварительные эксперименты (так, Риченс разработал правила разбиения словоформ на основы и окончания).
В те годы машины были очень большие и дорогие и довольно сильно отличались от современных. Они занимали целые комнаты и требовали для своего обслуживания большой штат инженеров, операторов и программистов. В основном эти компьютеры использовались для осуществления математических расчетов для нужд военных учреждений, а также математических и физических факультетов университетов (последние также были тесно связаны с военной сферой). Поэтому на ранних этапах разработка МП активно поддерживалась военными, при этом в США основное внимание уделялось русско-английскому направлению, а в СССР — англо-русскому.
В 1952 г. состоялась первая конференция по МП в Массачусетском технологическом университете, а в 1954 г в Нью-Йорке была представлена первая система МП — IBM Mark II, разработанная компанией IBM совместно с Джоржтаунским университетом (это событие вошло в историю как Джорджтаунский эксперимент). Была представлена очень ограниченная в своих возможностях программа (она имела словарь в 250 единиц и 6 грамматических правил), осуществлявшая перевод с русского языка на английский. Казалось, что создание систем качественного автоматического перевода вполне достижимо в пределах нескольких лет (при этом акцент делался на развитии полностью автоматических систем, обеспечивающих высококачественные переводы; участие человека на этапе постредактирования расценивалось как временный компромисс). Профессиональные переводчики всерьез опасались в скором времени остаться без работы.
|
Е: первое разочарование
К началу 50-х годов целый ряд исследовательских групп в США и в Европе работали в области МП. В эти исследования были вложены значительные средства, однако результаты очень скоро разочаровали инвесторов. Одной из главных причин невысокого качества МП в те годы были ограниченные возможности аппаратных средств: малый объем памяти при медленном доступе к содержащейся в ней информации, невозможность полноценного использования языков программирования высокого уровня. Другой причиной было отсутствие теоретической базы, необходимой для решения лингвистических проблем, в результате чего первые системы МП сводились к пословному (word-to-word) переводу текстов без какой-либо синтаксической (а тем более смысловой) целостности.
В 1959 г. философ Й. Бар-Хиллел (Yohoshua Bar-Hillel) выступил с утверждением, что высококачественный полностью автоматический МП (FAHQMT) не может быть достигнут в принципе. В качестве примера он привел проблему нахождения правильного перевода для слова pen в следующем контексте: John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy. (Джон искал свою игрушечную коробку. Наконец он ее нашел. Коробка была в манеже. Джон был очень счастлив.). Pen в данном случае должно переводиться не как "ручка" (инструмент для письма), а как "детский манеж" (play-pen). Выбор того или иного перевода в этом случае и в ряде других обусловлен знанием внеязыковой действительности, а это знание слишком обширно и разнообразно, чтобы вводить его в компьютер. Однако Бар-Хиллел не отрицал идею МП как таковую, считая перспективным направлением разработку машинных систем, ориентированных на использование их человеком-переводчиком (своего рода "человеко-машинный симбиоз").
Это выступление самым неблагоприятным образом отразилось на развитии МП в США. В 1966 г. специально созданная Национальной Академией наук комиссия ALPAC (Automatic Language Processing Advisory Committee), основываясь в том числе и на выводах Бар-Хиллела, пришла к заключению, что машинный перевод нерентабелен: соотношение стоимости и качества МП было явно не в пользу последнего, а для нужд перевода технических и научных текстов было достаточно человеческих ресурсов. За докладом ALPAC последовало сокращение финансирования исследований в области МП со стороны правительства США — и это несмотря на то, что в то время как минимум три различные системы МП регулярно использовались рядом военных и научных организаций (в числе которых ВВС США, Комиссия США по ядерной энергии, Центр Евроатома в Италии).
|
Е: низкий старт
Следующие десять лет разработка систем МП осуществлялась в США университетом Brigham Young University в Прово, штат Юта (ранние коммерческие системы WEIDNER и ALPS) и финансировалась Мормонской церковью, заинтересованной в переводе Библии; в Канаде группами исследователей, в числе которых TAUM в Монреале с ее системой METEO; в Европе — группами GENA (Гренобль) и SUSY (Саарбрюкен). Особого упоминания заслуживают работа в этой области отечественных лингвистов, таких, как И.А.Мельчук и Ю.Д.Апресян (Москва), результатом которой стал лингвистический процессор ЭТАП. В 1960 г. в составе Научно-исследовательского института математики и механики в Ленинграде была организована экспериментальная лаборатория машинного перевода, преобразованная затем в лабораторию математической лингвистики Ленинградского государственного университета.
Е: новый импульс
С развитием вычислительной техники в конце 70-х годов (появление микрокомпьютеров, развитие сетей, увеличение ресурсов памяти) машинный перевод вошел в эпоху "Ренессанса". При этом несколько сместились акценты: исследователи теперь ставили целью развитие "реалистических" систем МП, предполагавших участие человека на различных стадиях процесса перевода. Системы МП из "врага" и " конкурента" профессионального переводчика превращаются в незаменимого помощника, способствующего экономии времени и человеческих ресурсов.
О возрождении МП в 70-80-е гг. свидетельствуют следующие факты: Комиссия Европейских общин (CEC) покупает англо-французскую версию Systran, а также систему перевода с русского на английский (последняя развивалась после доклада ALPAC и продолжала использоваться ВВС США и НАСА); кроме того, CEC заказывает разработку франко-английской и итальяно-английской версий. В то время благодаря CEC были заложены основы проекта EUROTRA, основанного на разработках групп SUSY и GETA. Одновременно происходит быстрое расширение деятельности по созданию систем МП в Японии (главным образом основанных на технологии interlingva, разработанной Уивером в конце 40-х гг.); в США Панамериканская организация здравоохранения (PAHO) заказывает разработку испано-английского направления (система SPANAM); ВВС США финансируют разработку системы МП в Лингвистическом исследовательском центре при Техасском университете в Остине; группа TAUM в Канаде достигает заметных успехов в разработке своей системы METEO (которая использовалась в основном для перевода метеорологических сводок). Целый ряд проектов, начатых в 70-80-е гг., впоследствии развились в полноценные коммерческие системы.
За период 1978-93 в США на исследования в области МП истрачено 20 миллионов долларов, в Европе — 70 миллионов, в Японии — 200 миллионов.
Одной из новых разработок стала технология TM (translation memory), работающая по принципу накопления: в процессе перевода сохраняется исходный сегмент (предложение) и его перевод, в результате чего образуется лингвистическая база данных; если идентичный или подобный исходному сегмент обнаруживается во вновь переводимом тексте, он отображается вместе с переводом и указанием совпадения в процентах. Затем переводчик принимает решение (редактировать, отклонить или принять перевод), результат которого сохраняется системой. А в конечном итоге "не нужно дважды переводить одно и то же предложение!". В настоящее время разработчиком известной коммерческой системы, основанной на технологии TM, является система TRADOS (основана в 1984 г.).
От 90-х к XXI веку
90-е годы принесли с собой бурное развитие рынка ПК (от настольных до карманных) и информационных технологий, широкое использование сети Интернет (которая становится все более интернациональной и многоязыкой). Все это сделало возможным, а главное востребованным, дальнейшее развитие систем МП. Появляются новые технологии, основанные на использовании нейронных сетей, концепции коннекционизма, статистических методах
В настоящее время несколько десятков компаний занимаются разработкой коммерческих систем МП, в их числе: Systran, IBM, L&H (Lernout & Hauspie), Language Engineering Corporation, Transparent Language, Nova Incorporated, Trident Software, Atril, Trados, Caterpillar Co., LingoWare, Ata Software, Lingvistica b.v., и др.
Появилась возможность воспользоваться услугами автоматических переводчиков непосредственно в Сети:
- www.alphaworks.ibm.com/aw.nsf/html/mt;
- http://www.freetranslation.com/;
- http://www.transtlate.ru/;
- www.logomedia.net/text.asp;
- www.foreignword.com/Tools/transnow.htm;
- babelfish.altavista.com/translate.dyn;
- infinit.reverso.net/traduire.asp;
- http://www.t-mail.com/.
С начала 1990-х гг. на рынок систем ПК выходят отечественные разработчики.
В июле 1990 года на выставке PC Forum в Москве была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammer’s Machine Translation). В 1991 г. было создано ЗАО "ПРОект МТ", и уже в 1992 г. компания "ПРОМТ" выиграла конкурс NASA на поставку систем МП (ПРОМТ была единственной неамериканской фирмой на этом конкурсе).
В 1992 г. "ПРОМТ" выпускает целое семейство систем под новым названием STYLUS для перевода с английского, немецкого, французского, итальянского и испанского языков на русский и с русского на английский, а в 1993 г. на базе STYLUS создается первая в мире система МП для Windows. В 1994 г. вышла версия STYLUS 2.0 для Windows 3.Х/95/NT, а в 1995-1996 гг. представлено третье поколение систем машинного перевода, полностью 32-разрядных STYLUS 3.0 для Windows 95/NT, одновременно с этим успешно завершена разработка совершенно новых, первых в мире русско-немецкой и русско-французской систем МП.
В 1997 г. подписано соглашение с французской фирмой Softissimo о создании систем перевода с французского языка на немецкий и английский и обратно, а в декабре этого года была выпущена первая в мире система немецко-французского перевода. В этом же году компания "ПРОМТ" выпустила систему, реализованную по технологии Гигант — для поддержки нескольких языковых направлений в одной оболочке, а также специальный переводчик для работы в Интернете WebTranSite.
В 1998 г. выпускается целое созвездие программ под новым названием PROMT 98. Через год компания ПРОМТ выпустила два новых продукта: уникальный пакет программ для работы в Интернете – PROMT Internet, и переводчик для корпоративных почтовых систем – PROMT Mail Translator. Для корпоративных клиентов разработаны также специальные серверные решения – корпоративный сервер переводов PROMT Translation Server (PTS) и Интернет-решение PROMT Internet Translation Server (PITS).
В 2000 г. "ПРОМТ" обновила всю линию своих программных продуктов, выпустив МП системы нового поколения: PROMT Translation Office 2000, PROMT Internet 2000 и Magic Gooddy 2000.
В 2005 году компания PROMT выпустила новую версию электронного словаря PROMT VER-Dict 2.0. В новом продукте увеличено количество языковых направлений, а также объем и количество словарей.
В 2007 году к омпания PROMT представила новую линейку систем перевода – PROMT 8.0. Новое поколение переводчиков PROMT обладает еще более широким диапазоном настроек, имеет упрощенный механизм ввода словарных статей, доступ к онлайновым словарным базам, а также встроенную технологию ТМ. В состав восьмой версии PROMT входит переводчик для малого офиса PROMT Standard 8.0, программа для бизнес-пользователей PROMT Professional 8.0, система для профессиональных переводчиков PROMT Expert 8.0 и продукт для домашних пользователей PROMT 4U.
В 2008 году в ыпуск первого переводчика для смартфонов, КПК и коммуникаторов – PROMT Mobile 7.0, а также корпоративного решения PROMT Translation Server 8.0 Intranet Edition с поддержкой Microsoft ® Office 2007 и Windows Vista и инструмента разработчиков PROMT Translation Server 8.0 Developer Edition
Ключевым событием 2009 года стал выход новой версии наших систем машинного перевода - PROMT 8.5. Была обновлена вся линейка программ PROMT, а розничная линейка также расширена за счет принципиально нового продукта: впервые в России компания PROMT представила комплекты переводческих программ - инновационное решение для работы с переводческими задачами любого объема - от одного слова до целого текста.
Весной 2010 года вышла новая линейка программ-переводчиков – PROMT 9.0. Семейство программ 9.0 рассчитано на использование в корпоративном и частном сегменте, впервые в линейке PROMT представлены программы для профессиональных переводчиков.
Качество перевода заметно улучшено за счет расширения словарных баз (общее обновление составило более 300 000 слов и выражений) и совершенствования механизмов перевода. Акцент делался на улучшение качества перевода новостных текстов, бизнес- и IT-тематик.
В продуктах новой линейки появился доступ к персональному разделу пользователя на сайте – My PROMT. В конце 2010 года PROMT представил Гибридную технологию перевода, совмещающую в себе подход RBMT и SMT. Суть такого совмещения в том, что вместо одного варианта перевода программа порождает множество переводов, число которых у одного предложения, в зависимости от многозначности слов, конструкций и результатов статистической обработки, может доходить до нескольких сотен. Далее вероятностная модель языка позволяет выбрать самый вероятный из предложенных вариантов. Совмещение RBMT и SMT подходов дает преимущество от обеих технологий. Такой подход также позволяет быстро обучать переводчиков.
2011 год прошел под знаком переноса приоритетов с домашних систем перевода на корпоративные. В июне появилась новая линейка 9.5. Она включала в себя только корпоративные системы перевода, причем максимум изменений получили серверные решения PTS 9.5 IE и PTS 9.5 DE. У них обновились словарные базы, появился доступ к новым языкам – украинскому, латышскому и польскому, добавилась возможность перевода в браузерах Opera и Google Chrome. С 2011 г. PROMT также предлагает решения на основе статистического подхода.
Перевод в режиме он-лайн при поддержке системы "ПРОМТ" используется на ряде отечественных и зарубежных сайтов: http://www.translate.ru/, infinit.reverso.net/traduire.asp, http://itranslate4.eu/en/ и др.
Программные продукты компании "ПРОМТ" удостоены целого ряда отечественных и зарубежных наград, подробнее см. http://www.promt.ru/company/history/.
Контрольные вопросы:
1 Чьи идеи легли в основу подхода машинного перевода, который был основан на концепции interlingva?
2 В каком году и где была представлена первая система машинного перевода?
3 Каковы причины первого разочарования исследований, произведенных в области машинного перевода?
4 Что являлось причиной сокращения финансирования исследований в области машинного перевода в США в 50-е годы?
5 Охарактеризуйте 70-е годы развития машинного перевода?
6 Назовите основные страны, которые активно занимаются разработкой систем машинного перевода?
7 В каком году в России была представлена первая коммерческая система машинного перевода? Проследите этап ее разработки.
2 Системы машинного перевода
Машинный перевод (МП, MT, Machine Translation) – перевод текстов с одного естественного языка на другой специальной компьютерной программой.
Программы-переводчики оказываются просто незаменимыми, когда возникает необходимость:
- быстро понять общий смысл текста;
- быстро проанализировать многоязычную информацию из интернета;
- оптимизировать перевод большого объема текстов по одной тематике (процесс разбивается на два этапа: машинный перевод и постредактирование человеком);
- сделать информацию на сайте понятной иностранным пользователям, встроив функцию перевода на сайт;
- быстро вести переписку с иностранными партнерами, а также свободно общаться в социальных сетях и на форумах;
- извлечь информацию из большого объема текстов, опираясь на лингвистические характеристики слов. Например, выяснить, сколько раз в тексте встречаются имена собственные, какие это имена и какие действия связаны с этими именами.
Rule - based Machine Translation (RBMT, Машинный перевод, основанный на правилах )
Эта технология основана на словарной информации и анализе грамматических правил конкретных языков. Такие системы строятся на основе лингвистического описания двух естественных языков (двуязычных словарей и других баз данных, содержащих морфологическую, грамматическую и семантическую информацию), формальных грамматик и собственно алгоритмов перевода. Качество перевода зависит от объемов лингвистических баз данных (словарей) и глубины описания естественных языков, т. е. необходим учет максимального количества особенностей грамматической структуры как входного, так и выходного языка.
Существует два типа rule - based систем:
- системы по типу Transfer – предполагают морфологический, синтаксический и семантический анализ текста на языке входа;
- преобразование в структуру выходного языка (TRANSFER); синтез текста на выходном языке;
- системы по типу Interlingua– предполагают анализ входного текста в терминах метаязыка и синтез метаструктуры текста на выходном языке.
Преимущества RBMT -систем:
- синтаксическая и морфологическая точность,
- стабильность и предсказуемость результата,
- возможность настройки на предметную область.
Недостатки RBMT -систем:
- трудоемкость и длительность разработки,
- необходимость поддерживать и актуализировать лингвистические базы данных.
Компании-производители систем машинного перевода на основе технологии rule - based: PROMT, Systran, Linguatec.
Statistical Machine Translation (SMT, Статистический машинный перевод)
Эта технология основана на поиске наиболее вероятного перевода предложения с использованием данных, полученных из двуязычной совокупности текстов. Такие системы перевода строятся на основе сравнения больших объемов корпусов параллельных текстов. Корпус параллельных текстов — это тексты, содержащие предложения на одном языке и соответствующие им предложения на втором.
Cтатистический машинный перевод обладает свойством «самообучения»: чем больше в распоряжении имеется параллельных корпусов и чем точнее они соответствуют друг другу, тем лучше результат статистического машинного перевода.
Преимущества SMT -систем:
- гладкость перевода,
- легкость в построении при достаточном количестве параллельных корпусов,
- переносимость технологии на любые языковые пары.
Недостатки SMT:
- ограниченность параллельных корпусов в природе,
- неумение справляться с морфологией и синтаксисом,
-искажение информации (дублирование, пропуск, подмена информации).
Компании-производители систем статистического машинного перевода: PROMT, Google, SDL Language Weaver, Microsoft, Asia Online, IBM.
Hybrid Machine Translation (HMT, Гибридный машинный перевод)
В связи с тем, что технологии SMT и RBMT имеют свои недостатки и сложности, а также достигли определенного предела в своем развитии, разработчики решений по МП рассчитывают на технологический прорыв за счет создания гибридной технологии перевода. Эта технология основана на совмещении методов RBMT и SMT. Такой подход позволяет взять сильные стороны обеих технологий (грамматическую точность при переводе от RBMT и гладкость перевода от SMT).
Компании-производители систем машинного перевода на основе гибридной технологии: PROMT, Systran.
Формы организации взаимодействия ЭВМ и человека при машинном переводе:
- с постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат;
- с предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка;
- с интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи;
- смешанные системы (например, одновременно с пред- и постредактированием).
Помимо систем машинного перевода, существуют программы, принцип работы которых основан на технологии Translation Memory.
Контрольные вопросы:
1 Дайте определение машинного перевода.
2 В каких случаях необходимы программы-переводчики?
3 Охарактеризуйте основные технологии машинного перевода.
4 Каковы формы организации взаимодействия ЭВМ и человека при машинном переводе?
Поиск заказов
Сайты Headhunter (http://hh.ru), Superjob (http://superjob.ru) и ProZ (http://proz.com) – это места, где вы можете искать себе заказы. Первые два — сайты поиска работы, где частенько бывают вакансии и для удаленных переводчиков (только не забудьте в поиске убрать критерий «Регион»).
ProZ – это крупнейшее сообщество переводчиков в Сети, и там, кроме всего прочего, размещаются заказы на перевод со всего мира.
Из других иностранных сообществ переводчиков, где также можно найти заказы:
- http://translatorscafe.com/;
- http://translatorsbase.com/.
Интернет соединил переводчиков, живущих в разных странах мира. С каждым днем появляется все больше форумов, блогов и ресурсов для переводчиков, где последние могут обмениваться опытом и помогать друг другу. Наиболее известный среди таких сайтов в России Город переводчиков, а западных – Proz.com, KudoZ, Translators' Café и Translators' Base. Некоторое время назад среди переводчиков также были популярны списки рассылки (например, Lantra-L и Trad-Prt).
Контрольные вопросы:
1 Назовите категории, на которые можно разделить все программы, необходимые для переводчика.
2 Какие текстовые редакторы являются наиболее распространенными среди переводчиков?
3 Изучив список предложенных программ назовите те, которые Вы могли бы использовать в своей работе?
Поиск, замена и переходы
Продолжение таблицы 2 – Горячие клавиши
Действие | Сочетание клавиш |
Замена текста, форматирования и специальных знаков | CTRL+H |
Переход к странице, закладке, сноске, таблице, примечанию, рисунку и другим элементам документа | CTRL+G |
Переход между последними четырьмя местами внесения изменений | ALT+CTRL+Z |
Открытие списка параметров поиска. Для выбора параметра воспользуйтесь клавишами со стрелками, затем нажмите клавишу ВВОД, чтобы начать поиск в документе | ALT+CTRL+HOME |
Переход к месту предыдущего изменения | CTRL+PAGE UP |
Переход к месту следующего изменения | CTRL+PAGE DOWN |
Смена режима просмотра | |
Переход в представление режима разметки | ALT+CTRL+P |
Переход в представление режима структуры | ALT+CTRL+O |
Переход в представление черновика | ALT+CTRL+N |
Режим структуры | |
Перенос абзаца на вышестоящий уровень | ALT+SHIFT+СТРЕЛКА ВЛЕВО |
Перенос абзаца на нижестоящий уровень | ALT+SHIFT+СТРЕЛКА ВПРАВО |
Преобразование абзаца в основной текст | CTRL+SHIFT+N |
Перенос выделенных абзацев вверх | ALT+SHIFT+СТРЕЛКА ВВЕРХ |
Перенос выделенных абзацев вниз | ALT+SHIFT+СТРЕЛКА ВНИЗ |
Развертывание текста под заголовком | ALT+SHIFT+ЗНАК ПЛЮС |
Свертывание текста под заголовком | ALT+SHIFT+ЗНАК МИНУС |
Продолжение таблицы 2 – Горячие клавиши
Действие | Клавиши со стрелками |
Отображение первой строки основного текста или всего основного текста | ALT+SHIFT+L |
Отображение всех заголовков, оформленных стилем «Заголовок 1» | ALT+SHIFT+1 |
Отображение всех заголовков до заголовка, оформленного стилем «Заголовок n» | ALT+SHIFT+ n |
Вставка символа табуляции | CTRL+TAB |
Печать документа | CTRL+P |
Открытие или закрытие окна предварительного просмотра | ALT+CTRL+I |
Перемещение к предыдущей или следующей странице при уменьшенном масштабе изображения | PAGE UP или PAGE DOWN |
Перемещение к предыдущей или следующей странице при уменьшенном масштабе изображения | PAGE UP или PAGE DOWN |
Перемещение к первой странице при уменьшенном масштабе изображения | CTRL+HOME |
Перемещение к последней странице при уменьшенном масштабе изображения | CTRL+END |
Печать и предварительный просмотр документов Рецензирование документов | |
Вставка примечания | ALT+CTRL+M |
Включение и отключение режима записи исправлений | CTRL+SHIFT+E |
Закрытие области проверки (если она открыта) | ALT+SHIFT+C |
Режим полноэкранного чтения | |
Переход в начало документа | HOME |
Переход в конец документа | END |
Продолжение таблицы 2 – Горячие клавиши
Действие | Клавиши со стрелками |
Переход к странице с номером n | n, ВВОД |
Выход из режима чтения | ESC |
Работа с вебстраницами | |
Вставка гиперссылки | CTRL+K |
Переход на одну страницу назад | ALT+СТРЕЛКА ВЛЕВО |
Переход на одну страницу вперед | ALT+СТРЕЛКА ВПРАВО |
Обновление | F9 |
Выделение текста и рисунков | |
Включение режима выделения | F8 |
Выделение ближайшего знака | F8, а затем нажмите СТРЕЛКА ВЛЕВО или СТРЕЛКА ВПРАВО |
Расширение выделения | F8 (нажмите один раз, чтобы выделить слово, два раза, чтобы выделить предложение, и т. д.) |
Уменьшение выделения | SHIFT+F8 |
Отключение режима выделения | ESC |
Расширение выделения на один знак вправо от курсора | SHIFT+СТРЕЛКА ВПРАВО |
Расширение выделения на один знак влево от курсора | SHIFT+СТРЕЛКА ВЛЕВО |
Расширение выделения до конца слова | CTRL+SHIFT+СТРЕЛКА ВПРАВО |
Расширение выделения до начала слова | CTRL+SHIFT+СТРЕЛКА ВЛЕВО |
Расширение выделения до конца строки | SHIFT+END |
Продолжение таблицы 2- Горячие клавиши
Действие | Сочетание клавиш |
Расширение выделения до начала строки | SHIFT+HOME |
Расширение выделения на одну строку вниз | SHIFT+СТРЕЛКА ВНИЗ |
Расширение выделения на одну строку вверх | SHIFT+СТРЕЛКА ВВЕРХ |
Расширение выделения до конца абзаца | CTRL+SHIFT+СТРЕЛКА ВНИЗ |
Расширение выделения до начала абзаца | CTRL+SHIFT+СТРЕЛКА ВВЕРХ |
Расширение выделения на одну страницу вниз | SHIFT+PAGE DOWN |
Расширение выделения на одну страницу вверх | SHIFT+PAGE UP |
Расширение выделения до начала документа | CTRL+SHIFT+HOME |
Расширение выделения до конца документа | CTRL+SHIFT+END |
Расширение выделения до конца окна | ALT+CTRL+SHIFT+PAGE DOWN |
Выделение всего документа | CTRL+A |
Выделение вертикального блока текста | CTRL+SHIFT+F8, а затем используйте клавиши перемещения курсора; для выхода из режима выделения нажмите клавишу ESC |
Расширение выделения до определенного места в документе | F8, а затем используйте клавиши перемещения курсора; для выхода из режима выделения нажмите клавишу ESC |
Перемещение по документу | |
На один знак влево | СТРЕЛКА ВЛЕВО |
На один знак вправо | СТРЕЛКА ВПРАВО |
На одно слово влево | CTRL+СТРЕЛКА ВЛЕВО |
На одно слово вправо | CTRL+СТРЕЛКА ВПРАВО |
На один абзац вверх | CTRL+СТРЕЛКА ВВЕРХ |
На один абзац вниз | CTRL+СТРЕЛКА ВНИЗ |
На одну ячейку влево (в таблице) | SHIFT+TAB |
Продолжение таблицы 2- Горячие клавиши
На одну ячейку вправо (в таблице) | TAB | |
К предыдущей строке | СТРЕЛКА ВВЕРХ | |
К следующей строке | СТРЕЛКА ВНИЗ | |
Действие | Сочетание клавиш | |
В конец строки | END | |
В начало строки | HOME | |
В начало экрана | ALT+CTRL+PAGE UP | |
| ||
|
|
Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьшения длины пробега и улучшения маневрирования ВС при...
Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...
Адаптации растений и животных к жизни в горах: Большое значение для жизни организмов в горах имеют степень расчленения, крутизна и экспозиционные различия склонов...
Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!