Строение мозга и национальные традиции — КиберПедия 

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Строение мозга и национальные традиции

2021-01-29 71
Строение мозга и национальные традиции 0.00 из 5.00 0 оценок
Заказать работу

В начале книги уже обращалось внимание на особенности подходов, в том числе к грамматике, в разных традициях: индийской, арабской, китайской, японской и европейской. Во многом эти особенности были связаны со строем базового языка, изучение которого создало традицию. Но оказывается, что различия проходят и внутри лингвистики, восходящей к античной традиции. Хотя европейская традиция имеет общие истоки, она делится на разные варианты, разделяемые не столько нацио­нальными границами, сколько базовыми языками (русским, английским, французским и др.). Сразу должен оговорить, что речь не будет идти о политических или идеологических различиях, я не буду говорить о неязыковых аспектах культуры и не собираюсь давать этим вариантам каких-либо оценок. Всё здесь в конечном итоге обусловлено строем базового языка, а я не считаю научными популярные сейчас попытки «доказать», что, например, русский язык лучше или хуже английского. Но разный строй этих языков, о котором упоминалось в разделе о типологии, — объективная реальность: русский язык (как и древние языки, бывшие первоначально базовыми для традиции) — синтетический, английский и французский — аналитические.

Почему английский и французский (в меньшей степени немецкий) языки так значительно изменили свой строй в ходе исторического развития, а русский язык в целом сохранил прежние особенности? Как уже говорилось в разделе об исторической лингвистике, вопрос о причинах исторических изменений пока с большим трудом поддается решению, и современная наука в данном случае может лишь констатировать факт. Вот так случилось. А последствия этого значительны, в том числе для развития науки о языке в разных странах. Я буду в основном говорить об актуальном в наши дни противопоставлении русскоязычного и англоязычного вариантов лингвистики. Но сначала стоит привести показательный, как представляется, пример рассуждений французского ученого.

Еще в 1903 г. Антуан Мейе, рассматривая строй древних индоевропейских языков, писал: «Индоевропейский морфологический тип был чрезвычайно своеобразен и вместе с тем крайне сложен. … Слово являлось в нем лишь в сочетании со словоизменительными элементами. … В латинском языке для значения «волк» нет ни слова, ни выделяемой основы; есть только совокупность форм: lupus, lupe, lupum, lupī, lupō, lupōs, lupōrum, lupīs[6]. Нет ничего менее ясного, чем подобный прием. … Все индоевропейские языки в большей или меньшей степени, одни раньше — другие позже, обнаружили склонность упразднить словоизменение и довольствоваться словами как можно менее изменяемыми, а в конце концов и вовсе неизменяемыми». То есть для лингвиста — носителя французского языка равное основе неизменяемое слово — норма, а развитое словоизменение — «своеобразный», «сложный» и «неясный» тип, от которого нужно избавляться.

Автор комментариев к русскому изданию книги Мейе Розалия Осиповна Шор справедливо писала: «Как понимание структуры отдельного слова… так и понимание структуры предложения древнейших индоевропейских языков не представляет с точки зрения русского языка — языка синтетического строя — тех затруднений, которые оно представляет с точки зрения французского языка — языка аналитического строя». Для носителей русского языка здесь нет ничего неясного.

И, по контрасту, высказывание Александра Ивановича Смирницкого (1950-е гг.): «Слово с лексической точки зрения не есть какой-то обрубок. Слово окно как лексема, как единица словаря, есть все же окно или, в известных случаях, окна, окну, окна, но не окн-». Норме у Мейе соответствует «обрубок» у Смирницкого. Этот ненаучный эпитет точно передает интуицию носителя русского языка, для которого слово должно быть оформлено, то есть иметь показатель словоизменения (хотя бы нулевой); «неоформленное» же слово, равное основе, ощущается как исключение, свойственное либо периферийной лексике, либо служебным словам, которые как бы и не совсем слова. Отмечу, что Смирницкий по лингвистической специализации был германистом и много занимался как раз английским языком, но в общелингвистических работах исходил из представлений, привычных для носителя русского языка.

Такие представления могут влиять на то, как тот или иной лингвист исследует свой объект. Еще более полувека назад Андрей Анатольевич Зализняк и Елена Викторовна Падучева писали: «Естественно… что когда лингвист переходит от описаний родного языка к построению общей теории языка, основные понятия построенной им теории часто сохраняют тесную связь с фактами, которые хорошо представлены в его родном языке». Это может проявляться и в подходе к языкам, по строю отличным от родного.

Русский нацио­нальный вариант европейской лингвистической традиции в основном начал формироваться в XVIII в. B. E. Адодуровым, В. Г. Тредиаковским, М. В. Ломоносовым. Поначалу в нем имело место сильное влияние греко-латинского эталона; например, Ломоносов рассматривал по античному образцу имя как единую часть речи, но ученые XIX в. уже выделяли существительные и прилагательные, поскольку в русском языке они склоняются по-разному. Постепенно вырабатывался эталон, основанный на строе русского языка, к концу XIX в. он уже окончательно сложился. Аналогичные процессы шли с разной скоростью в английском, французском и других вариантах европейской лингвистической традиции, которые сложились на одно-два столетия раньше, но изменения здесь оказались более существенными.

Можно привести немало примеров влияния строя базового языка на лингвистическое описание. Особенно они наглядны в области морфологии, о которой писали в приведенных выше цитатах Мейе и Смирницкий.

Подобные представления отразились, например, в русской японистике. В русской традиции принято считать, что любая грамматическая категория, включая падеж, определяется, как сказано в русской грамматике 1970 г., «совокупностью словоформ (парадигмой)». То есть хотя бы некоторые из падежей того или иного языка должны выражаться внутри именной словоформы, прежде всего с помощью окончаний слов. Возможны в каких-то языках падежи, выраженные префиксами или чередованиями звуков в корне, но они не могут выражаться другим словом, в том числе служебным. Точнее, могут (традиция признаёт так называемые аналитические формы), но лишь при условии, что они входят в сис­тему вместе с синтетическими формами. В русском языке, правда, нет аналитических падежей, но есть аналитические формы глагола вроде буду писать, которые входят в единую сис­тему с формами вроде пишу, напишу и др. Если же ни один падеж не выражен словоизменением, то в языке нет падежей, а есть лишь грамматические конструкции со сходным значением.

Японская падежная сис­тема вполне соответствует данному названию с точки зрения функции падежей, однако споры вызывал вопрос о трактовке падежных показателей — это отдельные слова или аффиксы. Японская нацио­нальная традиция, как и англо­язычная японистика, всегда считает их отдельными словами, для чего есть серьезные основания. Они в некоторых случаях могут отделяться от существительных: например, в газетной заметке обозначен персонаж, далее в скобках указываются его возраст, место жительства и работы, и только после этого стоит показатель именительного падежа. Но если падежные показатели — слова, то с традиционной русской точки зрения в японском языке нет грамматической категории падежа, есть только послеложные конструкции. Но всё выглядит иначе, если признать японские падежные показатели аффиксами, что и сделал уже не раз мной упоминавшийся Поливанов в 1930 г. Эта точка зрения существовала только в российской японистике, одно время господствовала, но во второй половине XX в. была оставлена.

При рассмотрении японского языка разные привычки носителей русского языка вступают в противоречие: в «нормальном» языке должны быть, с одной стороны, падежи, с другой стороны, грамматическое оформление слова. То и другое совмещалось в концепции падежного словоизменения, которая никогда не приходила в голову англоязычным японистам. Однако понятие падежа в японском языке устояло ценой отказа части российских японистов от общелингвистического определения падежа, слишком ориентированного на особенности языков с развитым словоизменением. Для лингвиста, исходящего (может быть, и бессознательно) из русского языка как точки отсчета, кажется естественным случай, когда и в исследуемом языке слово «оформлено», если имеет в своем составе грамматические аффиксы. Если же такого аффикса нет, то более естественным может казаться трактовка его отсутствия как нуля, чем как совпадения слова с основой. А для носителя другого языка «оформленность» слова — вовсе не обязательный его признак; как мы видели, Мейе считал ее экзотикой, для него естественнее было отсутствие словоизменения.

Влияние родного языка может проявляться и в фонологии. Общепризнанно, что в фонологической сис­теме русского языка важнейшее место занимает противопоставление согласных фонем по наличию — отсутствию признака палатализации (мягкости). Нас этому учат с первых классов школы, рассказывая о том, что русские согласные разделяются, во-первых, на твердые и мягкие, во-вторых, на звонкие и глухие (прочие их дифференциальные признаки в школе не рассматриваются). Но если признак звонкости-­глухости встречается в огромном количестве языков мира, включая английский, то признак твердости-­мягкости (в научной терминологии непалатализованности-­палатализованности) не особенно част в мире, в том числе на фонологическом уровне его нет во многих европейских языках. Но есть серьезные основания относить японский к языкам с палатализацией, которая, как и в русском языке, проходит через всю сис­тему согласных. В России, начиная с Поливанова, такая точка зрения господствует и отражается в разработанной этим ученым кириллической транскрипции японских слов. Однако англоязычные японисты не замечают мягких согласных и трактуют разные элементы единой сис­темы по-разному. Некоторые из японских палатализованных согласных имеют более заднюю («шепелявую») артикуляцию, которая воспринимается в России как дополнительный, а в США как основной признак. Отсюда последовательностям ся, тя в кириллической транскрипции Поливанова соответствуют sha, cha в стандартной латинице, разработанной для японского языка в конце XIX в. американским миссионером Дж. К. Хэпбёрном. Отсюда разнобой в современном русском языке, когда одновременно встречаются непосредственные заимствования из японского (суси, Хитати) и заимствования через посредство английского (суши, Хитачи). В изданном в 1970 г. «Большом японско-русском словаре» есть только суси и сасими, но сейчас вместе с распространением исходящей в основном из США культуры глобализации уже стали привычными слова суши и сашими — запись русскими буквами английских sushi, sashimi. Если же звуки различаются только палатализацией, то носители английского языка слышат их как сочетания с йотом: мя, кя в кириллице и туа, куа в латинице. В англоязыч­ной японистике однотипные противопоставления рассматриваются то как противопоставления фонем, то как противопоставлении фонем их сочетаниям с йотом. Носителям языка, где нет мягкости (палатализации) согласных, ее услышать трудно, тогда как для носителей русского языка ее выделение представляется естественным.

Два приведенных примера из области японистики показывают, что базовый язык, ощущаемый как эталон «нормального» языка, может дать (в рассматриваемом случае одному и тому же исследователю — Поливанову) и верную, и неверную подсказку. Со временем влияние нацио­нальной традиции может ослабевать, как это произошло с трактовкой японских падежей. Но признания палатализации в англоязычной японистике не произошло: слишком мало там знают российскую лингвистику и русский язык.

Различия видны и в синтаксисе. В отечественной традиции синтаксис обычно понимается как совокупность слов (членов предложения) и синтаксических отношений между ними. Еще в школе нас учат проводить стрелки от главного слова к зависимому; такое представление синтаксической структуры называют грамматикой зависимостей. Направление анализа — от слова к предложению, а порядок слов существенной роли не играет: при изменении порядка синтаксические связи остаются теми же самыми. В западной науке такое представление структуры предложения встречается, его изображения с помощью стрелок называют «графами Теньера», поскольку их предложил французский лингвист Люсьен Теньер (1893–1954); он был славистом, изучал работы русских лингвистов и мог использовать их идеи.

Однако там, особенно в англоязычной лингвистике, преобладает иное представление синтаксиса, именуемое грамматикой составляющих, впервые разработанное Л. Блумфилдом. Предложение на каждом шагу делится на две части (составляющие), они, в свою очередь, делятся на части и т.д. Такая схема наглядно представляется не с помощью стрелок, а в виде скобок. Каждая пара скобок включает составляющую, пары скобок вкладываются друг в друга, но не пересекаются. Направление анализа — от предложения к меньшим единицам, часто при этом конечными единицами оказываются не слова, а морфемы.

Грамматика зависимостей принципиально не меняется при перемене порядка слов, при изменении порядка изображаемые стрелками синтаксические связи остаются теми же самыми. Это, вероятно, соответствует привычкам людей, для которых родной язык — русский. Но грамматика составляющих исходит из того, что составляющие в норме должны быть непрерывны, что, видимо, естественно для носителей английского языка, для которых существенно представление о корреляции между степенью синтаксической и линейной близости слов. Свободный порядок слов не предусмотрен в каноническом варианте грамматики составляющих и требует ее усложнения. С другой стороны, грамматика зависимостей требует обязательного членения текста без остатка на слова, что не всегда легко сделать. В грамматике же составляющих можно вообще обойтись без обязательного выделения слова.

В этом проявляется различие строя базовых языков. Зализняк и Падучева в упомянутой выше статье 1964 г. писали: «Ясно, что русский язык, с относительно свободным расположением слов, менее удобно анализировать по непосредственным составляющим, чем английский; аналогично, для английского языка понятие дерева зависимостей является менее естественным, чем для русского». По-видимо­му, грамматика зависимостей кажется естественной носителям русского языка, где слова обычно четко выделяются, их грамматические функции очевидны благодаря их «оформленности», а их порядок почти всегда свободен. Но грамматика составляющих естественнее для носителей английского языка с жесткими правилами словесного порядка и менее ясными границами слов. Здесь, в отличие от русского языка, слова часто получают синтаксическую роль лишь в зависимости от места в предложении.

Далее следует рассмотреть традиционную синтаксическую терминологию. Трудно дать стандартный и общепонятный английский перевод для привычных в России терминов знаменательное слово, служебное слово, словосочетание, главное предложение, придаточное предложение. Синтаксически несамостоятельные слова могут называть particles или clitics, но можно ли так называть, скажем, вспомогательные глаголы? А русский термин частица уже по значению, чем particle. Общего же термина для самостоятельных слов, не являющихся particles или clitics, в английском варианте традиции просто нет.

С другой стороны, до недавнего времени не имели точного русского эквивалента англоязычные термины phrase и clause. Первый из них — не то же самое, что фраза в русской традиции: фраза — более или менее — то же самое, что предложение, но phrase может быть словосочетанием и даже словом. Русскому термину словосочетание точнее всего соответствует как раз phrase, но не наоборот: словосочетание не может равняться одному слову. Такой подход, с точки зрения носителя русского языка, стирает важное различие между словом и словосочетанием. А термины sentence и clause покрываются термином пред­ложение, не будучи синонимами: sentence может состоять из нескольких clause, но не наоборот. Термин clause близок к русскому придаточному предложению, но не идентичен ему: сложносочиненное предложение делится на clauses, но не на придаточные предложения. Наконец, термину главное предложение, как и термину знаменательное слово, нет принятого эквивалента в английском языке.

Таким образом, мы имеем два ряда терминов: sentence — clause — phrase — word и предложение — словосочетание — слово. Точного соответствия нет. Правда, в самое последнее время в некоторых школах российской лингвистики распространился термин клауза, но это уже прямое влияние англоязычной традиции, всё более становящейся международной.

И дело не просто в терминах. Для носителя русского языка синтаксис — это прежде всего согласование и управление, выражаемые словоизменением. Такое представление, естественно, отражается и в том, что компонентами предложения признаются слова (любые или только знаменательные), но не словосочетания. Однако носитель английского языка, по-видимому, не привык находить опору в формах слов, тогда как их порядок для него почти всегда важен, а синтаксически наиболее тесно связанные компоненты в норме должны и стоять рядом. Поэтому русская традиция пошла по пути грамматики зависимостей и по пути разграничения главных и придаточных предложений, а англоязычная — по пути грамматики составляющих и выделения phrase.

Наконец, русский вариант европейской традиции устойчиво сохраняет представление о центральной роли слова среди единиц языка. Оно было таковым во всей европейской традиции тогда, когда она исходила из греческого и / или латинского эталона. Однако в западноевропейских вариантах традиции с XX в. слово начало отходить на задний план; позже оно стало вообще исчезать. Показательны включение морфологии в состав синтак­сиса в генеративизме и некоторых других направлениях западной лингвистики и идея ряда современных западных лингвистов о едином морфосинтаксисе. Но в русском варианте традиции это встречается много реже.

Такие особенности, по-видимому, имеют психолингвистические корни. В разделе 18 говорилось о речевых расстройствах и развитии детской речи у носителей русского языка. Эксперименты в том числе показывают, что для них базовая единица — прежде всего словоформа, почти всегда включающая аффиксы в свой состав. «В русском языке операции с флексиями задействованы всегда; иными словами, даже лица с речевыми нарушениями обязательно используют какие-либо окончания, не оставляя глагол морфологически неоформленным».

Исследования детской речи показывают, что носители русского и английского языков формируют морфологию по-разному. Если дети, овладевающие русским языком, на одном из этапов овладения говорят «замороженными словоформами», постепенно осваивая словоизменение, то американские исследователи отмечают на соответствующем этапе «телеграфную речь», в которой отсутствуют не только служебные слова, но и аффиксы. И исследования афазий показывают, что в английском языке регулярные формы прошедшего времени с элементом -ed (который по традиции принято считать аффиксом) составляются из компонентов (производятся), а не хранятся в готовом виде (воспроизводятся); формы неправильных глаголов, однако, воспроизводятся. Показательно, что когда-то некоторые представители американской дескриптивной лингвистики предлагали выделять, например, в формах английского глагола со значением «брать» take и took корень t-k и вставляемые внутрь его аффиксы. Однако эта точка зрения не прижилась для английского языка, хотя во многих «экзотических языках» аналогичные трактовки были распространены среди дескриптивистов. Видимо, мешала интуиция носителей языка.

То есть получает подтверждение вышеупомянутая точка зрения о разных механизмах для регулярных и нерегулярных форм. Но это верно лишь для таких языков, как английский. Как пишет Черниговская, «можно предположить, что резкое противопоставление регулярного и нерегулярного механизмов в русском языке не является продуктивным».

Надо, конечно, при этом учитывать, что и в странах английского языка лингвистика первоначально имела латинскую основу, а древнеанглийский язык был, как и латинский, синтетическим. Поэтому и в англоязычном варианте европейской традиции возможны представления, восходящие к его более раннему этапу: например, на представления о границах слова может влиять давно установленная орфография. Для маленьких детей –ed, по-видимому, отдельное слово, но последующее обучение грамоте, вероятно, может изменить представления.

В прошлом, по-видимому, и английский язык, имевший развитое словоизменение, обладал морфологическими механизмами, теперь в них уже нет необходимости, а формы неправильных глаголов, реликт былого словоизменения, хранятся в памяти в готовом виде. Многие из вышеупомянутых отличий нацио­нальных вариантов традиции могут прямо или косвенно вытекать отсюда.

Итак, многие различия вариантов европейской лингвистической традиции могут получить психолингвистическое объяснение. Носители любого языка имеют в своем распоряжении лексикон (набор базовых единиц) и правила порождения из них предложений (при афазиях бывает, что один из этих механизмов выходит из строя). Однако в русском языке базовые единицы сложнее по своему составу, чем в английском (и, по-видимому, во французском, о чём косвенно свидетельствуют рассуждения Мейе). Процесс порождения предложений для английского языка в основном сводится к соположению базовых единиц на основе правил порядка, а в русском языке помимо синтаксических механизмов имеются и морфологические, порождающие не базовые словоформы. Если лексикон и синтаксис абсолютно необходимы для носителей любого языка, то морфологический механизм, по-видимому, не столь универсален. Если в европейской традиции именно он ввиду его особой сложности первоначально описывался более всего (что сохранилось и в русском варианте), то его редукция в английском языке влияет и на англоязычные теории.

Если лингвист исследует чужой для него язык, то он сознательно или чаще бессознательно выбирает решение, более естественное с точки зрения родного языка, а дальнейший анализ может его подтвердить или не подтвердить. Русский язык всегда лежал в основе лингвистических теорий, создававшихся в русской науке. Даже лингвисты, специально не занимавшиеся этим языком, как германист Смирницкий, в первую очередь опирались на его данные. В то же время за пределами России он мало учитывался при построении теорий (исключение составляли игравшие важную роль в мировой лингвистике XX в. эмигранты из России и изредка слависты вроде Теньера). Излишняя ориентация на типологические особенности русского языка нередко встречалась в советское время при изучении других языков СССР, а сейчас в связи с глобализацией всё чаще начинают исходить из особенностей английского языка. В последнее время этот язык стал возводиться в ранг всеобщего эталона, тогда особенности русского языка вроде свободного порядка слов рассматриваются как отклонения от базовых принципов языка или вообще игнорируются. Однако остается проб­лема разграничения общих свойств языка, поставленная еще в XVII в. в «Грамматике Пор-Рояля»; здесь может помочь сопоставление нацио­нальных лингвистических вариантов.

Хотя современная лингвистика старается отойти от слишком большой ориентации на родной язык исследователя или наиболее престижный для него язык, но отрешиться от нее весьма трудно. Еще раз процитирую Кибрика: «Для отечественного языкознания характерен русоцентризм, для американского — англоцентризм, на фоне чего европоцентризм можно уже считать высоким уровнем языкового кругозора». С этим не всегда легко бороться, но делать это совершенно необходимо.

21

Прикладная лингвистика.
Компьютерная лингвистика

На протяжении всей книги речь постоянно заходила о прикладной деятельности лингвистов. В том числе уже отмечалось, что в своих истоках все лингвистические традиции были ориентированы на прикладное использование: прежде всего на обучение языку культуры, а также на правильное построение ритуальных текстов, стихосложение и другое. Но и, казалось бы, чисто теоретическое исследование может иметь прикладное применение. Уже упоминавшийся пример — фонология как база для конструирования алфавитов, что в условиях СССР 1920–1930-х гг. имело важное практическое значение.

Некоторые практические задачи языкознания существовали всегда и сохраняют свое значение и теперь. Прежде всего это задача обучения языкам в разных вариантах: языкам культуры, нормативным вариантам материнского языка или иностранным языкам. Методика обучения языкам — давно сложившаяся и имеющая значительные традиции прикладная дисциплина. Необходимо назвать и составление словарей и практических грамматик, которые могут быть не только учебными, но и справочными.

Однако в конце XIX в. и еще больше в XX в. прикладная деятельность лингвистов и ученых смежных специальностей (например, психологов и физиологов речи) значительно расширилась, и это расширение продолжается. В разных главах книги говорилось о конструировании алфавитов, лечении речевых расстройств, методах речевого воздействия, в том числе в пропаганде и рекламе, и др. Некоторые виды этой деятельности существовали давно, но развивались стихийно. Теперь же они получили научную базу.

Заметно расширились прикладные фонетические исследования. Если Реформатский в 1970 г. среди областей практического применения фонетики упоминал лишь технику связи, то в наши дни разрабатываются многие виды речевых технологий. Вот перечень некоторых из них в уже упоминавшемся учебнике Кодзасова и Кривновой: «…создание человеко-машинных интерфейсов с устным вводом / выводом информации; речевое управление компьютером и другими техническими устройствами… организация информационно-справочной службы, позволяющей получать и выдавать различную информацию из базы данных в условиях, когда вопрос задается голосом… создание устройств для приема и озвучивания различных сообщений… многоязычный устный ввод / вывод речевой информации с автоматическим переводом; разработка приспособлений и компьютерных сис­тем для помощи инвалидам… создание "автоматической машинистки"… озвучивание корректур и исправление орфографических ошибок; помощь в обучении иностранному языку (автоматические фонетические тренажеры)». Если для конструирования алфавитов классической фонологии было достаточно, то перечисленные задачи могут решаться лишь на основе экспериментальных методов.

Но особое значение с середины ХХ в. получили разного рода прикладные исследования, так или иначе связанные с общением человека и вычислительной машины. Данная область исследований получила название компьютерной, или вычислительной, лингвистики. Самая известная даже среди неспециалистов, хотя далеко не самая массовая область работ такого рода — создание сис­тем автоматического (машинного) перевода.

Уже вскоре после появления в 1940-е гг. электронно-вычислительной техники начались первые попытки такого рода. Впервые эксперимент в этой области состоялся в США в 1954 г. и охватывал 250 слов, а в СССР его провели годом позже. Поначалу задача автоматического перевода рассматривалась как в основном техническая, в США она разрабатывалась инженерами без участия лингвистов, но затем выяснилось, что их привлечение также необходимо. В нашей стране лингвисты, в том числе Мельчук, участвовали в разработках с самого начала.

В 1950-х гг. и начале 1960-х гг. исследователи еще не представляли себе всей сложности задачи. Казалось, что достаточно ввести в машинную память двуязычный словарь, и машина сможет каждому слову на входе приписывать на выходе его переводной эквивалент. То есть сис­темы производили пословный перевод. Однако выяснилось, что таким образом нужные практические результаты не могут быть получены прежде всего из-за проблемы неоднозначности реальных предложений любого языка. Уже на морфологическом уровне, например, в русском языке мы видим значительную омонимию. Форма двери может быть формой пяти падежей: родительного, дательного, предложного падежей единственного числа, именительного, винительного падежа множественного числа. Разумеется, носители языка снимают омонимию благодаря контексту, но машина этого сделать не может, если ей не задать алгоритм морфологического анализа. Еще больше неоднозначности в синтаксисе. Разработчики первых советских сис­тем машинного перевода приводили такую фразу с несколькими видами неоднозначности: Недовольство рабочих бригад вызвало осуждение товарища Иванова. Или вот строка из стихотворения: Педагог в руках с указкой. Взрослый носитель языка даже при нестандартном порядке слов поймет, что речь идет об учителе, который держит указку. Но возможно и другое прочтение, более соответствующее порядку слов: некто держит учителя и указку. Но это заметит разве что ребенок, у которого еще не выработался автоматизм синтаксического анализа. А как это распознавать машине? Оказался необходимым и синтаксический анализ. А многие случаи требовали и обращения к семантике.

К 1960-м гг. выяснилось, что помимо собственно перевода необходимыми процедурами являются механизмы анализа исходного языка и синтеза языка, на который осуществляется перевод. Механизмы анализа и синтеза могут не быть жестко привязаны к одной конкретной сис­теме и использоваться для разных сис­тем, в которых участвует данный язык. Между структурами входного и выходного языков в сис­тему включался так называемый язык-посредник, на который после анализа переписывался входной язык и с которого затем проводилась запись на выходной язык. Такие сис­темы назывались сис­темами второго поколения.

В отличие от грубых сис­тем пословного перевода, мало связанных с собственно наукой о языке, разработка анализа и синтеза требовала решения многих теоретических вопросов лингвистики. Выше уже не раз говорилось о том, что начало второй половины ХХ в. проходило в лингвистике (структурной, затем генеративной) под знаком формализации и математизации. Научные поиски, связанные с формальной лингвистикой, стимулировались прикладными задачами. При разработке сис­тем машинного перевода постоянно оказывалось, что достигнутый к тому времени уровень формализации недостаточен для эффективного машинного анализа и синтеза, а это требовало разрабатывать и лингвистические проблемы. При этом уровень теоретичности в США и СССР был неодинаков. Американские лингвисты, вместе с инженерами занимавшиеся машинным переводом, не отличались интересом к разработке лингвистической теории. Чаще лингвисты старались применить на практике влиятельные теоретические идеи, однако, несмотря на огромное влияние идей Хомского, они почти ничего не дали для машинного перевода и других областей компьютерной лингвистики. Больше для этого оказались пригодны концепции лингвистов, работавших вне хомскианской парадигмы, таких как Чарльз Филлмор (1926–2014). В СССР ситуация была иной: Мельчук, Апресян и другие лингвисты-теоретики активно занимались машинным переводом и прочими прикладными проб­лемами, между направлениями их деятельности была двусторонняя связь.

Первая половина 1960-х гг. была периодом больших ожиданий в отношении автоматического перевода, что нашло отражение даже в художественной литературе. Вот ранняя повесть братьев Стругацких «Попытка к бегству» (1962), где люди из коммунистического общества XXIII в., один из которых лингвист, попадают на чужую планету, и перед ними встает проб­лема общения с инопланетянами, которую лингвист, разумеется, успешно решает. Ему удается произвести дешифровку и разработать сис­тему машинного перевода на язык внеземной цивилизации и наоборот. Разумеется, было естественно полагать, что деятельность, казавшаяся реализуемой в ближайшем будущем, через три столетия станет рутиной.

В действительности всё оказалось сложнее. В 1966 г. в США пришли к выводу о том, что существовавшие к тому времени сис­темы машинного перевода не оправдали надежд, а обычный ручной перевод оставался дешевле машинного. После этого государственное финансирование данных работ было свернуто, хотя частные кампании его могли и продолжать, поскольку многие заказчики при очень большом объеме технической документации были заинтересованы в любых способах поиска информации, даже низкого качества. В СССР же развитие исследований продолжалось, и с 1970-х гг. начали работать промышленные сис­темы машинного перевода. Часть из них не пережила кризис 1990-х гг., но некоторые сис­темы разрабатываются десятилетиями, как сис­тема японско-русского перевода под руководством Зои Михайловны Шаляпиной в Институте востоковедения РАН.

Всё же современные исследователи вынуждены признать, что первоначальные надежды оказались завышенными. Разумеется, никто не ставит вопрос об автоматическом переводе художественных текстов, но и соответствующий перевод научно-­технических текстов пока что за редчайшими исключениями не может осуществляться без непосредственного участия человека, хотя бы на уровне предредактирования и постредактирования. О состоянии машинного перевода (МП) пишет автор учебника «Введение в прикладную лингвистику» Анатолий Николаевич Баранов: «В настоящее время сис­темы МП успешно функционируют в тех областях, где либо не требуется абсолютная точность перевода, либо существуют серьезные ограничения на использование структур естественного языка, где входной язык нормирован и упрощен». Используются либо сис­темы, где не требуется высокое качество перевода, либо, если такое качество необходимо (например, при переводе официальных документов), возрастает роль этапа постредактирования. Чуть ли не единственной целиком автоматизированной сис­темой является канадская сис­тема, переводящая тексты метеосводок с английского языка на французский; здесь перевод происходит в рамках очень сильно стандартизированного подъязыка.

Предполагалось, что с 1970-х гг. появятся сис­темы третьего поколения, где будет не только производиться морфологический и синтаксический анализ и синтез (эта проб­лема более или менее решалась уже во втором поколении), но и вступят в действие семантические компоненты, в конечном итоге являющиеся главными. Надеялись на создание универсального семантического языка-посредника; если бы он был создан, то получилось бы что-то вроде универсальной логической структуры в «Грамматике Пор-Рояля» XVII в. или глубинной структуры у Хомского. Но такого языка нет и сейчас, а проб­лема неоднозначности решена лишь частично, поскольку она в значительной степени является семантической.

Однако компьютерная лингвистика отнюдь не сводится к трудной и лишь частично решенной проблеме машинного перевода. Здесь на полюсе, связанном с максимальной сложностью объекта, находится машинный перевод, однако далеко не всегда нам для практических нужд необходимо анализировать и переводить весь текст. На другом полюсе находятся значительно более простые и вполне решаемые проблемы, например когда нужно из большого массива текстов выбрать те тексты, в которых содержатся интересующие нас ключевые слова. В промежутке между двумя полюсами имеются сис­темы, решающие разные другие практические задачи, не охватывающие сис­тему языка в целом. Обычно в таких случаях говорят об информационно-поисковых сис­темах (ИПС). Такие сис­темы в больших количествах создавались в советских ведомственных НИИ в 1960–1980-е гг.

Эти сис­темы так или иначе связаны с обработкой массивов текстов на естественном языке. В них не ставится задача сохранения всей имеющейся в текстах информации. Тем или иным способом осуществляется ее редукция, позволяющая найти во множестве документов то, что соответствует данному запросу. В том числе такие сис­темы на основе заданных параметров обеспечивают составление рефератов и аннотаций обрабатываемых документов. Документы могут описываться на особом формальном информационно-поисковом языке; составляется словарь дескрипторов — слов


Поделиться с друзьями:

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.037 с.