Современная парадигма лингвистических учений. — КиберПедия


Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Современная парадигма лингвистических учений.



В ряде работ ставится вопрос о том, можно ли считать антропоцентризм основной парадигмой лингвистики конца XX - начала XXI вв.

 

Е.С. Кубрякова, говоря о связи антропоцентризма с другим «главным параметром современно лингвистики» - функционализмом, или неофункционализмом, относит к антропоцентрическим направлениям в лингвистике когнитивное направление и коммуникативное направление .

В.А. Маслова в качестве основных направлений антропоцентризма называет когнитивную лингвистику и лингвокультурологию.

 

Лингвистика конца ХХ в. и начала XXI в. отличается полипарадигмальностью.

В целом же исследователи называют четыре направления современной антропоцентрической парадигмы в лингвистике:

 

1) исследования языковой картины мира;

2) коммуникативная лингвистика;

3) когнитивная лингвистика;

Внутрисубъектная лингвистика, или теория носителя языка, или же лингвоперсонология, теория языковой личности.

Основные методы лингвистических исследований

 

Индукция и дедукция

 

Индуктивный метод - сбор и документация конкретных явлений ( фактов ) с последующим их обобщением и переходом от фактов к лежащим в их основе сущностям .

Дедуктивный метод - постулирование сущностей и проверку реальности этих сущностей их соответствием ( или несоответствием ) наблюдаемым фактам) .

Эвристические методы .

Эвристические методы связаны со сбором и документацией фактов . Сам процесс получения фактов может быть пассивным или активным .

Метод пассивного наблюдения ( иначе именуемый регистрационным ) предпочитается тогда , когда необходимо получить максимально достоверный языковой материал , независимый от воли исследователя и процесса извлечения языковых данных . Таким материалом является спонтанная речь носителей языка в естественной коммуникативной ситуации .

Кроме того , новые компьютерные технологии создали условия для появления так называемой корпусной лингвистики , являющейся инструментальным средством усиления пассивного метода , позволяющим обследовать огромные массивы текстов и извлекать из них нужные факты .

Активный ( он же экспериментальный ) метод состоит в применении всевозможных процедур , управляющих речевым поведением говорящего , с целью получения необходимых исследователю фактов . Например , при изучении словоизменения или словообразования может использоваться парадигматический опрос , предъявление определенным образом модифицированных или специально сконструированных предложений для проверки их грамматической правильности или грамматической интерпретации , предъявление некоторого контекста с предложением его продолжить , перевод с языка - стимула на исследуемый язык и т . д . Экспериментальный метод является ведущим в психолингвистике и полевой лингвистике .



 

Описательные методы .

В лингвистике используются различные способы представления языковых сущностей и фактов .

Традиционная ( в том числе структурная ) лингвистика исходит из презумпции , что язык состоит из иерархически упорядоченных дискретных сущностей ( языковых единиц ), каждая из которых обладает уникальным набором признаков ( свойств ) и образует особый класс , соотносимый по определенным правилам с бесконечным множеством наблюдаемых фактов . Такое описание языка , называемое таксономическим , по существу является особого рода классификацией , к которой предъявляются определенные требования . Таксономическое описание предполагает установление классов языковых единиц и связей , существующих между ними . Языковые единицы определяются посредством системы необходимых и достаточных признаков . Эта система признаков должна быть максимально полной , т . е . покрывать все объекты , входящие в данный класс , и в то же время максимально узкой , т . е . исключать все объекты , в данный класс не входящие .

 

Объяснительные описания .

В последние десятилетия к описанию предъявляется также требование объяснения того , почему язык устроен именно таким , а не другим образом . Такие описания называются объяснительными .

Объяснения могут быть

· внутриязыковыми (обращение к системным или историческим факторам , в частности , объяснения через аналогию , через процессы языковых контактов ; к ареальным или генетическим связям исследуемого языка ; к типологическим закономерностям ) и



· внеязыковыми ( например , апелляция к когнитивным структурам и механизмам ; к устройству внеязыковой действительности ; к социальным , психическим , культурным факторам ).

 

Метод реконструкции .

В исторической лингвистике важнейшим является метод реконструкции прежних языковых состояний. Этот метод наиболее разработан применительно к фонетической стороне языковых выражений . Он опирается на презумпцию строгой закономерности фонетических изменений , распространяемых на весь лексикон языка . При внешней реконструкции используются данных генетически родственных языков , при внутренней реконструкции объектом наблюдения являются данные одного языка .

Аргументация и доказательство составляют важный компонент описательной работы. Широко принята общефилологическая аргументация методом логического сопоставления точек зрения предшественников на рассматриваемый объект , выявление причин и мотивов имеющихся между ними противоречий и обоснование предлагаемого решения . Часто используется статистическое обоснование предлагаемого описания .

 

 

Основные направления применения компьютерных технологий в лингвистических исследованиях: машинный перевод, корпусные базы данных, компьютерное моделирование коммуникационных процессов, компьютерная лексикография.

 

Маши́нный перево́д — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы.

Формы организации взаимодействия ЭВМ и человека при машинном переводе

· С постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат.

· С предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка.

· С интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.

· Смешанные системы (например, одновременно с пред- и постредактированием).

 

Однако термин автоматизированный перевод имеет совсем другое значение — при нём программа просто помогает человеку переводить тексты.

Автоматизированный перевод предполагает такие формы взаимодействия:

· Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.

· Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё, не уложившееся в схему, отдаёт человеку.

 

История:

Мысль использовать ЭВМ для перевода была высказана в 1947 году в США, сразу после появления первых ЭВМ. Первая публичная демонстрация машинного перевода (так называемый Джорджтаунский эксперимент) состоялась в 1954 году. Несмотря на примитивность той системы (словарь в 250 слов, грамматика из 6 правил, перевод нескольких простых фраз), этот эксперимент получил широкий резонанс

 

К середине 1960-х в США для практического использования были предоставлены две системы русско-английского перевода:

MARK (в Департаменте иностранной техники ВВС США);

GAT (разработка Джорджтаунского университета, использовалась в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия).

Все это привело к новому подъёму этой области, наступившему примерно с середины 1970-х. В 1980-е наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.

 

Корпусная лингвистика – раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с использованием компьютерных технологий. Под названием лингвистический, или языковой, корпус текстов понимается большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач.

 

Первые лингвистические корпусы текстов появились в 60-е гг. прошлого столетия. В 1963 г. в Брауновском университете (США) впервые был создан большой корпус текстов на машинном носителе (Brown Corpus).

 

Поиск в корпусе данных позволяет по любому слову построить конкорданс – список всех употреблений данного слова в контексте со ссылками на источник. Корпусы могут использоваться для получения разнообразных справок и статистических данных о языковых и рече-вых единицах. В частности, на основе корпусов можно получить данные о частоте словоформ, лексем, грамматических категорий, проследить измене-ние частот и контекстов в различные периоды времени, получить данные о совместной встречаемости лексических единиц и т.д.

Важнейшее понятие корпусной лингвистики – репрезентативность. Под репрезентативностью понимается необходимо-достаточное и пропорциональное представление в корпусе текстов различных пе-риодов, жанров, стилей, авторов и т.п.

Так в корпусной лингвистике возникла идея размеченного корпуса. Разметка (tagging, annotation) заключается в приписывании текстам и их компонентам специальных меток (tag, tags): внешних, экстралинг-вистических (сведения об авторе и сведения о тексте: автор, название, год и место издания, жанр, тематика; сведения об авторе могут вклю-чать не только его имя, но также возраст, пол, годы жизни и многое другое. Это кодирование информации имеет название метаразмет-ка), структурных (глава, абзац, предложение, словоформа) и соб-ственно лингвистических, описывающих лексические, грамматиче-ские и прочие характеристики элементов текста.

 

Среди лингвистических типов разметки выделяются:

· морфологическая разметка. В иностранной терминологии употребляется термин part-of-speech tagging (POS-tagging), дословно – частеречная разметка.

· синтаксическая разметка, являющаяся результатом синтаксического анализа, или парсинга (англ. parsing), выполняемого на основе данных морфологического анализа. Этот вид разметки описывает синтаксические связи между лексическими единицами и различные синтаксические конструкции (например, придаточное предложение, глагольное словосочетание и т.п.);

· семантическая разметка.

· анафорическая разметка. Фиксирует референтные связи, например, местоименные;

· просодическая разметка. В просодических корпусах применяются метки, описывающие ударение и интонацию.

 

Полем деятельности компьютерных лингвистов является разработка алгоритмов и прикладных программ для обработки языковой информации.

 

Направления компьютерной лингвистики

 

Обработка естественного языка (англ. natural language processing; синтаксический, морфологический, семантический анализы текста). Сюда включают также:

Корпусная лингвистика, создание и использование электронных корпусов текстов

Создание электронных словарей, тезаурусов, онтологий. Например, Lingvo. Словари используют, например, для автоматического перевода, проверки орфографии.

Автоматический перевод текстов. Среди русских переводчиков популярным является Промт. Среди бесплатных известен переводчик Google Translate

Автоматическое извлечение фактов из текста (извлечение информации) (англ. fact extraction, text mining)

Автореферирование (англ. automatic text summarization). Эта функция включена, например, в Microsoft Word.

Построение систем управления знаниями. См. Экспертные системы

Создание вопросно-ответных систем (англ. question answering systems).

Оптическое распознавание символов (англ. OCR). Например, программа FineReader

Автоматическое распознавание речи (англ. ASR). Есть платное и бесплатное ПО

Автоматический синтез речи

 

Компью́терная лексикогра́фия — прикладная научная дисциплина в языкознании, которая изучает методы использования компьютерной техники для составления словарей

Компьютерная лексикография представлена совокупностью методов и программных средств обработки текстовой информации для создания словарей[2]. В рамках компьютерной лексикографии разрабатываются компьютерные технологии составления и эксплуатации словарей. Специальные программы — базы данных, компьютерные картотеки, программы обработки текста — позволяют в автоматическом режиме формировать словарные статьи, хранить словарную информацию и обрабатывать её

 

 






Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...





© cyberpedia.su 2017-2020 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав

0.012 с.