Аналитико-синтетическая переработка информации: основные технологические процессы — КиберПедия 

Состав сооружений: решетки и песколовки: Решетки – это первое устройство в схеме очистных сооружений. Они представляют...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Аналитико-синтетическая переработка информации: основные технологические процессы

2024-02-15 25
Аналитико-синтетическая переработка информации: основные технологические процессы 0.00 из 5.00 0 оценок
Заказать работу

Аналитико-синтетическая переработка информации – это совокупность процессов по переработке и преобразованию исходных данных путем анализа и синтеза

АСПИ предназначена для

· ориентации в растущем потоке информации и повышении эффективности использования документов

· удовлетворения информационных потребностей в фактографической информации т.е. конкретных фактических данных, которые предварительно должны быть подвергнуты критической оценке и обработаны с учетом их использования

· обеспечения потребителей актуальной и достоверной информации

В результате информационного анализа создаются основные виды вторичных документов

Виды АСПИ:

· Индексирование (поисковый образ документа) в виде индексов, предметных рубрик, дескрипторов и др.

· Составление библиографического описания

· Аннотирование

· Составление обзоров

Назначение АСПИ и свертывания – сокращение затрат (временных,интелектуальных) пользователя при работе с информацией. Конечный результат в обоих случаях – вторичный документ

Использование АСПИ в различных областях(Книготорговой, музеях и тд) состоит в том, чтобы оперативно ознакомится с большим колличеством документов.

Представляется информация в сжатом виде. При таких условиях для поиска нужного документа нет необходимости просматривать тексты многих документов, а достаточно ознакомится с короткими сообщениями о них.

Процессы АСПИ:

- Библиографическое описание. Библиографическое описание содержит библиографические сведения о ресурсе, которые приведены по определенным правилам, устанавливающим наполнение и порядок следования областей и элементов, и предназначены для идентификации и общей характеристики ресурса.

 

Библиографическое описание является основной частью библиографической записи. Библиографическая запись может включать также заголовок, термины индексирования (классификационные индексы, предметные рубрики и ключевые слова), аннотацию, реферат, шифры хранения ресурса, дату завершения обработки ресурса, сведения служебного характера.

Заголовок библиографической записи составляют по ГОСТ 7.80(БИБЛИОГРАФИЧЕСКАЯ ЗАПИСЬ. ЗАГОЛОВОК), классификационные индексы и предметные рубрики - по ГОСТ 7.59(Индексирование документов. Общие требования к систематизации и предметизации), ключевые слова - по ГОСТ Р 7.0.66 (ИНДЕКСИРОВАНИЕ ДОКУМЕНТОВ Общие требования к координатному индексированию), аннотацию и реферат - по ГОСТ Р 7.0.99(Реферат и аннотация. Общие требования) и ГОСТ 7.86(Издания. Общие требования к издательской аннотации).

Библиографическая запись (БЗ) – это элемент БИ (БС), фиксирующий в документальной форме сведения о документе, позволяющий его идентифицировать, раскрыть состав и содержание в целях библиографического поиска. БЗ состоит из нескольких элементов, самым основным из которых является библиографическое описание.

В состав библиографического описания входят следующие области:

· область заглавия и сведений об ответственности

· область издания

· область специфических сведений

· область выходных данных

· область физической характеристики

· область серии

· область примечания

· область стандартного номера(или его альтернативы) и условий доступности

· одноуровневое и многоуровневое описание документа

· Аннотирование. Процесс АСПИ целью которого является получение обощенной характеристики документа, раскрывающей его логическую структуру и наиболее существенные стороны содержания.

· Аннотация- это вторичный документ, содержащий краткую обощенную характеристику первичного документа с точки зрения его назначения, содержания, вида,формы и других особенностей.

Функции: сигнальная (информирует о док.) и поисковая ( предназначение поиска док)

Виды:

По функциональному общественному назначению

· Справочная. Уточняет неясное заглавие и сообщает в справочных целях сведения об авторе, содержании

· Рекомендательная. Призвана пропагандировать документы, заинтересовывать, привлекать внимание

По способу характеристики первичного документа:

· общая. Характеризует документ в целом

· аналитическая(специализированная). Раскрывает только часть содержания документа.

По кол-ву анализируемых документов

· Монографическая. Составляется на один документ

· Групповая (сводная). Объединяет несколько близких по содержанию(или по другому признаку) док, позволяя показать в них общее и особенное.

По объему и глубине свертывания

· Пояснительная. Состоит из неск слов или одного – двух предложений, раскрывает недостаточно информативное заглавие документа

· Описательная. Обощенно характеризует содержание первичного док и приводит перечень основных тем

· Реферативная. Не только указывает перечень основных тем, но и раскрывает их содержание.

По исполнению

· Авторская. Составлена автором и составителем

· Референтская. Составлена специалистами служб информации

По способу подготовки

· Ручная

· автоматизированная

· Реферирование. Вид АСПИ, заключающийся в анализе первичного документа и извлечении из него наиболее важных в смысловом отношении сведений: основных положений, фактических данных, результатов, выводов.

· Реферат- вторичный документ, результат АСПИ, представляющий собой краткое изложение содержания первичного документа и содержащий его основные фактические сведения и выводы.

Классификация.

Целевое назначение:

· Информативные – раскрывают, что именно изложено в документе

· Индикативные – Сообщают о чем говорится в документе

Функциональное назначение:

· общие или рефераты конспекты, последовательно излагающие в общем виде содержание всего первичного документа

· специализированные или проблемно-ориентированные, акцентирующие внимание читателя на отдельных темах или проблемах первичного документа

- Индексирование

Индексирование- это процесс перевода содержания док и запросов с естественного на информационно- поисковый язык, в результате чего создаются поисковые образы док(ПОД) и поисковые предписания (ПП)

Индексирование, наряду с составлением библиог опис , реферированием, аннотированием, составлением обзоров, является разновидностью АСПИ И свертывания информации

Индексирование может воплощаться в след процессах в зависимоти от типа информац поиск языка(ИПЯ):

- предметизация т. е. индексирование на основе языка предметных рубрик, алфавитно-предметной классификации.

При предметизации док выделяют предмет(ы) и аспект(ы) его рассмотрения. Затем данные смысловые компоненты формулируются в словесной форме в соответствии с принятыми правилами и принципами предметизации. На заключительном этапе предмет и аспект рассмотрения обозначаются при помощи предметных рубрик предметного каталога данной библиотекис необходимой и достаточной степени адекватности. Если в словаре(списке) отсутствует предметная рубрика, позволяющая идентифицировать содержание документа, принимается решение о вкл в него новой рубрики и одновременно вносятся изменения в справочно-методическую документацию.

- систематизация лит-ры, осуществляемая на базе классификационных иерархических ИПЯ

При систематизации док на первом этапе непосредственно знакомятся с док, выявляют и отбирают их смысловые компоненты. Затем словесная форма по специальным таблицам классификации переводится на язык классификационных индексов. На заключительном этапе производится категориальный синтез – выявленные классификационные признаки объединяются в полном классификационном индексе

- координатное индексирование, реализуемое на основе дескрипторного ИПЯ или языка ключевых слов

В информатике часто оперируют термином координатное индексирование, понмиая под ним метод информационного анализа содержания документов или запросов, в результате которого лексические единицы (ключевые слова,словосочетания и тд) , извлеченные из текстов , соединяются между собой координатой(соподчинительной) связью, при этом они могут комбинироваться в любых отношениях, необходимых для более точного поиска информации.

Соответственно, в зависимости от используемого ИПЯ, результатом индексирования т.е. ПОДом или ПП, могут быть предметная рубрика, индекс классификации, перечень дескрипторов или ключевых слов.

Индексирование является основным сред-м раскрытия содержания как отдельного док, так и всего док фонда библиот информац учреждения.

По характеру сведений о документе или его составной части различают следующие основные виды заголовков библиограф записи:

Заголовок содерж имя лица

Заголовок содерж наименование организации

Загловок содерж унифицированное заглавие

Загловок содерж обозначение док

Загловок содерж географ название

ГОСТ Р 7.0.100-2018 - БИБЛИОГРАФИЧЕСКАЯ ЗАПИСЬ. БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ Общие требования и правила составления.

БЗ используют в разных целях: для составления библиографических пособий, библиотечных каталогов и т.д.

БЗ может включать следующие элементы:

1. заголовок;

2. библиографическое описание;

3. аннотацию или реферат;

4. термины индексирования;

5. шифр хранения документа;

6. ссылку;

7. сведения служебного характера;

1. Заголовок БЗ – это элемент БЗ, расположенный перед библиографическим описанием (БО) и предназначенный для упорядочения поиска БЗ.

Вид заголовка БЗ зависит от характера сведений о документе. Он может содержать:

– имя лица (заголовок индивидуального автора);

– наименование организации (заголовок коллективного автора);

– наименование страны, вид документа, географическое название, унифицированное заглавие (заголовок формы);

– тему документа (предметный заголовок).

2. Библиографическое описание (БО) – совокупность сведений о документе, приведенных по определенным правилам (ГОСТ), которые устанавливают порядок следования друг за другом областей элементов с целью общей характеристики документа, его идентификации. Оно дает сведения об авторе, содержании, назначении, объеме и других особенностях документа.

Виды БО выделяют в зависимости от следующих признаков:

· объекта описания:

- монографическое (БО однотомного издания);

- сводное (БО многотомного издания);

- аналитическое (описание составной части издания).

· полноты набора элементов:

- полное (содержит все обязательные и факультативные элементы);

- расширенное (все обязательные и один или несколько факультативных элементов);

- краткое (только обязательные элементы).

· от структуры описания:

одноуровневое и многоуровневое библиографическое описание

Аннотация – краткая характеристика документа, поясняющая его содержание, назначение, форму, другие особенности. Она дополняет, уточняет БО.

Виды аннотаций различают в зависимости от следующих признаков:

· в соответствии с функциональным общественным назначением:

- справочная (уточняет неясное заглавие, сообщает краткую информацию об особенностях документа, применяется для характеристики официальных, научных, производственно-практических, учебных, справочных изданий. Объем – от нескольких слов до нескольких строк. Функция – поисковая);

- рекомендательная (показывает значение, особенности документа, имеет дидактическую направленность, содержит педагогические советы, рекомендации. Составляется для раскрытия содержания научно-популярных, художественных, детских изданий. Язык – живой, доступный. Объем – от нескольких предложений до нескольких абзацев. Функция – оценочная.).

· по способу характеристики первичных документов:

- общая (характеризует содержание документа в целом);

- аналитическая (раскрывает часть содержания документа, его аспект или содержание структурного элемента издания – статьи, главы, т.д.).

· по количеству характеризуемых документов:

- монографическая (содержание одного документа);

- групповая / сводная (характеристика нескольких документов, близких по теме, одного автора, одного вида, сборника, т.д.).

· по объему и глубине свертывания информации:

- пояснительная (объёмом от нескольких слов до одного – двух предложений, поясняющих заглавие);

- описательная (дает обобщенную характеристику документа, перечень основных вопросов, отвечает на вопрос «О чем сообщается в документе?»);

- реферативная (сочетает свойства аннотации и реферата, отвечает на два вопроса «О чем?…» и «Что именно сообщается в документе?». По объему больше описательной.

· по исполнению:

- авторские;

- составленные редактором;

- составленные библиографом.

· по способу подготовки:

- традиционным (ручным) способом;

- автоматизированным способом.

Реферат – это краткое точное изложение содержания документа, включающее основные фактические сведения и выводы без дополнительной интерпретации и критических замечаний автора (составителя) реферата. Отвечает на вопрос «Что сообщается в первичном документе?». Главная особенность реферата – информативность. Реферат составляется для того, чтобы ученым, исследователям не надо было обращаться к первоисточнику.

Рефераты различают по следующим признакам:

· по принадлежности документа к определенной отрасли знания или области науки (по общественным, гуманитарным, естественным, техническим наукам);

· по способу характеристики первичного документа (общие или рефераты-конспекты; специализированные или проблемно - ориентированные);

· по количеству источников реферирования (монографические; обзорные/сводные, групповые, фрагмент);

· по форме изложения (текстовые, табличные, цифровые, иллюстрированные, смешанные);

· по объему или глубине свертывания (краткие, расширенные - могут занимать 10 – 15% объема первичного документа);

· по авторству (составленные автором (автореферат) или составленные библиографом).

4. Термины индексирования – это классификационные индексы и предметные рубрики. В самом общем понимании классификационный индекс представляет собой условное обозначение раздела классификации (ББК, УДК), к которому относится документ по своему содержанию. Классификационный индекс выражается в цифровой, буквенной или смешанной форме средствами информационно – поискового языка (ИПЯ) и устанавливается с помощью специальных таблиц. Предметная рубрика - это элемент ИПЯ в виде краткой формулировки вопроса в соответствии с содержанием документа.

5. Шифр хранения документа – это условное обозначение места хранения документа в виде сочетания буквенных и / или цифровых знаков.

Полочный индекс и авторский знак вместе составляют шифр книги, поэтому полочный индекс называют также индексом шифра. Располагаются они в виде дроби: вверху – полочный индекс; внизу – авторский знак.

6. Ссылка – это запись, связывающая между собой части документа, библиографические записи, классификационные деления, предметные рубрики, разделы библиографического пособия, каталога, т.д.

Применяются ссылки двух видов:

- «см.» (помогают вести поиск в нужном направлении);

- «см.также» (обеспечивают полноту поиска).

7. Сведения служебного характера могут давать информацию, например, об отделе, фонде библиотеки, где хранится документ, инвентарный номер, т.п.

БЗ могут состоять из различного сочетания элементов, например:

1. заголовок + БО;

2. номер + БО + аннотация (реферат);

3. БО + аннотация + классификационный индекс;

4. БО + предметная рубрика;

5. заголовок + БО + реферат + классификационный индекс + предметная рубрика + сведения служебного характера и т.д.

Одной из важнейших операций аналитико-синтетической обработки документов как средства информационного поиска является индексирование документов и информационных запросов.

 

Индексирование – процесс выражения содержания документа и (или) запроса на информационно-поисковом языке (ИПЯ) с помощью терминов индексирования (классификационных индексов, предметных рубрик (ПР), ключевых слов, дескрипторов, кодов). Иными словами, индексирование – процесс перевода содержания документов и запросов с естественного языка на ИПЯ, в результате чего создается поисковый образ документа (ПОД) и поисковый образ запроса (ПОЗ). Таким образом, происходит «свертывание» информации, содержащейся в документе и изложение ее на ИПЯ в виде индекса, рубрики, кода (на классификационном языке) или дескриптора, ключевого слова (на дескрипторном языке).

Поисковый образ документа – это выраженное в терминах формализованного информационно-поискового языка основное смысловое содержание документа (а не вся информация, содержащаяся в документе), которое поставлено в однозначное соответствие этому документу, по которому производится отыскание данного документа в массиве других документов.

Индексирование запроса осуществляется путем перевода его содержания на информационно-поисковый язык. Совокупность терминов индексирования, выражающих смысловое содержание запроса, называется поисковым образом запроса (ПОЗ). В этом случае поиск документов ведется по совокупности терминов индексирования. Чтобы повысить эффективность поиска информации по запросу, поисковый образ запроса можно дополнить специальными указаниями о последовательности выполнения логических операций в процессе информационного поиска, которые являются поисковым предписанием.

Методика индексирования запросов за счет включение в поисковое предписание дополнительных терминов, понятий или дополнительных указаний позволяет расширить область поиска информации (например, за счет включения видовых и ассоциативных терминов) и в конечном итоге повысить функциональную возможность информационно-поисковой системы.

Индексирование реализуется в следующих процессах: предметизации, систематизации и координатном индексировании.

Систематизация – вид индексирования, при котором содержание документа и (или) запроса выражено классификационными индексами в соответствии с правилами какого-либо классификационного ИПЯ (классификационной системы). Такой принцип индексирования принято считать классификационным. Классификационный принцип индексирования обеспечивает возможность организации информационного поиска по иерархическому признаку.

Предметизация – вид индексирования, при котором содержание документа и (или) запроса выражено предметной рубрикой (ПР) в соответствии с правилами соответствующего предметизационного ИПЯ. Предметизационный принцип индексирования базируется на представлении содержания документа в понятийной системе определенного естественного языка и на использовании в качестве терминов индексирования лексических единиц (ЛЕ) естественного языка.

Предметизационный принцип индексирования обеспечивает возможность организации информационного поиска по алфавитному признаку.

Координатное индексирование – вид индексирования, при котором смысловое содержание документа и (или) запроса многоаспектно выражается множеством ключевых слов или дескрипторов. Информационно-поисковый язык, предназначенный для координатного индексирования документов (или частей документов) и запросов посредством ключевых слов и (или) дескрипторов, называется дескрипторным языком.

Термины «индексирование» и «индексатор» распространены в англоязычной литературе и широко применяются в международной и отечественной библиотечной практике.

В зависимости от того, какой принцип индексирования является ведущим (или единственным) различают предметизационные, классификационные и дескрипторные информационно-поисковые языки. В соответствии с характером ИПЯ индексирование осуществляется как предметизация, систематизация и координатное индексирование.

А в качестве терминов этих видов индексирования используют предметные рубрики, классификационные индексы, дескрипторы, ключевые слова.

В зависимости от типа используемого ИПЯ, различают два режима индексирования: предкоординатное (классификационное) и посткоординатное.

В предкоординатном индексировании связи между терминами индексирования устанавливаются заранее – при разработке соответствующего ИПЯ. К предкоординатным ИПЯ можно отнести следующие:

перечислительные классификации;

иерархические классификации;

предметные классификации;

фасетные классификации.

+В посткоординатном индексировании связи (координация) между терминами индексирования устанавливаются во время индексирования документов или в процессе их поиска. К посткоординируемым ИПЯ относят:

дескрипторные языки;

посткоординируемые фасетные классификации.

Теоретические основы и методика процессов индексирования

(предметизации, систематизации, координатного индексирования) подробно изложены в последующих главах методического пособия.

Предметизация – один из фундаментальных методов организации знаний. Этим объясняется широта сфер его использования.

В основе предметизации как вида индексирования лежат две основные операции: 1.выявление предмета документа, установление аспектов и связей рассмотрения предмета и 2.преобразование этого предмета в краткую словесную формулировку, называемую предметной рубрикой (ПР).

Под предметизацией понимают интеллектуальный или автоматический анализ содержательных и формальных признаков документа с целью его свертывания и отражения в поисковой системе с помощью языка предметных рубрик (ЯПР).

Предметизация – многозначный термин, используемый для использования различных операций.

Во-первых, предметизация – вид индексирования, вид обработки документа. Целью предметизации в данном случае является формирование ПР, способствующих как раскрытию содержания фонда по предметному признаку, так и поиску документов, соответствующих запрашиваемому предмету. Процесс связан с обработкой документа и может быть назван документной предметизацией. Объектами предметизации могут выступать не только отдельный документ, но и его составная часть или совокупность документов. Существуют особенности предметизации текста документа, основанные на общей методике предметизации документа в целом. Данный вид предметизации можно назвать текстовым.

Предметизационный метод используется при формировании классификационных и предметизационных информационно-поисковых языков, предметных традиционных и электронных каталогов, картотек, библиографических указателей, единого алфавитно-предметного указателя к каталогам и т.д.

Метод предметизации используется при реализации другого вида индексирования – систематизации, так как процесс систематизации состоит не только из определения и оформления классификационного индекса, но и одновременно – рубрик алфавитно-предметного указателя (АПУ).

Единый АПУ обеспечивает поиск записей в систематическом каталоге, в систематической картотеке статей и является составной частью данных ИПС. Указатель обеспечивает связи различных элементов системы каталогов и картотек библиотеки и предоставляет возможность многоаспектного, организованного по предметному признаку поиска в отраслевых отделах систематических каталогов, картотек, указателей. АПУ способствует взаимопроникновению методов систематизации и предметизации.

В развитии теории и практики предметизации значительна роль РКП, осуществляющей централизованную предметизацию посредством печатных карточек и использующей предметизацию при составлении вспомогательных указателей к государственным библиографическим пособиям.

Редакции и издательства используют предметизацию при составлении прикнижных и прижурнальных вспомогательных указателей.

Вспомогательные указатели – упорядоченные путеводители, обеспечивающие быстрый поиск необходимой информации, заключенной в документе. В таких указателях список рубрик сопровождается номерами страниц, на которых помещен текст, соответствующий определенному предмету.

Аналогичные приемы предметизации распространяются на все виды вспомогательных алфавитных указателей, в том числе именные и географические.

Предметизация включает также процесс составления предметизационного информационно-поискового языка (ИПЯ), - искусственного языка, предназначенного для выражения основного содержания документа или информационного запроса посредством предметных рубрик. Такую предметизацию можно назвать лингвистической.

Органы ОНТИ используют данный метод для формирования рубрикаторов, информационно-поисковых тезаурусов, разработки вспомогательных указателей к информационным изданиям. Современные автоматизированные системы по существу лишь одна из разновидностей предметизационных систем.

Термин «предметизация» используется для обозначения процесса организации и ведения предметного каталога, картотеки, списка, указателя.

Итак, предметизация – многозначный термин, используемый для процесса индексирования документов, составления ИПЯ, формирования предметных ИПС и вспомогательных указателей ко многим видам первичных документов. Таким образом, можно вычленить три области применения предметизации:

- документную, предназначенную для индексирования документов;

- текстовую, способствующую дополнительному входу в содержание документа или ИПС по предметному признаку;

- лингвистическую, содействующую составлению вербальных ИПЯ.

В рамках АСПИ основное внимание уделяется рассмотрению документной предметизации. Главная задача предметизации как метода раскрытия содержания документа с помощью предметных рубрик – определение основного предмета произведения; установление аспектов его рассмотрения; фиксация его связей с другими предметами, отраженными как в тексте документа, так и в каталоге; указание формы и читательского назначения обрабатываемого документа.

Термин «предмет документа» - один из исходных и основополагающих для теории и практики всех видов индексирования.

Предмет в предметизации понимается весьма широко – это все, о чем в документе сообщается, то есть некоторая информация. Предмет раскрывает основную тему документа, его форму и читательское назначение.

Предмет документа – это все, что может быть объектом специального изучения: материальные вещи объективного мира в целом (человек, здание, машина); любые части вещей (сердце, фундамент, колеса) и их отдельные свойства, стороны, отношения (сердцебиение, бетонирование, размер); события, явления, факты, персоналии (Великая Отечественная война, снегопад, Л. Н. Толстой); отражение этих вещей в нашем сознании (ощущения, восприятия, представления, понятия); суждения, научные теории и т.д.

Предмет, интересующий пользователя, может формулироваться в произвольной форме с помощью любых слов естественного языка. В процессе предметизации эта форма преобразуется в предметную рубрику, формулируемую посредством специально разработанного предметизационного ИПЯ.

ГОСТ определяет термин «предметная рубрика» следующим образом:

«Предметная рубрика – элемент ИПЯ, представляющий собой краткую формулировку темы на естественном языке» (не указываются другие назначения).

Предметная рубрика – результат процесса предметизации, краткая формулировка факта, события, аспекта и т.п., рассматриваемого в документе, созданная на основе принципов и правил специально разработанного предметизационного ИПЯ.

Предмет, выявленный при анализе документа, отличается от предметной рубрики формой представления. Так, предмет учебника для основной школы «Азбука гражданина» можно сформулировать как «Права россиян», а рубрика на эту книгу будет выглядеть так: «Право – Российская Федерация – учебные издания для средней школы».

Рубрика – краткая формулировка темы конкретного документа, выраженная не только с помощью слов и словосочетаний естественного языка, но и цифрами и другими обозначениями, используемыми в естественном языке. Однако, ее не следует рассматривать только как нормализованную лексическую единицу естественного языка. Рубрики – это термины индексирования, поисковые, организующие, комплексирующие средства.

Таким образом, предметизатор должен определить предмет документа и преобразить его в предметную рубрику.

ГОСТ 7.74 – 96 «Информационно-поисковые языки: термины и определения» дает несколько определений, связанных с лингвистической предметизацией.

2. Предметизационный информационно-поисковый язык.

Качество любой ИПС, отражающей содержание документов, зависит от ИПЯ, с помощью которого система реализуется. Предметизационный язык или язык предметных рубрик (ЯПР) является искусственным информационно-поисковым языком, созданным на базе естественного языка и предназначенного для индексирования документов, частей документов и их совокупности, а также информационных запросов посредством ПР.

Основная задача ЯПР – наиболее полно раскрыть содержание той или иной предметной области в целом и отдельных ее разделов, то есть дать по возможности исчерпывающий перечень предметов науки (проблемы, темы), выразить взаимоотношения между ними. Массивы библиографических записей или первичных документов, сформированные по предметизационному признаку (предметные каталоги и картотеки, тематическая расстановка фонда), создаются на основе предметизационного языка или языка предметных рубрик.

ЯРП может быть представлен различными средствами, такими как «Словарь ПР», «Рубрикатор», «Алфавитный указатель ПР и ссылок», «Словарь предметного каталога», «Служебная картотека ПР», «Общий алфавитный ключ». В структуру ЯПР входит предисловие и алфавитный перечень предметных рубрик (словарь рубрик), организованных в продуманную систему с помощью ссылочно-справочного аппарата (ССА).

ЯПР относится к вербальным (словесным) ИПЯ, поскольку для представления своих ЛЕ в нем используются слова и выражения естественного языка, но имеющий существенные отличия. Словарь русского языка и словарь ПР содержат перечень слов в алфавитном порядке, но на этом их сходство заканчивается. Слова, представленные в ЯПР, проходят жесткий отбор из лексики естественного языка и формулируются по собственным правилам. Именно по этому ЯПР – искусственно созданный язык на основе естественного.

Естественный язык, с точки зрения информационного поиска обладает рядом недостатков, таких как многозначность и синонимичность, которые не позволяют производить однозначную запись содержания документов.

Формалзация лексики при создании предметных рубрик вызвана необходимостью устранения как «избыточности», так и «недостаточности» естественного языка для целей информационного поиска.

Важнейший принцип ЯПР – устранение синонимии, полисемии и омонимии для реализации «однозначности» информационного поиска.

1.Синонимия естественного языка – совпадение или близость значений различных слов. Например, желтуха – гепатит; формирование – создание – образование.

2. Полисемия – свойство какого-либо слова, имеющего одно или несколько этимологически близких значений, т.е. перенос названия с одного предмета на другой на основе сходства по форме, свойствам, функциям предметов. Ex. Звезда – геометрическая фигура, звезда – небесное тело, звезда морская.

3. Омонимия – внешнее совпадение слов, одинаковых по написанию и звучанию, но выражающих различные понятия. Ex. Родниковый ключ и замочный ключ; лук – оружие и лук овощ. (На речной косе девушка точила косу. Все было в девушке хорошо: и лицо, и стан, и длинная коса. Да жаль, была она коса.). Знание этих слов можно понять только из контекста.

Для различения омонимов в рубрику добавляют идентифицирующие признаки, заключенные в скобки, - локаторы. В качестве их могут использоваться понятия, характеризующие научные дисциплины, отрасль, этническую группу, язык, тип объекта, географическое название и т.д.


Поделиться с друзьями:

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.097 с.