Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...
Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...
Топ:
Оценка эффективности инструментов коммуникационной политики: Внешние коммуникации - обмен информацией между организацией и её внешней средой...
История развития методов оптимизации: теорема Куна-Таккера, метод Лагранжа, роль выпуклости в оптимизации...
Марксистская теория происхождения государства: По мнению Маркса и Энгельса, в основе развития общества, происходящих в нем изменений лежит...
Интересное:
Наиболее распространенные виды рака: Раковая опухоль — это самостоятельное новообразование, которое может возникнуть и от повышенного давления...
Национальное богатство страны и его составляющие: для оценки элементов национального богатства используются...
Искусственное повышение поверхности территории: Варианты искусственного повышения поверхности территории необходимо выбирать на основе анализа следующих характеристик защищаемой территории...
Дисциплины:
2024-02-15 | 83 |
5.00
из
|
Заказать работу |
Содержание книги
Поиск на нашем сайте
|
|
Аналитико-синтетическая переработка информации – это совокупность процессов по переработке и преобразованию исходных данных путем анализа и синтеза
АСПИ предназначена для
· ориентации в растущем потоке информации и повышении эффективности использования документов
· удовлетворения информационных потребностей в фактографической информации т.е. конкретных фактических данных, которые предварительно должны быть подвергнуты критической оценке и обработаны с учетом их использования
· обеспечения потребителей актуальной и достоверной информации
В результате информационного анализа создаются основные виды вторичных документов
Виды АСПИ:
· Индексирование (поисковый образ документа) в виде индексов, предметных рубрик, дескрипторов и др.
· Составление библиографического описания
· Аннотирование
· Составление обзоров
Назначение АСПИ и свертывания – сокращение затрат (временных,интелектуальных) пользователя при работе с информацией. Конечный результат в обоих случаях – вторичный документ
Использование АСПИ в различных областях(Книготорговой, музеях и тд) состоит в том, чтобы оперативно ознакомится с большим колличеством документов.
Представляется информация в сжатом виде. При таких условиях для поиска нужного документа нет необходимости просматривать тексты многих документов, а достаточно ознакомится с короткими сообщениями о них.
Процессы АСПИ:
- Библиографическое описание. Библиографическое описание содержит библиографические сведения о ресурсе, которые приведены по определенным правилам, устанавливающим наполнение и порядок следования областей и элементов, и предназначены для идентификации и общей характеристики ресурса.
|
Библиографическое описание является основной частью библиографической записи. Библиографическая запись может включать также заголовок, термины индексирования (классификационные индексы, предметные рубрики и ключевые слова), аннотацию, реферат, шифры хранения ресурса, дату завершения обработки ресурса, сведения служебного характера.
Заголовок библиографической записи составляют по ГОСТ 7.80(БИБЛИОГРАФИЧЕСКАЯ ЗАПИСЬ. ЗАГОЛОВОК), классификационные индексы и предметные рубрики - по ГОСТ 7.59(Индексирование документов. Общие требования к систематизации и предметизации), ключевые слова - по ГОСТ Р 7.0.66 (ИНДЕКСИРОВАНИЕ ДОКУМЕНТОВ Общие требования к координатному индексированию), аннотацию и реферат - по ГОСТ Р 7.0.99(Реферат и аннотация. Общие требования) и ГОСТ 7.86(Издания. Общие требования к издательской аннотации).
Библиографическая запись (БЗ) – это элемент БИ (БС), фиксирующий в документальной форме сведения о документе, позволяющий его идентифицировать, раскрыть состав и содержание в целях библиографического поиска. БЗ состоит из нескольких элементов, самым основным из которых является библиографическое описание.
В состав библиографического описания входят следующие области:
· область заглавия и сведений об ответственности
· область издания
· область специфических сведений
· область выходных данных
· область физической характеристики
· область серии
· область примечания
· область стандартного номера(или его альтернативы) и условий доступности
· одноуровневое и многоуровневое описание документа
· Аннотирование. Процесс АСПИ целью которого является получение обощенной характеристики документа, раскрывающей его логическую структуру и наиболее существенные стороны содержания.
· Аннотация- это вторичный документ, содержащий краткую обощенную характеристику первичного документа с точки зрения его назначения, содержания, вида,формы и других особенностей.
|
Функции: сигнальная (информирует о док.) и поисковая ( предназначение поиска док)
Виды:
По функциональному общественному назначению
· Справочная. Уточняет неясное заглавие и сообщает в справочных целях сведения об авторе, содержании
· Рекомендательная. Призвана пропагандировать документы, заинтересовывать, привлекать внимание
По способу характеристики первичного документа:
· общая. Характеризует документ в целом
· аналитическая(специализированная). Раскрывает только часть содержания документа.
По кол-ву анализируемых документов
· Монографическая. Составляется на один документ
· Групповая (сводная). Объединяет несколько близких по содержанию(или по другому признаку) док, позволяя показать в них общее и особенное.
По объему и глубине свертывания
· Пояснительная. Состоит из неск слов или одного – двух предложений, раскрывает недостаточно информативное заглавие документа
· Описательная. Обощенно характеризует содержание первичного док и приводит перечень основных тем
· Реферативная. Не только указывает перечень основных тем, но и раскрывает их содержание.
По исполнению
· Авторская. Составлена автором и составителем
· Референтская. Составлена специалистами служб информации
По способу подготовки
· Ручная
· автоматизированная
· Реферирование. Вид АСПИ, заключающийся в анализе первичного документа и извлечении из него наиболее важных в смысловом отношении сведений: основных положений, фактических данных, результатов, выводов.
· Реферат- вторичный документ, результат АСПИ, представляющий собой краткое изложение содержания первичного документа и содержащий его основные фактические сведения и выводы.
Классификация.
Целевое назначение:
· Информативные – раскрывают, что именно изложено в документе
· Индикативные – Сообщают о чем говорится в документе
Функциональное назначение:
· общие или рефераты конспекты, последовательно излагающие в общем виде содержание всего первичного документа
· специализированные или проблемно-ориентированные, акцентирующие внимание читателя на отдельных темах или проблемах первичного документа
- Индексирование
Индексирование- это процесс перевода содержания док и запросов с естественного на информационно- поисковый язык, в результате чего создаются поисковые образы док(ПОД) и поисковые предписания (ПП)
|
Индексирование, наряду с составлением библиог опис , реферированием, аннотированием, составлением обзоров, является разновидностью АСПИ И свертывания информации
Индексирование может воплощаться в след процессах в зависимоти от типа информац поиск языка(ИПЯ):
- предметизация т. е. индексирование на основе языка предметных рубрик, алфавитно-предметной классификации.
При предметизации док выделяют предмет(ы) и аспект(ы) его рассмотрения. Затем данные смысловые компоненты формулируются в словесной форме в соответствии с принятыми правилами и принципами предметизации. На заключительном этапе предмет и аспект рассмотрения обозначаются при помощи предметных рубрик предметного каталога данной библиотекис необходимой и достаточной степени адекватности. Если в словаре(списке) отсутствует предметная рубрика, позволяющая идентифицировать содержание документа, принимается решение о вкл в него новой рубрики и одновременно вносятся изменения в справочно-методическую документацию.
- систематизация лит-ры, осуществляемая на базе классификационных иерархических ИПЯ
При систематизации док на первом этапе непосредственно знакомятся с док, выявляют и отбирают их смысловые компоненты. Затем словесная форма по специальным таблицам классификации переводится на язык классификационных индексов. На заключительном этапе производится категориальный синтез – выявленные классификационные признаки объединяются в полном классификационном индексе
- координатное индексирование, реализуемое на основе дескрипторного ИПЯ или языка ключевых слов
В информатике часто оперируют термином координатное индексирование, понмиая под ним метод информационного анализа содержания документов или запросов, в результате которого лексические единицы (ключевые слова,словосочетания и тд) , извлеченные из текстов , соединяются между собой координатой(соподчинительной) связью, при этом они могут комбинироваться в любых отношениях, необходимых для более точного поиска информации.
Соответственно, в зависимости от используемого ИПЯ, результатом индексирования т.е. ПОДом или ПП, могут быть предметная рубрика, индекс классификации, перечень дескрипторов или ключевых слов.
|
Индексирование является основным сред-м раскрытия содержания как отдельного док, так и всего док фонда библиот информац учреждения.
По характеру сведений о документе или его составной части различают следующие основные виды заголовков библиограф записи:
Заголовок содерж имя лица
Заголовок содерж наименование организации
Загловок содерж унифицированное заглавие
Загловок содерж обозначение док
Загловок содерж географ название
ГОСТ Р 7.0.100-2018 - БИБЛИОГРАФИЧЕСКАЯ ЗАПИСЬ. БИБЛИОГРАФИЧЕСКОЕ ОПИСАНИЕ Общие требования и правила составления.
БЗ используют в разных целях: для составления библиографических пособий, библиотечных каталогов и т.д.
БЗ может включать следующие элементы:
1. заголовок;
2. библиографическое описание;
3. аннотацию или реферат;
4. термины индексирования;
5. шифр хранения документа;
6. ссылку;
7. сведения служебного характера;
1. Заголовок БЗ – это элемент БЗ, расположенный перед библиографическим описанием (БО) и предназначенный для упорядочения поиска БЗ.
Вид заголовка БЗ зависит от характера сведений о документе. Он может содержать:
– имя лица (заголовок индивидуального автора);
– наименование организации (заголовок коллективного автора);
– наименование страны, вид документа, географическое название, унифицированное заглавие (заголовок формы);
– тему документа (предметный заголовок).
2. Библиографическое описание (БО) – совокупность сведений о документе, приведенных по определенным правилам (ГОСТ), которые устанавливают порядок следования друг за другом областей элементов с целью общей характеристики документа, его идентификации. Оно дает сведения об авторе, содержании, назначении, объеме и других особенностях документа.
Виды БО выделяют в зависимости от следующих признаков:
· объекта описания:
- монографическое (БО однотомного издания);
- сводное (БО многотомного издания);
- аналитическое (описание составной части издания).
· полноты набора элементов:
- полное (содержит все обязательные и факультативные элементы);
- расширенное (все обязательные и один или несколько факультативных элементов);
- краткое (только обязательные элементы).
· от структуры описания:
одноуровневое и многоуровневое библиографическое описание
Аннотация – краткая характеристика документа, поясняющая его содержание, назначение, форму, другие особенности. Она дополняет, уточняет БО.
Виды аннотаций различают в зависимости от следующих признаков:
· в соответствии с функциональным общественным назначением:
|
- справочная (уточняет неясное заглавие, сообщает краткую информацию об особенностях документа, применяется для характеристики официальных, научных, производственно-практических, учебных, справочных изданий. Объем – от нескольких слов до нескольких строк. Функция – поисковая);
- рекомендательная (показывает значение, особенности документа, имеет дидактическую направленность, содержит педагогические советы, рекомендации. Составляется для раскрытия содержания научно-популярных, художественных, детских изданий. Язык – живой, доступный. Объем – от нескольких предложений до нескольких абзацев. Функция – оценочная.).
· по способу характеристики первичных документов:
- общая (характеризует содержание документа в целом);
- аналитическая (раскрывает часть содержания документа, его аспект или содержание структурного элемента издания – статьи, главы, т.д.).
· по количеству характеризуемых документов:
- монографическая (содержание одного документа);
- групповая / сводная (характеристика нескольких документов, близких по теме, одного автора, одного вида, сборника, т.д.).
· по объему и глубине свертывания информации:
- пояснительная (объёмом от нескольких слов до одного – двух предложений, поясняющих заглавие);
- описательная (дает обобщенную характеристику документа, перечень основных вопросов, отвечает на вопрос «О чем сообщается в документе?»);
- реферативная (сочетает свойства аннотации и реферата, отвечает на два вопроса «О чем?…» и «Что именно сообщается в документе?». По объему больше описательной.
· по исполнению:
- авторские;
- составленные редактором;
- составленные библиографом.
· по способу подготовки:
- традиционным (ручным) способом;
- автоматизированным способом.
Реферат – это краткое точное изложение содержания документа, включающее основные фактические сведения и выводы без дополнительной интерпретации и критических замечаний автора (составителя) реферата. Отвечает на вопрос «Что сообщается в первичном документе?». Главная особенность реферата – информативность. Реферат составляется для того, чтобы ученым, исследователям не надо было обращаться к первоисточнику.
Рефераты различают по следующим признакам:
· по принадлежности документа к определенной отрасли знания или области науки (по общественным, гуманитарным, естественным, техническим наукам);
· по способу характеристики первичного документа (общие или рефераты-конспекты; специализированные или проблемно - ориентированные);
· по количеству источников реферирования (монографические; обзорные/сводные, групповые, фрагмент);
· по форме изложения (текстовые, табличные, цифровые, иллюстрированные, смешанные);
· по объему или глубине свертывания (краткие, расширенные - могут занимать 10 – 15% объема первичного документа);
· по авторству (составленные автором (автореферат) или составленные библиографом).
4. Термины индексирования – это классификационные индексы и предметные рубрики. В самом общем понимании классификационный индекс представляет собой условное обозначение раздела классификации (ББК, УДК), к которому относится документ по своему содержанию. Классификационный индекс выражается в цифровой, буквенной или смешанной форме средствами информационно – поискового языка (ИПЯ) и устанавливается с помощью специальных таблиц. Предметная рубрика - это элемент ИПЯ в виде краткой формулировки вопроса в соответствии с содержанием документа.
5. Шифр хранения документа – это условное обозначение места хранения документа в виде сочетания буквенных и / или цифровых знаков.
Полочный индекс и авторский знак вместе составляют шифр книги, поэтому полочный индекс называют также индексом шифра. Располагаются они в виде дроби: вверху – полочный индекс; внизу – авторский знак.
6. Ссылка – это запись, связывающая между собой части документа, библиографические записи, классификационные деления, предметные рубрики, разделы библиографического пособия, каталога, т.д.
Применяются ссылки двух видов:
- «см.» (помогают вести поиск в нужном направлении);
- «см.также» (обеспечивают полноту поиска).
7. Сведения служебного характера могут давать информацию, например, об отделе, фонде библиотеки, где хранится документ, инвентарный номер, т.п.
БЗ могут состоять из различного сочетания элементов, например:
1. заголовок + БО;
2. номер + БО + аннотация (реферат);
3. БО + аннотация + классификационный индекс;
4. БО + предметная рубрика;
5. заголовок + БО + реферат + классификационный индекс + предметная рубрика + сведения служебного характера и т.д.
Одной из важнейших операций аналитико-синтетической обработки документов как средства информационного поиска является индексирование документов и информационных запросов.
Индексирование – процесс выражения содержания документа и (или) запроса на информационно-поисковом языке (ИПЯ) с помощью терминов индексирования (классификационных индексов, предметных рубрик (ПР), ключевых слов, дескрипторов, кодов). Иными словами, индексирование – процесс перевода содержания документов и запросов с естественного языка на ИПЯ, в результате чего создается поисковый образ документа (ПОД) и поисковый образ запроса (ПОЗ). Таким образом, происходит «свертывание» информации, содержащейся в документе и изложение ее на ИПЯ в виде индекса, рубрики, кода (на классификационном языке) или дескриптора, ключевого слова (на дескрипторном языке).
Поисковый образ документа – это выраженное в терминах формализованного информационно-поискового языка основное смысловое содержание документа (а не вся информация, содержащаяся в документе), которое поставлено в однозначное соответствие этому документу, по которому производится отыскание данного документа в массиве других документов.
Индексирование запроса осуществляется путем перевода его содержания на информационно-поисковый язык. Совокупность терминов индексирования, выражающих смысловое содержание запроса, называется поисковым образом запроса (ПОЗ). В этом случае поиск документов ведется по совокупности терминов индексирования. Чтобы повысить эффективность поиска информации по запросу, поисковый образ запроса можно дополнить специальными указаниями о последовательности выполнения логических операций в процессе информационного поиска, которые являются поисковым предписанием.
Методика индексирования запросов за счет включение в поисковое предписание дополнительных терминов, понятий или дополнительных указаний позволяет расширить область поиска информации (например, за счет включения видовых и ассоциативных терминов) и в конечном итоге повысить функциональную возможность информационно-поисковой системы.
Индексирование реализуется в следующих процессах: предметизации, систематизации и координатном индексировании.
Систематизация – вид индексирования, при котором содержание документа и (или) запроса выражено классификационными индексами в соответствии с правилами какого-либо классификационного ИПЯ (классификационной системы). Такой принцип индексирования принято считать классификационным. Классификационный принцип индексирования обеспечивает возможность организации информационного поиска по иерархическому признаку.
Предметизация – вид индексирования, при котором содержание документа и (или) запроса выражено предметной рубрикой (ПР) в соответствии с правилами соответствующего предметизационного ИПЯ. Предметизационный принцип индексирования базируется на представлении содержания документа в понятийной системе определенного естественного языка и на использовании в качестве терминов индексирования лексических единиц (ЛЕ) естественного языка.
Предметизационный принцип индексирования обеспечивает возможность организации информационного поиска по алфавитному признаку.
Координатное индексирование – вид индексирования, при котором смысловое содержание документа и (или) запроса многоаспектно выражается множеством ключевых слов или дескрипторов. Информационно-поисковый язык, предназначенный для координатного индексирования документов (или частей документов) и запросов посредством ключевых слов и (или) дескрипторов, называется дескрипторным языком.
Термины «индексирование» и «индексатор» распространены в англоязычной литературе и широко применяются в международной и отечественной библиотечной практике.
В зависимости от того, какой принцип индексирования является ведущим (или единственным) различают предметизационные, классификационные и дескрипторные информационно-поисковые языки. В соответствии с характером ИПЯ индексирование осуществляется как предметизация, систематизация и координатное индексирование.
А в качестве терминов этих видов индексирования используют предметные рубрики, классификационные индексы, дескрипторы, ключевые слова.
В зависимости от типа используемого ИПЯ, различают два режима индексирования: предкоординатное (классификационное) и посткоординатное.
В предкоординатном индексировании связи между терминами индексирования устанавливаются заранее – при разработке соответствующего ИПЯ. К предкоординатным ИПЯ можно отнести следующие:
перечислительные классификации;
иерархические классификации;
предметные классификации;
фасетные классификации.
+В посткоординатном индексировании связи (координация) между терминами индексирования устанавливаются во время индексирования документов или в процессе их поиска. К посткоординируемым ИПЯ относят:
дескрипторные языки;
посткоординируемые фасетные классификации.
Теоретические основы и методика процессов индексирования
(предметизации, систематизации, координатного индексирования) подробно изложены в последующих главах методического пособия.
Предметизация – один из фундаментальных методов организации знаний. Этим объясняется широта сфер его использования.
В основе предметизации как вида индексирования лежат две основные операции: 1.выявление предмета документа, установление аспектов и связей рассмотрения предмета и 2.преобразование этого предмета в краткую словесную формулировку, называемую предметной рубрикой (ПР).
Под предметизацией понимают интеллектуальный или автоматический анализ содержательных и формальных признаков документа с целью его свертывания и отражения в поисковой системе с помощью языка предметных рубрик (ЯПР).
Предметизация – многозначный термин, используемый для использования различных операций.
Во-первых, предметизация – вид индексирования, вид обработки документа. Целью предметизации в данном случае является формирование ПР, способствующих как раскрытию содержания фонда по предметному признаку, так и поиску документов, соответствующих запрашиваемому предмету. Процесс связан с обработкой документа и может быть назван документной предметизацией. Объектами предметизации могут выступать не только отдельный документ, но и его составная часть или совокупность документов. Существуют особенности предметизации текста документа, основанные на общей методике предметизации документа в целом. Данный вид предметизации можно назвать текстовым.
Предметизационный метод используется при формировании классификационных и предметизационных информационно-поисковых языков, предметных традиционных и электронных каталогов, картотек, библиографических указателей, единого алфавитно-предметного указателя к каталогам и т.д.
Метод предметизации используется при реализации другого вида индексирования – систематизации, так как процесс систематизации состоит не только из определения и оформления классификационного индекса, но и одновременно – рубрик алфавитно-предметного указателя (АПУ).
Единый АПУ обеспечивает поиск записей в систематическом каталоге, в систематической картотеке статей и является составной частью данных ИПС. Указатель обеспечивает связи различных элементов системы каталогов и картотек библиотеки и предоставляет возможность многоаспектного, организованного по предметному признаку поиска в отраслевых отделах систематических каталогов, картотек, указателей. АПУ способствует взаимопроникновению методов систематизации и предметизации.
В развитии теории и практики предметизации значительна роль РКП, осуществляющей централизованную предметизацию посредством печатных карточек и использующей предметизацию при составлении вспомогательных указателей к государственным библиографическим пособиям.
Редакции и издательства используют предметизацию при составлении прикнижных и прижурнальных вспомогательных указателей.
Вспомогательные указатели – упорядоченные путеводители, обеспечивающие быстрый поиск необходимой информации, заключенной в документе. В таких указателях список рубрик сопровождается номерами страниц, на которых помещен текст, соответствующий определенному предмету.
Аналогичные приемы предметизации распространяются на все виды вспомогательных алфавитных указателей, в том числе именные и географические.
Предметизация включает также процесс составления предметизационного информационно-поискового языка (ИПЯ), - искусственного языка, предназначенного для выражения основного содержания документа или информационного запроса посредством предметных рубрик. Такую предметизацию можно назвать лингвистической.
Органы ОНТИ используют данный метод для формирования рубрикаторов, информационно-поисковых тезаурусов, разработки вспомогательных указателей к информационным изданиям. Современные автоматизированные системы по существу лишь одна из разновидностей предметизационных систем.
Термин «предметизация» используется для обозначения процесса организации и ведения предметного каталога, картотеки, списка, указателя.
Итак, предметизация – многозначный термин, используемый для процесса индексирования документов, составления ИПЯ, формирования предметных ИПС и вспомогательных указателей ко многим видам первичных документов. Таким образом, можно вычленить три области применения предметизации:
- документную, предназначенную для индексирования документов;
- текстовую, способствующую дополнительному входу в содержание документа или ИПС по предметному признаку;
- лингвистическую, содействующую составлению вербальных ИПЯ.
В рамках АСПИ основное внимание уделяется рассмотрению документной предметизации. Главная задача предметизации как метода раскрытия содержания документа с помощью предметных рубрик – определение основного предмета произведения; установление аспектов его рассмотрения; фиксация его связей с другими предметами, отраженными как в тексте документа, так и в каталоге; указание формы и читательского назначения обрабатываемого документа.
Термин «предмет документа» - один из исходных и основополагающих для теории и практики всех видов индексирования.
Предмет в предметизации понимается весьма широко – это все, о чем в документе сообщается, то есть некоторая информация. Предмет раскрывает основную тему документа, его форму и читательское назначение.
Предмет документа – это все, что может быть объектом специального изучения: материальные вещи объективного мира в целом (человек, здание, машина); любые части вещей (сердце, фундамент, колеса) и их отдельные свойства, стороны, отношения (сердцебиение, бетонирование, размер); события, явления, факты, персоналии (Великая Отечественная война, снегопад, Л. Н. Толстой); отражение этих вещей в нашем сознании (ощущения, восприятия, представления, понятия); суждения, научные теории и т.д.
Предмет, интересующий пользователя, может формулироваться в произвольной форме с помощью любых слов естественного языка. В процессе предметизации эта форма преобразуется в предметную рубрику, формулируемую посредством специально разработанного предметизационного ИПЯ.
ГОСТ определяет термин «предметная рубрика» следующим образом:
«Предметная рубрика – элемент ИПЯ, представляющий собой краткую формулировку темы на естественном языке» (не указываются другие назначения).
Предметная рубрика – результат процесса предметизации, краткая формулировка факта, события, аспекта и т.п., рассматриваемого в документе, созданная на основе принципов и правил специально разработанного предметизационного ИПЯ.
Предмет, выявленный при анализе документа, отличается от предметной рубрики формой представления. Так, предмет учебника для основной школы «Азбука гражданина» можно сформулировать как «Права россиян», а рубрика на эту книгу будет выглядеть так: «Право – Российская Федерация – учебные издания для средней школы».
Рубрика – краткая формулировка темы конкретного документа, выраженная не только с помощью слов и словосочетаний естественного языка, но и цифрами и другими обозначениями, используемыми в естественном языке. Однако, ее не следует рассматривать только как нормализованную лексическую единицу естественного языка. Рубрики – это термины индексирования, поисковые, организующие, комплексирующие средства.
Таким образом, предметизатор должен определить предмет документа и преобразить его в предметную рубрику.
ГОСТ 7.74 – 96 «Информационно-поисковые языки: термины и определения» дает несколько определений, связанных с лингвистической предметизацией.
2. Предметизационный информационно-поисковый язык.
Качество любой ИПС, отражающей содержание документов, зависит от ИПЯ, с помощью которого система реализуется. Предметизационный язык или язык предметных рубрик (ЯПР) является искусственным информационно-поисковым языком, созданным на базе естественного языка и предназначенного для индексирования документов, частей документов и их совокупности, а также информационных запросов посредством ПР.
Основная задача ЯПР – наиболее полно раскрыть содержание той или иной предметной области в целом и отдельных ее разделов, то есть дать по возможности исчерпывающий перечень предметов науки (проблемы, темы), выразить взаимоотношения между ними. Массивы библиографических записей или первичных документов, сформированные по предметизационному признаку (предметные каталоги и картотеки, тематическая расстановка фонда), создаются на основе предметизационного языка или языка предметных рубрик.
ЯРП может быть представлен различными средствами, такими как «Словарь ПР», «Рубрикатор», «Алфавитный указатель ПР и ссылок», «Словарь предметного каталога», «Служебная картотека ПР», «Общий алфавитный ключ». В структуру ЯПР входит предисловие и алфавитный перечень предметных рубрик (словарь рубрик), организованных в продуманную систему с помощью ссылочно-справочного аппарата (ССА).
ЯПР относится к вербальным (словесным) ИПЯ, поскольку для представления своих ЛЕ в нем используются слова и выражения естественного языка, но имеющий существенные отличия. Словарь русского языка и словарь ПР содержат перечень слов в алфавитном порядке, но на этом их сходство заканчивается. Слова, представленные в ЯПР, проходят жесткий отбор из лексики естественного языка и формулируются по собственным правилам. Именно по этому ЯПР – искусственно созданный язык на основе естественного.
Естественный язык, с точки зрения информационного поиска обладает рядом недостатков, таких как многозначность и синонимичность, которые не позволяют производить однозначную запись содержания документов.
Формалзация лексики при создании предметных рубрик вызвана необходимостью устранения как «избыточности», так и «недостаточности» естественного языка для целей информационного поиска.
Важнейший принцип ЯПР – устранение синонимии, полисемии и омонимии для реализации «однозначности» информационного поиска.
1.Синонимия естественного языка – совпадение или близость значений различных слов. Например, желтуха – гепатит; формирование – создание – образование.
2. Полисемия – свойство какого-либо слова, имеющего одно или несколько этимологически близких значений, т.е. перенос названия с одного предмета на другой на основе сходства по форме, свойствам, функциям предметов. Ex. Звезда – геометрическая фигура, звезда – небесное тело, звезда морская.
3. Омонимия – внешнее совпадение слов, одинаковых по написанию и звучанию, но выражающих различные понятия. Ex. Родниковый ключ и замочный ключ; лук – оружие и лук овощ. (На речной косе девушка точила косу. Все было в девушке хорошо: и лицо, и стан, и длинная коса. Да жаль, была она коса.). Знание этих слов можно понять только из контекста.
Для различения омонимов в рубрику добавляют идентифицирующие признаки, заключенные в скобки, - локаторы. В качестве их могут использоваться понятия, характеризующие научные дисциплины, отрасль, этническую группу, язык, тип объекта, географическое название и т.д.
|
|
Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...
Биохимия спиртового брожения: Основу технологии получения пива составляет спиртовое брожение, - при котором сахар превращается...
Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...
Состав сооружений: решетки и песколовки: Решетки – это первое устройство в схеме очистных сооружений. Они представляют...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!