Типология универсальных информационных технологий — КиберПедия 

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Типология универсальных информационных технологий

2017-10-11 308
Типология универсальных информационных технологий 0.00 из 5.00 0 оценок
Заказать работу

Ввод текста

Операции ввода позволяют перевести исходный текст из бумажной формы в электронную, т. е. файл. Под вводом в общем случае понимается не только на­бор текста с помощью клавиатуры, но и получение элек­тронной формы текста в результате сканирования с последующим распознаванием и переводом в текстовой формат. В большинстве случаев основным инструмен­том ввода текста является клавиатура ПК.

Рассмотрим особенности реализации операции вво­да текста с помощью клавиатуры.

Вводимый текст располагается в рабочей области; экрана монитора. Остальная часть экрана — служебная область — содержит полезную для пользователя информацию о режиме работы программы

Позиция ввода очередного знака отмечается спе­циальным символом — курсором. Его перемещение по рабочей области может осуществляться автоматически (по мере набора символов справа налево и по достижению конца строки — в начало следующей) или при­нудительно (нажатием клавиши "ввод" для перехода на начало следующей строки, переход в произвольное место осуществляется с помощью курсорных клавиш "←", "↑", "→", "↓", "PgUp", "PgDn") или щелчком мыши в нужной точке. Ввод текста может осуществ­ляться в двух режимах вставки и замены. Режим за­мены включают нажатием клавиши "Insert" для того, чтобы вводимый текст замещал, а не сдвигал вправо имеющийся ранее.

Предусматриваются следующие возможности исправ­ления ошибки:

1. клавишей "Backspace" или кнопкой "Отменить ввод" стандартной панели инструментов — удалить сим­вол справа от курсора;

2. клавишей "Delete" — удалить текущий символ, на­ходящийся в позиции курсора.

Для ввода нестандартного символа предусмотрен режим "Символ" в меню "Вставка".

Ввод и составление документа становятся более эффективными при использовании стандартных фраз и выражений. В деловой переписке приняты устойчи­вые фразеологические обороты. Наборы таких профессиональных фраз и выражений, постоянно используемых наименований организаций, товаров и прочего можно ввести в память ПК, а затем быстро вставить нужное в текст подготавливаемого документа. Для со­здания такого набора элементов и последующего авто­матического ввода типовых слов и словосочетаний пре­дусмотрен режим "Автотекст" в меню "Вставка".

Данный режим формирует список рубрик (напри­мер, "приветствие", "прощание", "указания", "стандарт­ные пункты договора"), в каждой из которых содер­жится набор типовых текстовых элементов.

При вводе текста можно установить режим автома­тической проверки орфографии и грамматики. При этом возможные орфографические ошибки будут выделены красной волнистой линией, а возможные грамматичес­кие ошибки — зеленой волнистой линией. Проверка правописания может выполняться и после завершения ввода всего текста.

Кроме того, для проверки наличия синонимов можно использовать тезаурус.

С помощью специальных средств можно выполнить проверку правописания для текстов на иностранных языках.

 

Редактирование (правка) текста

К основным операциям редактирования введенно­го текста относят добавление, удаление, перемещение, копирование, поиск и замену фрагмента текста. Под фрагментом понимается область текста размером от одного символа до всего текста, являющаяся объектом воздействия. Для работы с фрагментом его необходимо выделить, что можно осуществить с помощью мыши или клавиатуры.

Для выполнения операций добавления, удаления, перемещения, копирования предусмотрены специаль­ные команды, вызвать которые можно либо из меню "Правка", либо из контекстного меню, либо соответствующей кнопкой панели инструментов.

Для добавления (вставки) выделенного фрагмента в заданное место текста необходимо этот фрагмент сна­чала скопировать во временный буфер, а затем из бу­фера вставить в текст.

Для копирования выделенного фрагмента предус­мотрена команда "Копировать", при выполнении кото­рой копия фрагмента помещается во временный буфер.

Для вставки предусмотрена команда "Вставить", при выполнении которой копия фрагмента помещается из буфера в текст.

Для удаления выделенного фрагмента предусмот­рена команда "Вырезать". При ее выполнении удален­ный фрагмент помещается во временный буфер и его можно вставить в любое место текста. Таким образом реализуется перемещение фрагментов текста.

Запись фрагмента текста в буфер предоставляет пользователю возможность его многократного исполь­зования. MS Word 2000 позволяет хранить и использо­вать до 12 фрагментов текста одновременно.

Замещение одного фрагмента текста другим осуще­ствляется командой "Заменить" в меню "Правка". Она позволяет произвести замену в рамках выделенного фрагмента либо во всем тексте (например, заменить по всему тексту словосочетание "Информационные систе­мы" на аббревиатуру "ИС").

MS Word предусматривает возможность одновре­менной работы с несколькими документами, что позволяет сделать процесс редактирования значительно более эффективным (например, перенося готовые фраг­менты текста из одного документа в другой).

 

Оформление текста будущего документа

При вводе и редактировании формируется содер­жание документа. Оформление текста определяет, как будет выгля­деть документ.

К универсальным функциям, используемым при оформлении любого документа и не ориентированным на форматирование определенного типа информации, можно отнести:

1. установление формата бумаги и размера полей;

2. оформление документа на основе шаблона;

3. форматирование с помощью стилей;

4. форматирование документов сложной структуры.

Для любого документа требуется задать формат бумаги и размер полей. При выборе этих параметров для служебных документов следует иметь в виду, что они регламентированы. Для установки формата бумаги и размера полей в Word предусмотрена команда "Па­раметры страницы" в меню "Файл".

Любой документ, подготавливаемый в Word, бази­руется на определенной основе - "шаблоне". Шаблон задает макет страницы документа и стиль ее оформле­ния. Шаблон может быть чистым листом заданного раз­мера, с заданными полями, шрифтами и т. п. Такие общие шаблоны содержат настройки, доступные для всех документов. Специальные шаблоны могут включать текстовые, графические и иные фрагменты. Для оформ­ления служебных документов Word предлагает серию шаблонов, возможность выбора которых предусмотре­на в меню "Файл" (команда "Создать"). С помощью той же команды можно создать свой шаблон, задав не-"обходимый набор реквизитов и их расположение, па­раметры оформления документа, разместив трафарет­ный текст с полями для ввода переменной информа­ции. Ввод переменной информации упрощает наличие в шаблоне раскрывающихся полей-списков значений элементов, из которых можно выбрать необходимое. Шаблоны могут содержать текстовые поля, содержа­щие подсказки составителю документа. Использование шаблонов способствует унификации как формы, так и содержания документа. Это значительно ускоряет про­цесс его составления, уменьшает количество возмож­ных ошибок.

Автоматизировать процесс форматирования позво­ляет использование стилей. Стилем называется набор параметров форматирования, который применяется к тексту, таблицам, спискам, чтобы быстро изменить их внешний вид. Стили позволяют одним действием при­менить сразу всю группу параметров форматирования. Стиль оформления можно выбрать и установить, вы­брав команду "Стили и форматирование" в меню "Фор­мат". Удобной операцией при оформлении документов является копирования стиля форматирования или фор­матирование по образцу. Для его реализации предус­мотрена специальная кнопка "Формат по образцу" на панели инструментов "Стандартная".

К большим многостраничным документам со слож­ной структурой применяют специальные методы фор­матирования. Они позволяют организовать общую структуру документа, а также выполнить ряд специфи­ческих операций, упрощающих структурирование, в том числе легко и быстро перемещаться по документу, эффективно и точно перемещать части документа, ге­нерировать оглавление по заголовкам структуры, со­здавать различного типа указатели, автоматически фор­матировать заголовки разделов документа.

К функциям, ориентированным на форматирова­ние текста, относят:

1. форматирование символов,

2. форма­тирование абзацев,

3. создание списков и др.

Большинство простейших операций удобно реали­зовать с помощью панели инструментов "Форматиро­вание".

Эффекты, недоступные с панели инструментов "Форматирование", можно создать командами в меню "Формат" или в контекстном меню.

Форматирование символов позволяет выбрать гар­нитуру шрифта, его размер, начертание, а также меж­символьный интервал. Изменяя интервал между сим­волами текст может быть уплотнен или разрежен, что иногда используется в заголовках.

Средства анимации в меню "Формат" используют для динамического оформления текста, но только в элек­тронных документах.

Форматирование абзацев позволяет изменять их внешний вид (оформить отступ или осуществить вы­равнивание абзацев, задать межстрочный интервал). В качестве универсального средства форматирования абзацев можно использовать команду "Абзац" в меню "Формат".

Следует учесть, что при выравнивании по ширине текст растягивается так, чтобы ровными оказались пра­вая и левая его границы. В связи с этим интервал между отдельными словами становится излишне большой. Для исключения этого следует при использовании вышеуказанного способа выравнивания абзаца устанавливать ре­жим переноса слов (команда "Язык" в меню "Сервис").

Упорядоченную информацию часто удобно оформ­лять в виде списков. Word поддерживает два вида списков — маркированные списки, в которых каждый пункт помечается одинаковым маркером, и нумеро­ванные списки, где пункты последовательно нумеру­ются. Для оформления списка можно воспользовать­ся соответствующими кнопками на панели инструмен­тов "Форматирование" или командой "Список" в меню "Формат", позволяющей настроить формат списка. Word позволяет создать специальный список, содер­жащий несколько уровней пунктов, нумеруемых или маркируемых отдельно, а также подобрать стиль оформления списка.

При создании и оформлении многостраничного до­кумента в нем могут появиться новые структурные эле­менты:

1. колонтитулы,

2. сноски,

3. ссылки и др.

Сноски в тексте применяются для объяснений, ком­ментариев или организации ссылок на первоисточни­ки в документе. Word дает возможность одновремен­но пользоваться как сносками в подстрочнике либо в любом другом месте страницы текста (далее будем на­зывать ее сноска),так и сносками на литературу из списка, располагаемого в конце раздела или докумен­та (далее будем называть ее концевая сноска). Каж­дая сноска состоит из двух связанных частей: маркера ссылки на сноску и текста сноски. В режиме "Авто" сноски нумеруются и размещаются на страницах до­кумента автоматически, маркеры сносок изменяются всякий раз, когда вставляют, удаляют или перемеща­ют текст сноски.

Для многостраничных документов необходима нумерация листов. У служебных документов номера страниц проставляются (начиная со второй страницы) посередине верхнего поля арабскими цифрами без ка­ких-либо дополнительных помет (тире, точек и пр.). Для вставки нумерации страниц предусмотрена коман­да "Номера страниц" в меню "Вставка".

Word предоставляет возможность вставить в доку­мент графические и другие объекты как элемент оформ­ления или как элемент содержания Word обладает необходимым набором инструмен­тов, который вызывается кнопкой "Рисование" на стан­дартной панели инструментов, для изготовления и до­бавления в текст несложных наиболее часто используе­мых графических объектов.

Word, как и большинство текстовых процессоров, поддерживает концепцию составного документа — кон­тейнера, включающего в себя объекты различных фор­матов — рисунки, таблицы, схемы, формулы, звуковые и видеофрагменты и др., подготовленные в других про­граммных средах. Для вставки или редактирования объекта из среды текстового процессора автоматически вызывается необходимая программа. Решить эту слож­ную задачу позволяет технология связи и внедрения объектов OLE (Object Linking and Embedding).

Печать документа

Режим печати документа предусматривает широкий спектр операций, дающих возможность:

1. распечатать весь документ или заданную выборку страниц;

2. задать число копий и способ подборки в них стра­ниц;

3. установить одностороннюю или двустороннюю пе­чать;

4. задать количество страниц, располагаемых при пе­чати на одном листе;

5. установить ряд дополнительных параметров печати и др.

 

2.2.1.2.Информационные технологии подготовки табличных документов

Большое количество управленческих документов (например, финансовые, бухгалтерские, планово-ана­литические и т. п.) содержат числовую информацию, представленную в табличном виде и подлежащую обра­ботке. Подобные табличные формы представления чис­ловой информации могут являться как составной час­тью другого документа, так и самостоятельным таблич­ным документом. Эффективность и качество работы с такими документами обеспечивают табличные процес­соры, называемые электронными таблицами. Данная информационная технология позволяет:

1. создать и оформить табличный документ;

2. автоматизировать табличные расчеты;

3. оформить результаты расчетов средствами деловой графики;

4. выполнить функции простейшей базы данных (за­полнение, сортировка, поиск, создание сводных ре­зультирующих таблиц);

5. осуществить подбор параметров, моделирование ре­альных ситуаций и оценки получающихся результа­тов с целью поиска оптимального решения задачи.

Электронные таблицы позволяют находить в бизне­се ключевые точки, воздействуя на которые можно с наименьшими затратами достигать желаемых результа­тов. Можно оценить отдачу от будущих проектов, за­благовременно обнаружить возможные узкие места и предотвратить неправильные шаги.

Одним их самых популярных табличных процессо­ров является MS Excel, входящий в состав интегриро­ванного пакета MS Office.

Структура документа Excel. Каждый документ пред­ставляет собой набор таблиц — рабочую книгу, состоя­щую из рабочих листов. Каждый лист— это отдельная электронная таблица, столбцы которой обозначаются заглавными латинскими буквами, а строки — цифрами. Адрес ячейки формируется как объединение номеров столбца и строки. Одна из ячеек всегда является теку-щей (она выделена широкой рамкой) и именно она ис­пользуется в большинстве операций.

Многие операции относятся не к одному элементу (ячейке, строке, столбцу, листу), а к их совокупности, которые называются диапазонами. Диапазон может быть сформирован как из нескольких подряд идущих элемен­тов, так и из несмежных диапазонов. Для работы с лю­бым элементом рабочей книги его необходимо выделить.

Ячейки таблицы могут содержать три вида инфор­мации;

1. текст;

2. числовые данные. Ячейки с числовыми данными могут быть использованы в вычислениях;

3. формулу. Ячейка, содержащая формулу, называет­ся вычисляемой и содержит производные данные, т. к. ее значение зависит от значений других яче­ек — основных.

Ввод информации осуществляется только в теку­щую ячейку. Следовательно, прежде чем начать ввод, необходимо выбрать соответствующую ячейку и сделать ее текущей.

Ввод текстовой и числовой информации аналогичен соответствующей операции в Word. Предусмотрены возможности автоматизации ввода повторяющихся дан­ных (например, одинаковое название товара в несколь­ких строках одного столбца) и данных, подчиненных несложному закону изменения (Excel может автомати­чески продолжить последовательность дней недели, названий месяцев, дат и произвольных чисел).

Ввод формулы начинается с ввода знака "=", ибо он является для Excel признаком записи формулы. Под формулой понимается набор чисел (констант) и (или) ссылок на адреса ячеек, содержащих исходные данные, соединенные знаками математических операций или функций. Ссылки в формулах могут быть трех типов:

1. абсолютные,

2. относительные

3. смешанные.

Первая за­дает абсолютные координаты ячейки на рабочем листе. При ее записи необходимо задать перед обозначением номера столбца или номера строки символ "$". При перемещении или копировании формулы из одной ячей­ки в другую такая ссылка в формуле не изменяется и всегда указывает на одну и ту же ячейку таблицы.

Относительная адресация задается по методу "ле­вее", "правее", "выше" и т. п. При копировании фор­мулы с относительными ссылками последние изменя­ются в соответствии с новым положением формулы в таблице.

Любой ячейке или диапазону ячеек можно присво­ить имя и использовать его в дальнейшем в качестве ссылки(адреса) в составе формул и функций

По окончании ввода формула в таблице не отража­ется. Вместо нее в ячейке размещается вычисленное значение. Формулу можно увидеть либо в строке фор­мул, либо в ячейке после двойного щелчка по ней мыши. Для выполнения сложных вычислений предусмотрено большое количество встроенных функций, ввод кото­рых возможен как с клавиатуры, так и с использовани­ем мастера функций. Функции сгруппированы по це­левому назначению, например, математические функ­ции, функции для работы с датами и временными зна­чениями, финансовые функции, функции для статистических расчетов, логические функции и др.

Объектами редактирования могут быть отдельные ячейки, столбцы, строки, диапазоны (последовательно­сти нескольких идущих подряд) строк и столбцов, бло­ки (фрагменты таблицы, образованные пересечением нескольких подряд идущих столбцов с несколькими подряд идущими строками) ячеек, таблица в целом. Для каждого объекта предусмотрены следующие операции редактирования: очистка, удаление, вставка, копиро­вание.

Форматирование документа включает:

1. форматирование ячейки, которое предусматривает установку таких параметров, как формат представ­ления значений (например, числовой, текстовой, де­нежный, процентный и т.д.), выравнивание значе­ний внутри клеток, шрифтовое оформление, оформ­ление границ и фона ячеек;

2. форматирование строк и столбцов предусматривает дополнительную установку их ширины и высоты.

Печать документа во многих случаях является за­ключительным этапом работы с электронными табли­цами. Рабочие листы могут быть очень большими, по­этому требуется определить область печати — заданный диапазон ячеек, который выдается на печать вместо рабочего листа. Размер печатной страницы ограничен размерам листа бумаги, поэтому даже выделение огра­ниченной зоны печати не всегда позволяет разместить целый документ на одной печатной странице. В этом случае возникает необходимость разбиения документа на страницы. Excel автоматически решает эту задачу.

При подготовке данных электронной таблицы на печать предполагается возможность задания следующих основных параметров страничного оформления:

1. ориентацию таблицы на листе (вдоль или поперек);

2. масштаб изображения на бумаге (относительно раз­мера изображения на экране);

3. определение размеров полей, режимов центрирова­ния, содержания верхнего и нижнего колонтитулов;

4. установление при необходимости вывода на каждой странице имен столбцов и номеров строк, а также порядка вывода примечаний и др.

Файл, в котором хранится электронная таблица, имеет расширение.xls.

Электронная таблица дает возможность выполнить некоторые простейшие функции базы данных. Таблица, используемая в указанном назначении, состоит из строк, каждая из которых представляет запись харак­теристик отдельного объекта, а столбцы, называемые полем данных, объединяют множества однотипных ха­рактеристик объектов базы данных. Для таких таблиц Excel позволяет выполнить операции: сортировку, филь­трацию.

Сортировка — это упорядочение записей в алфавит­ном, числовом, хронологическом или другом порядке. Сортировка может производиться по содержимому од­ного, двух или трех полей одновременно.

С помощью фильтра можно отобрать записи, удов­летворяющие определенным условиям, например оста­вить в списке только те товары, которые поступили на склад от определенного поставщика за последнюю не­делю. Excel предоставляет пользователю два способа фильтрации: с помощью автофильтра (реализуется ко­мандой "Автофильтр" в меню "Данные") и с помощью расширенного фильтра (реализуется командой "Расши­ренный фильтр" в меню "Данные"). Первый способ ориентирован на быструю выборку данных по одному или двум простым условиям, накладываемым на содер­жимое ячеек отдельного столбца. Второй способ реко­мендуется использовать в случаях, когда:

1. условие отбора должно одновременно применяться к ячейкам двух или более столбцов;

2. к ячейкам одного столбца необходимо применить три и более условий отбора;

3. в условии отбора используется значение, получен­ное в результате вычисления формулы.

Указанные выше операции можно производить не только на всей таблице, но и на ее части — диапазоне.

Для более наглядного представления табличных данных часто используют графики и диаграммы. Пе­ред построением диаграммы следует выбрать диапазон данных, которые будут в ней отражены. Для построения же самой графической иллюстрации удобно исполь­зовать Мастер диаграмм, вызываемый с помощью кноп­ки на панели инструментов Стандартная. Мастер помогает выбрать тип диаграммы и выполнить все опе­рации оформления ее компонентов. Excel предоставля­ет возможность создавать несколько десятков различ­ных типов и видов диаграмм

 

Технология баз данных

 

Наиболее совершенной информационной техноло­гией, ориентированной на хранение информации и обес­печение доступа к ней, является технология баз дан­ных. Использование баз данных становится неотъемле­мой составляющей деловой деятельности современного человека и функционирования организаций.

Результаты развития технологии баз данных (БД) за последние 30 лет по праву считают наиболее важ­ным достижением информатики, оказавшим огром­ное влияние на экономику. Достижения в исследо­ваниях БД стали основой фундаментальных разра­боток коммуникационных систем, систем админист­ративного управления, транспорта, логистики, финансового менеджмента, систем с базами знаний, методов доступа к научной литературе, а также большого количества гражданских и военных приложе­ний. БД стали основой информационных систем (ИС) и это коренным образом изменило методы работы многих организаций. БД стали неотъемлемой частью нашей повседневной жизни

Основные понятия БД

Теперь определим некоторые понятия, необходимые для обсуждения технологии БД.

Система, предназначенная для ввода, хранения, обработки, поиска и распространения информации, называется информационной системой. Такая система в первую очередь призвана облегчить труд человека, но для этого она должна как можно лучше соответство­вать очень сложной модели реального мира.

Ядром информационной системы являются храни­мые в ней данные. Совокупность логически взаимосвя­занных, хранящихся вместе данных, расположенных на машинных носителях, называют базой данных. К особенностям БД следует отнести минимальную из­быточность данных, а также то, что одна и та же сово­купность данных может использоваться большим чис­лом пользователей. Таким образом, состав БД должен определяться информационными потребностями всех ее пользователей.

Центральную роль в управлении процессами в БД играет система управления БД — СУБД. Она представ­ляет собой специальное программное обеспечение, ко­торое позволяет пользователю работать с базой данных (создавать БД, поддерживать ее в актуальном состоя­нии, обеспечивать всем пользователям эффективный доступ к данным в рамках их полномочий и др.).

Пользователь ИС — тот, кто работает с И С, решает с ее помощью свои задачи. Под пользователем можно понимать отдельного работника или группу лиц, вы­полняющих одинаковые служебные обязанности.

Для реализации ИС используется широкий спектр технических средств — вычислительные, коммуникационные средства и другие, а также программных средств как общего назначения, так и специального.

Каждой ИС соответствует определенная предмет­ная область (ПО). Предметная область ИС — это ре­зультат целенаправленного взгляда пользователя на фрагмент реального мира, представление пользователя о нем. Такое представление пользователя ИС включает в себя данные, необходимые ему для принятия реше­ний или выполнения некоторого задания. Обычно представление пользователя отражает некоторую функциональную область деятельности предприятия — например, производство, маркетинг, сбыт, управление кадрами или складской учет.

Существуют разные способы описания ПО, при выборе которых преследуют цель наиболее полного и точного описания. Так, например, ПО можно описать через совокупность документов, содержащих всю информацию, необходимую пользователю для решения задач. Другим способом ПО можно описать как совокупность фактов (отдельных данных, не привязанных к каким либо документам).

БД, построенная на основе первого способа описания ПО, называется документальной, а на основе второго — фактографической (соответственно назы­вают и ИС, в основе которых лежат БД определенно то вида).

Выбор типа базы данных осуществляется исходя из решаемых управленческих и экономических задач.

Функционирование БД обеспечивается специальными программными средствами дифференцирование для документальных и фактографических систем. Пакеты прикладных программ (CDS/ISIS/M, Pro-Cite, ODB Text и др.), предназначенные для ввода, обработки, поиска и обновления текстов, называют информацион­но-поисковой системой (ИПС). Программные средства аналогичного назначения для фактографических БД (например, Foxpro, Access) называют системами управ­ления базой данных (СУБД).

 

Документальные базы данных

 

Особенности документальных БД. Документальные базы (и, соответственно, документальные информационные системы') построены по иному принципу, неже­ли фактографические, и ориентированы на решение принципиально иного класса задач.

Единицей хранения в таких базах является доку­мент, основная часть которого — неструктурированный текст. Документальная база предназначена для созда­ния, хранения и выдачи по запросам документов, со­держащих требуемую информацию. В ответ на запрос выдается не конкретная информация (как в фактогра­фических системах), а список документов, в определен­ной мере содержащих нужную пользователю информа­цию. Мера соответствия выдачи запросу оценивается релевантностью. Характерным для документальных систем является поиск смысловой (семантической) ин­формации. Примером запроса может быть следующий:выдать статьи, посвященные документальным БД (т. е. содержащие термин "документальные БД").

Поиск смысловой (семантической) информации предполагает сравнение смыслового содержания запроса со смысловым содержанием хранящихся в информаци­онной системе документов. Такая операция возможна только в том случае, когда существует некоторый язык представления информации, позволяющий однозначно описывать смысловое содержание документов и запро­сов. Естественный язык для этой цели не подходит в силу своей многозначности (выражающейся, например, синонимией и полисемией), избыточности (например, возможности перефразировки), высокой сложности и других свойств. Поэтому создают специальные языко­вые средства на основе естественного языка (ЕЯ), ко­торые носят названия информационно-поисковые языки (ИПЯ).

При наличии такого языка процесс функциониро­вания ИС состоит в следующем:

— перевод содержания документа и (или) запроса с естественного языка на ИПЯ (процесс индексиро­вания текстов). В результате индексирования пол­ный текст документа (запроса) заменяется некото­рой характеристикой, кратко отражающей его смыс­ловое содержание. Эта характеристика носит назва­ние поискового образа документа (ПОД) и (или) поискового образа запроса (ПОЗ). Иногда ПОЗ называют поисковым предписанием (ПП);

— представление ПОД и ПОЗ в машинных кодах (ко­дирование). Часто этот этап выполняют совместно с предыдущим. Организация массивов ПОД и ПОЗ. Обработка элементов этих массивов и представле­ние их в виде, наиболее удобном для поиска;

— поиск информации, т. е. выделение из поискового массива тех документов, содержание которых соот­ветствует поисковому предписанию. Эта операция осу­ществляется в соответствии с некоторым критерием смыслового соответствия поискового образа докумен­та поисковому образу запроса (критерий выдачи);

— выдача пользователю информации, соответствующей отобранным ПОД;

— корректировка запросов или ПП и повторение пре дыдущих этапов. Эта операция выполняется в том случае, если потребитель не удовлетворен работой АИПС, и может производиться либо в пакетном ре­жиме, либо в режиме диалога.

2.2.2.6.3.1.Характеристика информационно-поисковых язы­ков

.

Основными элементами ИПЯ являются алфавит, лексика и грамматика.

Алфавит ИПЯ — система знаков, используемых для записи слов и выражений ИПЯ. Это могут быть буквы русского и (или) английского языка, знаки препина­ния, арабские цифры, любые иные символы.

Лексика, или словарный состав ИПЯ, — совокупность слов, словосочетаний и выражений, используемых для построения текстов ИПЯ. В качестве лекси­ческих единиц ИПЯ могут быть использованы— слова, фрагменты слов, словосочетания и выраже­ния любого естественного языка;

— коды и шифры (цифровые, буквенные, буквенно-цифровые) словосочетаний, слов и выражений, вы­ступающие в роли имен соответствующих классов;

— шифры и коды в сочетании со словами, словосоче­таниями и выражениями.

Существуют различные способы задания словарно­го состава ИПЯ, в том числе:

— перечисление всех лексических единиц ИПЯ;

— перечисление части лексических единиц и задание правил формирования из них других лексических единиц;

— задание правил построения лексических единиц, слов и выражений естественного языка.

Грамматика ИПЯ — совокупность средств и спосо­бов построения, изменения и сочетания лексических еди­ниц. Грамматика включает морфологию и синтаксис. Морфология — совокупность средств и способов построе­ния и изменения слов. Синтаксис — совокупность средств и способов соединения слов в выражения и фразы.

С лексикой и грамматикой связаны два различных аспекта ИПЯ — парадигматика и синтагматика. Они обусловлены двумя видами отношений между словами, которые могут возникать при построении выражений на ИПЯ.

Построение выражений ИПЯ связано с решением, по крайней мере, двух проблем.

Первая из них — выбор слов (лексических единиц) из множества лексических единиц ИПЯ, необходимых для построения выражений. Выбор слов определяется их смысловыми значениями, обусловленными отноше­ниями между предметами и явлениями, которые они определяют. Такие отношения называются парадигма­тическими (это отношения, обусловленные наличием не языковых, а логических связей между предметами и явлениями, обозначенными данными словами). Наибо­лее важны следующие парадигматические отношения — "род — вид" (например, "управленческая докумен­тация— приказ"); родовое понятие всегда включает в себя видовое; — "часть— целое", например " текст— документ".

Вторая проблема построения фраз ИПЯ связана с определением последовательности употребления или написания выбранных слов (словосочетаний). Отноше­ния, устанавливаемые при соединении слов в словосо­четания и фразы, носят название синтагматических от­ношений (это совокупность всех отношений, реализуе­мых синтаксисом ИПЯ). С этой точки зрения синтак­сис представляет собой совокупность способов и средств выражения синтагматических отношений. Простейшим видом синтагматических отношений является отноше­ние вхождения нескольких лексических единиц ИПЯ в один и тот же текст, фрагмент текста, фразу и прочее, т. е. отношение координации. Иногда говорят: ИПЯ без грамматики. Но поскольку ни один ИПЯ не может функционировать без синтаксиса, выражающего син­тагматические отношения между его словами, инфор­мационно-поисковые языки без грамматики фактичес­ки не существуют.

Многообразие используемых в ИПЯ парадигмати­ческих и синтагматических отношений определяет смысловыразительную способность, или семантическую силу ИПЯ.

К ИПЯ предъявляют следующие требования:

1. ИПЯ должен располагать лексико-грамматическими средствами для точного выражения основного содержания (центральной темы или предмета) текста. Это связано с необходимостью представления текстов на семантическом уровне и является обязательной пред­посылкой обеспечения смысловыразительной способно­сти ИПЯ.

2. ИПЯ не должен быть двусмысленным. Любое выражение ИПЯ должно пониматься вполне однознач­но, что связано с необходимостью устранения много­значности, присущей естественному языку и недопустимой для ИПЯ в силу того, что приемником текстов ИПЯ является ЭВМ, а не человек.

3. ИПЯ не должен содержать элементов, отобража­ющих волевое побуждение, эмоции и т.д. Выражение ИПЯ, его значение, смысл не должны зависеть от "на­строения" приемника информации.

4. ИПЯ должен быть удобным для алгоритмизации (чтобы упростить сопоставление поисковых образов документа и запроса).

Типология информационно-поисковых языков. По характеру использования грамматических средств раз­личают прекоординированные и посткоординированные ИПЯ.

Прекоординированные ИПЯ

Прекоординированные ИПЯ — это ИПЯ, словарный состав которых жестко связан грамматическими сред­ствами в единую структуру. Лексика и грамматика та­кого языка, а также синтаксис, морфология, все пара­дигматические и синтагматические отношения самосто­ятельно не существуют, а образуют единую жесткую связанную структуру. Индексирование текстов (пере­вод текстов на ИПЯ) выполняется только с использо­ванием элементов такой жесткой структуры. По сути дела, каждый ИПЯ этого типа представляет собой не­которую систему классификации, поэтому языки дан­ного типа называют классификационными. Преимуще­ствами таких языков является логичность и понятность их построения и простота индексирования. К недостат­кам следует отнести сложность их модернизации и не­возможность поиска по любому, заранее не заданному сочетанию признаков. К предкоординированным язы­кам относят:

— перечислительные классификации. Они представля­ют собой перечислительный список рубрик (клас­сов), не связанных друг с другом отношениями под­чинения. Список может быть упорядочен по како­му-либо принципу (например, по алфавиту). При­мерами таких классификаций являются структуры различного рода каталогов и указателей; — иерархические классификации. Термины в них упо­рядочены "от общего к частному" или "от рода к виду", т. е. между ними установлены отношения соподчинения. Такие классификации имеют одну верхнюю рубрику, к


Поделиться с друзьями:

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Состав сооружений: решетки и песколовки: Решетки – это первое устройство в схеме очистных сооружений. Они представляют...

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.108 с.