Программы распознавания текста (OCR) — КиберПедия 

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

Программы распознавания текста (OCR)

2017-11-17 241
Программы распознавания текста (OCR) 0.00 из 5.00 0 оценок
Заказать работу

Применяя сканер можно не только получать "электронные" фотографии, но и использовать его для преобразования текста, напечатанного на бумаге в "текст пригодный для редактирования".

Конечно текст сам собой превращаться не будет - необходима программа распознавания текста (OCR) - например FineReader.

Принцип действия таких программ следующий: сканируется фотография текста, затем методом сравнения множества образцов, черно-белая фотография (читай: картинка текста) преобразуется в "обычный текст", такой, если бы вы его напечатали с клавиатуры.

Пользователю остается только сохранить текст на диске или скопировать его через буфер обмена в любой текстовый редактор.

FineReader автоматически распознает разные участки текста: текст как таковой, картинку (рисунок), таблицу и так называемые "нераспознаваемые" блоки.

Несколько слов о параметрах сканирования. Для "хорошего" текста (белая бумага, качественная печать) достаточно разрешения 200 dpi. Газетные статьи и текст, отпечатанный на матричном принтере, сканируйте с разрешением 300 - 400 dpi.

В программе есть возможность "настройки" на конкретный текст (меню - сервис - параметры - установки сканера). Если вы сканируете документ из графического редактора - устанавливайте режим "B\W" и разрешение 300 dpi.

Перед началом работы следует включить сканер и положить оригинал (обычно лицом вниз, если только вы не используете ручной сканер).

После запуска FineReader появляется "совет дня" - краткое описание какой-либо операции. Для продолжения работы вам нужно закрыть это окно. Шпаргалка - необходима лишь самым "ленивым" пользователям.

 

На панели инструментов находятся кнопки "сканировать", "выделить блоки" и "распознать". Можно выполнять указанные операции и через меню (Scan&Read).

Для получения "фотографии текста" используем кнопку "сканировать". Наш компьютер все ресурсы во время выполнения этой операции отдает сканеру.

На рисунке: фрагмент окна FineReader с "распознанным" текстом.

Когда процесс завершается, вы увидите окно с изображением текста.

Ручную установку блоков[80] (рамка с помощью левой кнопки мыши) применяйте, если нужно распознать только часть текста.

Для большинства случаев сразу нажимайте на кнопку инструмента "распознать" и подтвердите автоматическое определение блоков. Процесс распознавания будет "иллюстрироваться" серой закраской участков текста.

В новом окне с именем "текст" вы увидите распознанный программой текст, который был напечатан на листе бумаги.

Возможно, вам придется исправить ошибки, так как точность распознавания FineReader около 92- 97 %, да и при печати книг и газет на бумаге иногда не прилипает или осыпается краска. Это хорошо видно в окне "крупный план" с увеличенным масштабом. Как только вы измените положение курсора в окне "текст" или "увеличительного стекла" в окне "image", поменяет позицию и "крупный план".

Чтобы отправить текст в буфер обмена необходимо его выделить (редактирование - выделить все), а затем использовать команду "копировать", доступную из меню или через панель инструментов.

Если вы будете распознавать и другие документы, тогда сохраните содержимое окна текст в виде файла (инструмент "дискета" или команда меню - файл - сохранить.

К сведению: на панели инструментов есть "поля" с режимами распознавания ("авто" и "русско-английский"). Для сканирования документов с другим языком выберите нужный из списка.

ВОПРОСЫ И ЗАДАНИЯ:

1. Какие типы сканеров вы знаете?

2. Что такое "разрешение", в каких единицах оно измеряется?

3. Даны две оцифрованные картинки. Первая - получена в режиме "Gray", вторая в режиме "Color". Какая из них будет занимать больше места на жестком диске, если при сканировании использовался один и тот же образец?

4. Назначение и сфера применения программ OCR

5. Можно ли распознать фотографию текста записанную в виде файла?

6. Какой стороной нужно помещать "оригинал" в сканер?

7. Какие типы распознаваемых блоков вы знаете?

8. Как распознать только часть текста сканируемого документа?

9. Опишите последовательность сканирования фотографии в редакторе растровой графики.

10.С каким разрешением Вы будете сканировать большую фотографию, которую в дальнейшем собираетесь показывать на экране компьютера?

 



Поделиться с друзьями:

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.007 с.