Редактирование текста в редакторе FineReader'a — КиберПедия 

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

Редактирование текста в редакторе FineReader'a

2017-05-23 1366
Редактирование текста в редакторе FineReader'a 0.00 из 5.00 0 оценок
Заказать работу

Если символы в текстовом окне FineReader отображаются некорректно (в словах на месте некоторых букв стоят значки "?" или "□"), это означает, что шрифты, выбранные на закладке Форматирование, не содержат всех символов, входящих в распознаваемый язык. Установите шрифт (группа Шрифты, меню Сервис > Опции, закладка Форматирование), поддерживающий все символы языка документа и перераспознайте документ.

Распознанный текст выводится в окно Текст. Текстовый редактор программы не показывает исходное оформление документа: деление на строки сохраняется; распознанный текст, картинки, таблицы располагаются подряд в порядке номеров блоков; содержимое блоков разделяется пунктирной линией. При сохранении текста в приложение оформление документа сохраняется в соответствии с опциями форматирования, устанавливаемыми на закладке Форматирование и в диалогах Форматы.

Неуверенно распознанные символы выделяются цветом. Вы можете отменить выделение слов с неуверенно распознанными символами: на закладке Вид (меню Сервис > Опции) снимите отметку с пункта Выделять неуверенно распознанные символы.

Для более удобного просмотра документа в окне Текст Вы можете установить черновой режим редактора. В черновом режиме редактора не отображаются картинки; левый отступ; выравнивание параграфа (все параграфы прижаты к левому краю); цвет и фон символов; для показа текста используется шрифт одного размера (по умолчанию 12 пт.). При этом сохраняется шрифт и форматирование текста: полужирный, курсив, подчеркнутый, верхние и нижние индексы.

Переход из одного режима в другой осуществляется нажатием на панели Форматирование кнопки . Если кнопка нажата, то форматирование отображается, если нет - текст показывается в черновом режиме.

Вы можете поменять установленный по умолчанию размер шрифта для показа в черновом режиме. Для этого:

1. В меню Сервис выберите пункт Опции.

2. На закладке Вид укажите нужный размер шрифта в пункте Размер шрифта в черновом режиме.

Редактор системы FineReader предоставляет следующие возможности по редактированию текста:

1. Копирование, перемещение, удаление выделенных фрагментов текста.

2. Поиск и замена указанного фрагмента текста.

3. Изменение начертания шрифта.

4. Отмена и восстановление действий.

Редактирование таблиц

При редактировании таблицы Вы можете:

1. Объединить содержимое ячеек или строк.

2. Разбить содержимое ячеек.

3. Разбить содержимое строки (столбца).

4. Удалить содержимое ячейки.

Чтобы объединить содержимое ячеек или строк:

Удерживая клавишу CTRL, выделите на изображении ячейки или строки, которые Вы хотите объединить. В меню Правка выберите пункт Объединить ячейки таблицы или Объединить строки таблицы.

Чтобы разбить содержимое ячеек:

В меню Правка выберите пункт Разбить ячейки таблицы.

Внимание! Команда применяется только к ранее объединенным ячейкам таблицы.

Чтобы разбить содержимое строки или столбца:

1. На панели Изображение выберите инструмент или .

2. Вставьте горизонтальную/вертикальную линию в строку/столбец таблицы, содержимое которых Вы хотите разделить.

Замечание. Воспользовавшись инструментом или командой меню Объединить строки таблицы (меню Правка), Вы можете объединить содержимое строк (столбцов).

Чтобы удалить содержимое ячейки:

В окне Текст выделите ячейку (или несколько ячеек), содержимое которой Вы хотите удалить, и нажмите клавишу DEL.

 

Рекомендации по оптимизации распознавания

Сканирование

Прежде всего нужно четко осознавать: чем лучше сканирование, тем меньше правки. Это очень важная составляющая. Перед выходом в свет книги её текст проходит через профессиональную корректуру, поэтому количество опечаток и пропущенных ошибок в книге мало. Подавляющее большинство всех помарок и ошибок текст приобретает после сканирования. И чем лучше настроить сканер и FineReader перед сканированием, тем меньше будет ошибок.

Под OCR будет рассматриваться как само сканирование, в т.ч. и графики, так и последующее распознавание с сохранением.

Перед тем, как приступить к довольно продолжительной операции сканирования, нужно определиться со следующими аспектами.

Яркость

Выставляется в зависимости от качества бумаги. Имеет смысл поэкспериментировать с разворотом книги (или с одной страницей), добиваясь наилучшего качества распознавания. Принцип тут ясен – чем желтее (темнее) бумага, тем выше яркость и наоборот. Если вы завышаете или занижаете чрезмерно яркость, FineReader вам об этом подскажет (если не отключили функцию "Показывать советы по время распознавания").

После того, как вы отрегулировали яркость, определимся с разрешением.

Разрешение

Оптимальное разрешение (без научных поисков и проб) при сканировании – 400 dpi. Если вы сканируете не каждый день, то примечание ниже можете игнорировать, – ставьте 400 точек. А если вы сканируете каждый день, то при снижении разрешения (ниже 400 dpi) резко снижается качество распознавания. Значит, у вас пока не выходит найти хороший баланс между разрешением и настройками сканера, или сканер плохой, или драйвер сканера плохой – тогда вы также ставьте 400 точек (и не ниже). Лучше потерять час на сканировании, чем затем 2 часа на правке.

Примечание. За счёт снижения разрешения можно сократить время сканирования. Но тогда вам (возможно) придется потратить лишнее время на правку. Всё зависит от качества печати и бумаги.

Вы можете снизить разрешение за счет обучения FineReader какому-то конкретному типу книг. Нужно создать мастер-шаблон на серию, если вы собираетесь сканировать много одинаково полиграфически исполненных книг. (Подробнее об этом см. в заметке по распознаванию с обучением, ниже).

Разрешение зависит от качества каждой отдельно взятой книги. Есть простейший способ выявить оптимальное разрешение для определенной книги. Если программа корректно распознает "п" и "н"; "о" и "р", "3" и "З" и "I" и "1" (то есть, не путает их друг с другом), значит, разрешение выбрано верно.

Область сканирования

Важно, чтобы в нее попадали номера страниц. Обычно область сканирования – это разворот книги. Если настроить область сканирования так, чтобы в неё попадали только страницы книги, но не внутреннее покрытие крышки сканера, то и время сканирования уменьшится, и качество будет гораздо выше.

Крышка при сканировании может мешать. Есть сканеры, где крышка снимается, без нее тоже можно нормально сканировать, это повышает производительность труда и экономит силы оператора.

Сгиб книги

Некоторые книги не хотят разворачиваться. И крышка сканера недостаточно тяжела, чтобы прижать книгу как следует. Но прижимать зачастую надо – лучше потратить 5 секунд на это, чем потом полчаса – на лишнюю правку или пересканирование. Но не доходите до крайностей. Корректное сканирование области при сгибе книги зависит от глубины резкости сканера. Большинство сканеров имеют достаточно хорошую глубину сканирования. А вот плоские (типа CanoScan), толщиной в 5 см – в этом качестве практически безнадёжны, книги ими не посканируешь. Достаточная глубина сканирования – 5-6 см., ее хватит для того, чтобы особо не прижимать книгу, а просто тщательней (но аккуратно) её раскрывать.

Распознавание

Поставим перед собой задачу задача отсканировать 4 книги: 1-я книга без картинок, только текст; 2-я книга с обильными картинками в тексте; 3-я книга двухколоночная; 4-я книга дореволюционная.


Поделиться с друзьями:

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.015 с.