Секреты сканирования на ПК - Леонтьев Б. К. 16 стр.


Для того, чтобы доустановить языки распознавания, запустите программу инсталляции FineReader в режиме покомпонентной установки (Установка дистрибутива по выбору), дезактивируйте все опции, за исключением опцииЯзыки распознавания, и просто нажмите на кнопкуСостав. В раскрывшемся списке языков укажите требуемые языки.

Важно:В процессе установке проверьте, что вы указали ту же папку, в которую вы ранее установили ABBYY FineReader.

Как подключить язык к списку отображаемых языков

В диалоговом окнеРедактор языков(доступ:Сервис к Редактор языков ) выберите язык, который вы хотите подключить, и дезактивируйте опциюПоказывать в списке языков.

Важно:Вы имеете возможность установить язык распознавания на отдельный блок. Для этого нажмите правой кнопкой мыши на блоке, для которого вы хотите установить язык распознавания, отличный от языка распознавания для всего текста, и из меню выберите командуСвойства. В раскрывшемся диалоговом окнеСвойства на закладкеБлокв полеЯзык распознаваниявыберите язык распознавания выделенного блока.

Тип печати входного текста

Для большинства текстов тип печати определяется автоматически. Этому соответствует значение Авто (доступ: разделТип печати, менюСервис к Опции, закладка Распознавание).

В процессе распознавания текстов, напечатанных на матричном принтере в черновом режиме или на пишущей машинке, можно добиться более высокого качества распознавания, установив правильныйТип печати: для текстов, набранных на пишущей машинке — значениеПишущая машинка. для текстов, напечатанных на матричном принтере — значениеМатричный принтер.

Как поменять тип печати

На закладке Распознавание диалогового окнаОпции(доступ:Сервис к Опции ) из разделаТип печативыберите нужную опцию.

Важно:После распознавания текстов, набранных на пишущей машинке или матричном принтере, не забудьте снова выбрать значениеАвто при возвращении к типографскому тексту.

Другие опции распознавания

Показывать или не показывать изображение при распознавании

Распознавание группы страниц происходит быстрее, если обрабатываемое изображение не отображается.

На закладкеОбщие(доступ:Сервис к Общие ) дезактивируйте опциюПоказывать изображение при распознавании.

Инвертировать блок

Для того, чтобы распознать инвертированные участки изображений (текстовый блок, ячейки таблицы или всю таблицу целиком) нажмите правой кнопкой мыши на инвертированном блоке и из меню выберите командуСвойства. В раскрывшемся диалоговом окнеСвойства блока активизируйте опциюИнвертированный.

Распознавание в фоновом режиме

В случае, если вы хотите одновременно с распознаванием редактировать распознанные страницы, вы имеете возможность запустить распознавание в фоновом режиме: из менюПроцесс выберите командуЗапустить фоновое распознавание.

В строке состояния появится значок. В случае, если для диалогового окнаПакет вами выбран режим показа свойства страниц (доступ:Вид к Вид со свойствами ), то напротив распознаваемой страницы в колонкеОткрыта появится специальный значок. В этом режиме распозна вание автоматически возобновляется, как только в пакете появляются нераспознанные страницы.

Как остановить распознавание в фоновом режиме

Из менюПроцессвыберите командуОстановить фоновое распознавание.

Важно:В программе abbyy finereader в режимеРаспознавание в фоновом режиме используются опции, установленные в программе до запуска фонового распознавания.

Глава 33.

Как обучить FineReader

Распознавание с обучением

• В программе ABBYY FineReader тексты хорошего и среднего качества, а также шрифты обычного начертания распознаются без предварительного обучения.

Поэтому OCR-система может работать в режимеРаспознавание с обучением, который позволяет вводить тексты разного качества, набранные практически любыми шрифтами. В режимеРаспознавание с обучением вы можете: распознавания текстов, использующих декоративные шрифты; распознавания текстов, в котором встречаются специальные символы (например, отдельные математические символы); распознавания большого объема (более 100 страниц) текста плохого качества.

В других случаяхРаспознавание с обучением использовать не рекомендуется, так как затраты на обучение будут больше, чем полученный выигрыш в качестве распознавания.

Обучение проводится при распознавании одной-двух страниц текста в специальном режиме. В результате создается эталон букв, встречающихся в тексте. Этот эталон в дальнейшем используется при распознавании основного объема текста. Некоторые пары или тройки символов в тексте могут склеиваться. В случае, если при обучении вам не удается переместить описывающий прямоугольник так, чтобы он заключал в себя один целый символ и не содержал при этом части соседних, то вы имеете возможность обучить программу сочетанию символов, которые невозможно «расклеить». Такие неразделяемые сочетания двух или трех символов называются лигатурами.

Важно:Созданный эталон можно использовать только для распознавания текстов, использующих тот же шрифт и размер шрифта и отсканированных с тем же разрешением, как и документ, на котором данный эталон создавался.

В процессе удаления пакета эталон также удаляется.

Вы имеете возможность сохранить созданный эталон для работы с другими пакетами. Для этого сохраните настройки пакета в формате шаблона пакета (*.fbt).

В процессе перехода к распознаванию текстов, набранных другим шрифтом, не забудьте отключить эталон ( Сервис к Опции к Распознавание ) активизируйте переключательНе использовать пользовательский эталон.

Как начать распознавать с обучением

Установите режимРаспознавание с обучением(на закладкеРаспознавание, менюСервис к Опции в разделеРаспознавание с обучением активизируйте переключательРаспознавание с обучением ). В строке состояния появится название эталона (по умолчаниюdefault ).

Нажмите на кнопку2-Распознать.

Обучите эталон, распознав одну-две страницы в режиме распознавание с обучением.

Обучаемые символы заносятся в эталон, создаваемый системой по умолчанию. По окончании обучения OCR-система сохранит созданный эталон (default.ptn) в папке, где хранится пакет.

Отредактируйте эталон.

Отмените режимРаспознавание с обучением(на закладкеРаспознавание в разделеОбучение установите переключательРаспознавание с пользовательским эталоном ).

Запустите распознавание основного текста, нажав на кнопку2-Распознать.

Важно:Для того, чтобы создать несколько эталонов на один пакет, воспользуйтесь диалогомРедактор эталонов(доступ: Сервис к Редактор эталонов ). Создайте новый эталон (нажмите в диалоговом окне на кнопкуНовый ) и выберите его для работы (нажмите на кнопкуВыбрать ). Далее работа с созданным эталоном происходит так же, как и работа с default-эталоном.

В случае, если в процессе обучения было создано несколько эталонов, то подключается последний созданный эталон. Название подключенного эталона пишется в строке состояния.

Для того, чтобы подключить другой эталон для распознавания, в диалоговом окнеРедактор эталонов(доступ:Сервис к Редактор эталонов ) в списке эталонов выберите эталон и просто нажмите на кнопкуВыбрать. На закладке

Распознаваниев разделеОбучение активизируйте переключательРаспознавание с пользовательским эталоном.

Назад Дальше