Для того, чтобы доустановить языки распознавания, запустите программу инсталляции FineReader в режиме покомпонентной установки (Установка дистрибутива по выбору), дезактивируйте все опции, за исключением опцииЯзыки распознавания, и просто нажмите на кнопкуСостав. В раскрывшемся списке языков укажите требуемые языки.
Важно:В процессе установке проверьте, что вы указали ту же папку, в которую вы ранее установили ABBYY FineReader.
Как подключить язык к списку отображаемых языков
В диалоговом окнеРедактор языков(доступ:Сервис к Редактор языков ) выберите язык, который вы хотите подключить, и дезактивируйте опциюПоказывать в списке языков.
Важно:Вы имеете возможность установить язык распознавания на отдельный блок. Для этого нажмите правой кнопкой мыши на блоке, для которого вы хотите установить язык распознавания, отличный от языка распознавания для всего текста, и из меню выберите командуСвойства. В раскрывшемся диалоговом окнеСвойства на закладкеБлокв полеЯзык распознаваниявыберите язык распознавания выделенного блока.
Тип печати входного текста
Для большинства текстов тип печати определяется автоматически. Этому соответствует значение Авто (доступ: разделТип печати, менюСервис к Опции, закладка Распознавание).
В процессе распознавания текстов, напечатанных на матричном принтере в черновом режиме или на пишущей машинке, можно добиться более высокого качества распознавания, установив правильныйТип печати: для текстов, набранных на пишущей машинке — значениеПишущая машинка. для текстов, напечатанных на матричном принтере — значениеМатричный принтер.
Как поменять тип печати
На закладке Распознавание диалогового окнаОпции(доступ:Сервис к Опции ) из разделаТип печативыберите нужную опцию.
Важно:После распознавания текстов, набранных на пишущей машинке или матричном принтере, не забудьте снова выбрать значениеАвто при возвращении к типографскому тексту.
Другие опции распознавания
Показывать или не показывать изображение при распознавании
Распознавание группы страниц происходит быстрее, если обрабатываемое изображение не отображается.
На закладкеОбщие(доступ:Сервис к Общие ) дезактивируйте опциюПоказывать изображение при распознавании.
Инвертировать блок
Для того, чтобы распознать инвертированные участки изображений (текстовый блок, ячейки таблицы или всю таблицу целиком) нажмите правой кнопкой мыши на инвертированном блоке и из меню выберите командуСвойства. В раскрывшемся диалоговом окнеСвойства блока активизируйте опциюИнвертированный.
Распознавание в фоновом режиме
В случае, если вы хотите одновременно с распознаванием редактировать распознанные страницы, вы имеете возможность запустить распознавание в фоновом режиме: из менюПроцесс выберите командуЗапустить фоновое распознавание.
В строке состояния появится значок. В случае, если для диалогового окнаПакет вами выбран режим показа свойства страниц (доступ:Вид к Вид со свойствами ), то напротив распознаваемой страницы в колонкеОткрыта появится специальный значок. В этом режиме распозна вание автоматически возобновляется, как только в пакете появляются нераспознанные страницы.
Как остановить распознавание в фоновом режиме
Из менюПроцессвыберите командуОстановить фоновое распознавание.
Важно:В программе abbyy finereader в режимеРаспознавание в фоновом режиме используются опции, установленные в программе до запуска фонового распознавания.
Глава 33.
Как обучить FineReader
Распознавание с обучением
• В программе ABBYY FineReader тексты хорошего и среднего качества, а также шрифты обычного начертания распознаются без предварительного обучения.
Поэтому OCR-система может работать в режимеРаспознавание с обучением, который позволяет вводить тексты разного качества, набранные практически любыми шрифтами. В режимеРаспознавание с обучением вы можете: распознавания текстов, использующих декоративные шрифты; распознавания текстов, в котором встречаются специальные символы (например, отдельные математические символы); распознавания большого объема (более 100 страниц) текста плохого качества.
В других случаяхРаспознавание с обучением использовать не рекомендуется, так как затраты на обучение будут больше, чем полученный выигрыш в качестве распознавания.
Обучение проводится при распознавании одной-двух страниц текста в специальном режиме. В результате создается эталон букв, встречающихся в тексте. Этот эталон в дальнейшем используется при распознавании основного объема текста. Некоторые пары или тройки символов в тексте могут склеиваться. В случае, если при обучении вам не удается переместить описывающий прямоугольник так, чтобы он заключал в себя один целый символ и не содержал при этом части соседних, то вы имеете возможность обучить программу сочетанию символов, которые невозможно «расклеить». Такие неразделяемые сочетания двух или трех символов называются лигатурами.
Важно:Созданный эталон можно использовать только для распознавания текстов, использующих тот же шрифт и размер шрифта и отсканированных с тем же разрешением, как и документ, на котором данный эталон создавался.
В процессе удаления пакета эталон также удаляется.
Вы имеете возможность сохранить созданный эталон для работы с другими пакетами. Для этого сохраните настройки пакета в формате шаблона пакета (*.fbt).
В процессе перехода к распознаванию текстов, набранных другим шрифтом, не забудьте отключить эталон ( Сервис к Опции к Распознавание ) активизируйте переключательНе использовать пользовательский эталон.
Как начать распознавать с обучением
Установите режимРаспознавание с обучением(на закладкеРаспознавание, менюСервис к Опции в разделеРаспознавание с обучением активизируйте переключательРаспознавание с обучением ). В строке состояния появится название эталона (по умолчаниюdefault ).
Нажмите на кнопку2-Распознать.
Обучите эталон, распознав одну-две страницы в режиме распознавание с обучением.
Обучаемые символы заносятся в эталон, создаваемый системой по умолчанию. По окончании обучения OCR-система сохранит созданный эталон (default.ptn) в папке, где хранится пакет.
Отредактируйте эталон.
Отмените режимРаспознавание с обучением(на закладкеРаспознавание в разделеОбучение установите переключательРаспознавание с пользовательским эталоном ).
Запустите распознавание основного текста, нажав на кнопку2-Распознать.
Важно:Для того, чтобы создать несколько эталонов на один пакет, воспользуйтесь диалогомРедактор эталонов(доступ: Сервис к Редактор эталонов ). Создайте новый эталон (нажмите в диалоговом окне на кнопкуНовый ) и выберите его для работы (нажмите на кнопкуВыбрать ). Далее работа с созданным эталоном происходит так же, как и работа с default-эталоном.
В случае, если в процессе обучения было создано несколько эталонов, то подключается последний созданный эталон. Название подключенного эталона пишется в строке состояния.
Для того, чтобы подключить другой эталон для распознавания, в диалоговом окнеРедактор эталонов(доступ:Сервис к Редактор эталонов ) в списке эталонов выберите эталон и просто нажмите на кнопкуВыбрать. На закладке
Распознаваниев разделеОбучение активизируйте переключательРаспознавание с пользовательским эталоном.