Секреты сканирования на ПК - Леонтьев Б. К. 18 стр.


Для того, чтобы наполнить словарь или подключить старый пользовательский словарь или текстовый файл в Windows-кодировке (слова должны быть разделены пробелами или другими символам, не включенными в алфавит), просто нажмите на кнопкуРедактировать.

Важно:Словарные слова пользовательского языка считаются правильными, если в тексте они встретились с той капитализацией, в которой они заданы в словаре, а также в каком-либо стандартном виде: всеми маленькими, всеми большими буквами или с большой буквы.

• Вид слова в словаре. Допустимые варианты написания слова в тексте:

• abc abc, Abe, ABC

• Abc abc, Abc, ABC

• ABC abc, Abc, ABC

• aBc aBc, abc, Abc, ABC

• Регулярное выражение (задается грамматика нового языка).

Важно:Нажав в диалоговом окнеСвойства языков на кнопкуДополнительно, вы имеете возможность указать дополнительные свойства нового языка, например, игнорируемые внутри слова символы или исключенные из распознавания символы.

Как создать новую группу языка

Важно:Эта возможность имеется только в версииFineReader Office.

В случае, если при распознавании текстов вы часто используете некоторое сочетание языков, то вы имеете возможность создать группу, в которую объединены эти языки. Созданная группа появится в списке языков на панелиСтандартная.

Важно:Вы имеете возможность указать комбинацию языков непосредственно в списке языков на панелиСтандартная. Для этого выберите в списке строкуВыбор нескольких языков. В раскрывшемся диалоговом окнеЯзык распознаваемого текста активизируйте необходимые языки.

Как создать группу языков для распознавания

Из менюСервис выберите командуРедактор языкови просто нажмите на кнопкуНовый. В раскрывшемся диалоговом окне выберите командуСоздать новую группу.

Перед вами откроется диалоговое окноСвойства группы языков. Здесь вам необходимо задать для новой группы языков (все параметры устанавливаются в диалоговом окнеСвойства группы )Имя группы иПодключенные языки.

Важно:Вы имеете возможность указать символы, которые заведомо не встречаются в распознаваемом документе. Указание таких символов может существенно увеличить скорость и надежность распознавания. Для этого в диалоговом окнеСвойства группы языков просто нажмите на кнопкуДополнительно и в диалоговом окнеДополнительные свойства новой группы активизируйте соответствующие символы.

Глава 34.

Как проверить и отредактировать распознанный текст

После завершения распознавания результат появляется в диалоговом окнеТекст. Диалоговое окноТекст — это встроенный редактор программы FineReader; в нем вы имеете возможность проверить результаты распознавания искорректировать распознанный текст.

Одна из возможностей текстового редактора FineReader — это встроенная проверка орфографии.

Система встроенной проверки орфографии дает возможность:

• Находить неуверенно распознанные слова (слова, в которых имеется неуверенно распознанные символы).

• Находить орфографические ошибки (неправильно написанные слова).

• Добавлять неизвестные системе FineReader слова в словарь для того, чтобы они распознавались уверенно.

Неуверенно распознанные символы и слова, которые отсутствуют в словаре, выделяются различными цветами. По умолчанию для выделения неуверенно распознанных символов используется голубой, для несловарных слов — розовый. Для того, чтобы изменить цвета на закладкеВид(доступ:Сервис к Опции ) в поле Объект выберите командуНеуверенно распознанный символ( Несловарное слово ) и в полеЦвет — цвет подсветки.

Как проверить результаты распознавания

Нажмите на кнопкуЗ-Проверить на панелиScan amp;Read(или выберите команду Проверка из менюСервис ).

Проверка дает возможность найти в тексте слова, содержащие неуверенно распознанные символы, несловарные слова, а также слова с орфографическими ошибками (клавиатурный эквивалент:F7 ).

Откроется диалоговое окноПроверка.

В диалоговом окнеПроверка имеется три окна. Верхнее диалоговое окно — аналог окнаКрупный план, в котором отображено изображение слова с возможной ошибкой. Среднее диалоговое окно показывает само слово с возможной ошибкой, в строке над этим диалоговым окном выводится название типа ошибки. В нижнем диалоговом окнеВарианты предлагаются варианты замены данного слова, для которых используется словарь, активизированный вами в спискеЯзык словаря.

Важно:Для удобства проверки и редактирования текста диалоговое окноПроверка может быть увеличено. Для этого достаточно поместить указатель мыши на границу диалогового окна (указатель превратится в двустороннюю стрелку). Перетаскивая границу, увеличьте или уменьшите размеры диалогового окна.

У вас имеется следующие возможности:

• Нажмите на кнопкуПропустить с тем, чтобы оставить слово, как есть.

• Нажмите кнопкуПропустить все с тем, чтобы оставить все такие слова в распознанном тексте, как есть.

Выберите вариант для замены и просто нажмите на кнопкуЗаменить илиЗаменить все с тем, чтобы заменить текущее слово или все такие слова в тексте. В случае, если в диалоговом окнеВариантыотсутствует правильный вариант для замены слова, скорректируйте его в среднем диалоговом окне и для того с тем, чтобы заменить текущее слово просто нажмите на кнопкуПодтвердить.

Нажмите на кнопкуДобавить, для того чтобы добавить слово в словарь. В этом случае при дальнейшей проверке орфографии, если это слово (или одна из его форм) встретится в тексте, оно не будет считаться ошибочным.

Нажмите на кнопкуОпциис тем, чтобы установить опции проверки распознанного текста.

НажмитеЗакрытьс тем, чтобы закрыть диалоговое окно.

Опции проверки и редактирования текста

Устанавливаются на закладкеПроверка(доступ:Сервис к Опции ).

Уровень выделения ошибок

В спискеУровень выделения ошибок возможно выбрать следующие значения:

•Нет— ошибки распознавания не выделяются.

•Стандартный— цветом выделяются нераспознанные и неуверенно распознанные символы.

•Максимальный— помимо нераспознанных и неуверенно распознанных символов, цветом выделяются слова, которые отсутствуют в словаре языка распознавания.

Важно:Количество отображаемых в диалоговом окнеТекстошибок будет изменено после повторного распознавания документа.

•Останавливаться на неуверенно распознанных словах— система при проверке орфографии останавливается на словах, в которых были неуверенно распознаны какие-либо буквы.

•Останавливаться на несловарных словах — эта опция позволит вам проверить слова, которые отсутствуют в словаре и которые могли быть неверно распознаны системой.

•Останавливаться на сложных словах — в процессе проверки орфографии OCR-система останавливается на словах, которые отсутствуют в словаре, но которые могут быть построены по имеющимся морфологическим моделям или которые могут быть составлены из имеющихся в словаре слов.

•Игнорировать слова с цифрами и другими неалфавитными символами — в процессе проверки орфографии слова, внутри которых встречаются цифры или какие-либо другие символы, не входящие в алфавит языка распознавания, не считаются ошибочными, если эти слова не содержат неуверенно распознанные символы.

•Корректировать пробелы до и после знаков препинания —в случае, если эта опция активизирована, то ocr-система не будет останавливаться на тех фрагментах, где неверно расставлены пробелы до и после знаков препинания, а исправит их автоматически.

Назад Дальше