В случае, если вы хотите очистить от «мусора» отдельный блок (участок изображения, выделенный в рамку), то из менюИзображение выберите командуОчистить блок от мусора.
Важно:В случае, если исходный текст был очень светлым или в исходном тексте использовался очень тонкий шрифт, то применение функцииОчистить изображение может привести к исчезновению точек, запятых или тонких элементов букв, что ухудшает качество распознавания.
Важно:В случае, если вы сканируете или открываете «замусоренные» изображения, то перед тем, как поместить в пакет программы подобные изображения обратитесь к разделуОбработка изображений, который находится на закладкеСканирование/Открытие(доступ:Сервис к Опции ) активизируйте опциюОчистить изображение от мусора.
Как инвертировать изображение
Некоторые сканеры переводят черный цвет в белый, а белый в черный. Для того, чтобы получить стандартное представление документа (черный шрифт на белом фоне из менюИзображениевыберите командуИнвертировать.
Важно:В случае, если вы открываете инвертированные изображения, то перед добавлением в пакет программы таких изображений в разделеОбработка изображений на закладкеСканирование/Открытие(доступ:Сервис к Опции ) обязательно активизируйте опциюИнвертировать.
Как повернуть или зеркально отразить изображение
В процессе распознавания изображение должно иметь стандартную ориентацию: текст должен читаться сверху вниз, и строки должны быть горизонтальными. По умолчанию программа при распознавании определяет и корректирует ориентацию изображения автоматически.
В случае, если ориентация изображения была определена ошибочно, то на закладке Сканирование/Открытие дезактивируйте опциюОпределять ориентацию страницы(в процессе распознавания) и поверните изображение вручную.
•Как повернуть изображение на 90 градусов вправо — выберите из менюИзображениекомандуПовернуть по часовой стрелке на 90 градусов влево — выберите из менюИзображениекомандуПовернуть против часовой стрелки. на 180 градусов — выберите из менюИзображение командуПовернуть на 180 градусов.
• Вы можете отразить изображение относительно: горизонтальной прямой — выберите из менюИзображениекомандуЗеркальное отражение относительно горизонтали. вертикальной прямой — выберите из менюИзображениекомандуЗеркальное отражение относительно вертикали.
Как удалить фрагмент изображения
В случае, если вы хотите исключить какой-то участок текста из распознавания или у вас на изображении имеются большие участки мусора, то вы имеете возможность стереть его. Для этого:
Выберите инструмент (на панели в диалоговом окнеИзображение ) и, нажав на левую кнопку мыши, выделите участок изображения, который вы хотите удалить. Отпустите кнопку, выделенная часть изображения будет удалена.
Как изменить масштаб изображения
На панелиИзображение(в диалоговом окнеИзображение ) выберите инструмент и щелкните левой кнопкой мыши на изображении.Изображение увеличится/уменьшится в два раза.
Нажмите правой кнопкой мыши на изображение и из меню выберите командуМасштаб и нужный вам масштаб.
Как получить информацию об изображении
• Вы имеете возможность получить следующую информацию об открытом изображении: ширину и высоту изображения в точках; вертикальное и горизонтальное разрешение в точках на дюйм (dpi); тип изображения.
Нажмите правой кнопкой на изображение и из меню выберите командуСвойства. В раскрывшемся диалоговом окне выберите закладкуИзображение.
Отменить последнее действие
Для отмены последнего действия на панелиСтандартная просто нажмите на кнопкуОтменить.
Важно:Для повторного выполнения последнего отмененного действия на панелиСтандартная просто нажмите на кнопкуВернуть.
Нумерация страниц при добавлении в пакет
По умолчанию каждой сканируемой странице присваивается номер на единицу больший номера последнего изображения в пакете.
Вы имеете возможность задать номер добавляемой страницы и вручную (например, вам необходимо сохранить исходную нумерацию страниц или вы сканируете стопку сортированных по порядку страниц). Для этого активизируйте опциюЗапрашивать номер страницы при добавлении в пакет на закладкеСканирование/Открытие(доступ: Сервис к Опции ).
В диалоговом окнеНомер страницы укажите номер страницы, с которой начинается сканирование и выберите опциюЧерез одну в полеНумерация страниц. Выберите способ нумерации страниц: по возрастанию или по убыванию. Возрастание или убывание зависит, например, от того, как вы кладете стопку в автоподатчик — находятся ли меньшие или большие номера наверху.
Уменьшать разрешение цветного/серого изображения до 100 dpi
Эта опция используется при добавлении в пакет цветных изображений большого размера. В этом случае, во-первых, пакет будет занимать меньше места на диске, а во-вторых, процесс обработки группы страниц будет происходить быстрее.
Важно:Эта опция не влияет на качество распознавания текста. Данное уменьшение разрешения влияет на качество сохраняемых картинок: разрешение картинок уменьшается до 100 dpi.
Как преобразовать цветное/серое изображение в черно-белое
Отметьте эту опцию при сканировании через TWAIN-диалог сканера в сером режиме (с автоподбором яркости) или при сканировании в цвете, если при этом сканируемые документы не содержат цветных картинок, цветного шрифта и фона или же вам не требуется передача цвета в выходное изображение. В этом случае сохраняемые в пакет изображения будут занимать меньше места на диске.
Как проанализировать макет страницы
Прежде чем приступить к распознаванию, программа должна знать, какие участки изображения необходимо распознавать. Для этого проводится анализ макета страницы, во время которого выделяются блоки с текстом, картинки, таблицы и штрих-коды (для версии Office).
Анализ макета страницы может проводиться как автоматически, так и вручную. В большинстве случаев FineReader сам успешно справляется с анализом сложных страниц. Автоматический анализ производится по кнопке2-Распознать одновременно с распознаванием текста.
Важно:Отдельная процедура анализа макета страницы тоже доступна (доступ:Процесс к Анализ макета страницы ). Правда, при этом качество сегментации может быть ниже, так как при совместной процедуре распознавания и сегментации для анализа страницы используется дополнительная информация, полученная в процессе распознавания.
Глава 31.
Блоки
Типы блоков в OCR — системе ABBYY FineReader
Блоки — это заключенные в рамку участки изображения. Программой блоки выделяются для того с тем, чтобы указать OCR-системе, какие участки отсканированной страницы необходимо распознавать и в каком порядке. Кроме того по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок. Вы имеете возможность изменить цвета рамок блоков на закладкеВид диалогового окна к Опции(доступ: Сервис к Опции ) в разделеОбъекты. В полеОбъектвыберите нужный тип блока, а в полеЦвет — требуемый цвет.
Выделение блоков «вручную» может понадобиться, если:
• Вы хотите распознать часть страницы.
• В результате автоматического анализа блоки были выделены неправильно.
Совет:В некоторых случаях качество автоматического анализа можно улучшить, правильно установив опции анализа макета. Проверьте установленные опции анализа (закладкаРаспознавание, менюСервис к Опции ).