Секреты сканирования на ПК - Леонтьев Б. К. 13 стр.


В случае, если вы хотите очистить от «мусора» отдельный блок (участок изображения, выделенный в рамку), то из менюИзображение выберите командуОчистить блок от мусора.

Важно:В случае, если исходный текст был очень светлым или в исходном тексте использовался очень тонкий шрифт, то применение функцииОчистить изображение может привести к исчезновению точек, запятых или тонких элементов букв, что ухудшает качество распознавания.

Важно:В случае, если вы сканируете или открываете «замусоренные» изображения, то перед тем, как поместить в пакет программы подобные изображения обратитесь к разделуОбработка изображений, который находится на закладкеСканирование/Открытие(доступ:Сервис к Опции ) активизируйте опциюОчистить изображение от мусора.

Как инвертировать изображение

Некоторые сканеры переводят черный цвет в белый, а белый в черный. Для того, чтобы получить стандартное представление документа (черный шрифт на белом фоне из менюИзображениевыберите командуИнвертировать.

Важно:В случае, если вы открываете инвертированные изображения, то перед добавлением в пакет программы таких изображений в разделеОбработка изображений на закладкеСканирование/Открытие(доступ:Сервис к Опции ) обязательно активизируйте опциюИнвертировать.

Как повернуть или зеркально отразить изображение

В процессе распознавания изображение должно иметь стандартную ориентацию: текст должен читаться сверху вниз, и строки должны быть горизонтальными. По умолчанию программа при распознавании определяет и корректирует ориентацию изображения автоматически.

В случае, если ориентация изображения была определена ошибочно, то на закладке Сканирование/Открытие дезактивируйте опциюОпределять ориентацию страницы(в процессе распознавания) и поверните изображение вручную.

•Как повернуть изображение на 90 градусов вправо — выберите из менюИзображениекомандуПовернуть по часовой стрелке на 90 градусов влево — выберите из менюИзображениекомандуПовернуть против часовой стрелки. на 180 градусов — выберите из менюИзображение командуПовернуть на 180 градусов.

• Вы можете отразить изображение относительно: горизонтальной прямой — выберите из менюИзображениекомандуЗеркальное отражение относительно горизонтали. вертикальной прямой — выберите из менюИзображениекомандуЗеркальное отражение относительно вертикали.

Как удалить фрагмент изображения

В случае, если вы хотите исключить какой-то участок текста из распознавания или у вас на изображении имеются большие участки мусора, то вы имеете возможность стереть его. Для этого:

Выберите инструмент (на панели в диалоговом окнеИзображение ) и, нажав на левую кнопку мыши, выделите участок изображения, который вы хотите удалить. Отпустите кнопку, выделенная часть изображения будет удалена.

Как изменить масштаб изображения

На панелиИзображение(в диалоговом окнеИзображение ) выберите инструмент и щелкните левой кнопкой мыши на изображении.Изображение увеличится/уменьшится в два раза.

Нажмите правой кнопкой мыши на изображение и из меню выберите командуМасштаб и нужный вам масштаб.

Как получить информацию об изображении

• Вы имеете возможность получить следующую информацию об открытом изображении: ширину и высоту изображения в точках; вертикальное и горизонтальное разрешение в точках на дюйм (dpi); тип изображения.

Нажмите правой кнопкой на изображение и из меню выберите командуСвойства. В раскрывшемся диалоговом окне выберите закладкуИзображение.

Отменить последнее действие

Для отмены последнего действия на панелиСтандартная просто нажмите на кнопкуОтменить.

Важно:Для повторного выполнения последнего отмененного действия на панелиСтандартная просто нажмите на кнопкуВернуть.

Нумерация страниц при добавлении в пакет

По умолчанию каждой сканируемой странице присваивается номер на единицу больший номера последнего изображения в пакете.

Вы имеете возможность задать номер добавляемой страницы и вручную (например, вам необходимо сохранить исходную нумерацию страниц или вы сканируете стопку сортированных по порядку страниц). Для этого активизируйте опциюЗапрашивать номер страницы при добавлении в пакет на закладкеСканирование/Открытие(доступ: Сервис к Опции ).

В диалоговом окнеНомер страницы укажите номер страницы, с которой начинается сканирование и выберите опциюЧерез одну в полеНумерация страниц. Выберите способ нумерации страниц: по возрастанию или по убыванию. Возрастание или убывание зависит, например, от того, как вы кладете стопку в автоподатчик — находятся ли меньшие или большие номера наверху.

Уменьшать разрешение цветного/серого изображения до 100 dpi

Эта опция используется при добавлении в пакет цветных изображений большого размера. В этом случае, во-первых, пакет будет занимать меньше места на диске, а во-вторых, процесс обработки группы страниц будет происходить быстрее.

Важно:Эта опция не влияет на качество распознавания текста. Данное уменьшение разрешения влияет на качество сохраняемых картинок: разрешение картинок уменьшается до 100 dpi.

Как преобразовать цветное/серое изображение в черно-белое

Отметьте эту опцию при сканировании через TWAIN-диалог сканера в сером режиме (с автоподбором яркости) или при сканировании в цвете, если при этом сканируемые документы не содержат цветных картинок, цветного шрифта и фона или же вам не требуется передача цвета в выходное изображение. В этом случае сохраняемые в пакет изображения будут занимать меньше места на диске.

Как проанализировать макет страницы

Прежде чем приступить к распознаванию, программа должна знать, какие участки изображения необходимо распознавать. Для этого проводится анализ макета страницы, во время которого выделяются блоки с текстом, картинки, таблицы и штрих-коды (для версии Office).

Анализ макета страницы может проводиться как автоматически, так и вручную. В большинстве случаев FineReader сам успешно справляется с анализом сложных страниц. Автоматический анализ производится по кнопке2-Распознать одновременно с распознаванием текста.

Важно:Отдельная процедура анализа макета страницы тоже доступна (доступ:Процесс к Анализ макета страницы ). Правда, при этом качество сегментации может быть ниже, так как при совместной процедуре распознавания и сегментации для анализа страницы используется дополнительная информация, полученная в процессе распознавания.

Глава 31.

Блоки

Типы блоков в OCR — системе ABBYY FineReader

Блоки — это заключенные в рамку участки изображения. Программой блоки выделяются для того с тем, чтобы указать OCR-системе, какие участки отсканированной страницы необходимо распознавать и в каком порядке. Кроме того по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок. Вы имеете возможность изменить цвета рамок блоков на закладкеВид диалогового окна к Опции(доступ: Сервис к Опции ) в разделеОбъекты. В полеОбъектвыберите нужный тип блока, а в полеЦвет — требуемый цвет.

Выделение блоков «вручную» может понадобиться, если:

• Вы хотите распознать часть страницы.

• В результате автоматического анализа блоки были выделены неправильно.

Совет:В некоторых случаях качество автоматического анализа можно улучшить, правильно установив опции анализа макета. Проверьте установленные опции анализа (закладкаРаспознавание, менюСервис к Опции ).

Назад Дальше