Описаны методы создания изображений на персональном компьютере с использованием так называемого сканирующего устройства: приведены характеристики ручных, листовых, планшетных, барабанных и слайд-сканеров. С помощью диска вы научитесь сканировать как черно-белые, так и цветные изображения, узнаете о глубине цвета, размере области сканирования, способах подключения сканера к персональному компьютеру, о том, как правильно выбрать сканер и соответствующее программное обеспечение.
Содержание:
Часть 1. - Сканирование и распознавание 1
Глава 1. - Как работает сканирующее устройство 1
Глава 2. - Ручные сканеры 1
Глава 3. - Листовые сканеры 2
Глава 4. - Планшетные сканеры 2
Глава 5. - Слайд-сканеры 3
Глава 6. - Барабанные сканеры 3
Глава 7. - Цветное сканирование 3
Глава 8. - Параметры сканеров 3
Глава 9. - Глубина цвета 3
Глава 10. - Размер области процесса сканирования 4
Глава 11. - Скорость процесса сканирования 4
Глава 12. - Способ подключения 4
Глава 13. - Драйверы 4
Глава 14. - Домашний сканер 4
Глава 15. - Как осуществляется сканирование в программе Adobe Photoshop TWAIN 4
Глава 16. - OCR - системы 5
Глава 17. - Сканирование 5
Глава 18. - Обработка 5
Глава 19. - Системы распознавания текстов в офисе 5
Глава 20. - Программа ABBYY FineReader 6
Глава 21. - Омнифонтовая OCR-система 7
Глава 22. - Установка программы 7
Глава 23. - Запуск программы 8
Глава 24. - Распознавание в программе FineReader 8
Глава 25. - Пакет 9
Глава 26. - Крупный план 10
Глава 27. - Клавиатурные эквиваленты для работы с окнами 10
Глава 28. - Сканирование TWAIN-интерфейс 10
Глава 29. - Процесс сканирования и распознавания печатного материала 11
Глава 30. - Сканирование многостраничных документов 11
Глава 31. - Блоки 13
Глава 32. - Распознавание 14
Глава 33. - Как обучить FineReader 15
Глава 34. - Как проверить и отредактировать распознанный текст 17
Глава 35. - Редактирование текста 18
Глава 36. - Редактирование таблиц 19
Глава 37. - Экспорт результатов распознавания во внешние приложения 19
Глава 38. - Описания основных команд меню 20
Часть 2. - Тонкости и хитрости 22
Глава 1. - Сканирование и обработка графических документов 22
Глава 2. - Обработка сканированных изображений для использования в различных системах САПР и ГИС 24
Глава 3. - Обработка сканированных изображений для использования в различных ГИС 25
Глава 4. - Цветопередача 26
Глава 5. - Использование цифровых камер 27
Глава 6. - Лазерные принтеры и сканеры 28
Глава 7. - Словарь 30
Б. К. Леонтьев
Секреты сканирования на ПК
Часть 1.
Сканирование и распознавание
Глава 1.
Как работает сканирующее устройство
В процессе ввода изображения в компьютер в первую очередь необходимо преобразовать его в последовательность электрических сигналов. Для этого используются так называемые фотоэлектронные элементы, которые проводят ток по-разному - в зависимости от яркости света, попадающего на их поверхность. В качестве примера можно привести известный всем фотодиод. Проводимость этого прибора пропорциональна его освещенности. Поэтому, пропуская через фотодиод электрический ток и измеряя напряжение на его выводах, можно определять значение попадающего на него светового потока.
При это помните, что в качестве светочувствительных элементов для сканирующих устройств обычные фотодиоды не используются. Вместо них применяются другие устройства, чаще всего - так называемые приборы с зарядовой связью (ПЗС). Они чувствительнее к незначительным перепадам яркости света и намного компактнее.
С помощью одиночного светочувствительного элемента можно измерить яркость только одной точки изображения, а чтобы считать всю поверхность, необходимо организовать целый массив фото датчиков. Так, в цифровых видеокамерах используется двумерная (прямоугольная) матрица ПЗС, на которую с помощью оптической системы объектива проецируется кадр.
В сканерах эта проблема решена по-другому. Светочувствительные ячейки располагаются в ряд, а полученная таким образом линейчатая сканирующая головка движется относительно оригинала (или оригинал относительно нее - это зависит от конструкции сканера), считывая все изображение строчка за строчкой. Подобным образом работает обычный фотоаппарат, где пленка засвечивается через узкую щель между шторками, которая перемещается от одного края кадра к другому.
В процессе ввода цветных изображений точность передачи оттенков в значительной степени зависит от освещения. Во избежание искажений цвета в каждом сканере предусмотрен встроенный источник света - высококачественная галогенная лампа. А "связующим звеном" между источником света, изображением на бумаге и матрицей ПЗС (размер которой намного меньше ширины листа) служит оптическая система, состоящая из линз и зеркал. С ее помощью поток света направляется на оригинал, а отраженные лучи фокусируются на светочувствительных элементах.
Кроме ПЗС, в сканерах могут использоваться фотодатчики других типов, в частности, так называемые фотоэлектронные умножители - ФЭУ (Photo Multiplier Tubes - РМТ). В этих приборах лучи, отраженные от оригинала, проходят между несколькими парами электродов, находящихся под высоким напряжением, за счет чего многократно усиливаются. Вследствие этого сканер с ФЭУ может различать детали даже на самых темных участках изображения.
И наконец, еще один тип светочувствительных приборов, применяемых в сканерах, - контактные оптические сенсоры (Contact Image Sensor - CIS).
Сканирующая головка, построенная на этой технологии, представляет собой линейку миниатюрных фотодатчиков, которые располагаются в непосредственной близости от оригинала. Это дает возможность обойтись без системы зеркал и линз, а следовательно, снизить цену сканера. Кроме этого помните, что качество изображений, считанных с использованием этих устройств, пока довольно низкое.
В процессе считывания двумерного изображения сканирующая головка движется относительно оригинала, а следовательно, неотъемлемой частью большинства сканеров является механизм, обеспечивающий их взаимное перемещение. Исходя из его наличия и конструкции различают следующие типы сканеров.
Глава 2.
Ручные сканеры
Эти устройства являются самыми простыми и дешевыми в своем классе. В их конструкции отсутствуют сложные прецизионные механизмы: пользователь сам двигает сканер по поверхности оригинала. Практически все ручные сканеры - небольшого размера, и поэтому позволяют считывать изображения шириной до 10 см. С другой стороны, отсутствуют ограничения на высоту оригинала, а поставляемое вместе с устройством программное обеспечение дает возможность вводить картинки, ширина которых больше, чем область захвата сканирующей головки. Для этого придется сделать несколько проходов, а затем "склеить" полученные таким образом части изображения в одно целое.
Ручные сканеры обладают серьезным недостатком. Пользователь не может двигать устройство строго равномерно и прямолинейно, что необходимо для качественного процесса сканирования. Поэтому с тем, чтобы получить приемлемый результат, нужны твердая рука и постоянные тренировки. Но даже в этом случае при вводе изображений с помощью ручного сканера неизбежно возникают искажения.
Раньше, когда настольные сканеры стоили тысячу и больше долларов, их "ручные собратья" были очень популярными. Кроме этого помните, что в последнее время цены на настольные модели упали, и вследствие этого спрос на ручные сканеры уменьшился. Сегодня их покупают, в основном, пользователи, сильно ограниченные в средствах. Кроме этого помните, что у этих устройств имеется одно преимущество: они компактны и могут с успехом применяться для ввода информации в портативные компьютеры. С ними можно работать в библиотеке, архиве или в любом другом месте.
Глава 3.
Листовые сканеры
По принципу действия эти устройства напоминают факс-аппараты. Считываемая страница с помощью специального механизма протягивается мимо головки. Протяжный сканер может оснащаться лотком для автоматической подачи листов, что существенно увеличивает скорость ввода многостраничных документов. Качество процесса сканирования у этих устройств, как правило, невысокое, главным образом из-за того, что при протягивании листа бумаги очень трудно добиться его равномерного движения без перекосов.
Протяжные сканеры занимают немного места на рабочем столе и стоят довольно дешево. Кроме того, они очень часто комбинируются с другими периферийными устройствами. В качестве примера можно упомянуть дополнительный модуль для ввода изображений, которым оснащался "древний" принтер Hewlett-Packard LaserJet 1100. Сконструирована даже клавиатура, в которую встроен малоформатный сканер. И наконец, протяжные сканеры очень часто входят в состав комбинированных периферийных устройств, выполняющих также функции принтера, копира, факс-аппарата и (в некоторых случаях) модема.
Серьезным недостатком протяжных сканеров является то, что с их помощью можно сканировать только отдельные листы. Чтобы ввести таким образом страницу из журнала, его придется расшить или разорвать. А вот считать изображение с негнущегося носителя (например, картона) протяжным сканером нельзя вообще.
Глава 4.
Планшетные сканеры
Устройства ввода этого типа чем-то напоминают "ксероксы": считываемый документ располагается на поверхности стеклянной пластины, под которой перемещается сканирующая головка. Такие сканеры являются универсальными, поскольку с их помощью можно вводить как отдельные листы, так и книги, журналы и даже изображения небольших трехмерных объектов. Они также могут комплектоваться дополнительным устройством для автоматической подачи бумаги, которое устанавливается вместо крышки. В этом случае вы имеете возможность быстро сканировать большое количество страниц, правда, только отдельных.
Планшетные сканеры рассчитаны на ввод изображений с непрозрачных оригиналов. Для этого сканируемый документ подсвечивается снизу лампой, а сверху накрывается крышкой, дополнительно отражающей и рассеивающей свет. Кроме этого помните, что считать таким образом изображения со слайдов, рентгеновских снимков и других прозрачных оригиналов не удастся, поскольку эти материалы необходимо рассматривать, а значит, и сканировать в проходящем свете. Для работы с такими оригиналами планшетный сканер оснащают специальной приставкой, которая устанавливается вместо крышки и содержит дополнительный источник света.
Почему большинство пользователей выбирают именно планшетные сканеры
Список устройств, которыми можно оснастить домашний компьютер, постоянно пополняется.
Спускаясь с заоблачных ценовых высот, в наших семейных "вычислительных центрах" прописываются ЗБ-акселераторы, звуковые карты, высококачественные цветные принтеры. В последнее время перечень таких "необходимых вещей" пополнили сканеры. Казалось бы, еще совсем недавно их можно было увидеть только в издательствах и полиграфических фирмах, поскольку цены на эти устройства были недоступными для большинства владельцев домашних компьютеров. Кроме этого помните, что сегодня самую дешевую модель цветного планшетного сканера можно приобрести примерно за 60$, а заплатив от 120$, вы станете обладателем довольно качественного и производительного устройства.
"Занятие" для сканера в современном доме отыскать нетрудно. С его помощью можно вводить в компьютер фотографии и рисунки с тем, чтобы затем отправлять их по электронной почте, использовать для оформления Web-страниц или составлять из них электронные фотоальбомы. Сканер окажет существенную помощь тем, кому приходится набирать тексты большого объема с печатных оригиналов, так как входящие в комплект поставки почти всех моделей программы оптического распознавания символов позволяют делать это намного быстрее.
В случае, если у вас имеется факс-модем, то, используя сканер, вы имеете возможность передавать факсимильные сообщения с бумажных оригиналов. Не забывайте также о формуле "сканер + принтер = копир" - хороший сканер может передавать изображение непосредственно на принтер, что дает возможность довольно быстро снимать копии с документов. А в домашнем офисе дизайнера или переводчика, верстальщика или научного работника без сканера просто не обойтись.
В последнее время практически все производители планшетных сканеров выпустили по одной, а то и по несколько недорогих моделей, рассчитанных на применение в домашних условиях. Кроме этого помните, что характеристики этих устройств отличаются довольно сильно, да и разброс цен на них достаточно велик - от 60$ до 220$.
Поэтому выбор сканера для неподготовленного пользователя представляется задачей весьма и весьма непростой, а чтобы ее облегчить, мы и решили провести тестирование.
Основным отличием дешевых сканеров от "совсем дешевых" является способ их подключения к компьютеру. Все устройства начального уровня работают через параллельный порт, а более дорогие модели используют SCSI или USB. Кроме того, простейшие устройства, как правило, обеспечивают сканирование с 30-битовым цветом, тогда как 36-битовый реализуется в аппаратах посложнее, хотя из этого правила имеется несколько исключений.
Что же касается такого важного параметра сканера, как разрешение, то среди протестированных нами моделей присутствуют устройства с оптической разрешающей способностью 300x600 и 600x1200 dpi. Прямой зависимости этого параметра от ценовой категории нет - сканеры с более высоким разрешением бывают как дешевые, так и несколько дороже. С интерполяционным разрешением ситуация еще интереснее - разброс его значений просто огромен (от 1200x1200 до 19200x19200 dpi), причем самые высокие обычно встречаются у дешевых моделей, которые ничем не отличились в ходе тестирования. Поэтому можно с уверенностью сказать, что столь большие цифры производители сканеров приводят исключительно в рекламных целях, и руководствоваться ими при выборе не стоит.
Классифицировать сканеры по качеству работы и производительности так же четко, как по цене, невозможно. Более того, окончательные результаты тестов свидетельствуют относительно того, что привычное правило "чем выше цена, тем лучше качество" по отношению к этим устройствам не всегда справедливо. Правда, модели высшей ценовой категории показали в большинстве случаев достаточно хорошие и стабильные результаты, однако говорить об их тотальном превосходстве над дешевыми аппаратами нельзя. Наоборот, некоторые из недорогих устройств справились с тестовыми заданиями не хуже, а иногда и лучше своих именитых собратьев.
Не секрет, что домашние сканеры чаще всего применяются для двух задач: ввода и распознавания печатного текста или процесса сканирования фотографий и других подобных изображений. Поэтому мы выбрали такую методику тестирования, которая позволила бы задать производительность и качество работы сканеров именно для этих процессов. Но нельзя и утверждать, что определенные нами характеристики одинаково важны для всех случаев использования домашнего сканера. Наоборот, его загрузка разнообразными задачами сильно зависит, в частности, от рода занятий его владельца. Кроме этого помните, что общие закономерности в использовании этого устройства выделить можно. Так, сканирование и распознавание текста наверняка можно назвать самой распространенной областью применения сканера, причем очень часто обрабатываются многостраничные документы.
Следовательно, важнейшими его характеристиками можно считать скорость работы в черно-белом режиме и качество распознавания текста.
Заметим, что последний параметр в значительной мере характеризует возможности сканера не только в черно-белом, но и в цветном режиме.
Сканирование цветных изображений - задача, пожалуй, не менее распространенная, чем предыдущая, однако при ее решении выдвигаются несколько другие требования к сканеру. Дело в том, что фотографии редко вводятся сразу в больших количествах, а поэтому вряд ли кто-нибудь занимается их сканированием "на скорость". Здесь первостепенную важность представляют качество ввода изображений, четкость деталей и точность цветопередачи. Что касается первых двух характеристик, то для их оценки вполне подойдет определенный нами параметр качества распознавания текста. А вот время процесса сканирования изображения и цветопередачу мы измеряли отдельно.
На методике определения последнего параметра и его значимости для домашнего пользователя хотелось бы остановиться особо.
Цветные изображения, как правило, сканируются для передачи по электронной почте или размещения на web-страницах, распечатки на цветном принтере либо отображения на экране монитора вашего компьютера (на рабочем столе или в электронных фотоальбомах). В первых двух случаях изображение почти всегда оптимизируется с целью уменьшения его объема, причем в ходе этой операции вносятся цветовые искажения, зачастую превышающие погрешность сканера.
В процессе печати качество результирующего изображения определяется свойствами струйного принтера, который искажает цвета намного сильнее, чем сканер.
Наконец, на экране монитора вашего компьютера неточность воспроизведения оттенков была бы сразу заметна, но параметры цветопередачи у большинства сканеров оптимизированы таким образом с тем, чтобы эти искажения не воспринимались человеческим глазом. В результате незначительные ошибки в отображении цветов практически неощутимы для непрофессионального пользователя, тогда как серьезных, заметно влиявших на вид картинки, в ходе тестирования не наблюдалось, за исключением очень редких случаев.