Журнал «Компьютерра» №33 от 13 сентября 2005 года - Компьютерра Журнал 619 7 стр.


Во-вторых, наскоками проблему не решить. В результате разовых акций «накрываются» прежде всего крупные операторы того или иного сектора ИТ, а крупные операторы, назовем их дистрибьюторами, являются своего рода санитарами леса, и так заинтересованными в максимальной чистоте своих операций. В образовавшуюся нишу, несомненно, ринется «чернуха», которая, спекулируя на дефиците продукции, постарается извлечь максимальную выгоду, абсолютно не беспокоясь о законности своего бизнеса.

Подводя черту, хочу сказать, что такие процессы должны идти только с помощью конструктивного и, конечно, продуктивного диалога между нашим правительством и индустрией. Думаю, что существующая сегодня Ассоциация предприятий компьютерных и информационных технологий (АП КИТ) вполне может явиться локомотивом такого процесса и включить в него все заинтересованные структуры и компании рынка ИТ.


Андрей Ященко

директор по развитию марки Salute

К аналогичным, я думаю. Дело в том, что существует ряд специализированных крупных таможенных брокеров, практически одинаковым образом растаможивающих схожие товары: компьютерные комплектующие, бытовую электронику, мобильные телефоны. Так что весь вопрос - в чем именно будут заинтересованы соответствующие (или не совсем соответствующие, как в случае с телефонами) органы при проведении своих рейдов.

С другой стороны, компьютерный рынок старше, чем рынок мобильных телефонов, так что и опыта по «борьбе» с таможней здесь накоплено больше, да и было время цивилизоваться. Некоторые группы товаров уже в основном растаможиваются «в белую». Тем не менее хаос на таможне (отказ некоторых перевозчиков возить грузы, задержки в оформлении грузов у более надежных перевозчиков), вкупе с конфискацией складов у крупных дистрибьюторов, в любом случае должны были бы привести к определенному дефициту на рынке.

Автор: Сергей Вильянов.


ОГОРОД КОЗЛОВСКОГО Клёвый чтец №8, или Новый сказ о Левше


«Клёвым чтецом» я перевел-обозвал FineReader в какой-то давней своей компьютерной брошюрке, еще до начала сотрудничества с «Компьютеррой», году, кажется, аж в 96-м, то есть, по скорости того компьютерного времени, - в далеком-далеком, практически незапамятном прошлом. Это как раз была третья версия, которая, после не вполне удовлетворительных мучений со второй, показалась мне верхом совершенства и одной из Сияющих Вершин брезжущего на близком - рукой подать - горизонте Искусственного Интеллекта, взятой Высокой Наукой вкупе с не менее Высокими Технологиями. Я увлеченно тестировал «тройку», сравнивая ее с конкурентами, как отечественными, так и зарубежными, - и она, подлинная «птица», легко обходила их всех на любых поворотах.

Сейчас уж не припомню, писал ли я отдельно о версиях следующих: с четвертой по седьмую, - очень может быть, что и нет: каждая очередная, конечно, была лучше предыдущей: качество распознавания - как божились PR-менеджеры, возрастало то на пять процентов, то на одиннадцать; рос и список распознаваемых языков, - включая даже такие вполне искусственные, как языки программирования (чтобы оцифровать покрытые пылью рулоны старых листингов) или чуть ли не эсперанто; появлялись всё новые возможности в смысле сохранения верстки документа и форматов; хорошели кнопочки тулбара; - и прочее, и прочее, и прочее. Конечно, это не могло не радовать, но при удовлетворении моих реальных потребностей: распознавание обложек компакт-дисков, книжных текстов и журнальных статей, - улучшения сказывались не особенно. Впрочем, ситуация естественная: при достижении любым продуктом некоего (довольно высокого) уровня дальнейшие усовершенствования идут больше по мелочам: возьмите хоть автомобили. То есть сказывались, конечно, однако недостаточно, чтобы дать повод для отдельного «Огорода».

Но вот вышла «восьмерка» - и повод такой, похоже, дала.

Список ее отличий от «семерки», выданный на презентации, занимает десять (!) страниц, включая в себя не только чисто эстетические удовольствия вроде появившихся словарных баз для словенского и башкирского языков и добавившегося в двух ипостасях - кириллической и латинской - уйгурского[Впрочем, относительно уйгурского и башкирского - это только для меня удовольствие чисто эстетическое, а для уйгуров и башкир - практическое. А они ведь - покупатели], но и практическое: например, понимание картинок в формате компрессированного (методом LZW) tiff’а, о кочку которого я в прежние времена частенько спотыкался. Повысившаяся скорость распознавания оставила меня практически равнодушным, поскольку и раньше она не казалась недостаточной: мне ведь, слава богу, не приходится просиживать за этим занятием дни напролет, - а вот понимание гиперссылок, их проверка в процессе распознавания и перенос в текст - это представилось блестящим, едва ли не цирковым трюком, и я стал всерьез подумывать о переводе в цифровую форму всего моего многокилограммового «Огородного» архива - с целью освобождения «тещиной комнатки». Появились радости и для бюрократов, для каторжной офисной работы, - но к интересам бюрократов я всю жизнь относился с неким брезгливым равнодушием… Впрочем, всё это вполне уложилось бы в стандартные улучшения от версии к версии, если б не…

Если б не объявленная (и, как выяснилось, неплохо реализованная) поддержка распознавания документов, снятых цифровыми аппаратами! Не могу сказать, что это революция, сравнимая с прорывом цифры в фотодело, но - безусловно заметный шажок, возможно, эту революцию завершающий. И впрямь: цифровой фотоаппарат сегодня есть если не у каждого, то у каждого, скажем, третьего, и, понятно, что переснять им пару нужных страниц учебника или справочника куда удобнее, чем предполагающим специальную стационарную обстановку сканером.

Косвенно эту материю я уже задевал в прошлом «Огороде» («Восточный DocExpress»)[Поскольку вегетационный период у овощей разный, редакция решила пропустить FineReader вперед. А DocExpress как раз через недельку и поспеет. - Прим. ред], когда писал, что цифровой фотоаппарат в ряде случаев удобнее любого, даже карманного (не говоря уж о настоящем) сканера, - но не мог и не признать, что результаты распознавания после фотосъемки выходят очевидно худшими. Дело понятное: оптика универсальных аппаратов недостаточно жестка, получаемое разрешение заметно ниже, чем у сканерных картинок, освещение, как правило, недостаточное и неравномерное, и вообще… И вот, программисты из ABBYY решили попробовать приспособить программу к этим «плохим» картинкам (предупредив, что лучше снимать камерами не менее чем с четырехмегапиксельными матрицами). И приспособили.

Я провел следующий тест: взял полосу «Компьютерры» с собственным «Огородом» («Компьютерру» потому, что она напечатана на полуглянцевой, бликующей бумаге и довольно мелким шрифтом; если бумага надежно матовая, можно у фотоаппаратов включать вспышку, что сразу резко повышает качество снимка), отсканировал ее сперва недорогим планшетником (Astra 4700 от Umax), потом - безо всякого специального света, но со штатива - снял ее же Olympus’ом Е-20 (5 мегапикселов) и шестимегапиксельным Exilim’ом Pro 600 от Casio (у него есть специальный режим для съемки документов, - распознавальщики и производители цифровых фотоаппаратов идут навстречу друг другу!). Все картинки скинул на винчестер и вызвал их для распознания сначала седьмым, а потом - восьмым «Клёвым чтецом».

Сканерная картинка в обоих случаях распозналась одинаково: практически стопроцентно, только после «восьмерки» гиперссылки, при сохранении в PDF, работали! Картинку с Olympus’а «семерка» распознала процентов эдак на шестьдесят, а «восьмерка» - ну… на семьдесят. Другое дело - картинка с Casio, у которого был включен «документ-режим». Там процент «семерки» повысился до восьмидесяти, а «восьмерки» - только, может, процента на три не дотянул до сотни! То есть разница налицо, причем видно, что аппаратная составляющая тоже играет свою, и немалую, роль. Короче: чудес, разумеется, не бывает, но если подходить к проблеме с умом и пониманием - можно добиться результатов, которые «третья» версия лет восемь назад давала при картинке со сканера.

В общем, браво, ABBYY! Верной дорогой идете, товарищи! Есть шанс дожить до времени, когда цифровики будут комплектоваться FineReader’ом Lite, как сегодня комплектуются сканеры.

Покончив с изюминкой «восьмерки», перейдем к неприятному, обозначенному в заголовке как «Новый сказ о Левше». Помните, в чем там, у Лескова, была главная грустная заковыка? Левша сумел подковать микроскопическую блоху и даже на гвоздиках автограф накарябал, - а сообразить, что после подковки она перестанет скакать - на это ума не хватило. Вот и FineReader, еще с самых первых своих версий, ковать учится все изощреннее, а думать, увы, нет.

Поясню в чем дело. Сканируется, положим, задняя обложка компакт-диска со списком треков, номера которых частенько набираются каким-нибудь высокохудожественным шрифтом или заключаются в квадратики или обводы другой формы. «Клёвому чтецу», несмотря на шрифт и квадратики, удается-таки разобрать два-три (а иной раз - и пять-шесть) номеров правильно. Но догадаться, что это - нумерованный список и, следовательно, нераспознанный между «тройкой» и «пятеркой» значок вероятнее всего есть «четверка» - это уж, извините, кишка тонка. Или еще пример, с той же обложки: фамилии авторов песни, заключенные в круглую скобку, распознаются не всегда точно: «(Josea - Taub» в четырех случаях распознаны как «Qosea - Taub», а в трех оставшихся - правильно. Честное слово, семи пядей во лбу не надо иметь, чтобы - по шрифту ли, по расположению - догадаться, что эта часть двадцатидвухпозиционного списка вся заключена в скобки, а нераспознанный Qosea есть не что иное, как распознанный рядышком Josea, - а вот поди ж ты!

Поясню в чем дело. Сканируется, положим, задняя обложка компакт-диска со списком треков, номера которых частенько набираются каким-нибудь высокохудожественным шрифтом или заключаются в квадратики или обводы другой формы. «Клёвому чтецу», несмотря на шрифт и квадратики, удается-таки разобрать два-три (а иной раз - и пять-шесть) номеров правильно. Но догадаться, что это - нумерованный список и, следовательно, нераспознанный между «тройкой» и «пятеркой» значок вероятнее всего есть «четверка» - это уж, извините, кишка тонка. Или еще пример, с той же обложки: фамилии авторов песни, заключенные в круглую скобку, распознаются не всегда точно: «(Josea - Taub» в четырех случаях распознаны как «Qosea - Taub», а в трех оставшихся - правильно. Честное слово, семи пядей во лбу не надо иметь, чтобы - по шрифту ли, по расположению - догадаться, что эта часть двадцатидвухпозиционного списка вся заключена в скобки, а нераспознанный Qosea есть не что иное, как распознанный рядышком Josea, - а вот поди ж ты!

Не то чтобы мне было так уж трудно поправить эти несколько «замученных очепяток», - но я в толк не мог никогда взять, почему такая умная программа, разбирающая знаковую составляющую порой очень трудно идентифицируемых закорючек, пасует перед столь элементарными задачами - и на каждой презентации тупо продолжал задавать один и тот же вопрос: когда же «Клёвый чтец» хоть чуть-чуть поумнеет? Задал и на этой, и мне, наконец, было отвечено, что в «восьмерку» «интеллектуальный» модуль уже встроен, хотя как следует еще на заточен, и, вероятно, точить его будут вплоть до выхода очередной версии. Но зачатки уже есть, так что я могу попробовать проверить.

Проверил первым делом - даже еще до фотографирования. Увы, «умнеющая» (по заявлениям разработчиков) «восьмерка» повела себя - в интеллектуальном отношении - ровно так же, как глупые «семерка», «шестерка», «пятерка» - и далее вверх до начала списка. Ну, как говорится: хорошо не жили, начинать нечего…

И все же закончить «Огород» хочется на ноте оптимистической: к «восьмерке», отдельно, прилагается замечательная утилитка под названием ABBYY Screenshot Reader, которая, правда, начинает работать только после того, как FineReader зарегистрируешь (эдакий легкий шантаж). Она запускается в виде маленького продолговатого окошка, в коем качестве и может висеть на экране, не особенно мешая работать. При необходимости можно выбрать, в каком из доброго десятка распространенных форматов сохранить содранное с экрана и тут же распознанное, потом - нажать на кнопочку с изображением фотоаппарата, потом - выделить нужную область экрана и… все.

Нельзя сказать, что раньше я не пользовался FineReader’ом для распознания текстов, скажем, системных табличек или субтитров фильма, - но тогда приходилось делать это в три с половиной этапа: сохранять в буфер обмена, записывать в графический файл и уж только потом вызывать FineReader, а в него - этот графический файл. Теперь процесс стал заметно проще и много приятнее.

Особенно впечатляет дерево каталогов с раскрытым справа списком файлов, экспортированное непосредственно в Excel. Правда, и тут ум прихрамывает: в тринадцати случаях правильно распознав и спозиционировав в таблице время создания файлов, в следующих пятнадцати Screenshot Reader (а вернее, думаю, сам FineReader) зачем-то отвел под минуты отдельную колонку.

В общем, как призвал в свое время Великий Вождь: учиться, учиться и еще раз учиться! Толк, рано или поздно, надеюсь выйдет.

Автор: Козловский Евгений.


ГОЛУБЯТНЯ Кукла из тряпочки и выигрышная комбинация


Эдакие игры взрослых: в модном местном супермаркете «Таврия В» вовсю идет розыгрыш лотереи компании BIC. Покупаете какую-нибудь ихнюю фигню (фломастер, ластик, карандаш, шариковую ручку и пр.) на сумму 15 гривен (80 рублей) и допускаетесь к лотерее: после оплаты на выходе вам вручают скрэтч-карту - стираете, а там подарок! Разве я мог не доставить удовольствие Сереге-младшему?

Покупаю набор фломастеров, подкатываю за кассами к журнальному столику с девушкой и… недоверчиво упираюсь взглядом в россыпь подарков от мирового концерна BIC, участвующих в лотерее: пластиковые пенальчики, те же самые ластики, карандашики, какие-то то ли платочки с крылышками, то ли салфеточки … Не хватает тряпочной куколки и машинки из деревянной катушечки да спичечного коробка - и прямиком в декорации фильма «Дети подземелья», снятого по одноименному рассказу великого русского сострадальца Владимира Галактионовича Короленко.

Сережка-младший застенчиво улыбается, тянет ручонку за скрэтч-картой… стираем… какая фантастическая удача! Вот уж повезло так повезло: выиграли ЧУПА-ЧУПС! Ребенок, конечно, не плачет, но около того, а я думаю: "Какая гомерическая дешевка - этот BIC! Служил бы в ней менеджером (не приведи Господи!), удавился бы от стыда - от сопричастности к такой лотерее!

Антонелло тут недалече жаловался, что какая-то подвальная компьютерная лавка затребовала в обмен на тестирование дешевого причиндала чуть ли не выписку из роддома с выправленным пятым пунктом. Чудак-человек: чего ж ожидать от безымянной торговой мацыпурки?! Совсем другой коленкор - BIC! Не поленился, проверил: годовой оборот - один миллиард восемьсот девяносто один миллион долларов! И рядом - рекламные акции с чупа-чупсами! Можно, конечно, все списать на местных клиноголовых репрезентантов компании, но я бы не стал: в слоноподобных концернах типа BIC личная инициатива душится в эмбрионе, а менеджерийное мышление целиком формируется корпоративной хартией, в которой навеки закреплен дух ее учредителя!

И здесь, друзья, мы попадаем на высокий уровень метафизики, никак не связанный с капиталистическим мелководьем (все эти «выгодно-невыгодно»). Что же мы видим на этом метафизическом уровне? Мы видим человека, Марселя Бика, который взял шариковую ручку (чужое изобретение) и дополнил ее концепцией мусорной дешевизны. Да-да, единственное «открытие» учредителя BIC Марселя Бика - одноразовость товара! На этом и сколотились миллиарды: 1953 год - одноразовые ручки, 1973-й - одноразовые зажигалки, 1975-й - одноразовые станки для бритья. На склоне лет дядюшка Бик попытался протолкнуть идею «одноразовых духов» - утешает, что не обломилось: французы долго плевались, а BIC подзалетел на 250 миллионов франков.

Так что утрите слезы недоразумения и неоправданных ожиданий, участники биковских лотерей: ничего кроме чупа-чупсов и кукол из тряпочек эта компания разыгрывать не может по определению - таковы ее дух и метафизическая парадигма!

Ну да прочь печаль-тоска: пора вгрызаться в заплесневелый софтверный сухарь (шутка: не любил бы, давно убил). Сегодня у нас кэ-пэ-кашная тематика: хочу поделиться новинками софтостроения, но сначала - отчет о почти годовом функционале iPAQ 4700.

Декорацией для рассказа выбрал миниатюрную театральную зарисовку. Итак: в правом углу сцены стоит упитанный и уверенный в себе главный редактор «Домашнего компьютера» Роман Косячков, в левом - стройная и неуверенная в себе моя жена с подаренным ей год назад Palm Tungsten T3. В зарисовке всего две реплики:

Роман: Всю жизнь был «пальмоводом». Потом бес попутал, продал к $#@ amp; (в жизни Рома никогда не ругается. - С.Г.) Tungsten Т3 и купил самый лучший по тем временам iPAQ. По инерции написал испуганную хвалебную статью, но через полгода горько раскаялся, очистил душу разгромной статьей, продал iPAQ и купил Tungsten T5. Какое счастье, снова быть дома!

Светлана (пишет электронное письмо сестре): Дорогая Аля, теперь у меня есть свой КПК! Это такая чудесная маленькая машинка, которая может делать все. Ну, или почти все. Во всяком случае, так говорит Сергей, потому что я за год работы так и не поняла, как он устроен, поэтому использую свой «палмик» только для чтения. Одно плохо - аккумулятор живет не больше четверти часа. Это в идеале, при выключенной подсветке экрана. А так, в среднем, минут одиннадцать, после чего приходится перезаряжать.

(Занавес.)

Итак, что мы имеем? В одном углу - феноменальную логику, которую я не пойму до конца жизни, в другом - жуткую правду жизни. В самом деле: как можно вернуться к Palm после хотя бы недели работы с хорошим Pocket PC?! Это же полнейший абсурд! Временна,я зависимость геометрическая: через неделю Palm вспоминается как страшный сон, через месяц - раздражает одна мысль о том, что когда-то мог совершить в жизни столь роковую ошибку, через год (как в моем случае) - на губах не остается ничего, кроме спокойной и снисходительной улыбки в сторону «пальмоводов»: «Прости их, Господи, ибо не ведают, что творят!»

Эмоции удесятеряются, когда перед глазами продолжает телепаться пальмовый цахес, выделывающий совсем уж чудовищные антраша: дигитайзер смещается почти на сантиметр - да так, что невозможно попасть стилусом не то что в нужную букву виртуальной клавиатуры, но и вообще в экран. Аккумулятор Т3, который с самого начала был образцом того, что американские люди называют pathetic [Вызывающее жалость ничтожество (англ.)], в конце первого года пользования работает от зарядки до зарядки около тридцати минут, в конце второго года - описанные женой (и поддержанные Паоло Коэльо!) одиннадцать минут. Для сравнения: год спустя заряда моего 4700 хватает на пять часов интенсивной работы.

Назад Дальше