Журнал 609 Компьютерра Журнал «Компьютерра» №37 (Компьютерра - 609)
13-я КОМНАТА: Право на ошибку
Описывая недавно 8-ю версию FineReader’а, Евгений Козловский совершенно верно отметил недостаток у программы «ума». Это не проблема конкретной разработки, - если посмотреть на остальной софт, этого самого «ума» мы увидим не больше. С помощью сегодняшних технологий можно научить программу выполнять корректные действия во всех ситуациях, которые предварительно описаны (точно или по граничным условиям - не столь важно). Адекватно же вести себя в ситуации незнакомой - увы.
А сделать все возможные ситуации знакомыми для программы - нереально. Для того чтобы электронный переводчик понимал все слова языка, надо забить в программу полный словарь. Если словарь слишком велик, можно придумать правила формирования слов с использованием приставок, суффиксов и окончаний (и добавить неизбежные исключения). Теоретически - реально, но это будет еще далеко не переводчик. Кроме слов, нужны их сочетания - снова придется их все описать. И снова вводить исключения, которых на этом этапе значительно больше. Труднее, но тоже возможно. А еще - целые фразы и предложения… Зато сам Евгений, к примеру, без труда поймет слово, вообще отсутствующее в словаре, образованное из пары нецензурных корней, приставки да суффикса, не подходящих ни к одному корню по правилам языка. Причем он также поймет, что смысла в этом слове нет вовсе, а есть только эмоции. Надеяться на то, что в ближайшие лет десять аналогичное заключение сделает электронный переводчик, не приходится. Ведь зачастую смысл фразы, написанной пусть и на родном языке, становится понятным даже не после прочтения, а в результате осмысления текста целиком (хороший заголовок к статье - из этой категории).
Но ведь и образцовый исполнитель подобных задач - человек, если не считать инстинктов, не рождается умным сам по себе, он приобретает способность мыслить вместе с постепенным накоплением информации, запоминая ее и соотнося с другой информацией. Отличие в том, что процесс человеческого развития с момента рождения опутан обратными связями и есть некоторая свобода в выборе действий. Действие приводит к некоторым последствиям, приятным либо неприятным, но в любом случае добавляющим информацию о правильности сделанного. У нынешних электронных переводчиков, программ распознавания и прочих, претендующих на вторжение в область искусственного интеллекта, таких обратных связей нет уже потому, что решаемая ими задача заканчивается раньше того момента, когда подобная связь могла бы образоваться. Не будет же пользователь после получения машинного перевода объяснять программе, в чем она не права, - он-то свой результат уже получил, а поправить ошибки проще самому…
Ситуация весьма напоминает процесс управления коллективом. Зачастую сделать дело своими руками проще, чем учить этому других. Но давно известно, что первый путь не приводит к прогрессу. Если перенести сей опыт на программирование, получается, что от обучения никуда не уйти. Кроме того, машинной системе надо в некоторых пределах позволить совершать пробные шаги, позволяющие ей периодически наступать на грабли. А стопроцентного результата все равно никогда не достичь по одной простой причине: в упомянутых областях мы даже для самих себя не можем сформулировать четких правил игры… Придется признать, что ошибаться свойственно не только людям.
Кстати, давно хотел наладить обратную связь с читателями, которым по разным причинам неудобна или недоступна электронная почта. Благо уже есть опыт Сергея Вильянова, опубликовавшего как-то номер мобильного телефона для SMS-отзывов. Тогда никого особо не смутила даже указанная стоимость сообщения в израильских шекелях (на самом деле, конечно же, это была шутка). Итак, номер: 8-916-523-00-43. SMS принимаются без ограничений, но в переписку и переговоры голосом редакция не вступает. Кроме общих высказываний и пожеланий можно оценивать отдельные статьи в виде «номер-страница-оценка» (последняя по пятибалльной шкале). И на сей раз без всяких шуток: стоимость отправки SMS на этот номер не отличается от стоимости обычных SMS.
НОВОСТИ
Дай, Google, на дружбу лапу мне
Канули в Лету времена, когда компания Google расценивалась всего лишь как возмутитель спокойствия, ворвавшийся в размеренный мир сетевых ищеек. Вчерашний стартап прочно вошел в обойму влиятельнейших компаний мира IT, а многие из обитателей софтверного Олимпа почитают за счастье пожать руку недавним «выскочкам». Как это сделал глава Sun Скотт Макнили, скрепивший многочисленными рукопожатиями договор о сотрудничестве с CEO Google Эриком Шмидтом.
Отныне и присно обе компании намерены выступать на софтверном рынке плечом к плечу, поддерживая программные решения партнера. Первым шагом нового альянса станет включение панели инструментов Google Toolbar в дистрибутив Java Runtime Environment (это обещано сделать в течение максимум нескольких недель). Кроме того, идет речь о совместном продвижении проекта OpenOffice.org (в том числе в виде веб-сервисов) и интеграции в него поисковых средств Google. По мнению многих экспертов, нынешняя дружба IT-гигантов направлена против их злейшего врага Microsoft: «накачанный» онлайновыми сервисами от Google, офисный комплект Sun может в перспективе превратиться в настоящего «киллера» для MS Office. Ну и конечно, в лице нового партнера «солнечная корпорация» приобрела достойного клиента - покупателя серверов.
«Есть ли еще на Земле места, куда не проник этот вездесущий Google?» - ворчат в своих колонках обозреватели. Не исключено, что скоро подобных «белых пятен» не останется не только на Земле, но и на других телах Солнечной системы: разработчики главного поисковика планеты подписали долговременный контракт о сотрудничестве с NASA. Работа плечом к плечу с гугловцами как нельзя лучше отвечает чаяниям американских звездочетов. «Космическое агентство утопает в информации, и мы приветствуем любого, кто может прийти нам на помощь», - признался директор Эймсовского центра NASA Скотт Пейс (Scott Pace). Этот расположенный в самом сердце Кремниевой Долины научный городок славен богатой историей: с момента основания в 1939 году на его полигонах испытывались новые модели самолетов, а в 60-е годы здесь рождалась знаменитая программа Apollo. Впрочем, не исключено, что звездный час этого центра еще впереди: в течение ближайших лет на его земле вознесется к небу новая исследовательская «теплица» с общей площадью помещений свыше 100 тысяч квадратных метров, строительство которой берет на себя «поисковик номер один».
Как следует из подписанного обеими сторонами меморандума, масштабы сотрудничества планируются поистине астрономическими. Будущее поле совместных усилий простирается от обработки гигантских массивов экспериментальных данных и написания софта для распределенных вычислений до инновационных инженерных разработок (так, по словам отцов-основателей Google Пейджа и Брина, их очень интересует создание космического лифта для транспортировки грузов на орбиту). Что ж, работать с NASA гугловцам не привыкать: их картографические проекты Google Maps и Google Earth немыслимы без предоставленных агентством космических снимков. «Земля у нас уже есть, так что дело теперь за Марсом», - шутит один из старших менеджеров Google Питер Норвиг (Peter Norvig). Учитывая наполеоновские планы его работодателей, смеяться над подобными остротами что-то не тянет. - Д.К
Мы наш, мы новый Интернет построим
Всемирный саммит по проблемам информационного общества, проходивший в Женеве под эгидой ООН, закончился крупным скандалом: делегаты большинства стран выступили единым фронтом против господства США в Интернете. Управляющая выдачей IP-адресов и доменных имен корпорация ICANN - это зарегистрированная в Калифорнии некоммерческая организация, которая формально контролируется американским правительством, и ее ключевые решения утверждаются Министерством торговли США. Согласно меморандуму 1998 года, в сентябре 2006-го ICANN должна была получить независимость от министерства, однако минувшим летом администрация Буша заявила о намерении «сохранить свою историческую роль» в авторизации корневой структуры DNS.
В свете этих заявлений женевский саммит оказался весьма бурным. Вначале на американцев обрушилась так называемая «Группа единомышленников», в которую вошли представители Китая, Бразилии, Кубы, Ирана и других стран (Россия тоже в ней отметилась). Группа потребовала передать функции ICANN Международному телекоммуникационному союзу (ITU) при ООН или специально созданной для этого организации. США, как и ожидалось, ответили резким отказом. Чиновник Госдепартамента Дэвид Гросс (David Gross) заявил, что ни одна межправительственная организация, будь то ООН или кто-то другой, не должна контролировать Интернет. Все наверняка закончилось бы очередным бессмысленным и бесплодным противостоянием между развивающимися странами и США, если бы предложения «единомышленников» не приняла близко к сердцу Еврокомиссия. В предпоследний день саммита британская делегация выступила от имени ЕС с требованием создать новую систему международной кооперации для управления корневыми DNS-серверами и национальными доменами, а также выработать правила разрешения споров по поводу Интернета.
Если кто-то подумал, что в ответ американцам пришлось смягчить свою позицию, то он ошибся. По словам того же Дэвида Гросса, предложения ЕС означают переход от традиционного способа управления Интернетом, когда контроль находится в руках частной организации, к системе, в которой Сеть контролируется правительственными ведомствами по принципу «сверху вниз». Соединенные Штаты, подчеркнул Гросс, будут всячески противиться такой реформе.
Хотя на первый взгляд это может показаться странным, в позиции американцев немало здравого смысла. Формально американское правительство контролирует ICANN, но де-факто эта организация действует самостоятельно и независимо. Вмешиваться в ее деятельность невыгодно прежде всего самим Штатам, поскольку это немедленно подорвет доверие к ICANN. В общем-то, претензия к Америке всего одна: почему право контролировать Интернет юридически закреплено только за одним государством? Но поскольку случаев, когда США блокировали бы решения, выгодные мировому сообществу, или каким-то иным способом злоупотребляли своим правом, не было, нынешний демарш следует рассматривать скорее как попытку ряда стран свести с Америкой личные счеты.
Попытка эта, однако, будет иметь далеко идущие последствия. Во-первых, инициаторам заварухи придется стоять до конца: если раньше США и не помышляли о том, чтобы воспользоваться своим преимуществом, то теперь, когда конфликт четко обозначился, им уже ничто не мешает использовать ICANN как политический инструмент. Во-вторых, если компромисс так и не будет найден, вполне возможен раскол Интернета как минимум на две альтернативные области: в одной будет действовать DNS от ICANN, в другой - DNS от, к примеру, ООН.
Такой экстремальный сценарий, конечно, маловероятен, однако его угроза сама по себе создает нестабильность. Наконец, совершенно непонятно, насколько эффективной будет глобальная межгосударственная организация по управлению Интернетом и насколько оперативно она сможет реагировать на стремительно меняющуюся реальность Сети. Если посмотреть, к примеру, на неповоротливые бюрократические структуры ООН, то перспективы «межправительственной координации» особого восторга не вызывают. - А.Ш.
Как пройти в библиотеку?
Книжки нынче в моде: вслед за Google о запуске собственного «библиотечного» проекта объявила Yahoo!.
Цель начинания та же, что и у Google Print Library: перевести книги и журналы в «цифру» и сделать их тексты общедоступными. Но в отличие от конкурента Yahoo! будет заниматься только текстами, не обремененными авторскими правами (теми, на которые защита не распространяется в силу срока давности, написанными в рамках профинансированных государством исследовательских проектов и т. п.), либо произведениями, авторы которых разрешат выход в «Интернет-свет». Планируется, что тексты будут доступны для поиска не только на портале Yahoo!, но и в других поисковиках (опять же камень в огород Google, старающейся только для себя)
В работе над проектом Yahoo! объединит усилия с Internet Archive (www.archive.org), Университетами Калифорнии и Торонто, Национальным британским архивом, издательством O’Reilly Media и крупнейшими библиотеками разных стран. Hewlett-Packard предоставит оборудование, Adobe Systems - пакеты Acrobat и Photoshop, а Archive.org будет отвечать за хостинг отсканированных текстов.
В библиотеке одного только Государственного университета Калифорнии насчитывается 33 млн. томов, из них 15% числятся в категории Public Domain. По мнению директора библиотеки Дэниэла Гринстайна (Daniel Greenstein) перевод книг в цифровую форму принесет обществу огромную пользу и поможет приучить к чтению молодежь. А издателям опасаться падения продаж не стоит - читающие люди всегда будут покупать новые произведения.
Участники проекта образуют организацию Open Content Alliance (OCA), которая будет заниматься поддержкой каталога книг, доступных для поиска в Сети, привлекать к сотрудничеству различные библиотеки и научные центры и решать все вопросы авторского права (напомним, что в конце сентября американская Гильдия авторов подала на Google в суд, обвинив последнюю в том, что в результатах поиска по оцифрованной библиотеке отображались отрывки защищенных копирайтом книг).
Со временем OCA планирует разработать механизм выплат вознаграждения авторам, которые пожелают включить свои труды в архив. Интересен и еще один аспект нынешней инициативы - сохранение культурного наследия разных стран на разных языках мира. Та же Google Print Library ориентирована исключительно на английский, что, скажем, вызвало возмущение французского правительства, начавшего дебаты о «засилье английского языка и доминировании англосаксонского образа мышления». Возможно, именно эти аргументы и подвигли недавно Еврокомиссию затеять собственный проект по сохранению в цифровой форме достояния стран-участниц коалиции (речь идет не только о текстах, но и картинах, фотографиях, фильмах, музыке и т.д.). Теперь, с приходом международного проекта OCA, аргументы «бритофобов» отчасти потеряют актуальность.
В Google к инициативе Yahoo! отнеслись положительно, заявив, что эти проекты смогут успешно сосуществовать параллельно. Впрочем, конкуренция наверняка будет. Например, Google смог первым договориться о сканировании и публикации незащищенных копирайтом текстов с крупнейшим в мире академическим издательством Oxford University Press. - Т.Б.
How, dog, you do?
«Апорт», «лежать», «фас»… Увы, пригоршня коротких команд - это все, чем ограничиваются познания в лингвистике большинства наших четвероногих друзей, так что «за жизнь» с барбосом не поговоришь. То ли дело его умнеющий год от года электронный собрат: компания Sony представила новую породу робота-пса Aibo ERS-7M3, чей английский вокабулярий составляет тысячу слов (правда, понимает робот лишь одну десятую из того, что может говорить сам).
Возросшие интеллектуальные возможности робособаки подпитываются более емкой 128-мегабайтной картой памяти, а лопотать по-человечески ей позволяет входящий в комплект поставки софтверный пакет MIND 3. Наряду с английским, вооруженная «третьим умом» собачонка владеет и испанским, правда, тут ее словарь ограничен лишь 35 обиходными выражениями, включая самодовольное «buenо perro» («хорошая собака»). Поначалу пес вещает детским голоском, но благодаря подстройке пола и возраста ничто не мешает ему освоить тембр «не мальчика, но мужа». В состав пакета входит программа для чтения потоков RSS, так что подключенный к Интернету пес-интеллектуал сможет прочитать вам вслух заголовки с любимого новостного сайта. Не забыта и еще одна модная фича: четвероногие смогут вести собственные блоги в стиле «как я провел день», состоящие из фотографий и коротких комментариев (закачивать их на один из совместимых блог-сайтов, конечно, придется через ПК).
Новое поколение Aibo вроде бы избавилось наконец от топографического кретинизма. Отныне песики наделены «кратковременной памятью», позволяющей им держать в уме планировку квартиры, а также расположение в ней ключевых пунктов (например, точки подзарядки или любимой корзины с игрушками; предыдущая версия находила «питание», только видя специальный маркер). Любопытно, что эта функция введена специально для заокеанских потребителей: как отмечают конструкторы, в гораздо более скромных по размерам японских квартирах любопытному псу заблудиться куда труднее.
Увы, в отличие от шагнувшей вперед интеллектуальной начинки, физиологическая эволюция семейства Aibo топчется на месте. По сравнению с вышедшей в прошлом году моделью ERS-7M2 в новой добавились лишь дизайнерские «бантики и рюшечки». А внешнюю притягательность песика по-прежнему сводит на нет его кусачая цена: будущим хозяевам придется выложить две тысячи «зеленых» (к услугам владельцев предыдущих версий - стодолларовый компакт-диск с Upgrade Kit). - Д.К.
Датско-корейская серенада
Samsung наконец раскрыла подробности совместного проекта с датской фирмой Bang amp; Olufsen, анонсировав мобильный телефон Serene. Этот аппарат во многом повторяет концепцию Nokia Vertu, демонстрируя роскошный экстерьер и урезанные функциональные возможности.
Дизайнеры Bang amp; Olufsen перевернули с ног на голову классический дизайн раскладушки: клавиатурную панель совместили с динамиком, а экран (двухдюймовый с разрешением 320x240) - с микрофоном. Разработчики утверждают, что при такой компоновке пользоваться аппаратом удобнее, но наверняка немалую роль сыграла и необычность компоновки: ведь для владельца Serene главное - выделиться из толпы. Поворотное колесо вокруг динамика обеспечивает довольно удобное управление, много внимания уделено и качеству звука (Bang amp; Olufsen как раз специализируется на выпуске эксклюзивной аудио/видеоаппаратуры с подчеркнуто изысканным дизайном). Любопытно, что, судя по рекламным фотографиям, Serene позиционируется на мужскую аудиторию, тогда как стиль аппарата получился скорее женским.