Журнал «Компьютерра» №36 от 04 октября 2005 года - Компьютерра Журнал 619 7 стр.


Во многих случаях разные подходы комбинируются друг с другом, но путь от исследовательских разработок до коммерческих продуктов довольно долог. В настоящее время существует только один коммерческий пакет, «натасканный» на параллельных текстах, — машинный переводчик от небольшой компании Language Weaver. Google, победивший в августе на конкурсе НИСТ (см. табл. 3 и 4), тоже разрабатывает переводчик, который обучается на огромной библиотеке параллельных текстов, однако это внутренний проект, и когда он будет доведен до коммерческого уровня — неизвестно. Любопытен, кстати, выбор языков для конкурса. В 1950-х гг., в разгар холодной войны, в моде был русский язык, сейчас конкурсантам предлагаются задания на арабском и китайском. Language Weaver, к слову, также первым делом представила систему перевода с арабского на английский, но у нее свой интерес: государственные структуры во всех странах являются очень выгодным заказчиком, и разработчики систем машинного перевода, естественно, пытаются угадать их предпочтения.

Но сказать, что все эти новшества радикально решили проблему непонимания контекста, было бы преувеличением. В общем случае качество перевода и по сей день остается неудовлетворительным. Получить представление о содержании текста на иностранном языке с помощью машинного перевода вполне можно, но гарантий, что содержание это передано верно — никаких. Все современные системы требуют доработки либо исходного текста перед переводом (для уменьшения словаря, искоренения возможных двусмысленностей и предельного упрощения синтаксических конструкций), либо уже сделанного перевода до читаемого уровня. Кстати, переводчикам, которые этим занимаются, не позавидуешь — порой очень нелегко понять, что имелось в виду в оригинале, тогда как ошибки, которые делают при переводе люди, все же более предсказуемы. В защиту машин можно сказать, что, ошибаясь, они ошибаются одинаково и, найдя ошибку один раз, нетрудно проследить в тексте следующие ее вхождения.

Некоторого успеха добились исследователи, сделавшие ставку на упрощение и ограничение задачи. Еще в 1970-х гг. компания Caterpillar, пытаясь сократить расходы на перевод руководств к своей продукции, придумала оригинальный язык — Caterpillar Fundamental English. В каком-то смысле Caterpillar English можно назвать предшественником нашего «технического английского» — это был язык с предельно упрощенным синтаксисом и словарем из 850 слов. По задумке Caterpillar работники зарубежных филиалов компании должны были выучить этот новый вариант английского, чтобы иметь возможность читать руководства без перевода и по возможности без словаря. Из затеи с «выучить» ничего толком не вышло, но сама идея контролируемого языка, приложенная к написанию технических документов, привела к тому, что на свет появилась документация, которую машины могут переводить без особых потерь смысла. Конечно, никаких красот перевода тут ждать не приходится, но их и в оригинале, думается, немного.

В целом же технические тексты (на обычном, не упрощенном языке) вовсе не являются, как можно было бы подумать, желанным объектом для перевода. Несмотря на то что в них, как правило, используется довольно простой язык, отсутствуют идиомы и не очень много неоднозначных фрагментов. Технические тексты для машинного перевода неудобны тем, что довольно часто написаны «левой ногой», с грубыми грамматическими ошибками, а компьютер — в отличие от человека — не может заметить ошибку на языке исходника. Он переводит то, что дали, свято веруя, что исходный текст правильный во всех отношениях. И, конечно, ошибки, которые носителю языка кажутся шероховатостями, не меняющими общую картину, при переводе могут многократно усилиться и совершенно исказить смысл.

Рынок переводов сегодня оценивается примерно в 10 млрд. долларов. Машинам доверяют перевести только одну страницу из ста (то есть пара десятков крупных лабораторий, несколько серьезных софтверных компаний бьются между собой ради куска пирога в 100—150 млн. долларов). Два кризиса идей в теории МП (первый был в шестидесятых, второй — после короткого ренессанса в 80-х) и общее разочарование в моделях, обещавших когда-то создание эффективных компьютерных переводчиков, привели к тому, что многие специалисты сменили вектор исследований и теперь занимаются непосредственно проблемами обучения машин. Они учат компьютеры понимать.

Озорства ради мы решили проверить, как справляются с тестом Бар-Хиллела современные системы перевода, и попытались перевести историю про Джона с помощью известных онлайновых систем:

Маленький Джон искал его игрушечную коробку. Наконец, он нашел это. Коробка была в ручке. Джон был очень счастлив.

Маленький john смотрел для его коробки игрушки. Окончательно, он нашел его. Коробка находилась в пер. John был очень счастлив.

Прошло почти полвека, а коробку все никак не могут вытащить из ручки.

Окончательно, он нашел его. Я сошла с ума, какая досада.

Это же была бессловесная машина. Я сказал «бессловесная»? У нее были все органы чувств. Она даже могла говорить. Могла и говорила. Она болтала без передышки. И слушала все наши разговоры. Она читала через наши плечи и давала непрошеные советы, когда мы играли в покер. Порой нам хотелось убить ее, да вот убить робота нельзя… такого совершенного.

Клиффорд Саймак, «Прелесть»

Моя твоя не понимай

Описывая реально доступные сегодня технологии, мы старались не распыляться и уделили внимание лишь тем аспектам, которые, на наш взгляд, важны для построения диалоговых интерфейсов. Поэтому в разделе о машинном переводе обсуждается только полный автоматический машинный перевод (хотя есть разработки, предполагающие участие человека, — и у них качество перевода в целом выше), а в разделе о технологии распознавании речи лишь мельком упомянули о технологии распознавания голоса по телефонной линии, которая не особенно интересна в аспекте построения диалоговых интерфейсов, но коммерчески вполне успешна. Но все равно впечатление получается двойственное.

С одной стороны, мы уже многое умеем. И построить систему, которая будет поддерживать «светский разговор», давно не составляет труда. В этом году приз Лёбнера (за псевдопрохождение теста Тюринга) получил бот Jabberwocky, с которым можно разговаривать часами. И голос синтезировать у нас тоже получается хорошо (правда, не только за счет технологий, но и за счет человеческой способности к узнаванию образов). С распознаванием речи, конечно, дела обстоят не ахти, но научимся и распознавать.

То есть построить диалоговый интерфейс с заданными командами на уровне «открой файл», «сохрани изменения» и «закрой файл» мы можем уже сегодня (и такие продукты есть).

Тем не менее остается еще один, самый главный кирпичик. Если мы хотим, чтобы общение с компьютером было продуктивным, компьютер должен нас понимать. Собственно, natural language understanding — это огромное междисциплинарное направление, на которое и отдельной темы номера не хватит, но не нужно быть семи пядей во лбу, чтобы прийти к очевидному выводу: построение эффективных речевых коммуникаций невозможно без нахождения обоих собеседников в одном и том же контексте.

В разделе, посвященном машинному переводу, мы приводили пример с коробкой в ручке, но вот другой пример, никак не связанный с переводами. Допустим, у нас есть компьютер, загруженный по самое не хочу словарями, семантикой, лингвистическими правилами, статистическими алгоритмами и прочая, и прочая, и прочая. Что он ответит на элементарный вопрос «есть ли вода в холодильнике?» Нормальный компьютер, конечно же, ответит, что вода в холодильнике есть. Во всяком холодильнике в любой момент времени можно найти множество молекул воды. На любой вкус. При этом компьютер не путает определения (как он делал в случае с «pen»). Формально он прав. Но мы-то спрашивали совсем о другом.

Человек, услышав тот же вопрос, сразу поймет, что имеется в виду не просто вода, а бутылка с минералкой. Иными словами, компьютер неправильно (с нашей точки зрения) отвечает на вопрос, хотя вся необходимая для ответа информация ему доступна.

Проблема в том, что речевая коммуникация — это не вещь в себе. Это верхушка айсберга, и если мы пытаемся подтянуть компьютеры до нашего уровня, то не можем усовершенствовать только их коммуникационные способности. Нельзя научить улитку французскому языку. И очень вероятно, что все описанные в статье задачи — распознавание речи, синтез текста, качественный машинный перевод — неразрешимы, пока не решена более глобальная задача: построение искусственного интеллекта.

Разработчики не любят говорить на эту тему. Задача создания ИИ давно уже табуирована. Но странное совпадение: сразу несколько исследовательских организаций (включая MIT Labs и Марвина Мински) работает сегодня над компьютерными программами (стоит ли называть их программами — тоже вопрос), обладающими зачатками здравого смысла и умеющими учиться. Они обучают нейросети простым, интуитивно понятным каждому человеку вещам. И не исключено, что когда-нибудь эти разработки действительно дадут нам возможность общаться с компьютером, не задумываясь о том, поймет он нас или нет.

Защищенный ноутбук Itronix GoBook VR-1

процессор Pentium M (1,86 ГГц)

до 2 Гбайт памяти DDR2

поддержка Wi-Fi, WLAN, GPS и Bluetooth (опции)

амортизированный 12,1-дюймовый ЖК-экран с разрешением 1024x768 (XGA)

амортизированный съемный жесткий диск объемом 40 или 80 Гбайт

клавиатура с защитой от пролитых жидкостей

два коннектора для антенн WLAN и WWAN

система защиты от кражи

цена $3330

Ноутбук для работы в экстремальных условиях, прекрасно экипированный в плане беспроводных стандартов. Для работы при нестандартных температурах жесткий диск оснащен обогревателем и кулером. Ресурс литий-ионной батареи — 4—6 часов. Компьютер, соответствующий военному стандарту MIL STD 810F, помещен в прочный корпус из магниевого сплава с шарнирами из нержавеющей стали. На базе этой модели и одновременно с нею выпущен вариант под названием Hammer ($3000); Itronix заключила лицензионное соглашение с корпорацией General Motors на эксклюзивное использование знаменитого автобрэнда.

Ультрапортативный ноутбук LG LW20 Express

12,1-дюймовый ЖК-экран с разрешением 1280x800 (WXGA)

процессор Pentium M 740 (1,3 ГГц, 2 Мбайт L2, 533-МГц шина);

чипсет Intel 915GM

512 Мбайт памяти DDR2 (до 2 Гбайт)

60-Гбайт 1,8-дюймовый жесткий диск Toshiba (4200 об./мин, PATA)

оптический привод DVD+/—RW, RAM

считыватель карт с поддержкой форматов xD, SD/MMC, MS/MS Pro

Wi-Fi-адаптер 802.11 b/g

разъем ExpressCard

цена $1750

Таким вот образом выглядит ультрапортативный компьютер по версии LG. Его экран создан с использованием фирменной технологии Fine Bright, улучшающей цветопередачу и контрастность изображения. Оптический привод (не поддерживающий двухслойные диски, зато работающий с экзотическим форматом DVD-RAM) может быть вынут и заменен заглушкой, что уменьшит вес ноутбука. Сногсшибательная деталь (оказывается, присутствующая и в других ноутбуках LG семейства Express): компьютер оснащен встроенным декодером Dolby Digital 5.1 и имеет аналоговую разводку аудиоканалов, что позволяет напрямую подключать к нему аудиосистему. Сам же ноутбук оснащен стереодинамиками (3 Вт) и поддерживает SRS TrueSound XT/WOW XT.

Портативный планшет Wacom PenPartner2

интерфейс USB

разрешение 1000 lpi

габариты 146x151x9 мм

вес 160 г

цена 35 евро

Очередной продукт компании Wacom, оккупировавшей рынок графических планшетов, предназначен для пользователей ноутбуков. От оригинальной версии PenPartner, вышедшей в апреле прошлого года, он отличается меньшими размерами и более привлекательным дизайном — и перо, и планшет выполнены в черном цвете с «антрацитовыми акцентами». Эргономика тоже улучшилась: планшет стал более плоским, благодаря чему рука меньше устает. Перо имеет прорезиненную область, препятствующую выскальзыванию из пальцев; две кнопки на нем работают как клик и двойной клик мыши. PenPartner2 поставляется с плагином JustWrite Office, позволяющим вводить рукописные комментарии в приложениях MS Office. В комплект также входит 60-см USB-кабель.

Ноутбук Fujitsu LifeBook C1320D

15,4-дюймовый широкоформатный ЖК-экран с разрешением 1280x768 (WXGA)

процессор Pentium M 740/750/760 (1,73—2 ГГц, 2 Мбайт L2, 533 МГц FSB)

чипсет Intel 915 GM

40/60/80-Гбайт винчестер (5400 об./мин.) с интерфейсом SATA 150

до 2 Гбайт памяти

адаптер сетей 802.11a/b/g Atheros Super AG (опция)

Bluetooth 1.2 (опция)

габариты 360x270x38 мм

вес 2,9 кг

цена от $1150

Новинка относится к разряду бюджетных, на что помимо цены указывает встроенный в чипсет видеоадаптер. Впечатляет время автономной работы (9,5 часа) — правда, для этого потребуется вставить батарею повышенной емкости и добавить к ней в отсек Modular bay еще одну. Оптический привод покупатель волен выбирать сам — это может быть как многоформатный DVD-рекордер с поддержкой двухслойных дисков, так и комбо-привод или просто DVD-ROM. Как и в любом современном ноутбуке, количество вариантов систем, построенных на базе этой модели, практически не поддается учету.

Многофункциональное устройство Garmin nu..vi 350

3,5-дюймовый ЖК-экран;

разъем SecureDigital;

встроенный динамик;

GPS-навигатор;

переводчик единиц меры и веса;

всемирные часы;

MP3-плейер;

проигрыватель аудиокниг;

цифровой фотоальбом

Сверхнавороченный универсальный спутник туриста и путешественника. На SD-картах (приобретаемых отдельно), специально подготовленных для этого устройства, производитель предлагает базы данных Garmin Language Guide и Garmin Travel Guide. Первая содержит многоязыковой банк слов и фраз, а также пять двухъязычных словарей. Поддерживается интерфейс «text-to-speech», так что пользователь будет знать и произношение тех или иных слов. Вторая база, подготовленная с использованием информации от «Марко Поло» (серия путеводителей), содержит обзоры и рекомендации по выбору ресторанов, гостиниц и т. п. Аппарат с легкостью воспроизводит MP3-файлы и фотографии, записанные на SD-карту.

Детектор беспроводных сетей Iogear Keychain Device

работа на частоте 2,4 ГГц;

поиск сетей 802.11b/g;

дальность действия 150 м;

четыре СИД для индикации покрытия сети и силы сигнала;

габариты 59x9x31 мм;

Назад Дальше