Еще в 1990-е гг. фирма Курцвейла делала первые шаги в распознавании речи и разрабатывала приложения, которые позволили бы врачам диктовать медицинские отчеты. Курцвейл продал свою компанию, и на ее, в частности, основе возникла компания Nuance Communications. Всякий раз, прибегая к помощи Siri, вы пользуетесь алгоритмами Nuance, задействованными в речевой части этого волшебства. Распознавание речи - искусство перевода произнесенного слова в текстовую форму (не путать с обработкой естественного языка, цель которой - извлечение смысла из написанных слов). После того, как Siri переведет ваш запрос в текстовый вид, в дело вступают три остальных ее главных таланта: обработка естественного языка, поиск в громадной базе данных и взаимодействие с поисковыми серверами Интернета, такими как OpenTable, Movietickets и Wolfram | Alpha.
Watson - что-то вроде Siri на стероидах и безусловный чемпион по обработке естественного языка. В феврале 2011 г. эта программа, применив построенные по образцу мозга системы, одержала убедительную победу над соперниками-людьми в "Своей игре". Как и шахматный чемпион Deep Blue, для IBM Watson - это способ продемонстрировать свои вычислительные ноу-хау при одновременном продвижении дела ИИ. Известная игра представляла для программы серьезный вызов, ведь в вопросах часто задействованы ассоциации и игра слов. Участники должны понимать каламбуры, сравнения и культурный контекст, а ответы необходимо формулировать в том же стиле, что и вопросы. Однако распознавание речи не является специализацией Watson. Он не способен понимать устную речь. А поскольку он не видит и не чувствует, он не может и читать, так что в ходе игры вопросы приходится вводить вручную. К тому же Watson не слышит, так что аудио- и видеоподсказки исключались.
Эй, погодите-ка! Так что же выиграл Watson - "Свою игру" или специально подстроенную под него ее разновидность?
Уже после громкой победы, чтобы научить Watson понимать человеческую речь, IBM скрестила его с технологией распознавания речи фирмы Nuance. Кроме того, Watson читает терабайты медицинской литературы. Одна из целей IBM - уменьшить его габариты с нынешней комнаты, наполненной серверами, до, скажем, размеров холодильника и сделать из него лучшего в мире медика-диагноста. Когда-нибудь, уже довольно скоро, вам, возможно, придется записываться к врачу через виртуального помощника, который засыплет вас вопросами и сообщит врачу ваш предварительный диагноз. К несчастью, Watson по-прежнему не видит и может просмотреть такие признаки вашего состояния, как блеск в глазах, румяные щеки или свежее пулевое ранение. IBM планирует также установить Watson на ваш смартфон в качестве идеального приложения "вопрос-ответ".
Где же работают скопированные с мозга способности Watson? Его аппаратное обеспечение имеет выраженную параллельную структуру: 3000 параллельных процессоров оперируют 180 различными программными модулями, написанными для параллельных процессоров. Параллельная обработка информации - величайшее достижение мозга, и разработчики программного обеспечения вовсю пытаются повторить это достижение. Как сказал мне Грейнджер, параллельные процессоры и написанные для них программы не оправдали ожиданий. Почему? Потому что написанные для них программы плохо справляются с разделением задач для параллельного решения. Но, как продемонстрировал Watson, доработанные параллельные программы меняют ситуацию, и "железо" с параллельной архитектурой не слишком отстает. Разрабатываются новые чипы параллельных вычислений, которые должны невероятно ускорить работу уже существующих программ.
Watson показал, что параллелизм способен выполнять поразительные объемы вычислительных работ с невероятной скоростью. Но главное достижение Watson - способность самостоятельно обучаться. Его алгоритмы находят закономерности в текстовых данных, которые дают ему его создатели. Сколько может быть таких данных? Энциклопедии, газеты, романы, словари, вся "Википедия", Библия - всего около 8 млн толстых томов текста, которые машина обрабатывает со скоростью 500 гигабайт (примерно тысяча толстых книг) в секунду. Следует отметить, что в число текстовых материалов входили подготовленные словарные базы, таксономии (систематизированные и классифицированные коллекции слов) и онтологии (описания слов и отношений между ними). По существу, в этих материалах собран человеческий здравый смысл. К примеру, "крыша - это верхняя часть дома, не нижняя его часть, как подвал, и не боковая, как наружная стена". Это предложение говорит Watson кое-что о крышах, домах, подвалах и стенах, но для того, чтобы предложение имело смысл, ему необходимо знать определения всех использованных слов и определение слова "часть" заодно. Кроме того, ему нужно увидеть это слово не один раз, а множество, в разных предложениях. У Watson есть такая возможность.
Во второй игре объявленного IBM конкурса "Своей игры" появился такой вопрос: "Это условие в коллективном трудовом договоре говорит о том, что заработная плата может увеличиваться и уменьшаться в зависимости от определенного параметра, такого, например, как стоимость жизни". Сначала Watson разобрал это предложение, то есть выбрал из него и проанализировал ключевые слова. Затем он извлек из уже освоенных источников информацию о том, что заработная плата - это нечто, что может увеличиваться и уменьшаться, что в трудовом договоре пишут о заработной плате и что в договорах бывают условия. У него был и еще один очень важный ключ - категория, к которой относился вопрос, называлась "юридические "И"". Из этого Watson узнал, что ответ связан с распространенным юридическим термином и должен начинаться с буквы "И". Watson быстрее людей дал ответ на этот вопрос: "Что такое индексация заработной платы?" - и это заняло у него целых три секунды.
А после первого правильного ответа в той или иной категории Watson обретал уверенность (и начинал играть смелее), поскольку "понимал", что верно интерпретировал категорию. Система адаптировалась к игре или училась играть лучше прямо по ходу игры.
Но отвлекитесь на минуту от "Своей игры" и представьте, как быстро адаптивное машинное обучение может быть перенастроено на обучение вождению автомобиля, управлению танкером в море или геологической разведке на золото. Подумайте, какая мощь скрыта в интеллекте человеческого уровня.
Watson продемонстрировал еще один интересный вид интеллекта. Его программа DeepQA генерирует сотни возможных ответов и собирает сотни данных в пользу каждого из них. Затем она фильтрует и ранжирует ответы по уровню своей уверенности в каждом. Если она не чувствует уверенности ни в одном ответе, она не станет отвечать, поскольку в "Своей игре" за неверный ответ назначается штраф. Иными словами, Watson знает, чего он не знает. Конечно, вы можете не поверить, что вероятностные вычисления - это осознание себя, но согласитесь, это уже шаг в верном направлении. Знает ли Watson на самом деле что-нибудь?
Ну, если контуры мозга управляются алгоритмами, как утверждают Грейнджер и другие специалисты по вычислительной нейробиологии, то логично спросить: а знаем ли мы, люди, хоть что-нибудь? Или, говоря иначе, может быть, и мы, и они что-то знаем. И, разумеется, Watson - это настоящий прорыв, способный многому нас научить. Курцвейл сказал об этом так:
Много писали о том, что Watson работает через статистические расчеты, а не через "подлинное" понимание. Многие читатели понимают это так, что Watson просто собирает статистику о словосочетаниях… Но точно так же и пространственное распределение концентрации нейротрансмиттеров в коре человеческого мозга можно назвать "статистической информацией". В самом деле, мы разрешаем свои сомнения примерно так же, как это делает Watson, - сравнивая вероятности различных интерпретаций фразы.
Иными словами, как мы уже говорили, ваш мозг помнит информацию благодаря прочности электрохимических сигналов в синапсах, участвовавших в кодировании этой информации. Чем выше концентрация химических веществ, тем дольше и надежнее будет храниться информация. Основанные на фактах вероятности, с которыми работает Watson, тоже представляют собой своего рода шифр, но только в компьютерной форме. Это знание или нет? Такая дилемма приводит на ум загадку "китайской комнаты" Джона Сёрля, речь о которой шла в главе 3. Как мы вообще сможем узнать, думают компьютеры по-настоящему или просто хорошо имитируют этот процесс?
Что характерно, на следующий день после победы Watson в "Своей игре" Сёрль сказал:
IBM придумала хитроумную программу - но не компьютер, способный думать. Watson не понимал ни вопросов, ни своих ответов, ни того, что некоторые из них оказывались верными, а некоторые - неверными, ни того, что все это игра, ни того, что он выиграл, - потому что он вообще ничего не понимает.
Дэвид Ферруччи, ведущий специалист IBM по системе Watson, на вопрос о том, умеет ли Watson думать, ответил, перефразируя известного голландского компьютерщика Эдгера Дейкстру: "Умеет ли подводная лодка плавать?"
То есть подлодка не "плавает" так, как плавает рыба, но она может передвигаться в толще воды быстрее большинства рыб и оставаться под водой дольше любого млекопитающего. Более того, в некоторых отношениях подлодка плавает лучше рыб и млекопитающих именно потому, что она плавает не так - у нее свои достоинства и недостатки. Интеллект Watson производит сильное впечатление, хотя и ограничен, потому что не похож на человеческий. В среднем он работает много быстрее и способен делать вещи, доступные только компьютерам, - к примеру, отвечать на вопросы "Своей игры" круглосуточно и без выходных, а также подключаться к сборочной линии новых архитектур типа Watson, когда возникнет необходимость поделиться с ними знаниями и готовыми программами. А в вопросе о том, думает ли Watson, я предлагаю довериться нашим органам чувств.
Кен Дженнигс, один из людей - оппонентов Watson по "Своей игре" (называвший себя, кстати, "Великой углеродной надеждой"), ощущал своего противника как человека.
Методы, при помощи которых компьютер раскручивает вопросы в игре, очень похожи на мои. Эта машина сосредоточивается на ключевых словах вопроса, а затем обшаривает свою память (в случае Watson это пятнадцать терабайт базы человеческих знаний) в поисках групп ассоциаций, связанных с этими словами. Она строго проверяет первые ассоциации по всей контекстной информации, какую только может собрать: название категории; тип возможного ответа; время, место и тендерные особенности, на которые указывает вопрос, и т. д.
И когда машина решает, что достаточно "уверена" в ответе, она нажимает на звонок. Все это происходит мгновенно, и для игрока-человека это интуитивный процесс, но я убежден, что, если разобраться, мой мозг проделывает приблизительно то же самое.
Действительно ли Watson думает? И как много он на самом деле понимает? Я не знаю наверняка. Но я уверен, что Watson - это первый вид совершенно новой экосистемы, первая машина, по поводу которой мы можем задаваться такими вопросами.
Может ли Watson стать основой когнитивной архитектуры, представляющей собой полноценный искусственный интеллект человеческого уровня? Ну, у этой системы серьезная база, которой нет больше ни у какой другой: это и толстый кошелек, и компания, публично заявляющая о готовности преодолевать препятствия и рисковать, и план будущего финансирования, обеспечивающего жизнь и развитие. Если бы я управлял IBM, я воспользовался бы популярностью компании, уровнем продаж и научными результатами, полученными в работе над сложнейшими проектами Deep Blue и Watson, и объявил бы миру, что в 2020 г. IBM готова будет пройти тест Тьюринга.
Успехи в обработке естественных языков очень скоро преобразят те области экономики, которые до сих пор, казалось, совершенно не затрагивал технический прогресс. Через несколько лет библиотекари и исследователи всех сортов присоединятся в очередях на бирже труда к продавцам, банковским кассирам, турагентам, биржевым брокерам, кредитным менеджерам и работникам справочных служб. За ними последуют врачи, юристы, налоговые и пенсионные консультанты. Вспомните, как быстро автоматы едва ли не полностью заменили банковских операторов, а машины начали вытеснять живых кассиров в супермаркетах. Если вы работаете в информационной индустрии (а цифровая революция превращает все на свете в информационную индустрию), берегитесь.
Вот простой пример. Любите университетский баскетбол? Определите, какая из этих заметок написана спортивным журналистом - человеком?
Текст А
Опрос среди тренеров по поводу того, кто может занять первое место, показал, что Ohio State (17) и Kansas (14) на двоих получают ни много ни мало тридцать один голос. Последние изменения в верхней части пула стали неизбежны, когда Duke в субботу вечером обидел противник из Конференции Атлантического побережья - Virginia Tech. Buckeyes (27:2), пробиваясь обратно на вершину, достаточно легко нанесли поражение соперникам из десятки сильнейших - Illinois и Indiana. Ohio State начал со счета 24:0 и четыре недели в начале сезона был лучшим, пока не опустился на третье место. А в тройке сильнейших он находится уже пятнадцатую неделю подряд. Kansas (27:2) по-прежнему второй и по результатам опроса отстает от Ohio State всего на четыре пункта.
Текст Б
Ohio State возвращает себе первое место через неделю после победы дома над Illinois со счетом 89:70. За этим последовала еще одна победа дома над Indiana, 82:61. Utah State входит в число двадцати пяти лучших и находится на двадцать пятом месте после победы дома над Idaho, 84:68. Temple на этой неделе выпадает из рейтинга после проигрыша первому на тот момент Duke и выигрыша над George Washington, 57:41. Arizona на этой неделе сильно сдвинулась и занимает восемнадцатое место после неприятного проигрыша Университету Южной Калифорнии со счетом 65:57 и неприятного проигрыша Университету Калифорнии в Лос-Анджелесе, 71:49. St. John's подскочил на восемь позиций и занял пятнадцатое место после выигрыша у пятнадцатой на тот момент в рейтинге Villanova, 81:68 и DePaul, 76:51.
Ну как, догадались? Конечно, ни один из авторов не создал шедевр, но лишь один из них - живой человек. Это автор текста А, опубликованного на сайте ESPN. Текст Б написан автоматической издательской платформой, созданной Робби Алленом из фирмы Automated Insight. За один год его компания со штаб-квартирой в Дареме (штат Северная Каролина) сформировала 100 ООО автоматических статей на спортивные темы и разместила их на сотнях сайтов, посвященных местным командам. Зачем миру нужны роботы, пишущие спортивные статьи? Аллен рассказал мне, что о многих командах вообще никто не пишет, и их болельщики остаются в полной неизвестности. Кроме того, написанные ИИ статьи могут появляться на сайте команды и подхватываться другими сайтами всего через несколько минут после окончания игры. Человек не в состоянии работать так быстро. Аллен - бывший старший инженер Cisco Systems - не захотел назвать мне "секретный источник" своей поразительной архитектуры. Но скоро, сказал он, Automated Insights начнет выдавать статьи на темы финансов, погоды, недвижимости и местных новостей. Его "голодные" серверы нуждаются лишь в слабоструктурированных данных.
Если вы уже начали знакомиться с результатами вычислительной нейробиологии, вам трудно (мне по крайней мере точно трудно) представить значительный прогресс в области архитектур УЧИ, достигнутый исключительно на базе когни- тивистики. Полное понимание принципов, на базе которых функционирует мозг на каждом уровне, представляется мне более надежным и исчерпывающим способом создания разумной машины, нежели любые усилия, прилагаемые без такого понимания. Вы согласны со мной? Ученым не понадобится анализировать работу каждого из ста миллиардов нейронов мозга, чтобы разобраться в их функциях и смоделировать их, поскольку структура мозга очень избыточна. Кроме того, не потребуется, возможно, моделировать весь объем мозга, включая те области, которые контролируют автономные функции, такие как дыхание, сердцебиение, реакцию "дерись или беги" и сон. С другой стороны, может стать очевидным, что интеллект должен обитать в теле, которое он контролирует, и что тело это должно существовать в сложной среде. Споры о необходимости воплощения на этом не разрешатся. Но подумайте о таких концепциях, как яркий, сладкий, твердый и острый. Как может ИИ узнать, что означают эти ощущения, и построить на них концепции, если у него не будет тела? Не возникнет ли непреодолимое препятствие для превращения машины в искусственный интеллект человеческого уровня, если у нее не будет чувств?
На этот вопрос Грейнджер отвечает: "Неужели Хелен Келлер была менее человеком, чем вы? Или парализованный человек? Неужели мы не можем вообразить себе интеллект с совершенно иными способностями, со зрением, датчиками прикосновения и микрофонами для слуха? Конечно, у него будут несколько иные представления о ярком, сладком, твердом, остром, - но очень вероятно, что представления об этих концепциях у многих людей с различными вкусовыми рецепторами, возможно, с нарушениями здоровья, принадлежащих к разным культурам и живущих в разных условиях, и сегодня сильно различаются".
Наконец, вполне возможно, что для рождения интеллекта ученым необходимо смоделировать еще и эмоциональный орган. В принятии решений эмоции зачастую играют более серьезную роль, чем разум; то, кто мы есть, и то, как мы думаем, в значительной степени определяется гормонами, которые возбуждают и успокаивают нас. Если мы и правда хотим смоделировать человеческий интеллект, разве эндокринная система не должна быть частью архитектуры? Не исключено, что интеллект требует полноценных человеческих ощущений. Первичные ощущения, или субъективное качество обитания в теле и жизни в состоянии постоянной сенсорной обратной связи, могут оказаться необходимыми для интеллекта человеческого уровня. Несмотря на аргументы Грейнджера, исследования показали, что люди, парализованные в результате травмы, испытывают эмоциональное омертвение. Можно ли создать эмоциональную машину без тела, а если нет, то неужели такую важную часть человеческого интеллекта никогда не удастся реализовать?
Разумеется - и я буду говорить об этом в последних главах, - мои опасения сводятся к тому, что на пути создания ИИ с интеллектом, подобным человеческому, исследователи создадут вместо этого нечто чуждое, сложное и неуправляемое