Об ИИ без мифов. Путеводитель по истории Искусственного Интеллекта - Леонид Черняк 6 стр.


В данном случае на роли братьев Райт жребий выбрал трех профессоров Фей-Фей Ли, Джефри Хинтона и Эндрю Ына, каждый из них внес свою лепту в становление этих трех научно-технических направлений. Стоит сказать, что на их месте могли бы оказаться любые другие ученые, все это игра случая, существенно то, что сложились необходимые предпосылки, а кому что досталась не столь важно.

 Профессору Фей-Фей Ли из Стэнфордского университета принадлежит идея использования машинного обучения для извлечения полезной информации из больших объемов данных. В своих экспериментах она использовала базу данных аннотированных изображений ImageNet. Большинство коллег применяли для подобных задач традиционные модели и алгоритмы AI, но Фей-Фей Ли решила нарушить традицию и применить для отработки и распознавания образов мало востребованные к тому времени методы машинного обучения.

 Из всех существовавших методов машинного обучения наилучшие результаты показали методы глубокого обучения, разработанные группой математиков из Университета Торонто, возглавляемой профессором Джефри Хинтоном.

 Универсальные компьютеры оказались слишком медленны для решения задач обучения, выход нашел работавший в Стэнфорде профессор Эндрю Ын. Он предложил использовать графические процессоры GPU для моделирования ANN.

Так возникла технологическая триада, являющаяся базисом современного AI большие данные, машинное обучение и GPU. Она является альтернативой двум компонентами действующей компьютерной парадигмы, состоящей из программирования и фон-неймановских компьютеров (CPU). Обучение на больших данных заменяет программирование, что же касается GPU, то сегодняшний день кластеры из эти процессоров, ядра которых остаются фон-неймановскими, позволяют создать обучаемую, а не программируемую инфраструктуру. Этот путь создания тела для AI далеко не совершенен, но действующей альтернативы нет, ведутся активные исследования и разработки иных нежели GPU процессоров, но они пока на уровне экспериментов.

Нынешнюю волну AI нередко называют третьей, это так, но надо отдавать себе отчет, что это лишь порядковый номер, ни теоретически, ни технологически эта волна никак не связана с предшествующими. Представленная выше группа весьма харизматичных ученых оказалась в центре внимания масс-медиа, однако необходимые и достаточные условия для возникновения этой волны ANI были созданы более широким научным сообществом.

Новые скептики

Подъем интереса к AI немедленно вызвал обратную волну, с критикой выступили люди, далекие от понимания сути происходящего. Неизгладимое впечатление на общественность произвел ныне покойный британский физик и космолог Стивен Хокинг, заявивший в 2017 году: «Развитие искусственного интеллекта может стать как наиболее позитивным, так и самым страшным фактором для человечества. Мы должны осознавать опасность, которую он несет». Хокинг выразил опасения относительно того, что новейшие технологии могут привести к деградации человека, сделав его беспомощным перед лицом природы, что в условиях естественной эволюции и борьбы за выживание означает верную гибель.

Среди тех, кто добросовестно заблуждается и выступают в прессе, не имея серьезного представления об AI, есть и вполне достойные люди, например, великий дипломат Генри Киссинджер. Его статья с эпохальным на первый взгляд названием «Конец Эпоха просвещения» (How the Enlightenment Ends) опубликована не где-нибудь, а в журнале The Atlantic.

Квинтэссенция позиции Киссинджера такова: «Просвещение началось с философских размышлений, которые распространялись с помощью новой технологии. Мы движемся по противоположному пути. Разработана потенциально доминирующая технология AI, которая нуждается в направляющей философии. Но разработкой таковой никто даже не занимается». Статья завершается выводом: «Создатели AI, некомпетентны в политике и философии, точно так же, как я в сфере технологий, поэтому они должны задаться вопросами, которые я поднял в этой статье, чтобы встроить ответы в свои инженерные разработки. Правительству США стоит подумать о создании президентской комиссии из признанных экспертов-мыслителей, которые помогут разработать национальный подход. Очевидно одно: если мы не начнем эту работу в ближайшее время, очень скоро мы поймем, что уже опоздали».

Однако это контрволна незаметно стихла, не успев как следует подняться, в 201820 годах поток «провидческих» выступлений заметно ослаб. В средствах массовой информации и в социальных сетях, где все чаще звучит призыв к трезвому отношению к AI под лозунгом демистификации AI (Demystification AI). В эти годы активно развивался AI-бизнес, связанный с производством средств автоматизации в самых разных сферах.

Особености третьей волны

В чем новизна очередной волны AI, что делает ее отличной от предшествующих, и не ждет ли ее такая же печальная судьба? Для этого сравним их исходные позиции. Напомним, авторы первых двух волн шли по пути, названному Тьюрингом «сверху-вниз» в сочетании с действующей по сей день двухзвенной компьютерной парадигмой, стоящей на двух китах: универсальное аппаратное обеспечение и программное обеспечение, служащее для решении конкретной задачи. В рамках этой парадигмы решение любой задачи, какой бы сложной она ни была, сводится написанию программы для компьютера, главное, чтобы он обладал необходимой производительностью. При этом упускались из виду ограничения этой парадигмы программируемый компьютер по природе своей не может делать ничего помимо того, что в него вложил человек. Следовательно, нет такого момента, где бы он проявить свой собственный тот самый искусственный интеллект и породить что-то «от себя». Он действует строго по программе, даже при выполнении таких, казалось бы, сложных действий, как доказательство теорем, написание музыки или игра в шахматы.

Качественное отличие третьей волны от первых двух в том, что она реализует схему «снизу-вверх» по Тьюрингу, в ее основе лежит коннекционистский подход, альтернативный символьному. В отличие от процессора нейронная сеть не может быть запрограммирована, но ее можно «обучить» тем или иным образом, после чего она способна моделировать простейшие процессы, происходящие в мозге. На данный момент многообразие методов обучения, сводится к предъявлению нейронной сети большого объема данных с тем, чтобы она смогла настроиться на них и находить решения. По большей части все, что называют AI-приложениями третьей волны ограничено компьютерным зрением (Computer Vision, CV) и обработкой текста на естественном (Natural Language Processing). В отличие от первых двух волн эти приложения относятся не просто к просто узкому или слабому AI (Narrow, Weak AI), а являются сугубо специализированным AI-решениями, которые называют AI, скорее, как дань традиции.

То, что многочисленные рассуждения о возможностях AI на практике пока свелись к сугубо специализированным решениям, имеет вполне понятное объяснение. Возможности моделирования средствами искусственных нейронных сетей ограничены существующими компьютерными технологиями, для сравнения даже самые мощные GPU кластеры, совершенно ошибочно называемые суперкомпьютерами (компьютеры универсальны, а GPU-кластеры специализированы), насчитывают десятки тысяч, максимум сотни тысяч ядер. При этом мозг таракана состоит из 1 миллиона нейронов, лягушки 16 миллионов. У более сложных существ мозг насчитывает миллиарды нейронов, что касается человека, то в его мозге примерно 85 миллиардов. На сотни тысяч ядер кластеры потребляют мегаватты энергии, а человеческий мозг 20 ватт. Каким же надо быть безудержным оптимистом, чтобы говорить о реальной возможности сильного AI, превосходящего возможности человека? А ведь находятся!

До того, когда AI обретет потенциал, хотя бы как-то сопоставимый с самым примитивным живым мозгом еще очень далеко, на нынешнем уровне развития электроники просто не о чем говорить. Поэтому схема работы современной обучаемой AI-системы на нейронных сетях в некотором роде искусственна, в отличие от мозга даже простейших. Она разделена на два этапа, первый training, как следует из названия на нем тренирует или обучает искусственную нейронную сеть, являющуюся грубой моделью мозга, а на втором обученная нейронная сеть переносится в другую сеть, этот процесс называется inference, что можно перевести логическим выводом иди умозаключением. В то же время мозг простейшего живого совмещает training с inference.

О компьютерах и AI

Даже при такой упрощенной схеме реализации AI классические компьютеры, построенные по ФНА с ограниченным количеством центральных процессоров (Central Processing Units, CPU) с задачей training не справляются. Фундаментальная причина заключается в том, что они строятся на процессорах, состоящих из ядер типа SISD (Single Instruction, Single data), то есть задуманы для обработки одного потока данных одним потоком инструкций, для распараллеливания число ядер может достигать нескольких десятков. Даже собранные вместе десятки мощных процессоров оказывается неспособными к моделированию работы мозга нейронной сетью с тысячами узлов, требуемой при решении задач CV и NLP. Временный выход из положения совершенно случайно нашелся в виде Graphics Processing Units (GPU), эти созданные для работы с графикой компьютерных игр процессоры относятся к типу SIMD (Single Instruction, Multiple Data), они состоят из тысяч небольших ядер, на них проще воспроизвести нейросеть и специализированный компьютер будет обладать большей производительностью. Сегодня большая часть задач training решается на GPU. Для inference обученная сеть чаще всего переносится на CPU или GPU, а также на программируемых матрицах (Field Programmable Gate Array, FPGA).

Назад Дальше