В роботах используются готовый промышленный манипулятор, захват с присоской и система технического зрения. Система технического зрения соединена с захватом с помощью Covariant Brain программной платформы, не зависящей от аппаратного обеспечения. Она призвана стать универсальным искусственным интеллектом для роботов в любой клиентской среде единой нейросетью, способной адаптироваться к разнообразным условиям.
«Наша система делает выводы об объектах, которые никогда раньше не встречала. Видеть полную картину и понимать, как взаимодействовать с отдельными предметами, включая совершенно незнакомые, это человеческая способность и это, по сути, общий интеллект, говорит Питер Эббил, один из основателей компании. Такое обобщенное понимание того, что находится в корзине, является ключом к успеху. В этом разница между традиционной системой, где вы заранее каталогизируете все товары и пытаетесь их распознать, и складами, где у вас много артикулов и постоянно появляются новые»[23].
Назвать эту систему гибридной вряд ли справедливо по отношению ко всем техникам, которые использовались для наделения ее способностью к обобщению. Covariant использует широкий спектр методов, включая имитационное обучение и обучение с подкреплением.
Например, чтобы обучить робота взаимодействовать с новым набором предметов, их раскладывают перед ним и смотрят, сумеет ли он правильно сориентироваться. В случае неудачи робот может обновить свое представление о том, что он видит, и попробовать другие подходы. Добиваясь успеха, он получает вознаграждающий сигнал, который подкрепляет обучение.
Когда набор артикулов совсем ни на что не похож, Covariant вынужден вернуться к обучению с учителем сбору и маркировке большого количества новых обучающих данных, как в системах глубокого обучения.
Чтобы добиться успеха в коммерческой среде, роботы должны работать на очень высоком уровне. Ранее роботы-сборщики KNAPP надежно обрабатывали около 15 % объектов; теперь же, оснащенные технологией Covariant, они справляются с 95 % объектов[24]. За час робот собирает около 600 объектов, а человек 450. И тем не менее в компании Obeta не сократили ни одного сотрудника.
По словам Питера Пухвайна, вице-президента по инновациям компании KNAPP, персонал прошел переподготовку, чтобы лучше разбираться в робототехнике и компьютерах[25]. Тем временем компания Covariant собирается развивать платформу Brain, чтобы использовать роботов в производстве, сельском хозяйстве, гостиничном бизнесе, на промышленных кухнях и в конечном счете в домах людей.
Выживает сильнейший алгоритм
Нерелевантные результаты поиска вечная головная боль для интернет-магазинов вроде Zappos. Запросы могут иметь несколько разных значений для поисковой системы сайта, поэтому получить точные результаты порой непросто. Потенциальные клиенты, подбирающие туфли к платью определенного стиля и получающие платья вместо туфель, вскоре от этого устанут и перейдут к конкурентам. Чтобы решить эту проблему, Zappos сталкивает алгоритмы друг с другом в цифровой игре «Выживший».
Эти так называемые генетические алгоритмы, по сути, являются алгоритмами рандомизированного поиска, имитирующими механику естественного отбора. В этом процессе человек, наткнувшись на полезные результаты, использует их, например, оптимизирует маршруты доставки или проектирует легкие, но прочные конструкции.
Генетические алгоритмы были впервые представлены в 1960 году Джоном Холландом, крупным ученым в области психологии, электротехники и информатики, но применять их стали лишь недавно: раньше не хватало вычислительных мощностей. Компания Zappos начала экспериментировать с генетическими алгоритмами в 2017 году.
В то время на сайте компании ежемесячно появлялось около миллиона уникальных поисковых запросов. Поисковая система должна была сопоставить эти запросы с более чем 100 000 позиций в каталоге[26]. Генетические алгоритмы моделируют процесс естественного отбора по Дарвину. Система Zappos, например, создает алгоритмы, которые определяют смысл поисковой фразы.
Один алгоритм рассматривает в определенной фразе как сильный сигнал слово «платье». Конкурирующий алгоритм в этом же запросе уделяет больше внимания другим словам. «Тест на релевантность», имитирующий поведение пользователей, вознаграждает победителя и передает его черты следующему поколению. Алгоритм, который лучше всех справился с поставленной задачей, и начинает работать на сайте, пока его не заменят более эффективным. Таким образом, поисковая система постоянно совершенствуется.
Менее чем через год использования технологии генетических алгоритмов компания обнаружила, что клиенты быстрее совершают покупки и применяют меньше фильтров: покупателям не приходится постоянно переформулировать запросы для уточнения поиска. По словам Амина Казеруни, ведущего специалиста по обработке данных в Zappos, «в конце концов, это не постоянные расходы: подключил и работает»[27].
Прогнозы все точнее
Люди регулярно и часто без особых усилий перебирают вероятности и, даже имея относительно небольшой опыт, действуют в соответствии с наиболее возможными из них. Сейчас специалисты обучают машины подражать рассуждениям с помощью вероятностных моделей, основанных на гауссовских процессах; такие модели позволяют действовать в условиях значительной неопределенности, работают с разреженными данными и обучаются на опыте.
Около десяти лет назад компания Alphabet, материнская компания Google, запустила в регионах мира, слабо охваченных интернетом, проект Loon. Это было сделано с помощью системы гигантских аэростатов, размещенных в стратосфере[28]. Их навигационные системы использовали гауссовские процессы для определения траектории оптимального движения среди разных слоев порывистых и изменчивых воздушных потоков. Каждый шар перемещался в воздушный поток нужного направления, таким образом из аэростатов формировалась большая коммуникационная сеть.
Воздушные шары могли не только делать достаточно точные прогнозы на основе прошлых полетов, но и анализировать новые данные прямо в воздухе, корректируя с их учетом свежие прогнозы.
Компания Alphabet завершила эксперимент в начале 2021 года, однако использование гауссовских процессов имеет большие перспективы. Стартап Secondmind разработал продукт Decision Engine, основанный на вероятностном моделировании с помощью гауссовских процессов. С помощью этой платформы японский автоконцерн Mazda смог улучшить настройку двигателя, используя в тысячу раз меньше данных, чем требуется обычным современным системам[29].
Некоторые эксперты считают, что использование гауссовских процессов для работы с небольшими объемами данных может ускорить создание автономного искусственного интеллекта. «Чтобы создать действительно независимое средство, нужно научить его очень быстро адаптироваться к меняющимся внешним условиям, говорит Вишал Чатрат, генеральный директор стартапа Secondmind, занимающегося искусственным интеллектом. То есть обучаться, эффективно используя данные»[30].
Гауссовские процессы не требуют огромного количества данных для распознавания закономерностей. Вычисления, необходимые для выводов и обучения, относительно просты, а если что-то пойдет не так, причину этого можно будет отследить, чего не скажешь о черных ящиках нейросетей.
Уже ближе к причинно-следственной связи
Искусственный интеллект хорошо умеет выявлять взаимосвязи и делать на их основе ценные прогнозы. Например, компания GNS Healthcare из Кембриджа, занимающаяся точной (персонализированной) медициной, использует алгоритмы причинно-следственных связей, чтобы помочь крупнейшим фармацевтическим компаниям мира понять не только кто именно из пациентов реагирует на те или иные препараты, но и почему.
Используя байесовские методы, их программная платформа переводит данные в каузальные (причинные) модели. Это позволяет определить, какие переменные в наборе данных оказывают максимальное влияние на другие переменные, улучшить качество проверки лекарственных препаратов, ускорить их апробацию и лучше спрогнозировать риски для пациентов.
В одном из исследований компания GNS совместно с Альянсом клинических испытаний в онкологии поставила задачу определить предикторы (прогностические параметры) для группы пациентов с метастатическим колоректальным раком (мКРР)[31]. Это один из самых распространенных видов рака в США: ежегодно диагностируется около 140 000 новых случаев.
В исследовании использовалась платформа на основе ИИ, учитывающего причинно-следственные связи; с ее помощью был проведен анализ клинических данных более чем 2000 пациентов с мКРР. Исследователи хотели выявить биомаркеры пациентов на разные лекарственные препараты и предикторы общей выживаемости среди определенных подгрупп пациентов.
«Мы никогда не были в лучшем положении, чтобы разгадать движущие силы заболевания и реакции пациентов на конкретные препараты, говорит Колин Хилл, председатель совета директоров, генеральный директор и соучредитель GNS. Мы создали компьютерную модель пациента с колоректальным раком и смогли обнаружить биомаркеры, показывающие, какие пациенты будут реагировать на то или иное лечение и, самое главное, почему. Именно это приведет нас к созданию персонализированной медицины и позволит искоренить болезнь»[32].
Завоевание пространства-времени
Ежедневно на YouTube загружается около 720 000 часов[33] видео, которое необходимо обработать для рекламных рейтингов и выдачи в рекомендациях пользователям. В медицинских учреждениях терабайты видеозаписей должны использоваться только на локальных устройствах, чтобы не нарушать конфиденциальность пациентов. В «умных» городах огромный объем записи камер видеонаблюдения иногда надо проанализировать очень быстро, чтобы предотвратить угрозу потенциально опасных или преступных действий.
Все эти задачи требуют точного и эффективного понимания происходящего на каждой конкретной видеозаписи. Но распознавание видео (в отличие от распознавания статичных изображений) требует временного моделирования способности понимать и предугадывать последовательность действий. Как и другие разновидности искусственного интеллекта, основанные на глубоком обучении, видеоприложения обычно нуждаются в огромных и дорогих вычислительных мощностях, без которых просто не работают.
Однако недавно в лаборатории MIT-IBM Watson AI Lab разработали новую методику обучения систем распознавания видео, обеспечивающую высокую точность при сокращении вычислительных затрат[34]. Исследователям удалось обучить систему выдавать результат втрое быстрее, чем если бы они использовали другие современные методики.
Сноски
1
Доэрти П., Уилсон Д. Человек + машина. Новые принципы работы в эпоху искусственного интеллекта. М.: Манн, Иванов и Фербер, 2019.
2
Bhaskar Ghosh, Adam Burden, and James Wilson, Full Value. Full Stop. How to Scale Innovation and Achieve Full Value with Future Systems, Accenture, 2019, https://www.accenture.com/us-en/insights/future-systems/future-ready-enterprise-systems.
3
Paul Daugherty, Bhaskar Ghosh, Annette Rippert, Ramnath Venkataraman, and H. James Wilson, Make the Leap, Take the Lead, Accenture, April 28, 2021, https://www.accenture.com/us-en/insights/technology/scaling-enterprise-digital-transformation.
4
Intelligence, Data, Expertise, Architecture, Strategy. Прим. ред.
5
Here, we are, of course, paraphrasing Marshall McLuhans observation, https://mcluhangalaxy.wordpress.com/2013/04/01/we-shape-our-tools-and-thereafter-our-tools-shape-us/.
6
Alan Turing, Computing Machinery and Intelligence, Mind, LIX (236): 433460, October 1950, https://doi.org/10.1093/mind/LIX.236.433.
7
Библия, Ветхий Завет. Книга пророка Исаии, 11:6.
8
Alison Gopnik, The Ultimate Learning Machines, Wall Street Journal, October 11, 2019, https://www.wsj.com/articles/the-ultimate-learning-machines-11570806023.
9
Brenden M. Lake, Tomer D. Ullman, Joshua B. Tenenbaum, and Samuel J. Gershman, Building Machines That Learn and Think Like People, Behavioral and Brain Sciences, 40, 2017, https://www.cambridge.org/core/journals/behavioral-and-brain-sciences/article/building-machines-that-learn-and-think-like-people/A9535B1D745A0377E16C590E14B94993.
10
Доэрти П., Уилсон Д. Человек + машина. Новые принципы работы в эпоху искусственного интеллекта. М.: Манн, Иванов и Фербер, 2019; Paul R. Daugherty and H. James Wilson, Human + Machine: Reimagining Work in the Age of AI (Boston: Harvard Business Review Press, 2018).
11
Alison DeNisco Rayome, Why Companies Plan to Double AI Projects in the Next Year, TechRepublic, July 15, 2019, https://tek.io/2Y3heCK.
12
Bhaskar Ghosh, Adam Burden and James Wilson, Full Value. Full Stop. How to Scale Innovation and Achieve Full Value with Future Systems, Accenture, 2019, https://www.accenture.com/us-en/insights/future-systems/future-ready-enterprise-systems.
13
Karen Hao, We Analyzed 16,625 Papers to Figure Out Where AI Is Headed Next, MIT Technology Review, January 25, 2019, https://www.technologyreview.com/2019/01/25/1436/we-analyzed-16625-papers-to-figure-out-where-ai-is-headed-next/.
14
Tristan Greene, AI Fails to Recognize These Nature Images 98 % of the Time, TNW, July 18, 2019, https://thenextweb.com/artificial-Intelligence/2019/07/18/ai-fails-to-recognize-these-nature-images-98-of-the-time/.
15
Carlos Zednick, Solving the Black Box Problem: A Normative Framework for Explainable Artificial Intelligence, arXiv, 2020, https://arxiv.org/ftp/arxiv/papers/1903/1903.04361.pdf.
16
Gary Marcus and Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust (New York: Pantheon Books, 2019), 69.
17
Marcus and Davis, Rebooting AI, 162.
18
Brian Bergstein, What AI Still Cant Do, MIT Technology Review, February 19, 2020, https://www.technologyreview.com/s/615189/what-ai-still-cant-do/.
19
Реверсивный инжиниринг (обратный инжиниринг, обратная разработка) изучение готового устройства с целью понять принципы работы в устройстве и создать его копию. Прим. ред.
20
Brenden M. Lake, Tomer D. Ullman, Joshua B. Tenenbaum, and Samuel J. Gershman, Building Machines That Learn and Think Like People, arXiv, April 1, 2016, https://arxiv.org/abs/1604.00289.
21
Covariant Launches from Stealth to Bring Universal AI to Robots, Covariant, January 29, 2020, https://www.prnewswire.com/news-releases/covariant-launches-from-stealth-to-bring-universal-ai-to-robots-300995185.html.
22
Karen Hao, AI-Powered Robot Warehouse Pickers Are Now Ready to Go to Work, MIT Technology Review, January 29, 2020, https://www.technologyreview.com/s/615109/ai-powered-robot-warehouse-pickers-are-now-ready-to-go-to-work/.
23
Evan Ackerman, Covariant Uses Simple Robot and Gigantic Neural Net to Automate Warehouse Picking, IEEE Spectrum, January 29, 2020, https://spectrum.ieee.org/automaton/robotics/industrial-robots/covariant-ai-gigantic-neural-network-o-automate-warehouse-picking.