Размышления по данной проблеме имеют древние корни. Они доходят до Платона, 23 столетия назад. Платон удивлялся, каким образом люди способны мыслить и узнавать о мире. Он обратил внимание, что реальные воплощения вещей и идеи всегда несовершенны, и всегда различны. Например, у вас есть понятие совершенной окружности, хотя вы никогда не видели такую в действительности. Все нарисованные окружности несовершенны. Даже если она нарисована с помощью циркуля, окружность представляется темной линией, тогда как линия настоящей окружности не имеет толщины. Как же вы тогда вообще смогли воспринять понятие идеальной окружности? Или возьмем более житейский случай, подумаем о понятии "собака". Любая из собак, каких вы видели, отличается от других, и каждый раз вы видите именно конкретную собаку. Все собаки различны и вы никогда бы не смогли увидеть конкретную собаку одним и тем же образом. Но весь ваш опыт относительно собак сходится к ментальному понятию "собака", которое неизменно. Платон был сбит с толку. Как возможно такое, что мы запоминаем и применяем понятия в этом мире бесконечно разнообразных форм и постоянно меняющихся ощущений?
Решением Платона была его известная Теория Форм. Он пришел к выводу, что наш высший разум должен быть связан с некоторым трансцендентным миром сверхреальности, где в безвременном совершенстве существуют постоянные, неизменные идеи (Формы с заглавной Ф). Наши души приходят из этого мистического места в момент рождения, заключил он, где они узнают о Формах в их первоначальном виде. После рождения у нас сохраняются скрытые знания о них. Обучение и понимание происходит потому что формы реального мира напоминают нам о Формах, которым они соответствуют. Вы можете узнать про окружности и собак, потому что они соответственно вызывают воспоминания Окружности и Собаки.
Все это достаточно далеко от современных взглядов. Но если вы уберете высокопарную метафизику, вы увидите, что он в действительности говорил об инвариантности. Его система объяснения была далека от цели, но его интуиция, что это один из важнейших вопросов о природе человека, которыми мы можем задаться, попала в яблочко.
* * *
Чтоб у вас не сложилось впечатление, что инвариантность относится только к зрению, давайте взглянем на некоторые примеры с другими чувствами. Рассмотрим тактильные ощущения. Когда вы тянетесь к бардачку в машине, чтоб найти солнечные очки, ваши пальцы должны только слегка задеть их, чтоб вы их нашли. Не важно, какая часть вашей руки соприкоснется; это может быть большой палец, любая часть любого пальца или ладонь. Соприкоснуться можно с любой частью очков, с линзой, дужкой, петлей или частью оправы. Всего лишь движения любой части вашей руки над любой частью очков достаточно, чтоб ваш мозг идентифицировал их. В каждом случае поток пространственных и временных паттернов, поступающих с ваших тактильных рецепторов, совершенно различный - различные участки кожи, различные части объекта - но вы хватаете ваши очки без раздумий.
Или рассмотрим сенсомоторную задачу - вставить ключ в замок зажигания. Положение, в котором вы сидите, положение тела, рук, каждый раз слегка отличаются. Для вас это выглядит как повторяющееся изо дня в день действие, но это потому что у вас инвариантное представление в мозгу. Если вы попытаетесь сделать робота, который смог бы попасть в машину и вставить ключ, вы быстро бы увидели, что это практически невозможно, пока вы не будете уверены, что робот находится в одном и том же положении и держит ключ одинаково каждый раз. И даже если вы смогли бы управлять им, чтоб сделать это, робота пришлось бы перепрограммировать под различные машины. Роботы и компьютерные программы, подобно искусственной автоассоциативной памяти, ужасны при обращении с вариациями.
Другой интересный пример - это ваша подпись. Где-то в вашем моторном кортексе, в передних долях, у вас есть инвариантное представление вашего автографа. Каждый раз, когда вы подписываетесь, вы используете одну и ту же последовательность ударов, изгибов и ритмов. Это верно и когда вы подписываетесь ежеминутно хорошей ручкой на весу, и когда неловко подписываетесь карандашом, зажатым между кончиками пальцев. Каждый раз получается что-то разное, конечно, особенно в неудобных условиях, которые я только что указал. Тем не менее, несмотря на масштаб, пишущую принадлежность или комбинацию частей тела, вы всегда запускаете одну и ту же абстрактную "моторную" программу.
Из примера с подписью видно, что инвариантное представление в моторном кортексе в некотором смысле это зеркальное отражение инвариантного представления в сенсорном кортексе. С сенсорной стороны, большое множество входных паттернов может активировать один и тот же ансамбль, который представляет один и тот же абстрактный паттерн (лицо вашей подруги, ваши очки). С моторной стороны, один и тот же ансамбль, представляющий некоторую абстрактную моторную команду (ловля мяча, подпись) способен проявит себя в широком множестве мышечных команд и удовлетворить широкому множеству других ограничений. Эта симметрия между восприятием и действием и есть то, что мы должны ожидать, если, как предположил Монткастл, во всех областях кортекса работает единый базовый алгоритм.
В качестве последнего примера давайте вернемся к сенсорному кортексу и снова взглянем на музыку (мне нравится использовать музыкальную память в качестве примера, потому что легко увидеть все проблемы, которые должен решить неокортекс). Инвариантное представление музыки иллюстрируется вашей способностью распознавать мелодию в любой тональности. Тональность, в которой сыграна мелодия, ссылается на музыкальную шкалу, на которой построена мелодия. Одна и та же мелодия, сыгранная в различных тональностях, построена из различных нот. Выбрав тональность для исполнения, вы задаете все оставшиеся ноты в мелодии. Мелодия может быть воспроизведена в различных тональностях. Это значит, что каждое исполнение "одной и той же" мелодии в новой тональности - фактически полностью отличающаяся последовательность нот! Каждое исполнение стимулирует различные участки вашей улитки, вызывая совершенно различные пространственно-временные паттерны, поступающие в слуховой кортекс… и тем не менее вы воспринимаете одну и ту же мелодию в каждом случае. Если у вас нет абсолютного слуха, вы не сможете даже различить, что одна и та же сыграна в другой тональности, если только не будете сравнивать.
Представьте песню "Somewhere over the Rainbow". Возможно вы впервые услышали ее в исполнении Джуди Гарленд в фильме "Волшебник страны Оз", но если у вас нет абсолютного слуха, то возможно вы не сможете даже вспомнить тональность, в которой она ее исполняла (Ля минор). Если я сяду за фортепиано и начну играть песню в такой тональности, в которой вы ее никогда не слышали - скажем, в Ре миноре - она будет звучать как точно та же самая песня. Вы не заметите, что все ноты отличаются от нот в той версии, с которой вы знакомы. Это означает, что ваша музыкальная память должна быть в форме, игнорирующей высоту ноты. Память должна хранить существенные отношения между нотами, но не сами ноты. В данном случае существенными отношениями являются относительная высота ноты, или "интервал". "Somewhere over the Rainbow" начинается с октавы вверх, затем полутон вниз, затем большая терция вниз и т. д. Интервальная структура мелодии одна и та же при исполнения в любой тональности. Ваша способность легко узнавать песню в любой тональности показывает, что ваш мозг хранит ее в форме, инвариантной к высоте нот.
Аналогично, память о лице вашей подруги также должно храниться в форме, не зависящей от особенностей точки зрения. Что делает ее лицо узнаваемым, так это его относительные размеры, относительные оттенки цвета, относительные пропорции, а не то, как оно выглядело в последний вторник в обед. Есть некоторые "пространственные интервалы" между чертами ее лица, также как и "высотные интервалы" между нотами в песне. Ее лицо шире относительно ее глаз. Ее нос короче относительно ширины ее глаз. Цвет ее волос и цвет ее глаз связаны подобным отношением, которое остается постоянным даже если при различном освещении их абсолютные цвета значительно изменяются. Когда вы запоминаете ее лицо, вы запоминаете эти относительные атрибуты.
Я верю, что подобное абстрагирование формы возникает во всем кортексе, в любой его области. Это общее свойство неокортекса. Память хранится в форме, которая фиксирует суть отношений, а не конкретные детали. Когда вы видите, чувствуете или слышите что-либо, кортекс получает детальную, высоко специфическую информацию и конвертирует ее в инвариантную форму. Именно инвариантная форма хранится в памяти, и любая новая информация сравнивается именно в инвариантной форме. Хранение, вспоминание и узнавание происходят в инвариантной форме. В вычислительной технике нет эквивалентной концепции.
* * *
Это поднимает интересную проблему. В следующей главе я докажу, что важной функцией кортекса является использование памяти для предсказания. Но исходя из того, что кортекс хранит воспоминания в инвариантной форме, каким образом он делает конкретные предсказания? Вот некоторые примеры, иллюстрирующие проблему и ее решение.
Вообразите, что сейчас 1980 год и вы в пограничном городке в Западной Америке. Ваша возлюбленная едет поездом из Восточной Америки, чтоб встретиться с вами в новом пограничном городке. Конечно же, вы хотите встретить ее на станции, когда она приедет. За несколько недель до приезда вы узнаете, когда поезд выходит и приходит. Расписания нет, и пока вы можете сказать, что поезд никогда не прибывает и не убывает в одно и тоже время дня. С такой позиции вы никогда не сможете предсказать, когда приедет ее поезд. Но затем вы замечаете, что есть некая структура в том, как поезд прибывает и убывает. Поезд с востока прибывает через четыре часа после того, как уедет на восток. Этот четырехчасовой перерыв остается постоянным изо дня в день, хотя конкретное время изменяется. В день ее прибытия вы отслеживаете поезд, уходящий на восток, и засекаете время. Через четыре часа вы возвращаетесь на станцию и встречаете ее поезд прямо в момент прибытия. Эта притча иллюстрирует и проблему распознавания лиц неокортексом, и то, как он ее решает.
Мир, ощущаемый вашими органами чувств никогда не повторяется; также как время отправки и прибытия поезда, он все время разный. Способ, которым вы понимаете мир, заключается в том, чтоб найти инвариантную структуру в постоянно изменяющемся потоке информации. Однако, этой инвариантной структуры самой по себе не достаточно для использования в качестве основы для предсказаний. Знание только того, что поезд приходит через четыре часа после отправки, не позволяет вам появиться на платформе вовремя для встречи возлюбленной. Чтоб сделать конкретное предсказание, мозг должен совместить знание инвариантной структуры с самыми последними деталями. Предсказание времени прибытия требует выявления четырехчасовой структуры в расписании поезда и комбинации ее с детальным знанием того, во сколько ушел последний поезд на восток.
Когда вы слушаете знакомую мелодию, исполняемую на фортепиано, ваш мозг предсказывает следующую ноту до того, как она будет сыграна. Но песня, как мы видели, хранится в памяти в форме, инвариантной к высоте нот. Ваша память говорит вам, какой интервал будет следующим, но не говорит ничего о конкретной ноте. Для предсказания точной ноты требуется комбинация следующего интервала с последней конкретной нотой. Если последний интервал это большая терция и последней нотой, которую вы слышали, было До, то вы можете предсказать, что следующей нотой будет Ми. Вы слышите в вашей голове Ми, а не "большую терцию". И если вы не ошибаетесь с идентификацией песни и пианист не спотыкается, ваши предсказания будут верными.
Когда вы видите лицо вашей подруги, ваш кортекс заполняется и предсказывает мириады деталей ее уникального изображения в данный момент. Он сверяется, что ее глаза правильные, что ее нос, губы и волосы точно такие, какие должны быть. Ваш кортекс делает эти предсказания с большой специфичностью. Он может предсказать низкоуровневые детали ее лица даже если вы никогда не видели ее в такой конкретной ориентации или в таком окружении. Если вы точно знаете, как располагаются глаза и нос вашей подруги, и вы знаете структуру ее лица, то вы можете точно предсказать, как должны располагаться ее губы. Если вы знаете, что ее кожа имеет оранжевый оттенок в свете заката, то вы знаете, какой оттенок должны приобрести ее волосы. И снова ваш мозг делает это путем комбинации памяти о инвариантной структуре ее лица с особенностями текущего опыта.
Пример с расписанием поезда всего лишь аналогия того, что происходит в вашем кортексе, но мелодия и лицо - нет. Комбинирование инвариантного представления и текущей информации для детального предсказания - это именно то, что происходит. Это повсеместный процесс, происходящий в каждой области вашего кортекса. Именно так вы делаете конкретные предсказания относительно комнаты, в которой вы сейчас сидите. Именно так вы способны предсказать не только слова, которые вам говорят другие, но также и интонацию, с которой они это скажут, каким тоном они это скажут и из какой части комнаты вы должны услышать голос. Именно так вы точно знаете, когда ваша нога коснется пола, и что она почувствует, когда вы будете подниматься по ступенькам. Именно так вы способны написать свое имя ногой или поймать брошенный мяч.
Три свойства кортикальной памяти, рассмотренные в этой главе (хранение последовательностей, авто-ассоциативность и инвариантное представление), являются необходимыми ингредиентами для предсказания будущего на основе памяти о прошлом. В следующей главе я покажу, что предсказание - это суть интеллекта.
5. Новая структура интеллекта
Однажды в апреле 1986 года я размышлял над тем, что значит "понимать" что-либо. Несколько месяцев я бился над фундаментальным вопросом, Чем же занимается мозг, если он не продуцирует поведение? Что делает мозг, когда он пассивно слушает речь? Что делает ваш мозг прямо сейчас, когда он читает? Информация поступает в мозг, но не выходит из него. Что с ним происходит? Ваше поведение в данный момент возможно элементарное - вроде дыхания или движения глаз - но, как вы уже знаете, ваш мозг делает гораздо больше, чем это, поскольку вы читаете и понимаете. Понимание должно быть результатом нервной активности. Но какой? Что нейроны делают, годна они понимают?
Когда я оглядел мой офис в тот день, я увидел знакомые стулья, плакаты, окна, растения, карандаши и т. д. Вокруг меня были сотни вещей. Мои глаза видели их, когда я мельком оглядывался, но просто созерцание их не вызывало у меня никаких действий. Никакого поведения не осуществлялось и не требовалось, но как-то я "понимал" комнату и ее содержимое. Я делал то, чего не могла сделать Китайская Комната Серла, и мне не требовалось возвращать что-либо через прорезь. Я понимал, но никакие действия не могли доказать этого. Что означало "Понимать"?
Как раз когда я размышлял над этой дилеммой, у меня появилось озарение, один из тех эмоционально сильных моментов, когда то, что было путаницей, неожиданно становилось ясным и понятным. Все что я сделал - это спросил, что произошло бы, если бы в комнате появился новый объект, которого я никогда раньше не видел - скажем, синяя кофейная чашка.
Ответ казался простым. Я должен был заметить новый объект, как несоответствующий. Он должен был поймать мое внимание, как нечто новое. Мне не надо было бы спрашивать себя сознательно, является ли кофейная чашка новой. Это просто должно было возникнуть, как несоответствие. Кажущийся тривиальным, лежащий в основе ответ является мощной концепцией. Чтобы заметить, что что-то отличается, некоторые нейроны в моем мозгу, которые не были активны до этого, должны были стать активными. Как эти нейроны узнали, что кофейная чашка является новой, а сотни других предметов - нет? Ответ на этот вопрос до сих пор для меня является неожиданным. Наш мозг хранит воспоминания, чтобы постоянно делать предсказания обо всем, что мы видим, чувствуем, слышим. Когда я оглядываю комнату, мой мозг использует память для формирования предсказаний о том, что он ожидает почувствовать, прежде чем я почувствую это. Громадное количество предсказаний возникает за пределами понимания. Это как если бы отдельные части моего мозга говорили: "Посреди стола есть компьютер? Да. Он черный? Да. В правом углу стола есть лампа? Да. Лежит ли словарь там, где я его оставил? Да. Прямоугольно ли окно, вертикальны ли стены? Да. С того ли направления светит солнце для данного времени дня? Да". Но когда поступает некоторый визуальный паттерн, которого я не помню в этом контексте, предсказание нарушается. И ошибка привлекает мое внимание.
Конечно, мозг не разговаривает сам с собой, когда делает предсказания, и он делает предсказания не последовательным образом. Он также не просто делает предсказания о различных объектах вроде кофейной чашки. Ваш мозг постоянно совершает предсказания о структуре того самого мира, в котором мы живем, и делает он это параллельным образом. Это будет верным и когда мы быстро обнаруживаем необычную текстуру, уродливый нос или необычное движение. Сразу не скажешь, насколько обширны эти в основном подсознательные предсказания, что, возможно, является причиной того, почему мы так долго упускали их важность. Они происходят настолько автоматически, настолько легко, что мы ошиблись в оценке того, что происходит в наших головах. Я надеюсь убедить вас в могуществе этой идеи. Предсказания настолько обширны, что наше "восприятие" - то есть, каким мы видим мир - происходит не только от наших органов чувств. То, что мы воспринимаем - это комбинация того, что мы чувствуем, и предсказаний, основанных на памяти нашего мозга.