Анализируем изменения частоты во времени
Такие различия во временной развертке, как в бил и пил, хорошо видны на графиках временной зависимости типа изображенного на рис. 1.8. Различие в частоте, как в и и у, отражаются на спектрах, подобных тем, что представлены на рис. 1.6. Однако ни один из графиков не смог бы показать акустическое различие между звуками б и г. Здесь дело заключается в изменении частоты во времени. Чтобы правильно описать различие между б и г, нам нужен третий и последний график, называемый спектрограммой.
На верхней панели на рис. 1.9 представлен простой пример, изображающий звуковой тон, который со временем переходит от низкочастотного к высокочастотному и обратно, как в одобрительном свисте при виде чего-то впечатляющего. Вспомните звук сирены или представьте себе, что водите пальцем по клавиатуре фортепиано.
Различие между согласными в слогах ба и га определяется изменением частот полос акустической энергии во времени (нижняя панель). Верхняя полоса гармоник для ба и га одинаковая: она изменяется во времени от низкой до высокой частоты, пока не выравнивается на звуке а. Но на нижней полосе два слога различаются. В случае ба частота изменяется от низкой до высокой, а затем выравнивается. В случае га звук начинается на относительно более высокой частоте, а затем снижается. Частотная модуляция (ЧМ, или FM, от frequency modulation) важная характеристика звука, которая отражает это изменение частоты во времени.
Рис. 1.9. Спектрограмма (график изменения частоты во времени). Вверху: частота увеличивается, затем уменьшается. Внизу: слоги ба и га. Частоты обеих волн акустической энергии изменяются со временем, пока не стабилизируются на гласном звуке а.
Таким образом, в обоих наших примерах с парами согласных звуков (б/п и б/г) временная развертка является важнейшим фактором, который необходимо учитывать. В случае слогов ба и па время является необходимым и достаточным элементом для выявления различия. В случае слогов ба и га различие определяется взаимодействием обоих факторов времени и частоты. Хотя мы способны уловить и выделить эти звуковые различия, замедлив произнесение и произведя измерения, на практике они произносятся слишком быстро, чтобы мы могли осознанно воспринимать отличающие их параметры. Удивительно быстро. Подумайте об этом: знали ли вы о разнице между ба и га в контексте компонентов звука до того, как я вам об этом рассказала? Понимали ли вы, что пара мгновенных частотных модуляций может превратить пегого дога в беглого бога? Я совершенно определенно не могу определить на слух, что какая-то энергетическая полоса поднимается в ба и опускается в га. И эта скорость и тонкость объясняют сложность восприятия согласных звуков и требуют применения фонетического алфавита (Антон, Борис, Василий, Григорий). Тонкость и сложность дифференцирования и трудности в восприятии этих звуков у некоторых людей имеют интересные последствия для речи и даже для чтения, как мы увидим далее.
При обсуждении временных параметров мы сконцентрировались на речи. И это не случайно. Речь функционирует в гораздо более быстрых рамках, чем другие звуки, включая музыку. Например, allegro это музыкальный темп в диапазоне 120170 ударов в минуту (уд/мин). Для простоты давайте рассмотрим музыкальную пьесу в темпе аллегро в ритме 150 уд/мин. Это соответствует двум с половиной ударам (четвертным нотам) в секунду. Так что каждая четвертная нота длится целых 400 миллисекунд (тысячных долей секунды), одна восьмая 200 мс, а одна шестнадцатая 100 мс. Пьеса Полет шмеля исполняется в еще более быстром темпе presto и интересна тем, что обычно для восприятия двух нот раздельно нам требуется целых 100 мс. Заставив шестнадцатые доли главной темы звучать по 8085 мс, Римский-Корсаков превратил ноты в нечто напоминающее жужжание шмеля. Однако с речью совсем другая история. Согласные в обычной речи длятся так же коротко или еще короче примерно от 20 до 40 мс. И мы можем почти бесконечно произносить речь, наполненную согласными звуками. К счастью для всех музыкантов, исполнявших Полет шмеля, эта пьеса короткая.
Другие компоненты звука
Интенсивность это мера амплитуды изменений давления воздуха, которую мы воспринимаем как громкость: сколько воздуха сдвигает гитарная струна на рис. 1.1 и насколько высоки создаваемые ею волны, изображенные на рис. 1.3. В абсолютном измерении звук производит едва заметные изменения давления воздуха. Однако мы воспринимаем изменения давления в широчайшем диапазоне от тишайших до самых громких звуков, различающихся по физическому давлению воздуха в десять триллионов раз. Поэтому, чтобы отобразить наше восприятие громкости звука с помощью каких-то удобных показателей, мы используем логарифмическую шкалу, переводя количество перемещенного воздуха в знакомые всем единицы интенсивности звука децибелы (дБ). В результате диапазон в десять триллионов раз можно выразить в единицах от 0 дБ (это порог слышимости, ниже предела чувствительности самых чувствительных микрофонов) до 140 дБ самого громкого звука, который мы в состоянии вынести.
Возможно, термины амплитудная и частотная модуляция (АМ и ЧМ) ассоциируются у вас только с настройкой радиоприемника. Однако АМ и ЧМ чрезвычайно важны для нашего звукового пространства и особенно для речи. АМ это флуктуации интенсивности звука (амплитуды): громкий-тихий-громкий-тихий. Автомобильная сигнализация часто работает в режиме от громкого к тихому. Колебания голосовых складок при их открытии и закрытии осуществляют амплитудную модуляцию того, что мы произносим на нашей высоте голоса (на основной частоте). На рис. 1.4 отражена обычная форма АМ: один и тот же сигнал модулируется по амплитуде с разными скоростями.
Частотная модуляция отражает изменение частоты во времени. Когда в речи мы переходим от гласных к согласным и наоборот, полосы акустической энергии поднимаются и опускаются. Это и есть частотная модуляция (изменение на рис. 1.9).
Еще один компонент звука, который стоит упомянуть, это фаза. В начале главы мы обсуждали давление молекул воздуха справа от гитарной струны. Молекулы воздуха слева от струны на рис. 1.1, которые мы не показали, рассеиваются, когда молекулы справа сжимаются, и наоборот. В каждый конкретный момент времени движение струны одновременно сжимает и рассеивает соседние молекулы воздуха. Два человека, сидящие по разные стороны от гитары, слышат музыку, которая по сигналу и давлению различается по фазе на 180 градусов. Графики доходящих до них волн как бы перевернуты по отношению друг к другу. В зависимости от того, где вы находитесь, звук гитары достигает ваших ушей в разное время, или в разной фазе. Эти фазы важны для локализации источника звука, а сложение и погашение фаз играют роль в идентификации звуков в шумном пространстве или при наличии ревербераций (эха).
И, наконец, явление фильтрации. Фильтрация это избирательное усиление или ослабление некоторых частот звукового сигнала. Мы фильтруем звук миллион раз в день как преднамеренно, так и непреднамеренно. Любимая песня звучит по-разному, когда вы слушаете ее на домашней стереосистеме, в машине, через компьютер, через наушники или через мобильный телефон. Каждая система воспроизведения звука имеет свои фильтры, которые либо тщательно изготовлены специалистами по звуку, либо просто удовлетворяют таким параметрам товара, как размер и стоимость, или каким-то иным показателям. Ваш голос и голоса ваших друзей звучат по-разному на улице и в кафе. Фильтрация, вызванная твердой поверхностью стен, потолка и ванны, объясняет, почему мы любим петь под душем. Готические соборы имеют фигурные каменные поверхности, вызывающие многократное отражение звука на более высоких частотах, что обеспечивает особую акустическую атмосферу для музыки и речи. Попробуйте послушать звук своего мобильного телефона, переходя из комнаты в комнату. Кроме того, что звук фильтруется во внешнем пространстве, мы сами тоже преднамеренно фильтруем звуки, издаваемые ртом, языком и губами, чтобы произнести слова, требующиеся для передачи сообщения.
Сигналы снаружи и внутри головы: компоненты
Наш мозг придает смысл внешним сигналам (звукам) с помощью сигналов внутри головы электрических импульсов нейронов.
Каждый ученый выбирает определенную стратегию научного поиска. Одни проводят опросы. Другие используют экспрессию генов. А третьи анализируют биомаркеры в крови. Мой выбор сигналы. Мне эти сигналы (как снаружи, так и внутри головы) кажутся надежными, поскольку они ощутимые, в каком-то смысле не такие эфемерные, как сам звук. Их можно достоверно измерить, и есть общеизвестные и эффективные способы их визуализации и анализа. Особенно меня привлекает замечательное сходство между сигналами внутри головы и снаружи. Это очень красиво. И поразительно, что так происходит. Эта реальность дает мне нечто надежное, на что можно повесить шляпу, на что можно опереться, когда я исследую такие важные проблемы, как влияние занятий музыкой на звуковой разум, связь поддержания ритма и грамотности или последствия сотрясения мозга для обработки звука. Сигналы направляют ход моих мыслей и открывают мне Истину.
Компоненты звука играют важнейшую роль в понимании того, почему все люди слышат по-разному и как личный звуковой опыт каждого человека может меняться в лучшую или худшую сторону по мере того, как наш звуковой разум сплетается с нашими ощущениями, размышлениями, чувствами и движениями.
Как нейробиолог, я могу привнести эту осязаемость в мое исследование звука и его обработки в мозге. Я могу изучать восприятие высоты, временной развертки и тембра по отдельности и как слуховое целое, чтобы понять, что происходит правильно или неправильно у людей, которые слышат превосходно или испытывают некоторые затруднения. Можно изучать по отдельности обработку разных компонентов звука и их превращение в наши ощущения. Например, некоторые люди плохо различают звуки разной высоты, но без труда воспринимают тембр, или наоборот. У других проблемы возникают только с временными характеристиками звука. Музыканты и двуязычные люди слышат превосходно, но их мастерское восприятие сигналов опирается на разные компоненты звука.
Теперь давайте посмотрим, что происходит, когда звуковая волна снаружи головы создает мозговые волны внутри когда движение гитарной струны достигает слухового прохода.
Глава 2
Сигналы внутри головы
Компоненты звука внутри и снаружи
В какой-то момент в нашем эволюционном прошлом естественный отбор способствовал развитию у нас способности улавливать ушами изменение давления, вызванное самыми слабыми перемещениями молекул воздуха. В результате у нас появились части тела, которые за несколько удивительных стадий превращают движения воздуха, вызванные вибрацией гитарной струны или произнесением слова, в амальгаму компонентов (высоты, тембра и временной развертки), которые мы воспринимаем как звук гитары или голоса.
Трансдукция (от лат. transductio перемещение) в физиологии означает смену одного состояния на другое. Обменная валюта нервной системы электричество. Если мы хотим осмыслить звук и подействовать на него, нам нужен способ преобразования, или трансдукции, движения воздуха в электричество мозга. Как мы это делаем? Все начинается в ухе и протекает через элегантную последовательность событий, включающих в себя физические движения костей, перемещение жидкостей и выделение химических соединений. Затем сигнал поступает в мозг в виде электрических импульсов, созданных ухом, и там обрабатывается далее, в результате чего наш звуковой разум может извлечь максимум информации из внешних звуков.
Рис. 2.1. Звуковой разум обрабатывает компоненты звука, извлекая из них максимум возможностей.
Мне нравится сравнивать процесс обработки звука в мозге с микшерным пультом. Как звукоинженер в студии звукозаписи, который перемещает регуляторы (фейдеры) вверх и вниз в поисках равновесия между гитарой и вокалом, так и мозг усиливает одни компоненты звука и ослабляет другие (рис. 2.1).
Когда трансдукция выполнена и мы работаем в удобной среде электрических сигналов, мы можем отображать их с помощью тех же графиков времени, частоты (спектр) и частоты во времени (спектрограмма), которые мы обычно используем, когда говорим о звуке. Как и в случае внешних сигналов, при обработке сигналов внутри головы необходимо, чтобы те же компоненты, такие как частота, временная развертка и гармоники, обрабатывались раздельно, как с помощью фейдеров и потенциометров на микшерном пульте. В каждом мозге фейдеры устанавливаются по-разному в зависимости от опыта, навыков, потери или ослабления слуха. Каждый звуковой разум уникален.
Вверх и вниз
Звуковой разум обширен. Когда мы слушаем, электрические сигналы проходят через мозг, перемещаясь восходящими и нисходящими потоками, взаимодействуя с другими ощущениями с тем, как мы движемся, что мы думаем и что мы чувствуем. Вся эта мозговая сеть позволяет нам осмысливать звук извлекать смысл из нашего звукового окружения (рис. 2.2).
Прилагательные эфферентный и афферентный обозначают направление движения от чего-то или к чему-то соответственно. От чего и к чему? В системе циркуляции крови от сердца и к сердцу. Сосуды, переносящие кровь от сердца, называются эфферентными, а несущие кровь к сердцу афферентными. Афферентные и эфферентные потоки есть в лимфатической системе: они переносят лимфу в лимфатические узлы и из них. В нейробиологии мозг это узел. Афферентная система переносит информацию от уха к мозгу. Эфферентная система переносит информацию от мозга обратно к уху и тем самым играет ключевую роль в том, как мы обучаемся как мы конструируем нашу звуковую реальность и становимся самими собой в плане звукового восприятия.
Рис. 2.2. Слуховой путь имеет двунаправленные связи между собственными структурами и областями мозга, ответственными за ощущения, мышление, чувства и движения.
Восходящий поток (афферентный путь)
Эта глава рассказывает о путешествии электрического сигнала вверх[13] от уха через мозг. В Google по запросу слуховой путь появляются картинки, подкрепляющие классическое представление об иерархии слуховых механизмов, в основном блок-диаграммы с однонаправленными стрелками, ведущими от уха к мозгу, как на рис. 2.3. Это не ошибка: действительно, слуховой ствол мозга располагается между нервом и слуховым средним мозгом. Таламус находится между средним мозгом и корой. Но это лишь одна часть общей картины. На самом деле существует двунаправленный поток информации, который обычно не следует иерархическим путям. Но хотя я не согласна с иерархическим описанием слуховой системы, я считаю, что однонаправленная модель полезна для описания слухового пути. Сейчас мы проследуем по стрелкам афферентной (направленной к мозгу) обработки сигнала, идущим вверх. И закончим главу кратким обзором нисходящих влияний на эту обработку, чтобы позднее исследовать их подробнее.
Рис. 2.3. Слуховой путь в мозге, соответствующий схеме слева. Акварельная иллюстрация д-ра Арнольда Старра, впервые использовавшего реакции мозга на звук для оценки неврологического здоровья. Воспроизведено с разрешения; фото Тома Лэмба.
Ухо
Наружное ухо. Наружное ухо видимая часть уха воронкой направляет звук в слуховой канал к среднему уху.
Среднее ухо. Когда волна давления, вызванная движением воздуха, попадает в ухо, проходит через его наружную часть и слуховой канал, она ударяется о барабанную перепонку, иначе называемую тимпанической мембраной. В отличие от некоторых общеупотребимых названий анатомических структур, таких как адамово яблоко или коленная чашечка, слово барабан вполне точно описывает эту преграду на пути в среднее ухо. Как и кожаная мембрана барабана, барабанная перепонка тоже мембрана, растягивающаяся при ударе звукового давления. Когда эта крошечная мембрана движется, она толкает первую из трех самых маленьких костей нашего тела слуховых косточек[14], которая, в свою очередь, толкает вторую и, наконец, последнюю косточку, называемую стремечком. Далее стремечко ударяется о другую анатомическую мембрану еще более крошечное овальное окно, закрывающее проход во внутреннее ухо. Зачем нам нужны две перепонки, разделенные тремя косточками? Затем, что с другой стороны овального окна внутри внутреннего уха находится жидкость. Перемещения воздуха недостаточно, чтобы напрямую надавить на овальное окно, поскольку жидкость внутри слишком плотная, чтобы перемещаться только под действием воздуха. Цепочка из трех косточек действует по принципу рычага и усиливает давление примерно в 20 раз[15]. Минимальный толчок по барабанной перепонке превращается в сильный удар, достаточный, чтобы подтолкнуть овальное окно. Заметьте, что мы все еще находимся на механической стадии процесса. Мы перешли от движения воздуха к движению жидкости. Но самая важная трансдукция в электричество еще впереди.