Мозг слушает. Как создается осмысленный звуковой мир
NINA KRAUS
OF SOUND MIND
HOW OUR BRAIN CONSTRUCTS A MEANINGFUL SONIC WORLD
This edition is published by arrangement with Anne Edelstein Literary Agency LLC and The Van Lear Agency
Издание осуществлено при поддержке “Книжных проектов Дмитрия Зимина”
© Nina Kraus, 2021
© Т. Мосолова, перевод на русский язык, 2023
© ООО “Издательство АСТ”, 2023
Издательство CORPUS®
Эта книга издана в рамках программы “Книжные проекты Дмитрия Зимина” и продолжает серию “Библиотека фонда «Династия»”. Дмитрий Борисович Зимин – основатель компании “Вымпелком” (Beeline), фонда некоммерческих программ “Династия” и фонда “Московское время”.
Программа “Книжные проекты Дмитрия Зимина” объединяет три проекта, хорошо знакомых читательской аудитории: издание научно-популярных книг “Библиотека фонда «Династия»”, издательское направление фонда “Московское время” и премию в области русскоязычной научно-популярной литературы “Просветитель”.
Подробную информацию о “Книжных проектах Дмитрия Зимина” вы найдете на сайте ziminbookprojects.ru
Введение
О звуковом разуме: партнерство между звуком и мозгом
Редко так бывает, что нет никаких звуков. Теоретически звуконепроницаемые помещения существуют. Но если вам когда-нибудь случалось попадать в такое помещение, вы быстро улавливали шорох своей одежды, когда переступали с ноги на ногу, собственное дыхание, приглушенные удары сердца, хруст в шее при повороте головы, легкое шуршание языка, трущегося о заднюю поверхность зубов, урчание в животе. Вокруг нас всегда есть звук – вездесущий и невидимый.
Наш слух постоянно включен. Мы не можем закрыть уши так, как закрываем глаза. Но, возможно, в большей степени, чем любой другой сигнал, мы можем игнорировать малозначимые звуки, так что они отодвигаются куда-то на задворки нашего сознания. Всем знакомо ощущение, когда мы обращаем внимание на звук, только когда он внезапно прекращается. Перестал гудеть холодильник? Или заглушили мотор у стоявшего поблизости грузовика? Или соседи снизу выключили телевизор? Постоянное присутствие звука в сочетании с нашей способностью не обращать на него внимания делают наши отношения со звуком весьма сложными. Это наше важнейшее средство коммуникации, и в этом качестве оно играет центральную роль в межчеловеческом общении. Однако часто слух воспринимают как данность. Большинство из нас, возникни такая дилемма, отказались бы от слуха, но не от зрения, поскольку мы способны представить себе обыденную жизнь в тишине, но не в темноте. Мы недостаточно признаем звук. И недооцениваем слух.
Мой интерес к звуку проявился рано. Я росла среди музыки – мама была пианисткой. В детстве я больше всего любила играть под роялем. Я приносила туда кукол и играла с ними под музыку Баха, Шопена, Скрябина. Кроме того, я росла в доме, где говорили на нескольких языках, поскольку мы все время перемещались между Нью-Йорком и маминым родным Триестом в Италии. В обеих странах у меня были родственники и друзья, и я достаточно хорошо владела обоими языками. Этот ранний музыкальный и языковой опыт очень на меня повлиял, и именно поэтому позднее, когда я стала нейробиологом и преподавательницей, моим любимым предметом стали биологические основы речи и музыки. Этот курс и эта книга о звуке – о его богатстве, значении и силе – и о том, как мозг осмысливает звук и делает нас такими, какие мы есть.
Путь от маминого фортепиано до изучения необыкновенно точного слухового мозга, обрабатывающего звуки нашей жизни, не был прямым. Поначалу в университете мой интерес к словам и языкам привел меня в сферу сравнительного литературоведения. Это было моей специализацией, пока я не стала изучать биологию. Примерно в это же время я обнаружила книгу Эрика Леннеберга “Биологические основы языка”[1] (звучит знакомо?). Леннеберг писал о биологических и эволюционных принципах, обеспечивающих существование речи. Он по-новому для того времени объединил изучение речи с изучением биологии. И это привлекло мое внимание. Я поняла, что это возможная область исследований и что мне интересно этим заниматься. Но мне не хотелось ограничиваться изучением речи. Мой интерес был более широким – звук так таковой. Звуком наполнено все, что находится снаружи от нас, но что происходит внутри мозга, когда мы слышим слово, аккорд, мяуканье или визг? Как звуки нас изменяют? Как наш звуковой опыт изменяет наше восприятие звука? В качестве предмета исследований я выбрала биологию обработки звука.
Поступив в аспирантуру, я поняла, что могу получать деньги, чтобы учиться. У меня была стипендия 200 долларов в месяц, а за квартиру я платила 50 долларов. Все устроилось! Теперь мне оставалось лишь представить себе, как я буду заниматься изучением биологии обработки звука. Вскоре я оказалась в лаборатории и стала изучать двухтоновое подавление в слуховом нерве шиншиллы – влияние одного звука на другой при их одновременном звучании[2]. Когда я с энтузиазмом рассказывала все это маме, она посмотрела на меня и спросила: “Нина, что ты делаешь?” В тот момент я поняла, что не могу объяснить маме, почему двухтоновое подавление звука у шиншиллы важно и для нее. Почему я хочу это изучать? Нина, а что ты делаешь?
Мне стало ясно, что я не хочу тратить время, если не могу объяснить маме, на что я его трачу. Я поняла, что наука, которой я занимаюсь, должна иметь очевидную связь с жизнью. Меня все еще чрезвычайно интересовали звук и мозг, и поэтому я перешла в другую лабораторию, где работала со слуховой корой кроликов. Здесь я обнаружила, что после тренировки – научения присваивать звукам смысл – отдельные нейроны слуховой коры меняют поведение[3]. Если звук не имеет большого значения, мозг реагирует на него одним образом. Но если тот же звук приобретает смысл (например, когда за этим звуком следует еда), мозг реагирует иначе. Возникает связь между звуком и мозгом, имеющая отношение к реальному миру. Смысл внешних по отношению к мозгу сигналов имеет значение для сигналов внутри мозга. В то время это было новым, и, что еще важнее, это можно было объяснить маме. Она могла увидеть в этом смысл – любой мог увидеть смысл. Я решила понять, как и почему мозг меняет реакцию на звук, если у него есть смысл.
Умение воспринимать звук появилось очень давно. Механизм слуха есть у всех позвоночных. Однако многие позвоночные слепы, в том числе некоторые кроты, земноводные и рыбы, а также некоторые обитатели пещер. Восприятие звука эволюционировало в качестве защитного механизма – как система предупреждения о наличии хищников или других опасностей в окружающем пространстве. Возможно, стресс от уличного шума в XXI веке – это тень прошлого, когда наши далекие предки реагировали на шум, предвещавший сход лавины или приближение стада бегущих животных.
Хелен Келлер[4] говорила, что “слепота отделяет нас от вещей, а глухота отделяет от людей”. Звук отражает то, что мы не можем увидеть и не можем описать. Вспомните, как мама спрашивала вас: “Что случилось?” в тот момент, когда поднимала телефонную трубку и слышала ваш не совсем адекватный голос. Звук невидим, но ощутим и насыщен смыслом.
Тогда почему же первое место среди “главных чувств” при опросах занимает зрение?[5][6] Почему Институт зрения Национального института здоровья был основан на 20 лет раньше Института слуха? Я думаю, одна из причин заключается в том, что мы забываем, как слушать. Непрекращающийся шум вокруг сделал нас нечувствительными к звуку и лишил способности слышать его оттенки. Поэтому мы решили не обращать внимания на звук и ориентироваться с помощью зрения. Другая причина в том, что, подобно силе тяжести и другим мощным силам в нашем мире, звук невидим. Когда в последний раз вы обращали внимание на силу тяжести? Мы не видим звук – значит, не о чем и думать. Наконец, звук непостоянен. Если мы видим комбайн, идущий по кукурузному полю, он остается громоздким желтым металлическим предметом, даже если перемещается из одной части нашего поля зрения в другую. Он обладает постоянством. Он ждет нас, чтобы погрузить в свое “комбайнство”, и вознаграждает наше долгое и неспешное разглядывание набором видимых признаков. Но звук может мгновенно прекратиться или со временем превратиться в другой звук. А когда он затих, он затих.
Давайте рассмотрим мельчайшую единицу речи с точки зрения акустики. Слово “крот” имеет всего одну гласную, но четыре различимые фонемы, или четыре отдельных звука. Замените любую из них, и смысл изменится (“грот”) или исчезнет (“нрот”). В разговорной речи мы каждую секунду слышим от 25 до 30 фонем, и если не обрабатывать их правильно, смысл может потеряться. Однако в большинстве случаев этот вихрь звуков не доставляет особенных проблем нашей скоростной слуховой системе. Представьте себе, что нужно было бы обрабатывать зрительный сигнал, изменяющийся 25 или 30 раз в секунду. Это мяч! А теперь жираф! А теперь облако!
Как же нам удается распознавать речь, если она разворачивается слишком быстро для неторопливого анализа? Мы используем невероятную скорость и вычислительную способность слухового мозга. Представьте себе длительность секунды. А теперь представьте себе десятую долю секунды. А теперь сотую долю. Трудно даже осознать, насколько это быстро. А теперь добавьте еще один ноль. Слуховые нейроны осуществляют вычисления в диапазоне тысячных долей секунды. Свет быстрее звука, но в головном мозге слух быстрее зрительного, тактильного или любого другого ощущения.
Мы не просто слышим звуки; мы взаимодействуем с ними, когда придаем им смысл. Наш слышащий мозг обширен. Слышать – значит чувствовать, двигаться, мыслить и ощущать. Но до последнего времени мы так не думали.
Замечательные специализированные слуховые структуры, соединяющие ухо с мозгом, на первый взгляд напоминают рабочих на конвейере. Исходный продукт (звук) проникает в ухо и далее передается от этапа к этапу, приобретая по дороге дополнительные части. Эта иерархическая однонаправленная схема – классическое описание процесса обработки звука. Оно до сих пор применяется, но является слишком упрощенным и неполным. Путь обработки звука – не улица с односторонним движением посреди пустыни; это часть многостороннего скоростного шоссе в оживленном урбанистическом центре, с въездами и съездами, перекрестками с круговым движением и транспортными развязками, которые направляют движение ко многим и из многих соседних отделов мозга. При максимальной эффективности – это чудо инфраструктуры, где движение происходит быстро и гладко. Но, как и на городской магистрали, здесь случаются неожиданности, вызванные аварией в другой части города, в километре от плотного потока, в котором я сейчас нахожусь.
Да, в слуховых путях существует иерархия, отделы и специализация, но их значимость определяется степенью их взаимосвязи и связи с внешними силами. Такие человеческие достижения, как речь и музыка, возможны не благодаря активности центров по обработке звука, деловито передающих информацию о звуковом пространстве в одну сторону от уха к мозгу. Скорее эти достижения являются результатом обширной сети взаимосвязей между нашей сенсорной системой, двигательной системой, системой мотивации и вознаграждения, а также когнитивных центров, управляющих нашим мышлением. На самом деле слух включает в себя чувства, движения, мышление и ощущения (рис. i.1).
Рис. i.1. Извлечение смысла из звука зависит от того, как мы думаем, чувствуем, ощущаем и движемся.
Связи между слуховыми и двигательными центрами позволяют нам двигать ртом, языком и губами, чтобы говорить и петь, и непосредственно задействовать различные части тела, когда мы играем на музыкальных инструментах. Когда мы слышим речь, мы бессознательно осуществляем движения языком и другими артикуляционными мышцами синхронно с говорящим.
Слух и мышление связаны между собой. Мы можем издавать какие-то звуки инстинктивно (вспоминается звук, который раздается, когда я попадаю молотком по пальцу). Но для того чтобы произнести даже простейшую фразу или исполнить самую примитивную музыку, требуются значительные когнитивные, интеллектуальные способности. И эта связь двусторонняя. У людей со сниженным слухом значительно повышен риск деменции. И дело не просто в том, что глохнущему дяде Джо трудно следить за разговором и поэтому он кажется отставшим от жизни. Потеря слуха затрудняет мышление[7].
Звуки речи и музыки имеют привилегированный доступ к мозговой сети эмоций, или вознаграждения. Возможно, речь и музыка появились только для создания глубокого эмоционального ощущения связи с другими людьми, возникающего в процессе этих социальных действий. На самом деле звук обеспечивает часть нашего ощущения принадлежности к миру, нашего персонального ощущения дома.
Теперь уже многие считают, что слух – не изолированный и однонаправленный процесс, однако сдвиг в сторону такого понимания произошел сравнительно недавно – на протяжении моей карьеры. Связь слуховой системы с остальным мозгом оказывает чрезвычайно сильное влияние на процесс обработки звука. Это ядро нашего опыта в отношении звука, общения с людьми и нашей индивидуальности.
Мы с мужем часто спорим по поводу настройки батареи, поскольку по-разному воспринимаем температуру. Сенсорные системы – не научные приборы, объективно измеряющие физические параметры, такие как масса или температура. Наш мозг форматирует сигналы из физического мира, так что они приобретают для нас смысл. Придание смысла звуку в значительной степени определяется тем, как мы чувствуем, думаем, видим и движемся. Верно и обратное: слух влияет на то, как мы чувствуем, думаем, видим и движемся.
Я уверена, что моя реакция на слово “Нина” отличается от вашей. В тональных языках, таких как китайский, один и тот же слог имеет разное значение, если произносится с ровной, повышающейся или понижающейся высотой. Поэтому человек, говорящий на китайском, в большей степени, чем говорящий на английском, подключает мозговые ресурсы для кодировки высоты[8]. Со временем совместная работа звука и мозга меняет реакцию мозга на звук. Именно за счет такой настройки ребенок выделяет голос матери из всех голосов, даже если матери нет в поле зрения, и по этой же причине в нашей лаборатории мозг девочки по имени Дейна чрезвычайно активно реагировал на слог “дей” по сравнению со слогами “ду”, “до”, “да” и “ди”, которые она слышала в одном из наших экспериментов (рис. i.2).
Рис. i.2. Обработка звука в мозге зависит от того, на каком языке мы говорим, от музыки, которую мы исполняем, и от здоровья нашего мозга.
Когда мне было пять лет, соседские дети говорили: “Ты сможешь играть с нами, когда тебе будет шесть”. Этот и другой подобный опыт, а также связь с двумя культурами – ощущение себя не полностью итальянкой и не полностью американкой – долгое время заставляли меня задумываться над тем, кто я есть. Где мне место как ученому? Я всегда чувствовала себя более комфортно на стыке дисциплин, чем в центре какой-то одной, и именно в таком контексте я создавала свою лабораторию Brainvolts.
Если вы посмотрите на сайт Brainvolts, вы увидите в спектре изучаемых проблем музыку, сотрясения мозга, старение, чтение и двуязычие. Вы можете поинтересоваться: “Что же они там делают в Brainvolts?” Говоря попросту, одна объединяющая тема – взаимодействие звука и мозга. Звук пронизывает многие стороны нашей жизни и, соответственно, формирует наш мозг.
Мой муж называет Brainvolts “ларьком с хот-догами”. Моя работа заключается в том, чтобы создать всю необходимую инфраструктуру “для продажи хот-догов”. Ученому требуется специализированное оборудование и, главным образом, правильные люди. И это может быть очень трудно, поскольку мои интересы редко соответствуют критериям специализации большинства источников финансирования. Я часто чувствую себя так, как будто мне все еще пять лет и мне говорят: “Мы финансируем только шестилетних”. В этом проблема междисциплинарных исследований, но, к счастью, мне удается поддерживать работу ларька с хот-догами. Потрясающе, что наука свела меня с удивительными людьми вне исследовательской и академической сферы. В Brainvolts наука в первую очередь и главным образом определяется людьми, которые привносят свои уникальные идеи для достижения общей цели. Наша наука зависит от наших коллег в сфере образования, музыки, биологии, спорта, медицины, производства – от людей, работающих вне лаборатории, в том мире, в котором мне хочется поселить нашу науку. Как заметил нейробиолог Норм Вейнбергер, “для природы нет дисциплин”.
Brainvolts, как и мозг, представляет собой интегрированную и реверберирующую системную сеть, объединенную уникальными и специализированными составляющими – членами команды. За 30 лет существования лаборатории мне необычайно повезло работать с выдающимися людьми с их собственными интересами, взглядами и навыками, но с неизменным интересом к взаимодействию звука и мозга. Мы проанализируем эти связи (как в мозге, так и в лаборатории) на страницах книги.
Когда книга начала обретать форму, я стала отсылать черновики друзьям и родственникам, чтобы узнать их мнение. Я хотела знать, понятно ли я излагаю, интересна ли эта тема самым разным читателям. По большей части это были мои ближайшие родственники, среди которых, что удобно, есть шеф-повар, адвокат, строитель, музыкант и художник. Достаточно скоро мой зять-адвокат спросил, о чем эта книга – о звуке или о мозге. Это заставило меня уточнить, что книга и о том и о другом. Книга о звуке, о том, что с ним делает мозг, а также о том, что это дает нам, – о звуковом разуме.
Иными словами, я рассматриваю звуковой разум как некую силу, объединяющую прошлое, настоящее и будущее. Звуки, с которыми мы имели дело на протяжении всей жизни, определяют состояние нашего мозга сегодня. Мозг в свою очередь принимает сегодня решения о том, как формировать наш звуковой мир в будущем – и не только в нашем индивидуальном будущем, но в будущем наших детей и общества в целом. То есть разум регулирует систему обратной связи, которую, что важно, мы в состоянии в некоторой степени контролировать. У нас есть возможность выбирать звук – хорошо это или плохо. Примем ли мы правильные решения, чтобы создать добродетельный круг обратной связи? Или ошибочные решения, которые запустят порочный круг?
Я биолог и интересуюсь тем, как звук развивает нашу звуковую индивидуальность и позволяет включаться в мир. Я хочу понять процесс обработки звука в мозге – звуковой разум – с точностью, которую я научилась регистрировать непосредственно на уровне отдельных нейронов. В книге мы проанализируем сигналы, поступающие из внешнего мира (звуковые волны), и сигналы внутри головы (мозговые волны). Мы увидим, что обогащает процесс обработки звука, а какие факторы оказывают на него пагубное влияние. Мы увидим, что музыка имеет силу лечить, а шум разрушает нервную систему. По пути мы обсудим, что происходит со звуковым мозгом, если мы говорим на иностранном языке, имеем речевые нарушения, ощущаем ритм, слышим пение птиц или получаем сотрясение мозга.
Звук – невидимый союзник и враг здоровья мозга. Наше взаимодействие со звуком сильнейшим образом определяет, кто мы такие. Звуки нашей жизни формируют наш мозг, на горе и на радость. И наш звуковой разум, в свою очередь, влияет на наш звуковой мир – опять же, на горе и на радость. Станем ли мы хорошими слушателями или плохими? В зависимости от того, что мы ценим в звуке, каким мы будем строить звуковой мир, в котором нам жить? Целостное понимание биологических последствий нашей жизни в звуковом мире позволяет делать лучший выбор для нас самих, наших детей и всего общества.
Хочется думать, что мама получила бы удовольствие от чтения этой книги.
Часть I
Как работает звук
Глава 1
Сигналы из внешнего мира
Эта вводная глава рассказывает о сигналах, раздающихся за пределами нашей головы, – о звуке. Звук – это всего лишь перемещающиеся туда-сюда молекулы воздуха. Замечательно, что этот простой механизм создает бесконечное разнообразие звуков – от Баха до скворчанья яичницы на сковородке, от песни “Rocky Raccoon” до копающегося в помойном баке енота. Звуки бывают громкими и тихими, высокими и низкими, консонансными или диссонансными, быстрыми и медленными, грубыми, визгливыми, хаотичными, полифоническими, свистящими или монотонными. Предлагаю вам прочувствовать красоту свойств звука – его компонентов, о которых мы будем говорить вновь и вновь по мере исследования звукового разума.
Звук – это движение. Когда дергают гитарную струну, она заставляет двигаться воздух в ближайшем окружении. На рис. 1.1 изображены колебания гитарной струны после щипка. Слева показана струна в свободном состоянии, и справа от нее – дюжина маленьких молекул воздуха. Когда гитарная струна находится в покое, локальное атмосферное давление составляет около 14,7 фунта на квадратный дюйм – давление воздуха на уровне моря. Когда струну дернули, она быстро отклоняется вправо и молекулы воздуха прижимаются ближе друг к другу, создавая более высокое давление[9]. Затем, через очень небольшой промежуток времени (сотые или тысячные доли секунды в зависимости от высоты ноты), гитарная струна движется в обратном направлении, минует исходное положение и смещается чуть левее. Тогда молекулы воздуха справа опять рассеиваются, и давление снижается. Но молекулы не возвращаются сразу к исходному состоянию, как было до натяжения струны. Теперь они рассеяны чуть в большей степени (занимают больший объем) и, следовательно, создают меньшее давление, чем было до первого движения струны. Затем они опять сжимаются, и опять рассеиваются, и еще, и еще, каждый раз чуть слабее, и, наконец, движение прекращается, вибрация затихает, звук умирает. Движение было звуком, и когда движение прекратилось, прекратился и звук.
Рис. 1.1. Струна сдвигает окружающие ее молекулы воздуха.
Большинство звуков определяется несколькими компонентами (рис. 1.2), как видимый предмет определяется формой, цветом, материалом и размером. Поскольку звук невидим, компоненты звука не так очевидны, но они чрезвычайно важны для осмысления звука. Я считаю, что если думать о звуке в терминах составляющих его компонентов – признавая важность того, что происходит с движущимися молекулами воздуха, – то его обработка в мозге становится еще более удивительной. Чтобы проследить за этими чудесными компонентами, я считаю, что полезным организующим принципом является представление о звуке в терминах высоты, временной развертки и тембра.
Рис. 1.2. Бесконечное разнообразие звуков возникает из-за движения воздуха и описывается небольшим количеством компонентов.
Высота – это то, что отличает “высокий” звук от “низкого”. Звук флейты мы называем высоким, а звук тубы – низким. То, что мы слышим и описываем этими терминами, является проявлением физического свойства частоты. Мы слышим высокий звук, когда колебания от высокого давления воздуха к низкому происходят очень быстро – с высокой частотой. Низким звукам соответствуют более медленные изменения давления воздуха – с низкой частотой (рис. 1.3). Высота звука – это категория восприятия, а частота – измеряемое физическое свойство. Нам следует хорошо понимать разницу между высотой и частотой, поскольку они не всегда идеально коррелируют.
Рис. 1.3. Серая волна описывает больше циклов (имеет большую частоту), чем черная, и поэтому звучала бы на более высокой ноте.
Частота не в качестве научной меры высоты звука, а как слово английского языка означает число каких-то событий за фиксированный интервал времени. Вы можете получать зарплату два раза в месяц. В городе Тампа во Флориде за год в среднем бывает 78 гроз. Я получаю спам по электронной почте 22 раза в неделю. Во всех этих случаях речь идет о частоте. Число колебаний давления воздуха в секунду отличает высоту звучания флейты от высоты звучания тубы. Число подобных событий в единицу времени (в секунду) измеряется в герцах (сокращенно Гц). Человеческое ухо воспринимает частоту колебаний давления воздуха в диапазоне от 20 до 20 000 Гц. Высоко звучащая флейта издает звуки с частотой от 250 до 2500 Гц, а низко звучащая туба – от 30 до 380 Гц. Забавно, что эти диапазоны частично перекрываются! Непременно напишу концерт для тубы и флейты, где более высокую партию будет исполнять туба.
Однако между частотой звука и высотой, которую мы слышим, не всегда соблюдается идеальная корреляция. Если мы улавливаем высоту звука (если этот звук можно пропеть), частота, на которой мы его пропоем, называется основной частотой. Волновые линии на рис. 1.4 имеют одинаковое количество пиков и провалов (примерно 35), так что номинально они имеют одну и ту же частоту. Однако они включаются и выключаются (модулируются) с разной скоростью. И высота слышимого нами звука определяется скоростью модуляции, а не частотой модулируемой волны.
Рис. 1.4. Черная и серая волны имеют одинаковую частоту. Однако скорость модуляции разная, то есть звук, обозначенный серой волной, включается и выключается быстрее, и поэтому он звучит выше, чем звук, обозначенный черной волной. Более быстрая модуляция звука, происходящая из-за более быстрых колебаний голосовых связок у женщин, объясняет более высокие голосовые ноты при произнесении одних и тех же слов.
Примером служит человеческий голос. Высота (основная частота) человеческой речи варьирует в диапазоне от 50 до 300 Гц. Основная частота речи соответствует скорости открытия и закрытия голосовых складок, приводимых в движение нашим дыханием. Скорость движения голосовых складок у мужчин самая низкая, так что у них более низкие голоса, а у детей – самая высокая, и голоса у них высокие. Интересно, что высота голоса разная не только у разных индивидуумов и разных полов, но связана и с некоторыми другими неожиданными факторами. Различия в основной частоте в целом наблюдаются у людей, говорящих на разных языках[10], а также в разных демографических группах людей, говорящих на одном и том же языке[11]. Возможно, вы и по себе заметили, что двуязычные люди обычно говорят на одном языке на более высоких нотах, чем на другом[12].
В музыке тембр – важнейший параметр, позволяющий различить два инструмента, исполняющих одну и ту же ноту. В речи это главное средство для различения одного звука (гласного или согласного) от другого. Мужчина и женщина произносят одно и то же: основная частота (высота голоса) позволяет определить, кто есть кто. Женщина произносит два разных слова: тембр помогает отличить ее “со” от “су”. Физической мерой высоты звука является основная частота, а тембр определяется гармониками – более высокими частотами, чем основная частота.
Полезно знать, из каких частот состоит конкретный звук. Речь идет о так называемом звуковом спектре. Спектр камертона состоит из одной-единственной частоты и поэтому представляет собой одну тонкую вертикальную линию, как на верхней панели на рис. 1.5. У этого звука нет гармоник, только основная частота. Естественный звук, такой как “до” первой октавы в исполнении тромбона или кларнета, имеет пик в спектре на основной частоте “до” первой октавы, соответствующей 262 Гц, а также дополнительные пики на частотах, кратных основной частоте (524, 786 Гц и т. д.) Это и есть гармоники (гармонические обертоны). Как показано на средней и нижней панели на рис. 1.5, не все гармоники обладают одинаковой энергией. Относительный энергетический уровень гармоник является характеристикой тромбона и кларнета и объясняет, почему мы слышим разницу между ними. Уникальный характер гармоник определяется формой и конструкцией инструмента, производящего звук. Аналогичным образом форма и положение языка, губ и носа определяют спектр гармоник, характеризующих разные звуки речи.
В зависимости от положения губ и языка и от объема проходящего через рот и нос воздуха мы изменяем спектр издаваемого звука (какие-то из гармоник усиливаются), как показано на рис. 1.6. Хотя в спектре двух гласных звуков есть пики, отстоящие друг от друга на 100 Гц (поскольку в данном примере основная частота составляет 100 Гц), высота пиков, изображенных серыми линиями, очень разная. Это речевой аналог разницы между звуками тромбона и кларнета. В случае звука “и” два максимума серой линии приходятся на частоты 300 и 2300 Гц, в случае звука “у” они располагаются примерно на частотах 400 и 1000 Гц. Спектр речи имеет выпуклости – области с максимумом энергии, называемые формантами. Интересно, что эти полосы акустической энергии достаточно похожи у разных людей. Человек с высоким голосом имеет пики для звука “у” где-то в районе частот 400 и 1000 Гц, как и человек с низким голосом.
Рис. 1.5. Спектр камертона представляет собой единственную вертикальную линию на одной конкретной частоте – в данном случае 262 Гц, что соответствует ноте до первой октавы. В звуковом спектре инструмента, исполняющего ноту до, есть пик на частоте 262 Гц, а также несколько гармоник на кратных частотах. Звук “до” первой октавы в исполнении тромбона или кларнета имеет разный рисунок гармоник из-за резонансных характеристик этих инструментов. Спектры помогают понять, почему одна и та же нота до первой октавы звучит по-разному в исполнении разных инструментов (по оси x отложены частоты, по оси y – энергия).
Рис. 1.6. Вверху: спектр звука “и”, как в слове “лик”. Внизу: спектр звука “у”, как в слове “лук”. Оба звука имеют одинаковую основную частоту, но распределение энергии в гармониках различается принципиальным образом (по оси x отложены частоты, по оси y – энергия).
Таким образом, тембр – это восприятие звука, связанное с его гармоническим содержанием. Расположение гармоник и их относительная высота – физические свойства звука, позволяющие нам по тембру определять разницу между двумя инструментами или двумя голосами. В речи группы гармоник выделяются в спектре конкретных слов или слогов. Рисунок 1.7 иллюстрирует полный диапазон частот (основных частот и гармоник) голоса и некоторых музыкальных инструментов.
Рис. 1.7. Полный диапазон частот голоса и музыкальных инструментов. Слева показан диапазон основных частот, справа – диапазон гармоник.
До сих пор мы говорили о камертоне, отдельных музыкальных нотах и гласных – все это примеры звуков, устойчивых на протяжении какого-то времени. Однако существует группа звуков, для которых определяющей характеристикой является время – не в том смысле, когда начинается и заканчивается звук, как слог или музыкальная нота, а в том смысле, как и когда звук развивается во времени. К этой группе относятся согласные звуки. При произнесении некоторых согласных звуков временная развертка играет важнейшую роль.
Рис. 1.8. “Бил” превращается в “пил” за счет добавления паузы длительностью 1 /20 с до начала произнесения гласного звука (по оси x отложено время, по оси y – энергия).
Произнесите вслух слово “был”. А потом слово “жил”. Можете описать, чем различаются механические движения вашего рта? Это довольно просто. В первом случае ваши губы смыкаются, а язык занимает некую нейтральную позицию. Во втором случае губы слегка приоткрыты, а задняя часть языка прижата к небу. А теперь скажите “бил” и “пил”. Это сложнее. В чем тут разница? Механическая разница между произнесением “б” и “п” не так уж очевидна. Язык и губы в обоих случаях находятся фактически в одном и том же положении. Основное отличие заключается во временной развертке – когда вы начинаете произносить гласную, то есть когда голосовые складки начинают издавать звук “и”. Произнося слово “бил”, вы включаете голос почти сразу. Однако при произнесении слова “пил” между тем, как ваши губы раскрываются, и тем моментом, когда вы начинаете произносить гласный звук, имеется очень короткий промежуток времени. В верхней части рис. 1.8 изображена звуковая волна слова “бил”. В нижнюю волну я включила паузу длительностью 1/20 секунды. Все колебания двух линий идентичны, за исключением этой добавленной паузы. Небольшой паузы до начала произнесения “и” достаточно, чтобы вторая волна отчетливо звучала как “пил”. Различие во времени в несколько долей секунды создает значительное различие в речи. Это одна из многих причин, почему для обработки таких едва заметных изменений звука нам с вами требуется сверхбыстрый слуховой мозг.
Такие различия во временной развертке, как в “бил” и “пил”, хорошо видны на графиках временной зависимости типа изображенного на рис. 1.8. Различие в частоте, как в “и” и “у”, отражаются на спектрах, подобных тем, что представлены на рис. 1.6. Однако ни один из графиков не смог бы показать акустическое различие между звуками “б” и “г”. Здесь дело заключается в изменении частоты во времени. Чтобы правильно описать различие между “б” и “г”, нам нужен третий и последний график, называемый спектрограммой.
На верхней панели на рис. 1.9 представлен простой пример, изображающий звуковой тон, который со временем переходит от низкочастотного к высокочастотному и обратно, как в одобрительном свисте при виде чего-то впечатляющего. Вспомните звук сирены или представьте себе, что водите пальцем по клавиатуре фортепиано.
Различие между согласными в слогах “ба” и “га” определяется изменением частот полос акустической энергии во времени (нижняя панель). Верхняя полоса гармоник для “ба” и “га” одинаковая: она изменяется во времени от низкой до высокой частоты, пока не выравнивается на звуке “а”. Но на нижней полосе два слога различаются. В случае “ба” частота изменяется от низкой до высокой, а затем выравнивается. В случае “га” звук начинается на относительно более высокой частоте, а затем снижается. Частотная модуляция (ЧМ, или FM, от frequency modulation) – важная характеристика звука, которая отражает это изменение частоты во времени.
Рис. 1.9. Спектрограмма (график изменения частоты во времени). Вверху: частота увеличивается, затем уменьшается. Внизу: слоги “ба” и “га”. Частоты обеих волн акустической энергии изменяются со временем, пока не стабилизируются на гласном звуке “а”.
Таким образом, в обоих наших примерах с парами согласных звуков (“б”/“п” и “б”/“г”) временная развертка является важнейшим фактором, который необходимо учитывать. В случае слогов “ба” и “па” время является необходимым и достаточным элементом для выявления различия. В случае слогов “ба” и “га” различие определяется взаимодействием обоих факторов – времени и частоты. Хотя мы способны уловить и выделить эти звуковые различия, замедлив произнесение и произведя измерения, на практике они произносятся слишком быстро, чтобы мы могли осознанно воспринимать отличающие их параметры. Удивительно быстро. Подумайте об этом: знали ли вы о разнице между “ба” и “га” в контексте компонентов звука до того, как я вам об этом рассказала? Понимали ли вы, что пара мгновенных частотных модуляций может превратить “пегого дога” в “беглого бога”? Я совершенно определенно не могу определить на слух, что какая-то энергетическая полоса поднимается в “ба” и опускается в “га”. И эта скорость и тонкость объясняют сложность восприятия согласных звуков и требуют применения фонетического алфавита (Антон, Борис, Василий, Григорий…). Тонкость и сложность дифференцирования и трудности в восприятии этих звуков у некоторых людей имеют интересные последствия для речи и даже для чтения, как мы увидим далее.
При обсуждении временных параметров мы сконцентрировались на речи. И это не случайно. Речь функционирует в гораздо более быстрых рамках, чем другие звуки, включая музыку. Например, allegro – это музыкальный темп в диапазоне 120–170 ударов в минуту (уд/мин). Для простоты давайте рассмотрим музыкальную пьесу в темпе аллегро в ритме 150 уд/мин. Это соответствует двум с половиной ударам (четвертным нотам) в секунду. Так что каждая четвертная нота длится целых 400 миллисекунд (тысячных долей секунды), одна восьмая – 200 мс, а одна шестнадцатая – 100 мс. Пьеса “Полет шмеля” исполняется в еще более быстром темпе presto и интересна тем, что обычно для восприятия двух нот раздельно нам требуется целых 100 мс. Заставив шестнадцатые доли главной темы звучать по 80–85 мс, Римский-Корсаков превратил ноты в нечто напоминающее жужжание шмеля. Однако с речью совсем другая история. Согласные в обычной речи длятся так же коротко или еще короче – примерно от 20 до 40 мс. И мы можем почти бесконечно произносить речь, наполненную согласными звуками. К счастью для всех музыкантов, исполнявших “Полет шмеля”, эта пьеса короткая.
Интенсивность – это мера амплитуды изменений давления воздуха, которую мы воспринимаем как громкость: сколько воздуха сдвигает гитарная струна на рис. 1.1 и насколько высоки создаваемые ею волны, изображенные на рис. 1.3. В абсолютном измерении звук производит едва заметные изменения давления воздуха. Однако мы воспринимаем изменения давления в широчайшем диапазоне – от тишайших до самых громких звуков, различающихся по физическому давлению воздуха в десять триллионов раз. Поэтому, чтобы отобразить наше восприятие громкости звука с помощью каких-то удобных показателей, мы используем логарифмическую шкалу, переводя количество перемещенного воздуха в знакомые всем единицы интенсивности звука – децибелы (дБ). В результате диапазон в десять триллионов раз можно выразить в единицах от 0 дБ (это порог слышимости, ниже предела чувствительности самых чувствительных микрофонов) до 140 дБ – самого громкого звука, который мы в состоянии вынести.
Возможно, термины амплитудная и частотная модуляция (АМ и ЧМ) ассоциируются у вас только с настройкой радиоприемника. Однако АМ и ЧМ чрезвычайно важны для нашего звукового пространства и особенно для речи. АМ – это флуктуации интенсивности звука (амплитуды): громкий-тихий-громкий-тихий. Автомобильная сигнализация часто работает в режиме от громкого к тихому. Колебания голосовых складок при их открытии и закрытии осуществляют амплитудную модуляцию того, что мы произносим на нашей высоте голоса (на основной частоте). На рис. 1.4 отражена обычная форма АМ: один и тот же сигнал модулируется по амплитуде с разными скоростями.
Частотная модуляция отражает изменение частоты во времени. Когда в речи мы переходим от гласных к согласным и наоборот, полосы акустической энергии поднимаются и опускаются. Это и есть частотная модуляция (изменение на рис. 1.9).
Еще один компонент звука, который стоит упомянуть, это фаза. В начале главы мы обсуждали давление молекул воздуха справа от гитарной струны. Молекулы воздуха слева от струны на рис. 1.1, которые мы не показали, рассеиваются, когда молекулы справа сжимаются, и наоборот. В каждый конкретный момент времени движение струны одновременно сжимает и рассеивает соседние молекулы воздуха. Два человека, сидящие по разные стороны от гитары, слышат музыку, которая по сигналу и давлению различается по фазе на 180 градусов. Графики доходящих до них волн как бы перевернуты по отношению друг к другу. В зависимости от того, где вы находитесь, звук гитары достигает ваших ушей в разное время, или в разной фазе. Эти фазы важны для локализации источника звука, а сложение и погашение фаз играют роль в идентификации звуков в шумном пространстве или при наличии ревербераций (эха).
И, наконец, явление фильтрации. Фильтрация – это избирательное усиление или ослабление некоторых частот звукового сигнала. Мы фильтруем звук миллион раз в день – как преднамеренно, так и непреднамеренно. Любимая песня звучит по-разному, когда вы слушаете ее на домашней стереосистеме, в машине, через компьютер, через наушники или через мобильный телефон. Каждая система воспроизведения звука имеет свои фильтры, которые либо тщательно изготовлены специалистами по звуку, либо просто удовлетворяют таким параметрам товара, как размер и стоимость, или каким-то иным показателям. Ваш голос и голоса ваших друзей звучат по-разному на улице и в кафе. Фильтрация, вызванная твердой поверхностью стен, потолка и ванны, объясняет, почему мы любим петь под душем. Готические соборы имеют фигурные каменные поверхности, вызывающие многократное отражение звука на более высоких частотах, что обеспечивает особую акустическую атмосферу для музыки и речи. Попробуйте послушать звук своего мобильного телефона, переходя из комнаты в комнату. Кроме того, что звук фильтруется во внешнем пространстве, мы сами тоже преднамеренно фильтруем звуки, издаваемые ртом, языком и губами, чтобы произнести слова, требующиеся для передачи сообщения.
Наш мозг придает смысл внешним сигналам (звукам) с помощью сигналов внутри головы – электрических импульсов нейронов.
Каждый ученый выбирает определенную стратегию научного поиска. Одни проводят опросы. Другие используют экспрессию генов. А третьи анализируют биомаркеры в крови. Мой выбор – сигналы. Мне эти сигналы (как снаружи, так и внутри головы) кажутся надежными, поскольку они ощутимые, в каком-то смысле не такие эфемерные, как сам звук. Их можно достоверно измерить, и есть общеизвестные и эффективные способы их визуализации и анализа. Особенно меня привлекает замечательное сходство между сигналами внутри головы и снаружи. Это очень красиво. И поразительно, что так происходит. Эта реальность дает мне нечто надежное, на что можно повесить шляпу, на что можно опереться, когда я исследую такие важные проблемы, как влияние занятий музыкой на звуковой разум, связь поддержания ритма и грамотности или последствия сотрясения мозга для обработки звука. Сигналы направляют ход моих мыслей и открывают мне Истину.
Компоненты звука играют важнейшую роль в понимании того, почему все люди слышат по-разному и как личный звуковой опыт каждого человека может меняться в лучшую или худшую сторону по мере того, как наш звуковой разум сплетается с нашими ощущениями, размышлениями, чувствами и движениями.
Как нейробиолог, я могу привнести эту осязаемость в мое исследование звука и его обработки в мозге. Я могу изучать восприятие высоты, временной развертки и тембра по отдельности и как слуховое целое, чтобы понять, что происходит правильно или неправильно у людей, которые слышат превосходно или испытывают некоторые затруднения. Можно изучать по отдельности обработку разных компонентов звука и их превращение в наши ощущения. Например, некоторые люди плохо различают звуки разной высоты, но без труда воспринимают тембр, или наоборот. У других проблемы возникают только с временными характеристиками звука. Музыканты и двуязычные люди слышат превосходно, но их мастерское восприятие сигналов опирается на разные компоненты звука.
Теперь давайте посмотрим, что происходит, когда звуковая волна снаружи головы создает мозговые волны внутри – когда движение гитарной струны достигает слухового прохода.
Глава 2
Сигналы внутри головы
В какой-то момент в нашем эволюционном прошлом естественный отбор способствовал развитию у нас способности улавливать ушами изменение давления, вызванное самыми слабыми перемещениями молекул воздуха. В результате у нас появились части тела, которые за несколько удивительных стадий превращают движения воздуха, вызванные вибрацией гитарной струны или произнесением слова, в амальгаму компонентов (высоты, тембра и временной развертки), которые мы воспринимаем как звук гитары или голоса.
Трансдукция (от лат. transductio – перемещение) в физиологии означает смену одного состояния на другое. Обменная валюта нервной системы – электричество. Если мы хотим осмыслить звук и подействовать на него, нам нужен способ преобразования, или трансдукции, движения воздуха в электричество мозга. Как мы это делаем? Все начинается в ухе и протекает через элегантную последовательность событий, включающих в себя физические движения костей, перемещение жидкостей и выделение химических соединений. Затем сигнал поступает в мозг в виде электрических импульсов, созданных ухом, и там обрабатывается далее, в результате чего наш звуковой разум может извлечь максимум информации из внешних звуков.
Рис. 2.1. Звуковой разум обрабатывает компоненты звука, извлекая из них максимум возможностей.
Мне нравится сравнивать процесс обработки звука в мозге с микшерным пультом. Как звукоинженер в студии звукозаписи, который перемещает регуляторы (фейдеры) вверх и вниз в поисках равновесия между гитарой и вокалом, так и мозг усиливает одни компоненты звука и ослабляет другие (рис. 2.1).
Когда трансдукция выполнена и мы работаем в удобной среде электрических сигналов, мы можем отображать их с помощью тех же графиков времени, частоты (спектр) и частоты во времени (спектрограмма), которые мы обычно используем, когда говорим о звуке. Как и в случае внешних сигналов, при обработке сигналов внутри головы необходимо, чтобы те же компоненты, такие как частота, временная развертка и гармоники, обрабатывались раздельно, как с помощью фейдеров и потенциометров на микшерном пульте. В каждом мозге фейдеры устанавливаются по-разному в зависимости от опыта, навыков, потери или ослабления слуха. Каждый звуковой разум уникален.
Звуковой разум обширен. Когда мы слушаем, электрические сигналы проходят через мозг, перемещаясь восходящими и нисходящими потоками, взаимодействуя с другими ощущениями – с тем, как мы движемся, что мы думаем и что мы чувствуем. Вся эта мозговая сеть позволяет нам осмысливать звук – извлекать смысл из нашего звукового окружения (рис. 2.2).
Прилагательные эфферентный и афферентный обозначают направление движения – от чего-то или к чему-то соответственно. От чего и к чему? В системе циркуляции крови – от сердца и к сердцу. Сосуды, переносящие кровь от сердца, называются эфферентными, а несущие кровь к сердцу – афферентными. Афферентные и эфферентные потоки есть в лимфатической системе: они переносят лимфу в лимфатические узлы и из них. В нейробиологии мозг – это узел. Афферентная система переносит информацию от уха к мозгу. Эфферентная система переносит информацию от мозга обратно к уху и тем самым играет ключевую роль в том, как мы обучаемся – как мы конструируем нашу звуковую реальность и становимся самими собой в плане звукового восприятия.
Рис. 2.2. Слуховой путь имеет двунаправленные связи между собственными структурами и областями мозга, ответственными за ощущения, мышление, чувства и движения.
Эта глава рассказывает о путешествии электрического сигнала “вверх”[13] от уха через мозг. В Google по запросу “слуховой путь” появляются картинки, подкрепляющие классическое представление об иерархии слуховых механизмов, – в основном блок-диаграммы с однонаправленными стрелками, ведущими от уха к мозгу, как на рис. 2.3. Это не ошибка: действительно, слуховой ствол мозга располагается между нервом и слуховым средним мозгом. Таламус находится между средним мозгом и корой. Но это лишь одна часть общей картины. На самом деле существует двунаправленный поток информации, который обычно не следует иерархическим путям. Но хотя я не согласна с иерархическим описанием слуховой системы, я считаю, что однонаправленная модель полезна для описания слухового пути. Сейчас мы проследуем по стрелкам афферентной (направленной к мозгу) обработки сигнала, идущим вверх. И закончим главу кратким обзором нисходящих влияний на эту обработку, чтобы позднее исследовать их подробнее.
Рис. 2.3. Слуховой путь в мозге, соответствующий схеме слева. Акварельная иллюстрация д-ра Арнольда Старра, впервые использовавшего реакции мозга на звук для оценки неврологического здоровья. Воспроизведено с разрешения; фото Тома Лэмба.
Наружное ухо. Наружное ухо – видимая часть уха – воронкой направляет звук в слуховой канал к среднему уху.
Среднее ухо. Когда волна давления, вызванная движением воздуха, попадает в ухо, проходит через его наружную часть и слуховой канал, она ударяется о барабанную перепонку, иначе называемую тимпанической мембраной. В отличие от некоторых общеупотребимых названий анатомических структур, таких как адамово яблоко или коленная чашечка, слово “барабан” вполне точно описывает эту преграду на пути в среднее ухо. Как и кожаная мембрана барабана, барабанная перепонка – тоже мембрана, растягивающаяся при ударе звукового давления. Когда эта крошечная мембрана движется, она толкает первую из трех самых маленьких костей нашего тела – слуховых косточек[14], которая, в свою очередь, толкает вторую и, наконец, последнюю косточку, называемую стремечком. Далее стремечко ударяется о другую анатомическую мембрану – еще более крошечное овальное окно, закрывающее проход во внутреннее ухо. Зачем нам нужны две перепонки, разделенные тремя косточками? Затем, что с другой стороны овального окна внутри внутреннего уха находится жидкость. Перемещения воздуха недостаточно, чтобы напрямую надавить на овальное окно, поскольку жидкость внутри слишком плотная, чтобы перемещаться только под действием воздуха. Цепочка из трех косточек действует по принципу рычага и усиливает давление примерно в 20 раз[15]. Минимальный толчок по барабанной перепонке превращается в сильный удар, достаточный, чтобы подтолкнуть овальное окно. Заметьте, что мы все еще находимся на механической стадии процесса. Мы перешли от движения воздуха к движению жидкости. Но самая важная трансдукция в электричество еще впереди.
Внутреннее ухо (улитка). Теперь крохотное стремечко оказывает достаточно сильное давление, чтобы сместить овальное окно и находящуюся с другой стороны жидкость. Жидкость со свистом проносится через волосковые клетки Кортиева органа; эта структура расположена по всей длине свернутой в спираль улитки, и в соревновании на звание самого крохотного органа тела она проигрывает лишь одному органу (вот ведь!) – шишковидной железе. Посмотрите на рис. 2.4. По всей длине улитки располагаются волосковые клетки; и именно здесь происходит таинство трансдукции[16]. Волосковые клетки располагаются рядами – один внутренний и три внешних, – и каждый покрыт слоем еще более тонких ресничек под названием “стереоцилии”, плавно раскачивающихся в жидкости, как волосы ныряльщика. Волосковые клетки, как в сэндвиче, зажаты между базилярной и текториальной мембранами, названия которых происходят от архитектурных терминов: слово “базилярный” этимологически связано со словом “база” (основание), а слово “текториальный” происходит от латинского tectum, что означает “крыша”. Волосковые клетки встроены в основание, и стереоцилии не могут двигаться свободно, поскольку их кончики прикреплены к крыше. Когда жидкость начинает двигаться в результате толчка в овальное окно, некоторые волосковые клетки раскачиваются вверх и вниз, заставляя стереоцилии упираться в текториальную мембрану, что приводит к их отклонению вбок. Это движение как бы “открывает” внутренние волосковые клетки, так что в них могут проникать электрически заряженные химические частицы, в частности ионы кальция и калия. Эти ионы запускают цепную реакцию, заканчивающуюся высвобождением нейромедиаторов в синапс – место соединения волосковой клетки и слухового нерва, что приводит к быстрому изменению электрического напряжения в слуховом нерве. Наконец, мы дошли до трансдукции. Движение воздуха снаружи головы преобразовано в электричество внутри головы.
Рис. 2.4. Вверху: улитка в свернутом и развернутом виде. Основание свернутой улитки, где стремечко сталкивается с овальным окном, настроено на восприятие высокочастотных звуков. Верхушка (центр) улитки предпочитает низкочастотные звуки. На “развернутой” улитке справа это изображено схематически по аналогии с клавиатурой, а на срезе виден кортиев орган. Внизу: кортиев орган. Мы видим одну внутреннюю и три внешние волосковые клетки (зажатые в виде сэндвича между текториальной и базилярной мембранами) и их связь со слуховым нервом. Воспроизводится с разрешения из статьи Арнольда Старра. Фото Тома Лэмба.
Любая отдельно взятая волосковая клетка в улитке (их около 30 тысяч) не движется в ответ на каждый звук. Базилярная мембрана, к которой прикреплены волосковые клетки, по всей длине имеет разную ширину и жесткость. Ближайший к овальному окну конец самый узкий и жесткий, а при удалении от основания и приближении к верхушке мембрана становится шире и гибче (как “конский хвост”). Из-за этого физического различия волосковые клетки на узком и жестком конце реагируют на высокочастотные звуки. По мере того как звуки становятся все более и более низкочастотными, они начинают воздействовать на волосковые клетки, располагающиеся все ближе и ближе к гибкой верхушке. Такую упорядоченность называют тонотопией (“тональной топографией”). Впервые возникнув в улитке, тонотопическая карта, как крохотная фортепианная клавиатура, появляется вновь и вновь во всей слуховой системе от улитки до коры. Мозговые карты – это важнейший организационный принцип, определяющий функционирование наших чувств.
Мы слышим мозгом. Одно из моих любимых рассуждений на эту тему приводится в книге Робина Уоллеса “Слышащий Бетховен”[17]. Как Бетховен сочинил некоторые из своих шедевров после того, как потерял слух? Так же, как делал всегда:
Он импровизировал. Он набрасывал. Он исправлял. Не было никакой принципиальной разницы между состоянием до глухоты и после ее появления. Было только постоянное уточнение его взаимоотношений с фортепиано. О Бетховене можно думать не как о птице без крыльев или рыбе без воды, но скорее как о пилоте, летящем без работающих навигационных инструментов, но с глубоким физическим пониманием того, как вести самолет.
После того как внешняя, средняя и внутренняя части уха выполнили свою работу, предстоит еще долгий путь, прежде чем мы сможем сказать, что “слышим”, то есть до того, как мы придадим звуку смысл. Зайдем в мозг. На нашем слуховом пути будет множество остановок.
Под словом “мозг” часто подразумевают кору – изрытую бороздками, состоящую из различных долей внешнюю оболочку мозга, покрывающую левое и правое полушарие. Я считаю, что следует уделить такое же внимание и менее известным участкам мозга, на которых располагается кора. Между слуховым нервом и корой находятся улитковое ядро, верхний оливарный комплекс (ствол мозга), нижний холмик четверохолмия (средний мозг) и медиальное коленчатое тело (таламус). Возникающие электрические сигналы при путешествии по мозгу проходят через эти структуры. На этом пути встречается гораздо больше промежуточных структур, чем в любой другой сенсорной системе.
Давайте рассмотрим путь от слухового нерва к слуховой коре. Обработка звука изменяется в процессе прохождения звукового сигнала через слуховой мозг. Воспитанница лаборатории Brainvolts Дженна Каннингем одновременно регистрировала сигналы нейронов среднего мозга, таламуса и коры и показала, что ответы нейронов, расположенных вдоль слухового пути, различаются между собой. Ее эксперименты позволили увидеть, что ответ на один и тот же звук в разных структурах разный[18].
Слуховой нерв. Слуховой нерв представляет собой пучок волокон (примерно 30 тысяч в каждом ухе), настроенных на определенную частоту в зависимости от того, в каком месте они встречаются с базилярной мембраной улитки. Обнаруженная нами в улитке тонотопическая карта (маленькая фортепианная клавиатура) далее повторяется в слуховом нерве. Частота звука определяется тем, в каком месте тонотопической карты располагается нейрон. По мере углубления в мозг тонотопические карты множатся.
При продвижении от уха к мозгу мы наблюдаем еще один организационный принцип: по мере восхождения по мозговой лестнице понижается скорость возбуждения нейронов[19]. Иными словами, скорость синхронизации конкретных нейронов со звуком в реальном времени систематически снижается при продвижении от уха к мозгу. Волокна слухового нерва являются самыми быстрыми.
Рис. 2.5. Типы клеток в улитковом ядре. Воспроизводится в адаптированном виде из книги The Mammalian Auditory Pathway: Neuroanatomy с разрешения издательства Springer Nature.
Улитковое ядро. Первой структурой на пути к слуховой коре после возникновения электрического сигнала в месте соединения улитки со слуховым нервом является улитковое ядро. В нем содержится множество типов клеток с замечательными названиями (кустовидные, веретенообразные, октопусные!)[20] и характеристиками ответа[21], необходимыми для выполнения их работы. На рис. 2.5 я показываю, как выглядят эти клетки, просто потому, что мне они кажутся изумительными[22].
По мере восхождения по цепочке от уха к мозгу ответ нейронов на звуковой сигнал становится все более специализированным, благодаря принципу торможения. В отсутствие звука нейроны не полностью неактивны, они производят спонтанные импульсы. Ответом на звуковой сигнал может быть как возбуждение (выше частоты спонтанных импульсов), так и торможение (снижение активности ниже частоты спонтанных импульсов). Когда раздается звук с определенной частотой, пульсация настроенных на эту частоту нейронов начинает превышать спонтанный уровень. А пульсация нейронов, настроенных на близкие частоты, замедляется и становится ниже спонтанного уровня. Торможение позволяет выделить некоторые компоненты звука, повышая точность и настройку.
К области специализации улиткового ядра относится амплитудная модуляция (АМ)[23]. Клетки этой структуры специализируются на АМ некоторых частот. Высота голоса определяется АМ. Когда мы говорим, наш голос подвергается АМ в соответствии с колебаниями наших голосовых связок (с их открытием и закрытием).
После настройки в улитковом ядре нейронные импульсы проходят к следующей структуре цепи, однако это путешествие длится дольше, поскольку на этом уровне впервые нейронные электрические сигналы от каждого уха направляются в оба полушария мозга.
Верхний оливарный комплекс. Когда речь заходит о точности во времени, слуховая система по-настоящему восхищает и оставляет далеко позади систему зрительного восприятия. Микросекундные нюансы звука требуют микросекундной точности мозга. Волшебство временной настройки в значительной степени обеспечивается верхним оливарным комплексом, особенно в отношении бинауральной (bi – два, aural – ушной) обработки, локализации источника звука и избирательного улавливания конкретных звуков из звукового окружения.
Любой звук, источник которого находится не прямо перед нами, достигает двух ушей в разное время и с разной громкостью. Если звук доносится слева, он достигает левого уха на какую-то долю секунды раньше, чем правого уха. Если источник звука хоть в какой-то степени сдвинут относительно центрального положения, эта разность во времени может составлять порядка одной стотысячной доли секунды (10 мкс). Кроме того, слева он будет чуть громче, чем справа, поскольку его путь был чуть короче и его не преграждала голова. Эти различия во времени прибытия и громкости звука, достигающего двух ушей, вносят разный вклад в зависимости от частоты звука. Низкочастотные звуки с большей длиной волны проделывают путь вокруг головы с меньшей потерей громкости. Однако такой звук прибывает в два уха не одновременно, и мы способны уловить это различие в несколько микросекунд. Напротив, высокочастотный звук блокируется головой, так что два уха могут уловить различие в громкости. Поскольку каждое ухо направляет информацию как в левый, так и в правый верхний оливарный комплекс, есть возможность сравнить время прибытия и громкость звука[24]. Это помогает понять, из какой точки пространства идет звук. Давай, мозг, сделай свой расчет, пойми, какое положение может объяснять такое различие во времени прибытия и громкости звука, которое воспринимают мои уши. Кроме фиксации источника звука в пространстве, эта способность помогает составить из звуков “звуковые объекты”, такие как голос собеседника, так что мы способны улавливать его даже при наличии других звуков в звуковом пространстве. Если ваша приятельница сидит слева от вас в шумном ресторане, чрезвычайно полезно иметь возможность не обращать внимания на женщину с похожим голосом, сидящую за соседним столиком справа. Бинауральная обработка звука, позволяющая понять, где что, любезно обеспечивается верхним оливарным комплексом.
Слуховой средний мозг – нижний холмик четверохолмия. Следующая остановка на афферентном пути – верхушка нижнего холмика, расположенного в среднем мозге. Нижним он является по отношению к другому холмику, называемому верхним. Поскольку эта активная в метаболическом плане (жадно потребляющая энергию) структура одновременно является узлом обработки афферентной слуховой информации и главным перекрестком эфферентных, мультисенсорных и несенсорных нервных процессов, функционирование среднего мозга, названного так вполне обоснованно, представляет чрезвычайно большой интерес для нейробиологов, занимающихся слухом, поскольку характеризует слуховую функцию в целом.
Рис. 2.6. Сигналы от обоих ушей сливаются в верхнем оливарном комплексе, где анализируется относительное время их прибытия и интенсивность. Воспроизводится с разрешения Арнольда Старра. Фотография Тома Лэмба.
Все сигналы от перечисленных выше слуховых структур приходят в слуховой средний мозг из обоих ушей, как и сигналы из других частей мозга. Таким образом, в среднем мозге совершаются расчеты, связанные с избирательной настройкой, определением локализации источника звука и созданием “звуковых объектов”[25]. Поскольку слуховой средний мозг играет центральную роль в качестве комплектующего звена и точки слияния мозговых сигналов от многих источников, он имеет важнейшее значение для осмысления звука.
К счастью, хотя средний мозг локализован в глубоких слоях мозга, он производит достаточно мощные электрические сигналы, которые удается регистрировать на поверхности головы. Многие исследования в лаборатории Brainvolts включали в себя измерение электрической активности среднего мозга в виде реакции на периодический звуковой стимул (frequency following response, FFR) и использование ее в качестве отправной точки для изучения мозговых процессов, связанных с восприятием музыки, чтением, аутизмом, старением и другими состояниями.
Слуховой таламус – медиальное коленчатое тело. Последней остановкой на пути к коре является медиальное коленчатое тело (оно названо так за изогнутую форму). Эта структура расположена в таламусе, по соседству с латеральным коленчатым телом – субкортикальным центром обработки зрительных сигналов.
Здесь уместно будет сообщить, что система зрительного восприятия включает в себя гораздо меньше этапов субкортикальной обработки, чем система слухового восприятия. Зрительный нерв более или менее прямым путем проходит от сетчатки глаза к таламусу. В системе зрительного восприятия нет аналогов таких центров обработки сигнала, как улитковое ядро, верхний оливарный комплекс или нижний холмик. Сигнал идет напрямую: сетчатка – таламус – кора – и готово![26] Аналогичным образом от обонятельных рецепторных клеток в носу сигнал идет в обонятельную луковицу[27], затем в кору – и всё![28] Кроме того, различные станции в системе слухового мозга (слуховой нерв, улитковое ядро, верхний оливарный комплекс, нижний холмик, медиальное коленчатое тело) состоят из набора подстанций. Слуховая субкортикальная система необычайно богата.
Таламус направляет сигнал от слухового среднего мозга к слуховой коре, кодирует длительность звуков, совершает дополнительную обработку сложных звуков и подключает большое количество информации от различных отделов мозга. Он регулирует сознание – бдительность, возбуждение и понимание. Представьте себе таламус в виде прожектора (он даже по форме напоминает лампочку), следящего за активностью всего мозга.
Слуховая кора. Слуховая кора вполне удобным образом расположена в височных долях над ушами, на обеих сторонах головы. Слуховая кора, содержащая множество тонотопических карт, является заключительным этапом афферентного пути. Здесь бинауральная обработка дополнительно уточняется, поскольку пучки специализированных нейронов реагируют оптимальным образом в зависимости от того, одно ухо или оба получают сигнал[29]