Прямо сейчас ваш мозг совершает подвиг. Как человек научился читать и превращать слова на бумаге в миры и смыслы

Stanislas Dehaene
READING IN THE BRAIN
Copyright © 2009 by Stanislas Dehaene. All rights reserved.
© Чечина А.А., перевод на русский язык, 2022
© ООО «Издательство «Эксмо», 2022
Как устроен мозг
Введение
Новая наука о чтении
Здесь у меня собранье небольшое Ученых книг, покой и тишина; Моим очам усопших речь внятна, Я с мертвыми беседую душою.
ФРАНСИСКО ДЕ КЕВЕДО[1] (ИСПАНСКИЙ ПОЭТ И ПРОЗАИК, 1580–1645)
Прямо сейчас ваш мозг совершает удивительный подвиг – он читает. Сканируя страницу, ваши глаза движутся скачкообразно. Четыре или пять раз в секунду ваш взгляд останавливается ровно настолько, чтобы вы успели распознать одно или два слова. Ничего этого вы, конечно, не замечаете. Сознательного разума достигают только звуки и значения слов. Но каким образом черным закорючкам на белой бумаге, попадающим на сетчатку глаза, удается вызывать в нашем воображении целую вселенную, как это делает Владимир Набоков в первых строках «Лолиты»?
Лолита, свет моей жизни, огонь моих чресел. Грех мой, душа моя. Ло-ли-та: кончик языка совершает путь в три шажка вниз по нёбу, чтобы на третьем толкнуться о зубы. Ло. Ли. Та.[2]
Человеческий мозг содержит целый набор сложных механизмов, отлично приспособленных к чтению. На протяжении веков этот дар Homo sapiens оставался тайной. Сегодня черный ящик мозга открыт, и на смену догадкам пришла настоящая наука – наука о чтении. За последние 20 лет благодаря достижениям в области психологии и нейробиологии выявлены многие принципы, лежащие в основе процесса чтения. Современные методы нейровизуализации всего за несколько минут позволяют непосредственно увидеть участки мозга, задействованные в расшифровке письменной речи. Ученые могут проследить весь путь печатного слова от сетчатки глаза до соответствующих центров в коре. Обработка слов осуществляется в несколько последовательных этапов, на каждом из которых система пытается ответить на следующие элементарные вопросы: Это буквы? Как они выглядят? Они образуют слово? Как оно звучит? Как оно произносится? Что оно значит?
На такой эмпирической основе и строится теория чтения. Согласно современным представлениям, для распознавания печатных слов в мозг могут быть внедрены нейронные цепи, сформированные в ходе эволюции и унаследованные нами от приматов. С этой точки зрения подходящие сети фактически перепрофилируются и начинают выполнять новую задачу – читать. Четкое понимание того, как умение читать и писать трансформирует мозг, оказывает глубочайшее влияние на наш подход к образованию и нарушениям обучаемости. В настоящее время разрабатываются новые реабилитационные программы. Хочется верить, что со временем они позволят справиться даже с такой изнуряющей патологией, как дислексия (неспособность к чтению текста).
Основная задача, которую я ставил перед собой при работе над этой книгой, – поделиться новыми и малоизвестными открытиями науки о чтении. Как ни странно, в XXI веке среднестатистический человек гораздо лучше разбирается в том, как работает автомобиль, нежели в том, как функционирует его собственный мозг. Люди, принимающие ключевые решения в сфере образования, покорно следуют веяниям педагогической реформы, откровенно игнорируя то, как мозг учится читать на самом деле. Многие родители, педагоги и политики признают: между учебными программами и последними достижениями в области нейробиологии существует огромный разрыв. Однако их представления о том, как именно эта наука может способствовать прогрессу в образовании, зачастую основаны лишь на паре-тройке цветных изображений работающего мозга. К сожалению, методы нейровизуализации, позволяющие нам увидеть мозг в действии, не так однозначны, как кажется, а потому могут ввести в заблуждение. Новая наука о чтении появилась совсем недавно и развивается так быстро, что за пределами научного сообщества о ней мало кто знает. Таким образом, моя главная цель состоит в том, чтобы, во-первых, вкратце изложить основы этой захватывающей области знаний, а во-вторых, подчеркнуть удивительные возможности нашего читающего мозга.
От нейронов к обучению
Формирование навыка чтения – важный шаг в развитии ребенка. Многим детям чтение дается нелегко; как показывают опросы, примерно один взрослый из десяти не владеет даже зачатками понимания текста. Нужны годы усердной работы, прежде чем система, отвечающая за чтение, заработает как часы и мы забудем о ее существовании.
Почему же научиться читать так трудно? Какие глубинные изменения в мозге сопровождают процесс освоения этого навыка? Все ли стратегии обучения одинаково хороши или одни лучше адаптированы к особенностям детского мозга, чем другие? Почему фонетический метод – систематическое обучение звуко-буквенным соответствиям – работает более эффективно, чем метод целых слов? Есть ли для этого конкретные научные основания; если да, то какие? Хотя многое еще неизвестно, новая наука о чтении дает более или менее точные ответы на все эти вопросы. В частности, она объясняет, почему результаты первых экспериментов свидетельствовали в пользу эффективности метода целых слов, в то время как новейшие исследования нейронных механизмов чтения доказывают, что это не так.
Зная, что именно представляет собой процесс чтения, мы можем лучше понять и его нарушения. Исследуя сознание и мозг читателя, я познакомлю вас с жертвами инсульта, внезапно утратившими способность читать, а также проанализирую причины дислексии, о неврологических основах которой мы узнаем все больше и больше. На сегодняшний день совершенно ясно, что мозг дислексика слегка отличается от мозга обычного человека. Хотя выявлено несколько генов предрасположенности к дислексии, ни в коем случае не стоит впадать в уныние и опускать руки. В настоящее время специалисты занимаются разработкой новых методик вмешательства. Например, было установлено, что интенсивное переобучение нейронных сетей, отвечающих за речь и чтение, приводит к значительным улучшениям, которые можно легко отследить с помощью методов нейровизуализации.
Нейрокультурный подход
Способность читать – еще одно доказательство исключительности человеческого мозга. Но почему Homo sapiens – единственный вид, способный активно самообучаться? Почему только ему присуща способность передавать свою сложную культуру потомкам? Как биологический мир синапсов и нейронов соотносится со вселенной культурных достижений? Чтение, а также письмо, математика, искусство, религия, сельское хозяйство и городская жизнь в разы расширили врожденные возможности нашего мозга. Только человек сумел выйти за рамки сугубо биологического существования; только человек создает искусственную культурную среду и обучает себя новым навыкам, таким как чтение. Эта уникальная человеческая способность, не свойственная ни одному другому виду, озадачивает и требует теоретического объяснения.
Один из базовых методов исследования в инструментарии нейробиолога заключается в изучении «культуры нейронов», то есть в выращивании их в чашке Петри. В этой книге я призываю к другой «культуре нейронов» – к новому взгляду на культурную деятельность человека, основанному на понимании ее связи с соответствующими нейронными сетями. Общепризнанная цель нейробиологии состоит в описании механизмов, с помощью которых элементарные компоненты нервной системы приводят к поведенческим закономерностям у детей и взрослых (включая продвинутые когнитивные навыки). Чтение – одна из наиболее многообещающих экспериментальных платформ для такого «нейрокультурного» подхода. На сегодняшний день мы имеем достаточно четкое представление о том, как самые разные системы письменности, включая иврит, китайский и английский языки, сохраняются в нейронных сетях человеческого мозга. В случае с чтением мы можем проследить прямую связь между нашей врожденной нейронной архитектурой и приобретенными культурными способностями. Есть надежда, что этот нейробиологический подход можно применить и к другим ключевым областям культурного самовыражения человека.
Загадка читающей обезьяны
Чтобы пересмотреть связь между мозгом и культурой, мы должны разгадать загадку, которую я называю парадоксом чтения: почему наш мозг, который мало чем отличается от мозга других приматов, способен читать? Чем объясняется его склонность к чтению, учитывая, что эта культурная деятельность была изобретена всего несколько тысяч лет назад?
Существуют веские причины, по которым этот обманчиво простой вопрос заслуживает статуса парадокса. Мы обнаружили, что кора грамотного мозга содержит особые механизмы, тонко настроенные на распознавание письменных слов. Что еще удивительнее, у всех людей эти механизмы локализованы в одних и тех же областях. Можно подумать, в нашем мозге имеется специальный орган для чтения!
Но письменность зародилась всего 5400 лет назад в Плодородном полумесяце[3], а самому алфавиту не больше 3800 лет. Эти временные промежутки – сущий пустяк по меркам биологической эволюции. Поэтому у эволюции просто не было времени наделить Homo sapiens нейронными сетями, специально предназначенными для чтения. Мозг современного человека построен на генетическом коде, который позволял выживать нашим предкам – охотникам-собирателям. Хотя мы с удовольствием читаем Набокова и Шекспира, изначально наш мозг был рассчитан на жизнь в африканской саванне. Ничто в человеческой эволюции не могло подготовить нас к восприятию речи через зрение. Однако нейровизуализационные исследования показывают, что мозг взрослого человека содержит фиксированные цепи нейронов, идеально приспособленные к чтению.
Парадокс чтения чем-то напоминает рассуждения Уильяма Пейли[4], которые он приводит в доказательство существования Бога. В своем труде «Естественная теология» (1802) он задается следующим вопросом: если в пустыне некто найдет на земле часы с замысловатым внутренним механизмом, явно предназначенным для измерения времени, разве не будет это служить неопровержимым доказательством того, что где-то существует умный часовщик, который создал этот прибор намеренно? Аналогичным образом, утверждал Пейли, сложные устройства, которые мы наблюдаем в живых организмах – например, механизмы глаза, – это подтверждение того, что природа есть не что иное, как творение божественного часовщика.
Чарлз Дарвин опроверг теорию Пейли, продемонстрировав, что слепой естественный отбор тоже может порождать высокоорганизованные структуры. Даже если биологические организмы на первый взгляд кажутся созданными для определенной цели, более тщательный анализ показывает, что их организация далека от совершенства, которого можно ожидать от всемогущего архитектора. Самые разные недостатки свидетельствуют о том, что эволюция не подчинена замыслу некоего разумного творца; в борьбе за выживание она выбирает случайные пути. В сетчатке глаза, например, кровеносные сосуды и нервные волокна расположены перед фоторецепторами, тем самым частично блокируя поступающий свет и создавая слепое пятно. Не очень удачная конструкция, верно?
Следуя по стопам Дарвина, Стивен Джей Гулд[5] привел множество примеров неидеальных творений естественного отбора, включая большой палец у панды[6]. Британский эволюционист Ричард Докинз также показал, что сложные механизмы работы глаза или крыла могли возникнуть только в результате естественного отбора – иначе говоря, их создал «слепой часовщик»[7]. Итак, эволюционизм Дарвина, по всей вероятности, является единственным источником видимого «замысла» в природе.
Однако когда речь идет о чтении, то аллегория Пейли представляется сомнительной в несколько ином плане. Механизмы мозга, поддерживающие чтение, безусловно, сравнимы по сложности и конструкции с часами, найденными в пустыне. Вся их организация подчинена единственной очевидной цели – как можно быстрее и точнее расшифровывать написанные слова. И все же ни гипотеза о разумном творце, ни теория о медленном формировании в ходе естественного отбора не дают убедительного объяснения того, как именно возникло чтение. За столь короткое время эволюция не успела бы создать соответствующую нейронную сеть. Как же тогда человеческий мозг научился читать? Наша кора является результатом миллионов лет эволюции в мире без письменности. Каким же образом ей удается адаптироваться к специфическим задачам, связанным с распознаванием письменных слов?
Биологическое единство и культурное многообразие
В социальных науках приобретение культурных навыков, таких как чтение, математика или изобразительное искусство, редко объясняется сквозь призму биологии. До недавнего времени лишь немногие социологи признавали, что биология мозга и эволюционная теория имеют отношение к наукам об обществе. Даже сегодня большинство слепо согласится с наивной моделью мозга как бесконечно пластичного органа, чья способность к научению столь велика, что не накладывает никаких ограничений на пределы человеческой деятельности. Эта идея не нова. Она восходит к теориям британских эмпириков Джона Локка, Дэвида Юма и Джорджа Беркли. Человеческий мозг, утверждали они, подобен чистому листу, который постепенно впитывает отпечаток естественной и культурной сред посредством пяти органов чувств.
Подобный взгляд, отрицающий само существование человеческой природы, принимался без сомнений. Он принадлежит к «стандартной социологической модели»[8], которую отстаивают многие антропологи, социологи, некоторые психологи и даже несколько нейробиологов, рассматривающих поверхность коры как «преимущественно эквипотентную и лишенную предметно-специфической структуры»[9]. Предполагается, что человеческая природа формируется посредством планомерного и гибкого процесса культурного насыщения. Проще говоря, этот подход подразумевает, что дети инуитов (амазонского племени охотников-собирателей) и дети, родившиеся в Верхнем Ист-Сайде[10] в Нью-Йорке, имеют мало общего. Даже восприятие цвета, понимание музыки или представления о правильном и неправильном должны варьироваться от одной культуры к другой – хотя бы потому, что человеческий мозг содержит не так много стабильных структур, помимо способности к обучению.
Кроме того, эмпирики убеждены, что человеческий мозг, не стесненный биологическими ограничениями и не похожий на мозг других видов, может впитать любую форму культуры. С этой точки зрения рассуждать о фундаментальных основах культурных изобретений, таких как чтение, все равно что анализировать атомный состав пьесы Шекспира.
В этой книге я опровергаю подобный упрощенный взгляд на бесконечную приспособляемость мозга к культуре. Как показывают новейшие исследования нейронных сетей, отвечающих за чтение, гипотеза о невероятно гибком мозге неверна. Конечно, если бы мозг не мог учиться, он бы не смог адаптироваться к специфическим правилам правописания английского, японского или арабского. Однако это научение носит строго ограниченный характер. Все его механизмы заданы генами. Архитектура мозга схожа у всех представителей Homo sapiens и лишь незначительно отличается от других приматов. Во всем мире расшифровка письменного слова задействует одни и те же области коры. Овладение чтением – будь то на французском или китайском языке – осуществляется через генетически запрограммированную сеть нейронов.
На основании этих данных я предлагаю новую теорию нейрокультурных взаимодействий, противоположную культурному релятивизму[11] и способную разрешить парадокс чтения. Я называю ее гипотезой «нейронного рециклинга». Согласно этому новому подходу, архитектура человеческого мозга подчинена жестким генетическим ограничениям, однако некоторые нейронные цепи допускают определенную вариативность. Часть нашей зрительной системы, например, не зафиксирована и восприимчива к изменениям в окружающей среде. Именно эта зрительная пластичность в хорошо структурированном мозге позволила древним писцам изобрести чтение.
В целом ряд нейронных сетей, заданных генами, снабжает мозг «предварительными репрезентациями»[12] или гипотезами, которые он может принять относительно будущих изменений в окружающей среде. В процессе развития механизмы научения помогают определить, какие из них лучше всего отвечают текущим обстоятельствам. Овладение культурными достижениями происходит именно благодаря этой пластичности. Наш мозг отнюдь не чистый лист, который покорно впитывает все, что его окружает; он адаптируется к конкретной культуре, минимально корректируя свои функции с учетом новых требований. Иными словами, мозг – это не tabula rasa[13], в рамках которой накапливаются культурные конструкции, а тщательно структурированное устройство, способное переориентировать некоторые свои части на новые задачи. Осваивая тот или иной навык, мы перепрофилируем определенные старые нейронные сети, доставшиеся нам от приматов – конечно, в той мере, в какой они допускают подобные трансформации.
О содержании книги
На страницах этой книги я расскажу, как нейронный рециклинг[14] может объяснить грамотность, ее механизмы и даже ее историю. Первые три главы посвящены анализу механизмов чтения у взрослых. В главе 1 мы посмотрим на чтение с психологической точки зрения: как быстро мы читаем и каковы основные детерминанты этого действия? В главе 2 описаны области мозга, активные во время чтения, а также современные методы их визуализации. Наконец, в главе 3 мы спустимся на уровень отдельных нейронов, которые распознают буквы и слова, и их организации в цепи.
Подходя к своему анализу с механистической точки зрения, я предлагаю обнажить шестерни читающего мозга подобно тому, как преподобный Пейли призывал разобрать часы, брошенные в пустыне. Впрочем, заглянув в мозг читателя, мы не увидим в нем никакого совершенного устройства, сотворенного божественным часовщиком. Нейронные сети, задействованные при чтении, имеют немало изъянов, выдающих компромисс между идеальным считывающим аппаратом и имеющимися биологическими механизмами. Почему чтение не работает так, как работает быстрый и эффективный сканер? Все дело в специфических особенностях зрительной системы приматов. По мере того как мы перемещаем взгляд по странице, слова попадают в центральную область сетчатки глаза, а затем распадаются на множество фрагментов, которые позже наш мозг вновь собирает воедино. Только потому, что за счет многолетней практики все эти процессы становятся автоматическими и бессознательными, мы пребываем в иллюзии, будто чтение – это просто и легко.
Бесспорно, наши гены эволюционировали не для того, чтобы однажды мы могли научиться читать. Как же тогда разрешить парадокс чтения? Моя логика проста. Если мозг не эволюционировал для чтения, значит, верно обратное: системы письменности развились с учетом ограничений нашего мозга. В главе 4 мы проанализируем историю письма с этой точки зрения, начиная с первых доисторических символов и заканчивая изобретением алфавита. На каждом из этапов были обнаружены свидетельства непрерывных культурных изменений. На протяжении тысячелетий писцы старались придумать слова, знаки и алфавиты, наилучшим образом отвечающие ограничениям нашего мозга. По сей день мировые системы письменности сохраняют ряд общих конструктивных особенностей, которые могут быть прослежены до ограничений, налагаемых на письмо устройством нашего мозга.
В продолжение мысли о том, что наш мозг не создан для чтения, но способен переориентировать некоторые из своих сетей на эту новую культурную деятельность, я рассматриваю то, как именно дети учатся читать. Психологические исследования показывают, что существует не так много способов превратить мозг примата в мозг опытного читателя. В главе 5 довольно подробно исследуется единственная траектория, по которой, по всей видимости, следует формирование этого навыка. Школы поступят благоразумно, если используют эти знания для оптимизации обучения чтению и смягчения пагубных последствий неграмотности и дислексии.
Я также покажу, как нейронаучный подход может пролить свет на более загадочные особенности овладения навыком чтения. Например, почему так много детей пишут свои первые слова справа налево? Вопреки общепринятому мнению, ошибки, связанные с зеркальной инверсией, не являются первыми признаками дислексии; скорее, это естественное следствие организации нашей зрительной системы. У большинства детей дислексия связана с другой, вполне отчетливой аномалией в обработке звуков речи. Описанию симптомов дислексии, их мозговых механизмов, а также самых последних открытий, касающихся генетических основ этой патологии, посвящена глава 6. В главе 7 мы узнаем, что зеркальные ошибки могут говорить о нормальном процессе зрительного распознавания.
Наконец, в главе 8 мы вновь вернемся к тому удивительному факту, что только наш вид способен на такие сложные культурные изобретения, как чтение. Чтение – уникальный подвиг, который не под силу ни одному другому примату. Согласно стандартной социологической модели, мозг – это чистый лист, на котором культура может писать все, что ей заблагорассудится. Это не так. В действительности культура и организация мозга неразрывно связаны между собой, и чтение – убедительное тому доказательство. За свою долгую культурную историю люди убедились, что зрительную систему можно использовать в качестве суррогатного речевого входа. Так возникло чтение и письмо. Аналогичный подход применим и к другим ключевым культурным изобретениям человека. Математика, искусство, музыка, религия – все это можно рассматривать как устройства, сформированные веками культурной эволюции и захватившие наш мозг примата.
Остается последняя загадка: если учиться могут все приматы, почему Homo sapiens – единственный вид с развитой культурой? Хотя этот термин иногда применяется в отношении шимпанзе, их «культура» едва ли выходит за рамки нескольких хитроумных способов колоть орехи. Да, они моют картофель и выуживают муравьев палкой, но это ничто по сравнению со свойственным человеку беспрерывным производством взаимосвязанных условностей и систем символов, включая языки, религии, искусство, спорт, математику и медицину. Другие животные могут постепенно научиться распознавать новые знаки, такие как буквы и цифры, но они не могут их изобрести. В заключении я высказываю некоторые предварительные размышления об исключительности человеческого мозга. Уникальность нашего вида может быть обусловлена сочетанием двух факторов: теории чужого сознания (способностью понимать мысли других людей) и глобального рабочего пространства (внутренним буфером, в котором происходит объединение множества идей). Оба механизма, заложенные в наших генах, делают нас единственным культурным видом на планете. Кажущееся бесконечным разнообразие человеческих культур – лишь иллюзия. Никому из нас не под силу вырваться из замкнутого когнитивного круга: как вообще можно вообразить формы, кроме тех, что способен представить наш мозг? Хотя чтение – относительно недавнее изобретение, оно тысячелетиями дремало в ореоле потенциальных способностей, заложенных в нашем мозге. В основе внешнего многообразия человеческих систем письменности лежит базовый набор универсальных нейронных механизмов, которые, подобно водяному знаку, обнаруживают ограничения человеческой природы.
1
Как мы читаем
Существование текста – это безмолвное существование, безмолвное ровно до тех пор, пока его не прочтет читатель. Лишь после того, как знаков на табличке коснется опытный взгляд, текст пробуждается к активной жизни. Все написанное зависит исключительно от великодушия читателя.
АЛЬБЕРТО МАНГУЭЛЬ, «ИСТОРИЯ ЧТЕНИЯ»[15]
Обработка письменной речи начинается с глаз. Только центр сетчатки – так называемая центральная ямка – имеет достаточно высокое разрешение, чтобы распознавать мелкий шрифт. Именно поэтому взгляд вынужден беспрерывно перемещаться по странице. Когда наши глаза останавливаются, мы можем различить не больше одного-двух слов. Каждое из них дробится нейронами сетчатки на множество фрагментов, а затем собирается обратно. Наша зрительная система последовательно извлекает графемы, слоги, префиксы, суффиксы и корни слов. Обработка слова осуществляется по двум параллельным маршрутам: фонологическому, который преобразует буквы в звуки речи, и лексическому, который обеспечивает доступ к ментальному словарю значений.
На первый взгляд чтение кажется почти волшебством: глаза видят слово, и мозг без труда дает нам доступ к его значению и произношению. Но не все так просто. Попадая на сетчатку, слово дробится на множество фрагментов: каждую часть зрительного образа распознает отдельный фоторецептор. Задача в том, чтобы снова собрать эти кусочки воедино, расшифровать буквы, выяснить порядок, в котором они расположены, и, наконец, идентифицировать слово.
Вот уже 30 лет специалисты по когнитивной психологии активно изучают механику чтения. Их главная цель – взломать «алгоритм» зрительного распознавания слов и выявить последовательность основных этапов его обработки. Психологи рассматривают чтение как задачу автоматизированного анализа данных. По большому счету любой читающий человек напоминает робота с двумя камерами – глазами и сетчаткой. Сначала все слова представляются в виде пятен света и тени и не могут быть интерпретированы как лингвистические знаки. Чтобы мы могли получить доступ к соответствующим звукам, словам и значениям, зрительную информацию необходимо перекодировать в другой формат. Следовательно, наш алгоритм расшифровки должен быть в чем-то похож на программу автоматического распознавания символов, которая на входе получает пиксели, а на выходе предлагает слова. Хотя мы этого не осознаем, наш мозг поступает именно таким образом: чтобы распознать слово, он производит целый ряд сложных операций по декодированию, принципы которых ученые только начинают понимать.
Глаз – плохой сканер
Чтение начинается в тот момент, когда фотоны[16], отраженные от страницы, попадают на сетчатку глаза. Но сетчатка не является однородным сенсором. Лишь центральная ямка (фовеа) содержит большое количество клеток с высокой разрешающей способностью и чувствительностью к свету. Для остальной сетчатки характерно более низкое разрешение. Центральная ямка занимает около 15 градусов зрительного поля и является единственным участком сетчатки, который «способен» читать. Когда фовеальная информация отсутствует, например, из-за повреждения сетчатки, инсульта, разрушившего центральную часть зрительной коры, или хитроумного эксперимента, который избирательно блокирует зрительные сигналы, поступающие в центральную ямку, чтение становится невозможным[17].
Итак, мы можем читать только те слова, которые попадают в область центральной ямки. Вот почему во время чтения наши глаза находятся в постоянном движении. Мы «сканируем» текст наиболее чувствительной частью сетчатки. Только она имеет достаточно высокое разрешение, необходимое для распознавания букв. Тем не менее наши глаза не перемещаются по странице безостановочно[18]. Скорее наоборот: они движутся небольшими скачками. Эти быстрые, согласованные движения глаз называются саккадами. В этот самый момент вы совершаете четыре или пять таких резких движений в секунду. Благодаря им в вашу область фовеа поступает новая информация.
Однако даже в центральной ямке визуальная информация представлена с разной степенью четкости. В сетчатке, как и в зрительных ретрансляторах таламуса и коры, количество клеток, «закрепленных» за одним фрагментом изображения, уменьшается прямо пропорционально расстоянию от центра зрительного поля. Это приводит к постепенному снижению четкости. Острота зрения оптимальна в центре и плавно снижается к периферии. Посмотрите прямо перед собой. Вам кажется, что все видно с одинаковой четкостью, как если бы вы снимали на цифровую камеру с однородным набором пикселей? Это иллюзия. В отличие от камеры, наш глазной сенсор точно воспринимает лишь ту точку, на которую падает взгляд. Все остальное остается нечетким и расплывчатым (рис. 1.1)[19].
Рис. 1.1. Сетчатка глаза строго фильтрует все, что мы читаем. Эта страница из журнала Сэмюэла Джонсона[20] The Adventurer (1754) была обработана с помощью специального алгоритма, имитирующего снижение остроты зрения от центра сетчатки к периферии. Независимо от размера, мы можем идентифицировать только те буквы, которые оказались близко к точке фиксации взгляда. Вот почему во время чтения наши глаза постоянно «прыгают» по странице, совершая быстрые, скачкообразные движения. Когда наш взгляд останавливается, мы можем различить всего одно или два слова.
Можно подумать, что в таких обстоятельствах легкость, с которой мы читаем, зависит от абсолютного размера печатных знаков: маленькие буквы сложнее читать, чем большие. Как ни странно, это не так. Причина в том, что чем крупнее знаки, тем больше места они занимают на сетчатке. Слово, напечатанное большими буквами, смещается на периферию, где клетки с трудом различают даже крупные буквы. Поскольку эти два фактора компенсируют друг друга, точность отображения на сетчатке ОГРОМНОГО и крошечного слова фактически одинакова. Конечно, это верно только при условии, что размер символов больше абсолютного минимума, соответствующего максимальной четкости в середине центральной ямки. Людям со сниженной остротой зрения, например пожилым пациентам, логично рекомендовать книги, напечатанные крупным шрифтом.
Поскольку глаз человека устроен именно таким образом, наше восприятие зависит от количества букв в словах, а не от места, которое эти слова занимают на сетчатке[21]. Действительно, саккады, которые совершают наши глаза при чтении, различаются по абсолютному размеру, но всегда одинаковы, если измерять их по количеству букв. Секрет в том, что при вычислении расстояния, на которое необходимо переместить взгляд, мозг учитывает размер символов. В результате наши глаза всегда сдвигаются на семь-девять букв вперед, вне зависимости от того, большие они или маленькие. Приблизительно столько информации мы можем обработать за одну зрительную фиксацию. За одну зрительную фиксацию мы можем обработать семь-девять букв.
Как же доказать, что в любой заданный момент времени мы видим лишь малую часть страницы? Джордж У. Макконки и Кит Рейнер разработали экспериментальный метод, который мне нравится называть картезианским дьяволом. В своих «Метафизических размышлениях» Рене Декарт пишет о воображаемом злом гении, который играет нашими чувствами:
Итак, я сделаю допущение, что не всеблагой Бог, источник истины, но какой-то злокозненный гений, очень могущественный и склонный к обману, приложил всю свою изобретательность к тому, чтобы ввести меня в заблуждение: я буду мнить небо, воздух, землю, цвета, очертания, звуки и все вообще внешние вещи всего лишь пригрезившимися мне ловушками, расставленными моей доверчивости усилиями этого гения; я буду рассматривать себя как существо, лишенное рук, глаз, плоти и крови, каких-либо чувств: обладание всем этим, стану я полагать, было лишь моим ложным мнением…[22]
Подобно суперкомпьютеру в фильме «Матрица», злой гений Декарта бомбардирует наши органы чувств искусными сигналами, создающими псевдореальность, виртуальное действо, истинная сторона которого всегда остается скрытой. Макконки и Рейнер оказались более скромными и придумали только лишь «движущееся окно», которое создает иллюзию текста на экране компьютера[23]. Специальное устройство отслеживает движения глаз испытуемого и может менять визуальный вывод в режиме реального времени. Например, его можно запрограммировать так, чтобы на экране отображались только несколько символов слева и справа от центра взгляда, а все остальные буквы на странице заменялись на х:
Как только глаза начинают двигаться, компьютер незаметно обновляет изображение. Его задача – показывать соответствующие буквы только в том месте, куда смотрит человек, а все остальные менять на x:
* Слова из преамбулы к Конституции США, которая содержит одно предложение:
«Мы, народ Соединенных Штатов, в целях образования более совершенного Союза, утверждения правосудия, обеспечения внутреннего спокойствия, организации совместной обороны, содействия общему благосостоянию и обеспечения нам и нашему потомству благ свободы, учреждаем и принимаем эту Конституцию для Соединенных Штатов Америки». (Прим. перев.)
Используя это устройство, Макконки и Рейнер сделали любопытное и вместе с тем парадоксальное открытие. Они обнаружили, что испытуемые не замечали никаких манипуляций со словами. До тех пор пока слева и справа от точки фиксации представлено достаточное количество букв, читатель не видит подвоха и считает, что смотрит на совершенно нормальный текст.
Причина этой удивительной «слепоты» проста: в точке, где одна буква сменяется другой, глаз развивает максимальную скорость. В результате обнаружить изменение букв практически невозможно: в этот самый момент все изображение на сетчатке расплывается из-за движения. Как только взгляд останавливается, текст выглядит нормально: в центральной ямке все буквы на месте. Что же касается букв на периферии зрительного поля, то они все равно не могут быть распознаны. Таким образом, эксперимент МакКонки и Рейнера убедительно доказывает, что сознательно мы обрабатываем лишь очень малое подмножество зрительных сигналов. Если компьютер оставит четыре буквы слева от точки фиксации и 15 букв справа, скорость чтения останется нормальной[24]. Другими словами, в любой заданный момент времени мы извлекаем очень мало информации из страницы текста. Попади это оборудование в руки злокозненному гению Декарта, ему хватило бы 20 букв в каждой фиксации, чтобы заставить нас поверить, будто мы читаем Библию или Конституцию США!
На самом деле 20 букв – это преувеличение. Мы идентифицируем только 10 или 12 букв за саккаду: три-четыре слева от точки фиксации и семь-восемь справа. К остальным буквам мы практически нечувствительны и просто кодируем пробелы между словами. Эти промежутки позволяют приблизительно оценить длину слов и спланировать движения глаз таким образом, чтобы взгляд оказался как можно ближе к середине следующего слова. Специалисты продолжают спорить о том, в каком объеме мы извлекаем информацию из последующего слова – вероятно, мы распознаем только первые несколько букв. Тем не менее все согласятся с тем, что направление чтения влечет за собой асимметрию зрительного поля. Зрительное поле западного человека смещено вправо, а у носителей арабского языка или иврита, которые сканируют страницу справа налево, – влево[25]. В других системах письма, например китайской, где плотность символов больше, саккады короче, и зрительный диапазон, соответственно, меньше. Отсюда следует, что каждый человек корректирует стратегию визуального исследования с учетом конкретного языка и письменности.
С помощью этого же метода можно установить, сколько времени требуется для кодирования внешнего облика слов. Компьютер можно запрограммировать так, чтобы спустя определенное время он менял на х все буквы, включая те, что попадают в область центральной ямки. Эксперименты показывают: для обеспечения практически нормальной скорости чтения достаточно показывать слово в течение 50 миллисекунд. Разумеется, это не означает, что все операции, связанные с чтением, осуществляются за одну двадцатую долю секунды. Как мы увидим далее, мыслительные процессы продолжаются еще как минимум 500 миллисекунд после прочтения слова. Тем не менее первоначальный сбор зрительной информации может происходить очень быстро.
Вкратце, человеческий глаз накладывает множество ограничений на процесс чтения. Структура наших зрительных сенсоров заставляет нас сканировать страницу, совершая скачкообразные движения глазами каждые две-три десятых доли секунды. Чтение есть не что иное, как пословное мысленное восстановление текста с помощью серии моментальных «снимков». Хотя некоторые короткие служебные слова иногда можно пропустить, почти все значимые слова, такие как существительные и глаголы, должны быть зафиксированы хотя бы один раз.
Эти ограничения являются неотъемлемой частью нашего зрительного аппарата и не могут быть устранены посредством тренировки. Конечно, можно научить людей оптимизировать движение глаз, однако те, кто читает от 400 до 500 слов в минуту, и без того близки к максимуму. Учитывая имеющийся в нашем распоряжении ретинальный сенсор (сетчатку), едва ли стоит рассчитывать на что-то большее. Доказать, что скорость чтения ограничивается именно движениями глаз, позволяет простой эксперимент[26]. При предъявлении целого предложения, которое будет возникать слово за словом в той самой точке, где сфокусирован взгляд, необходимость двигать глазами отпадает. В таких условиях опытный читатель может читать с ошеломляющей скоростью – от 1100 до 1600 слов в минуту, то есть примерно одно слово в 40 миллисекунд, что в три-четыре раза быстрее обычного! При использовании этого способа – так называемого быстрого последовательного визуального предъявления – идентификация и понимание остаются удовлетворительными, а, значит, продолжительность показа центральных элементов не накладывает серьезных ограничений на нормальное чтение. Возможно, этот компьютеризированный режим предъявления – будущее чтения в мире, где мониторы стремительно вытесняют бумагу.
В любом случае движения глаз будут неизбежно замедлять чтение до тех пор, пока текст представлен в виде страниц и строк. По этой причине ко всем методам скорочтения, которые обещают увеличить скорость до 1000 слов в минуту и больше, следует относиться скептически[27]. Несомненно, мы можем немного расширить наш зрительный диапазон, чтобы уменьшить количество саккад в строке, и даже научиться избегать регрессии, когда взгляд возвращается к только что прочитанным словам. Тем не менее физиологические ограничения, свойственные нашим глазам от природы, нельзя преодолеть, если только человек не готов пропускать слова. Правда, в этом случае он рискует понять текст неправильно или не понять его вообще. Эту ситуацию прекрасно описал Вуди Аллен: «Я записался на курс скорочтения и смог прочитать «Войну и мир» за 20 минут. Там что-то про Россию».
Поиск инвариантов
КЛИТАНДР. Так ты умеешь читать?
ЛЮБЕН. Да, по печатному, а вот по писаному никак не могу научиться.
Жан-Батист Мольер, «Жорж Данден»[28]
Чтение ставит перед нами сложную перцептивную[29] задачу. Мы должны идентифицировать слова независимо от их длины и того, какими буквами они написаны – печатными или рукописными, строчными или заглавными. Психологи называют это проблемой инвариантности: прежде всего нам необходимо распознать, какой аспект слова не меняется (то есть саму последовательность букв) несмотря на множество возможных форм, которые могут принимать фактические символы.
Если перцептивная инвариантность представляет собой проблему, то это потому, что слова не всегда располагаются в одном и том же месте и не всегда напечатаны одним и тем же шрифтом одинакового размера. Будь оно так, для декодирования было бы достаточно лишь перечислить активные и неактивные клетки на сетчатке. Именно так поступает компьютер: любое черно-белое изображение определяется списком составляющих его пикселей. Однако в реальности одному и тому же слову могут соответствовать сотни различных изображений на сетчатке. Все зависит от того, как именно оно написано (рис. 1.2). Следовательно, одна из первоочередных задач при чтении – компенсировать огромное разнообразие этих поверхностных форм.
Рис 1.2. Зрительная инвариантность – одно из важнейших свойств человеческой системы чтения. Наше устройство распознавания слов удовлетворяет двум, казалось бы, противоречивым требованиям: оно пренебрегает несущественными вариациями в форме знаков, даже если они огромные, но усиливает релевантные различия, даже если они совсем крошечные. Без нашего ведома зрительная система автоматически компенсирует бесчисленные вариации в размере и шрифте. Вместе с тем она замечает малейшие изменения формы. Превращая букву «s» в букву «е» и, следовательно, «sight» («зрение») в «eight» («восемь»), один знак переориентирует цепочку обработки на абсолютно разное произношение и значение.
Сразу несколько признаков указывают на то, что наш мозг эффективно решает проблему перцептивной инвариантности. Держа газету на некотором расстоянии от глаз, мы можем прочесть и заголовки, и рекламные объявления. Хотя одни слова могут быть меньше других в 50 раз, это не оказывает особого влияния на скорость чтения. Эта задача не сильно отличается от задачи распознавания лица или объекта с расстояния одного метра или 30 – наша зрительная система терпимо относится к изменениям масштаба.
Вторая форма инвариантности позволяет нам игнорировать расположение слов на странице. Когда наш взгляд сканирует текст, центр сетчатки приходится не на середину слова, а чуть левее. Разумеется, наша меткость далека от совершенства, а потому глаза периодически останавливаются на первой или последней букве. Как ни странно, это вовсе не мешает нам распознавать слова. Мы даже можем читать их на периферии зрительного поля при условии, что крупный размер букв компенсирует снижение разрешающей способности сетчатки. Таким образом, стабильность размеров идет рука об руку с нормализацией пространственного расположения.
Наконец, распознавание слов практически не зависит от формы знаков. Сегодня программные средства обработки текстов присутствуют везде. Технология, которой раньше пользовались только лучшие типографы, стала общедоступной. Всем известно, что существует множество наборов знаков, называемых шрифтами (этот термин остался с тех времен, когда каждый знак приходилось отливать в свинце на шрифтолитейном заводе). Каждый шрифт содержит два типа знаков, или «регистров»: верхний и нижний (первоначально свинцовые отливки, или литеры, хранили в специальных ящиках с множеством отсеков – так называемых наборных кассах; в верхних ящиках обычно лежали литеры заглавных букв, а в нижних – все остальные). Наконец, мы можем выбрать «вес», или насыщенность, шрифта (обычный или жирный), наклон (курсив, первоначально изобретенный в Италии), подчеркивание, а также любую их комбинацию. Впрочем, эти выверенные опции ничтожны по сравнению с неимоверным разнообразием рукописных стилей. Рукописное письмо явно выводит нас на новый уровень изменчивости и неоднозначности.
В свете всех этих вариаций остается загадкой, как именно наша зрительная система учится классифицировать формы букв. Частично проблему инвариантности можно решить относительно простыми способами. Возьмем, например, букву «о». Благодаря уникальной замкнутой форме эта гласная легко распознается независимо от размера, регистра или шрифта. Иначе говоря, создать зрительный детектор «o» не так уж и трудно. С другими буквами ситуация обстоит сложнее. Рассмотрим букву «б». Хотя нам кажется очевидным, что знаки б, Б, б и б обозначают одну и ту же букву, тщательный анализ показывает, что эта ассоциация совершенно произвольна. С равным успехом строчной версией буквы «Б» мог стать, скажем, знак e. В результате ребенок, который только учится читать, должен запомнить, что буквы не только передают определенные звуки, но и могут принимать самые разные формы. Как мы увидим далее, умение читать, по всей вероятности, обусловлено существованием абстрактных буквенных детекторов – нейронов, способных распознавать букву в ее различных обличиях. Согласно результатам экспериментов, чтобы с нормальной скоростью ДеКоДиРоВаТь ЦеЛыЕ пРеДлОжЕнИя, БуКвЫ кОтОрЫх НаПеЧаТаНы ПоПеРеМеНнО в ВеРхНеМ и НиЖнЕм РеГиСтРе, достаточно минимальной тренировки[30]. В «дьявольски гениальном» компьютере Макконки и Рейнера регистр может меняться перед каждой саккадой, но человек этого даже не заметит[31]! Хотя в повседневной жизни мы практически никогда не видим слов, напечатанных с чередованием регистров, наши процессы нормализации настолько эффективны, что зрительная система с легкостью игнорирует подобные трансформации.
Экспериментальные исследования подтверждают: внешний облик слова не играет в процессе чтения никакой роли. Если мы можем мгновенно распознать, что «слово», «СЛОВО» и «СлОвО» означает одно и то же, то это потому, что наша зрительная система не обращает внимания ни на размер, ни на регистр, которым напечатаны слова. Ее интересуют только буквы, которые их составляют. Несомненно, наша способность определять слова не зависит от анализа их общей формы.
Усиление различий
Хотя наша зрительная система успешно отфильтровывает визуальные различия, незначительные для чтения (например, между «Б» и «б»), не стоит думать, будто она всегда отбрасывает информацию и упрощает формы. Во многих случаях она, наоборот, сохраняет и даже усиливает (амплифицирует) мельчайшие детали, позволяющие отличить два очень похожих слова друг от друга. Рассмотрим слова «зрение» и «трение»[32]. Хотя разница составляет всего несколько пикселей, мы мгновенно получаем доступ к их соответствующим значениям и произношениям. Наша зрительная система чрезвычайно чувствительна к крошечным различиям между «зрением» и «трением». Усилив их, она посылает сигнал в разные семантические зоны мозга. В то же время она уделяет очень мало внимания другим, гораздо более выраженным различиям – например, между словами «зрение» и «ЗРЕНИЕ».
Как и в случае с регистром, способность обращать пристальное внимание на значимые детали является результатом многолетней тренировки. Читатель, который мгновенно замечает разницу между буквами «е» и «о» и ее отсутствие между «а» и «а», может не заметить, что еврейские буквы «» и «» кардинально отличаются друг от друга, хотя для любого еврея это очевидно.
Каждое слово – это дерево
Наша зрительная система решает проблему инвариантного распознавания слов с помощью хорошо организованной схемы обработки сигналов. Как мы увидим в главе 2, поток нейронной активности, поступающий в зрительную кору, постепенно рассортировывается на значимые категории. Слова, кажущиеся похожими (например, «зрение» и «трение»), просеиваются через ряд мельчайших фильтров, которые отделяют их друг от друга и относят к разным статьям в ментальном лексиконе – нашем внутреннем словаре всех слов, с которыми мы сталкивались в жизни. И наоборот, такие слова, как «зрение» и «ЗРЕНИЕ», изначально кодируются разными нейронами в первичной зрительной области, но постепенно перекодируются, пока не становятся практически неразличимыми. Детекторы элементарных признаков распознают сходство букв «р» и «Р». Другие, более абстрактные, детекторы классифицируют «e» и «E» как две формы одной и той же буквы. Несмотря на первоначальные различия, зрительная система в конечном счете кодирует сам смысл буквенных цепочек «зрение» и «ЗРЕНИЕ» и приписывает им один и тот же ментальный адрес – абстрактный код, ориентирующий остальную часть мозга на соответствующее произношение и значение.
Как выглядит этот адрес? Согласно некоторым моделям, он представляет собой своего рода неструктурированный список, фиксирующий последовательность букв З-Р-Е-Н-И-Е. Другие модели предполагают, что мозг опирается на абстрактный и условный код, похожий на случайный шифр: скажем, [1296] – это слово «зрение», а [3452] – это «трение». Однако современные исследования говорят в пользу другой гипотезы. Каждое написанное слово, по всей вероятности, кодируется иерархическим деревом. В нем буквы объединены в более крупные единицы, которые, в свою очередь, сгруппированы в слоги и слова. Точно так же человеческое тело можно представить в виде совокупности ног, рук, туловища и головы, состоящих из более простых частей. В мозге человека каждое написанное слово кодируется иерархическим деревом, в котором буквы объединены в более крупные единицы, а те, в свою очередь, сгруппированы в слоги и слова.
В качестве примера мысленного разложения слов на значимые единицы разберем английское слово «unbuttoning» («отстегивание», «расстегивание»). Сначала уберем приставку un- и характерный суффикс или грамматическое окончание – ing. Оба обрамляют центральный элемент – корень «button». Все три компонента называются морфемами – мельчайшими единицами, несущими некий смысл. На этом уровне каждое слово характеризуется особой комбинацией составляющих его морфем. Разбиение слова на морфемы позволяет нам понимать даже те слова, которые мы никогда раньше не видели, например «reunbutton» (буквально – «снова отстегивать»; приставка re- предполагает повтор действия) или «deglochization» (приставка de- обозначает отмену, прекращение чего-либо; значит, «deglochization» – это аннулирование действия «gloching», в чем бы оно ни заключалось). В некоторых языках, таких как турецкий или финский, морфемы могут быть сгруппированы в очень длинные слова, которые передают столько же информации, сколько целое английское предложение. В этих языках, как и в английском, разложение слова на морфемы является важным шагом на пути от визуального восприятия к смыслу.
Экспериментальные данные показывают, что наша зрительная система очень быстро и абсолютно бессознательно отсекает морфемы слов. Например, если на мониторе компьютера на мгновение высветится слово «поезд», то позже, увидев слово «отъезд»[33], вы произнесете его немного быстрее. Предъявление слова «поезд», по-видимому, заранее активирует морфему – езд, тем самым облегчая к ней доступ в будущем. В таких ситуациях психологи говорят об эффекте прайминга (предшествования) – чтение одного слова стимулирует распознавание родственных ему слов. Примечательно, что эффект прайминга зависит не только от зрительного сходства: слова, которые выглядят совершенно по-разному, но имеют общую морфему, например «мог» и «может», ускоряют распознавание друг друга, в то время как похожие, но не имеющие тесной морфологической связи, например «аспирант» и «аспирин»[34], – нет. Кроме того, эффект прайминга не требует сходства на уровне смысла. Такие слова, как «речь» и «речка» или «нос» и «носить»[35], могут стимулировать друг друга, даже если их значения по существу никак не связаны[36]. Переход к морфемному уровню, по-видимому, имеет столь важное значение для нашей системы чтения, что она охотно строит догадки относительно морфемного состава слов. Наш считывающий аппарат разбивает слово «носить» на нос- + – ить[37] в надежде, что это облегчит задачу операторам, вычисляющим его значение[38]. Неважно, что это работает не всегда. Например, «горец» не обязательно горюет, а «лукавый» не имеет никакого отношения к растениям[39]. Такие ошибки будут исправлены на последующих стадиях процесса анализа слова.
Продолжим разбирать английское слово «unbuttoning». Сама по себе морфема – button- тоже не является неделимым целым. Она состоит из двух слогов, – b- и – ton-, каждый из которых может быть разбит на отдельные согласные и гласные: [b] [] [t] [o] [n]. Здесь кроется еще одна важная единица для нашей системы чтения: графема. Графема – это буква или ряд букв, которые соответствуют одной фонеме. Обратите внимание: в нашем примере две буквы «tt» соотносятся с одним звуком [t][40]. Очевидно, что процесс преобразования графем в фонемы не всегда носит прямой характер. Во многих языках графемы могут состоять из нескольких букв. Английский язык, например, может похвастаться особенно обширной коллекцией сложных графем, таких как «ough», «oi» и «au».
Наша зрительная система научилась воспринимать эти комбинации как определенные единицы, а потому почти не обращает внимания на их фактический буквенный состав. Чтобы в этом убедиться, проведем простой эксперимент. Изучите список ниже и отметьте слова, которые содержат букву «а»:
garage
metal
people
coat
please
meat
Вы заметили, что вам пришлось чуть-чуть «сбросить скорость» на последних трех словах: «coat» [kut], «please» [pli: z] и «meat» [mi: t]? Все они содержат букву «а», но она встроена в сложную графему, которая не произносится как [a]. Полагайся мы исключительно на детекторы букв, разбиение слова на составляющие его графемы не имело бы значения. Однако фактические измерения скорости реакции ясно показывают, что наш мозг не останавливается на уровне одной буквы. Поскольку зрительная система автоматически перегруппирует буквы в графемы более высокого уровня, заметить, что такие сочетания букв, как «ea», на самом деле содержат букву «a», не так-то просто[41].
В свою очередь, графемы автоматически группируются в слоги. Проведем еще один эксперимент. Ниже вы увидите слова из пяти букв. Одни буквы напечатаны жирным шрифтом, другие – обычным. Сосредоточьтесь исключительно на средней букве и попытайтесь определить, каким шрифтом она напечатана[42]:
Список 1: ВОЙНА АКТЕР СКАЛА ОТДЕЛ
Список 2: ВОДКА МЕТРО ЛОДКА СУПЕР
Вам не показалось, что первый список немного сложнее, чем второй? В нем знаки, выделенные жирным шрифтом, не совпадают с делением на слоги – например, в слове «АКТЕР» буква «Т» напечатана жирным шрифтом, а остальная часть слога – обычным. Поскольку наш ум склонен автоматически группировать буквы в слоги, возникает конфликт, который приводит к существенному замедлению реакции[43]. Это свидетельствует о том, что наша зрительная система не может не разбивать слова на их элементарные составляющие, причем даже в тех случаях, когда лучше этого не делать.
Изучение природы этих составляющих – одно из важнейших направлений научных исследований. Казалось бы, множественные уровни анализа вполне могут сосуществовать друг с другом: сначала одна буква, затем пара букв (или биграмма, важная единица, к которой мы вернемся чуть позже), графема, слог, морфема и все слово целиком. На последней стадии зрительной обработки слово оказывается разбитым на иерархическую структуру, похожую на дерево. Это дерево состоит из постепенно утолщающихся ветвей с буквами вместо листьев.
Таким образом, лишенная всех своих несущественных свойств вроде шрифта, регистра и размера, буквенная цепочка разбивается на элементарные компоненты. Именно они будут использованы остальной частью мозга для вычисления звука и значения.
Молчаливый голос
Письмо – искусство живописать слова и речь для глаз.
Жорж де Бребеф (французский поэт, 1617–1661)
Во время визита к святому Амвросию, бывшему тогда епископом Миланским, Августин заметил нечто столь странное, что счел необходимым упомянуть об этом в своих мемуарах:
Когда он [Амвросий] читал, глаза его бегали по страницам, сердце доискивалось до смысла, а голос и язык молчали. Часто, зайдя к нему (доступ был открыт всякому, и не было обычая докладывать о приходящем), я заставал его не иначе, как за этим тихим чтением[44].
В середине VII века богослов Исидор Севильский тоже удивлялся тому, что «буквы суть указатели вещей, знаки слов, чья сила такова, что сказанное отсутствующими доносится до нас без звучания голоса»[45]. В то время по-латыни обычно читали вслух, что было не только социальным обычаем, но и необходимостью. Во-первых, слова писали без пробелов, а во-вторых, безупречным знанием латинского языка обладали лишь единицы. В итоге большинство читателей были вынуждены проговаривать слоги, как маленькие дети. Вот почему молчаливое чтение Амвросия казалось столь удивительным, хотя для нас это дело привычное: мы можем читать, не произнося звуки вслух.
Вопрос о том, как именно происходит обработка письменной речи – от написанного слова напрямую к его значению, без доступа к произношению, или же посредством бессознательного преобразования букв в звуки, а звуков в смысл, – стал темой продолжительных дискуссий. Проблема организации ментальных путей, опосредующих чтение, расколола психологическое сообщество более чем на 30 лет. Одни полагали, что преобразование печатного знака в звук необходимо: письменная речь, утверждали они, есть лишь побочный продукт устной речи, а потому мы обязаны проговаривать слова вслух, используя фонологический маршрут. Только так у нас будет возможность восстановить их значение. Другие, напротив, видели в фонологическом перекодировании стадию, преимущественно характерную для начинающих. У более опытных читателей эффективность чтения обеспечивает прямой лексический маршрут, ведущий от буквенной цепочки прямо к ее значению.
В настоящее время специалисты пришли к следующему мнению: у взрослых существуют оба маршрута, и они активны одновременно. Все мы имеем прямой доступ к значению слов, что избавляет нас от необходимости произносить слова. Тем не менее даже опытные читатели продолжают использовать звуки, хотя и делают это неосознанно. Нет, нам вовсе не нужно шевелить губами. На более глубинном уровне информация о произношении слова извлекается автоматически. Лексический и фонологический пути работают параллельно, дополняя друг друга.
Существует множество доказательств, что во время чтения мы автоматически получаем доступ к звукам речи. Предположим, вам показывают цепочку букв и просят определить, настоящее это слово или нет. Готовы? Начали:
кролик
граниса
лошадть
деньги
карова
арбус
йожык[47]
Скорее всего, вы сомневались, когда буквы складывались в настоящие слова – например, «корова», «арбуз» или «ежик». Чтобы оценить этот эффект интерференции (помехи), достаточно измерить скорость реакции. Это означает, что каждая буквенная цепочка автоматически преобразуется в последовательность звуков и анализируется как реальное слово, даже если этот процесс идет вразрез с поставленной задачей[46].
Особенно важную роль преобразование букв в звуки играет при чтении незнакомых слов – скажем, буквенной цепочки «шаттл»[48]. Сначала мы не можем получить прямого доступа к его значению, поскольку никогда не видели, как это слово пишется. Все, что мы можем сделать, – преобразовать его в звук, убедиться, что такой звуковой паттерн существует, и таким обходным путем прийти к его значению. Зачастую проговаривание – единственный способ понять новое слово. Кроме того, оно необходимо при чтении слов, которые написаны неправильно. В качестве примера возьмем малоизвестный рассказ Эдгара Аллана По «Ангел Необъяснимого». По сюжету в квартиру рассказчика таинственным образом попадает странный персонаж – «некто, прямо сказать, невообразимый и неописуемый», с немецким акцентом, густым, как британский туман:
– Как я сюда попал, не тфоя забота, – отвечала фигура. – А что я гофорю, так я гофорю то, что надо. А кто я такой, так я затем и пришел сюда, чтобы ты это уфидел сфоими глазами… Фзгляни на меня! Смотри хорошенько! Я – Ангел Необъяснимого.
– Необъяснимо, – ответил я. – У меня всегда было такое впечатление, что у ангелов должны быть крылышки.
– Крылышки! – воскликнул он, сразу распалясь. – Фот еще! На что они мне? Майн готт! Разфе я цыпленок?[49]
Читая этот отрывок, мы задействуем давно забытый путь, которым пользовались в детстве: фонологический маршрут, заключающийся в медленном преобразовании незнакомых буквенных цепочек в звуки, после чего они чудесным образом становятся понятны, словно кто-то шепчет их нам на ухо.
Что же насчет обиходных слов, которые мы встречали уже тысячу раз? У нас не возникает ощущения, будто мы медленно расшифровываем их посредством проговаривания. Тем не менее психологические тесты показывают, что мы по-прежнему обращаемся к их произношению, только на бессознательном уровне. Предположим, вас просят определить, какие из следующих слов обозначают части человеческого тела. Все они знакомы каждому, поэтому вы наверняка сможете сосредоточиться на их значении и не обращать внимания на произношение. Попробуйте:
колено
нога
стол
голова
самолет
ведро
род[50]
Признайтесь, у вас был соблазн отнести к частям тела слово «род», которое звучит точь-в-точь как «рот»? Эксперименты показывают: когда исходные слова напоминают по звучанию слова из целевой категории, испытуемые замедляются и совершают ошибки[51]. Непонятно, как мы могли бы распознать омофонию, если бы предварительно не извлекали произношение слова. Только мысленное преобразование букв в звуки речи может объяснить ошибки такого типа. Наш мозг автоматически переводит буквы «р-о-д» во внутреннюю речь, а затем ассоциирует их со значением. Этот процесс может дать сбой в тех редких случаях, когда буквенная цепочка произносится как иное знакомое слово.
С другой стороны, несовершенство этой конструкции лежит в основе одного из величайших удовольствий нашей жизни: каламбуров, или «радостей текста», как однажды выразился юморист Ричард Ледерер. Лишенные дара преобразовывать буквы в звуки, мы не смогли бы насладиться ни сарказмом актрисы Мэй Уэст («She’s the kind of girl who climbed the ladder of success wrong by wrong»[52]), ни остротами шурина Артура Конана Дойла («There’s no police like Holmes»[53]). Без «молчаливого голоса» Августина мы бы не могли наслаждаться смелыми двусмысленными высказываниями[54]:
Один почитатель однажды сказал президенту Линкольну: «Позвольте представить мою семью. Моя жена, Сара Ист. Моя дочь, Мэри Ист. Мой сын, Анан Ист». «Вот это да!» – ответил президент[55].
Другим доказательством того, что наш мозг автоматически получает доступ к звуковым паттернам слова, является эффект подсознательного прайминга. Допустим, я на несколько мгновений показываю вам слово «LATE» [let], за которым тут же следует слово «mate» [met], и прошу прочитать второе слово как можно быстрее. Слова напечатаны в разном регистре, чтобы исключить любое зрительное сходство на низком уровне. Однако скорость чтения заметно возрастает, если первое слово звучит и пишется как второе, и не меняется, если слова не связаны друг с другом (например «BOWL» и «mate»). Отчасти это обусловлено сходством на уровне правописания. Кратковременное предъявление слова «MATH» [mæθ] облегчает распознавание «mate» [met], хотя обе буквенные цепочки читаются по-разному. Разумеется, особенно сильно эффект прайминга выражен, когда два слова произносятся одинаково («LATE» и «mate»), причем даже тогда, когда их написание не совпадает («EIGHT» [et] и «mate» [met]). Таким образом, произношение, судя по всему, извлекается автоматически. Но орфография и звук не кодируются одновременно. Нашему мозгу достаточно 20–30 миллисекунд, чтобы машинально активировать орфографию слова, но требуется еще 40 миллисекунд для преобразования букв в звуки, о чем свидетельствует эффект звукового прайминга[56].
Итак, простые эксперименты позволяют нам очертить целый ряд последовательных стадий – от изображения на сетчатке глаза до их превращения в буквы и звуки. Любой опытный читатель быстро преобразует буквенные цепочки в речь, без усилий и участия сознания.
Ограничения звука
Хотя преобразование букв в звуки осуществляется автоматически, эта стадия не всегда обязательна. Зачастую этот процесс происходит слишком медленно и неэффективно. Как следствие, мозг нередко пытается восстановить значение, используя более короткий путь, который ведет от буквенной цепочки прямо к соответствующей позиции в ментальном лексиконе.
Чтобы лучше понять, как работает прямой лексический маршрут, вообразим читателя, который способен проговаривать написанные слова только мысленно. Он не будет различать омофоны – например, «плод» и «плот», «луг» и «лук», «балл и «бал», «компания» и «кампания»[57]. Полагаясь исключительно на звук, он может подумать, будто сейф открывает кот, а грипп на самом деле растет в лесу[58]. Сам факт, что обычный человек с легкостью различает множественные значения таких омофонов, свидетельствует о том, что мы вовсе не обязаны их произносить: наш второй маршрут позволяет мозгу разрешать любые двусмысленности и извлекать значение напрямую.
Все сугубо звуковые теории чтения сталкиваются с одной и той же проблемой: путь от букв к звукам не является скоростным шоссе без единого препятствия. Вывести произношение слова из последовательности составляющих его букв зачастую просто невозможно – нужны дополнительные подсказки. Рассмотрим английское слово «blood» («кровь»). Очевидно, что оно должно произноситься как [bld] и рифмоваться с «bud» [bd] и «mud» [md]. Но откуда мы это знаем? Почему слово «blood» не рифмуется с «food» [fu: d] или, скажем, с «good» [gud]? А главное – почему оно не произносится как «bloom» [blu: m] или «bloomer» [blu: mə]? Даже один и тот же корень может произноситься по-разному, как, например, в словах «sign» [san] и «signature» [sgn]. Некоторые слова пишутся так странно, что абсолютно непонятно, как звук соотносится с буквами («colonel» [k: nl], «yacht» [jt], «though» [ðu] и так далее). Произношение такого слова нельзя определить без предварительного знания этого самого слова.
Английская орфография изобилует подобными исключениями. Разрыв между письменной и устной речью имеет многовековую историю, на что указывал еще Уильям Шекспир в своей комедии «Бесплодные усилия любви». Педант Олоферн говорит:
Терпеть не могу таких фанатичных фантазеров, таких необщительных и натянутых собеседников, таких палачей правописания, которые вместо «кого» говорят «каво», вместо «конечно» произносят «канешна», а вместо «милость» мямлят «милась». Это мне так отовратительно (они-то бы сказали «отвратительно»!), что доводит меня почти до умалишенности.[59]
Английский – вопиюще неправильный язык. Джордж Бернард Шоу как-то заметил, что слово «fish» («рыба») вполне могло бы писаться как «ghoti»: gh как в слове «enough» [nf], o как в слове «women» [wimin], а ti как в слове «lotion» [lun]! Шоу так раздражала английская орфография, что в своем завещании он выделил огромную сумму на создание нового и рационального алфавита под названием «Shavian». К сожалению, тот не имел большого успеха – вероятно, потому, что слишком сильно отличался от всех других существующих орфографических систем[60].
Конечно, пример Шоу далек от реальной жизни. Никто не станет читать «ghoti» как «fish»: всем известно, что в начале слова буква «g» произносится как твердое [g] или [j], а не как [f]. Аналогичным образом, что бы ни говорил Шекспир, в современном английском языке буквы «alf» в конце слова всегда произносятся [af], как в «calf» и «half»[61]. Если буквы взяты в контексте, то можно выявить закономерности более высокого порядка, упрощающие преобразование букв в звуки. Но даже в этом случае есть множество исключений: «has» [hæz] и «was» [wz], «tough» [tf] и «dough» [du], «flour» [flau] и «tour» [tu], «header» [hed] и «reader» [ri: d], «choir» [kwa] и «chair» [], «friend» [frend] и «fiend» [fi: nd]. Читая такие слова, мы не восстанавливаем произношение, чтобы понять смысл. Скорее наоборот: только после того, как мы распознали слово «dough», мы можем восстановить его звуковую структуру.
Скрытая логика английского правописания
Но почему английский язык придерживается столь сложной системы правописания? Итальянцы, например, не сталкиваются с такими трудностями. Их орфография прозрачна: каждая буква передает определенную фонему, практически без исключений. В результате на то, чтобы научиться читать, уходит всего несколько месяцев. Это дает огромное преимущество: что касается навыков чтения, итальянские дети опережают английских на несколько лет, при этом школьные учителя не тратят по несколько часов в неделю на диктанты и правописание. Кроме того, дислексия в Италии – не такая серьезная проблема, как в других странах. Возможно, англичанам стоит последовать примеру итальянцев, сжечь все словари и разработать новую систему праваписания, каторой лихко сможет авладеть даже трехлетний рибенок?
Безусловно, английскую орфографию можно упростить. Многие ее особенности объясняются исторической традицией, восходящей к битве при Гастингсе[62]. Современные школьники должны горько оплакивать поражение англичан: именно смесь французского и английского языков, которая возникла в итоге, является причиной орфографических мучений, выпадающих на долю любого носителя английского. Хороший пример – использование буквы «с» для звука [s], как в слове «cinder» («зола»). Столетия академического консерватизма, граничащего с педантизмом, буквально заморозили английский словарь. Ко всему прочему, академики эпохи Ренессанса, руководствуясь исключительно благими побуждениями, ввели в язык целый ряд орфографических нелепостей. Например, немая «s» в слове «island» («остров») – попытка восстановить этимологию латинского слова «insula». Хуже всего, что, несмотря на естественную гибкость устной речи, английская орфография не развивалась. Введение иностранных слов и спонтанные сдвиги в артикуляции создали огромный разрыв между тем, как англичане пишут, и тем, как они говорят. Для детей это оборачивается годами ненужных мучений. Словом, здравый смысл призывает радикально упростить английскую орфографию.
Однако, прежде чем вносить какие-либо изменения в правописание, необходимо понять скрытую логику уже существующей системы. Орфографические странности – это не только вопрос традиции. Они проистекают из самой структуры нашего языка и нашего мозга. Два механизма чтения – от букв к звуку и от букв к смыслу – накладывают сложные и зачастую непреодолимые ограничения на любую систему письменности. Лингвистические различия между английским, итальянским, французским и китайским языками таковы, что единого орфографического решения, которое бы подошло им всем, не существует. Таким образом, крайняя иррегулярность английской орфографии неизбежна. Хотя реформа правописания назревает давно, ей придется столкнуться с огромным количеством препятствий.
Прежде всего не совсем ясно, могла бы английская орфография, подобно итальянской, закрепить за каждым звуком одну букву, а за каждой буквой – фиксированный звук. Это не так-то просто: английский язык содержит гораздо больше речевых звуков, чем итальянский. Количество английских фонем колеблется от 40 до 45, в зависимости от произношения и методов подсчета, в то время как в итальянском их всего 30. Особенно много в английском языке гласных и дифтонгов: есть шесть простых гласных (как в словах «bat», «bet», «bit», «but», «good» и «pot»), пять долгих гласных (как в словах «beef», «boot», «bird», «bard» и «boat») и по меньшей мере семь дифтонгов (как в словах «bay», «boy», «toe», «buy», «cow», «beer», «bear»). Если бы каждый из этих звуков получил свой собственный письменный символ, англичанам пришлось бы изобретать новые буквы, тем самым создав дополнительные сложности для детей. Конечно, есть другой выход: к уже существующим буквам можно добавить диакритические знаки, например ã, õ или ü. И все же универсальный алфавит, который мог бы транскрибировать все языки мира, – абсолютная утопия. Такая орфографическая система на самом деле уже существует: она имеет название «Международный фонетический алфавит» и играет важную роль в научных публикациях фонологов и лингвистов. Тем не менее эта система настолько сложна, что в повседневной жизни будет неэффективной. Международный фонетический алфавит состоит из 170 знаков, некоторые из которых выглядят особенно устрашающе (). Даже специалистам трудно читать на нем без помощи словаря.
Чтобы избежать заучивания чрезмерного числа символов, языки с большим количеством фонем, такие как английский и французский, прибегают к компромиссу. Они обозначают определенные гласные или согласные либо специальными знаками (например, «ü»), либо группой букв (например, «oo» или «oy»). Такие особенности, индивидуальные для каждого конкретного языка, появились не просто так: они имеют важное значение в «ментальной экономии» при чтении и должны найти свое место в любой орфографической реформе.
Хотя нам едва ли удастся закрепить по одной букве за каждым звуком речи, мы, вероятно, могли бы попробовать противоположный подход. Многих орфографических ошибок можно избежать, если систематически транскрибировать каждый звук фиксированной буквой. Например, если бы англичане перестали передавать звук [f] одновременно буквой «f» и диграфом «ph», жизнь стала бы намного проще. Несомненно, мы могли бы с легкостью избавиться и от других бесполезных излишеств, на усвоение которых уходят лучшие годы детства. На самом деле именно эту задачу ставила перед собой американская орфографическая реформа, когда упростила британское написание слов «behaviour» и «analyse», превратив их в «behavior» и «analyze». В этом же направлении можно предпринять и другие шаги. Опытные читатели перестают осознавать абсурдность английской орфографии. Например, буква «х» вообще не нужна: она передает две фонемы [ks], имеющие собственные обозначения. В Турции, например, люди ездят на «taksi», а не на «taxi». Эта страна, которая всего за один год (с 1928 по 1929) приняла латинский алфавит, кардинально упростила систему правописания и научила читать три миллиона человек. Это убедительный пример того, что орфографическая реформа осуществима.
Однако и здесь необходима осторожность. Я подозреваю, что любая радикальная реформа, предполагающая четкую, однозначную транскрипцию английской речи, заведомо обречена на провал. Дело в том, что роль орфографии заключается не только в точном транскрибировании. Вольтер ошибался, когда утверждал, будто «письмо – это портрет голоса: чем больше сходство, тем лучше». Письменный текст – это не качественная запись звука. Его цель состоит не в том, чтобы воспроизвести речь так, как мы ее произносим, а в том, чтобы закодировать ее на уровне достаточно абстрактном, чтобы читатель мог быстро восстановить смысл.
Теоретически мы можем представить, как выглядела бы фонетическая система письма, о которой мечтал Вольтер. В устной речи мы меняем произношение слов в зависимости от окружающих их звуков. Допустим, орфография отражает такие сложные языковые явления, как коартикуляция[63], ассимиляция[64] и ресиллабификация[65], о которых большинство обычных людей даже не подозревают. В итоге одно и то же слово в разных контекстах писалось бы по-разному. Нам пришлось бы использовать разные знаки для разных произношений множественного числа – например, вместо «cab driver» писать «cap driver», так как буква «b» в позиции перед звуком [d] обычно произносится как [р], – а также учитывать акцент говорящего («Майн готт! Разфе я цыпленок?»). Согласитесь, это был бы apsurd (да, англичане произносят это слово со звуком [p]). Главная задача письменного текста – передать смысл. Любая система, предполагающая рабское транскрибирование звуков речи, будет уводить от этой цели.
Английская орфография часто ставит прозрачность корней превыше буквенного выражения. Например, слова «insane» [n’sen] и «insanity» [n'sænt][66] настолько тесно связаны по своему значению, что было бы глупо писать их по-разному из-за незначительных отличий в произношении. Или, допустим, логично сохранить немое «n» в конце слов «column», «autumn» или «condemn», учитывая, что от этих слов образованы «columnist», «autumnal» и «condemnation»[67].
Кроме того, транскрипция значения объясняет (частично, по крайней мере), почему в английском языке одни и те же звуки пишутся по-разному. Английские слова тяготеют к компактности и односложности, в результате чего омофония стала обычным явлением для этого языка. Примеров множество: «eye» («глаз) и «I» («я»), «you» («ты») и «ewe» («овца»). Если бы эти слова транскрибировались фонетически, отличить их друг от друга было бы невозможно. Разумеется, правила правописания развивались с учетом этого ограничения. Разное написание одних и тех же звуков усложняет письмо под диктовку, но упрощает задачу для читателя, который мгновенно улавливает смысл. Да, в английском языке существует бесчисленное множество способов передать звук [u] – «two», «too», «to», «stew», – но именно они помогают читать быстро. Без них любой письменный текст превратился бы в сложный ребус. Благодаря сложившимся традициям, письменный английский язык указывает непосредственно на смысл. В чем бы ни заключалась орфографическая реформа, она обязана сохранить это тонкое равновесие между звуком и значением, так как оно отражает гораздо более глубинный и менее гибкий феномен – два маршрута чтения, которыми пользуется наш мозг.
Несбыточная мечта прозрачной орфографии
Соперничество между чтением ради звука и чтением ради смысла распространено повсеместно. Все системы письма решают эту проблему по-своему. То, какой компромисс лучше, зависит от транскрибируемого языка. Конечно, жизнь была бы легче, если бы английскую орфографию можно было освоить так же легко, как итальянскую или немецкую. Оба этих языка обладают рядом особенностей, которые позволяют без труда переводить их в письменную форму. В итальянском языке, как и в немецком, большинство слов длинные, многосложные. Грамматическое согласование выражают звучные гласные, а омонимы встречаются редко. Таким образом, возможна простая и однозначная транскрипция звуков. Итальянский и немецкий могут позволить себе довольно прозрачную орфографическую систему, где почти каждая буква соответствует уникальному звуку.
На другом конце континуума находится севернокитайский язык (мандаринский китайский). Подавляющее большинство китайских слов состоит из одного или двух слогов, а поскольку всего их 1239 (410, если не считать тональные изменения), каждый из них может обозначать десятки различных понятий (рис. 1.3). Получается, что чисто фонетическая система письма в китайском языке была бы бесполезна, так как каждый из ребусов можно понять сотнями разных способов. Вот почему тысячи символов в мандаринском письме преимущественно транскрибируют слова, а точнее их морфемы – базовые элементы значения слова. Кроме того, китайская письменность включает несколько сотен фонетических маркеров. Они уточняют, как должен произноситься определенный корень, и помогают читателю понять, какое слово имеется в виду. Например, иероглиф 媽, который означает «мать» и произносится как [ма], состоит из морфемы 女 («женщина») и фонетического маркера 馬 = [mă]. Следовательно, вопреки распространенному мнению, даже китайскую письменность нельзя считать ни абсолютно идеографической (знаки которой представляют понятия), ни логографической (знаки которой обозначают отдельные слова). Это смешанная «морфосиллабическая» система, где одни символы передают морфемы слов, а другие – их произношение[68].
Конечно, научиться читать по-китайски гораздо труднее, чем по-итальянски. Нужно выучить несколько тысяч знаков, а не несколько десятков. Таким образом, эти два языка находятся на двух противоположных концах шкалы орфографической прозрачности. Английский и французский языки занимают в этой системе промежуточное положение[69]. Слова в них преимущественно короткие, а потому омофоны встречаются относительно часто («right», «write», «rite»). Чтобы учесть эти ограничения, английские и французские орфографические правила включают в себя смесь фонетической и лексической транскрипции, что плохо для писателя, но очень удобно для читателя.
Рис. 1.3. Орфографические иррегулярности не так иррациональны, как кажется. Хотя один и тот же китайский слог может обозначаться на письме 20, а то и 30 разными символами, эта избыточность далеко не бессмысленна. Напротив, она очень помогает китайским читателям, потому что этот язык богат омофонами – словами, которые звучат одинаково, но имеют разные значения, как, например, английские «one» («один») и «won» («победил»)[70]. Выше приведена целая история, все 92 слога которой читаются как «ши»! Любой китаец может понять этот текст. Будь он транскрибирован фонетически – «ши-ши-ши…» – это было бы невозможно. Китайские иероглифы снимают омонимию, используя разные символы для разных значений. Именно омофония объясняет, почему в английском языке до сих пор сохраняется такое множество различных вариантов написания одних и тех же звуков («I scream for ice cream»[71]).
Итак, мы только начинаем понимать ограничения, лежащие в основе английской орфографической системы. Сможем ли мы когда-нибудь реформировать ее? Лично я убежден, что радикальное упрощение неизбежно. Мы обязаны облегчить правописание хотя бы ради наших детей, тратящих сотни часов на эту жестокую игру. Некоторые из них мучаются всю жизнь: одни – из-за дислексии, другие – просто потому, что родились в малообеспеченных или многоязычных семьях. Они являются подлинными жертвами нашей архаичной системы правописания. Надеюсь, благодаря мобильным телефонам и Интернету следующее поколение настолько привыкнет к сокращенной орфографии, что перестанет относиться к этому вопросу как к табу и найдет в себе достаточно силы воли, чтобы подойти к нему рационально. Впрочем, эту проблему не решить указом, фиксирующим фонологическое написание. Английский никогда не будет таким прозрачным, как итальянский. Мечта о единых правилах правописания – это иллюзия, о чем наглядно свидетельствует один любопытный буклет, который уже некоторое время циркулирует по Европе:
Комиссары Евросоюза объявили о решении принять в качестве предпочтительного языка для общения на территории Европы английский язык, а не немецкий, хотя такая возможность тоже рассматривалась. В ходе переговоров Британское правительство признало, что английскую орфографию можно усовершенствовать, и утвердило пятилетний поэтапный план по созданию евроанглийского языка (сокращенно – Евро).
В первый год вместо мягкого «c» будет использоваться «s». Несомненно, граждане воспримут эту новость с радостью. Кроме того, твердое «c» будет заменено на «k». Это не только исключит путаницу, но и приведет к тому, что на печатающих устройствах станет на одну букву меньше. Особый восторг общественности вызовут упрощения второго года, в том числе замена неудобного «ph» на «f». В результате такие слова, как «photograph», станут на 20 % короче.
На третьем году благодаря всеобщему одобрению новой системы планируется осуществить более сложные изменения. Правительство будет всячески содействовать исключению удвоенных букв, которые всегда были источником орфографических ошибок. Кроме того, все согласятся, что ужасные немые «е» – позор для языка. Они тоже исчезнут.
К четвертому году люди будут готовы к таким нововведениям, как замена «th» на «z» и «w» на «v». В течение пятого года можно будет избавиться от ненужной «o» в словах с «ou». Аналогичные изменения, безусловно, коснутся и других комбинаций букв.
В конце пятого года мы получим по-настоящему разумный письменный язык. Больше не будет никаких проблем и сложностей. Все будут понимать друг друга без труда. Мечта наконец-то сбудется!
Фонологический и семантический маршруты
Прежде чем мы двинемся дальше, я хотел бы подытожить то, о чем мы говорили ранее. Итак, все системы письма стремятся к компромиссу между точной репрезентацией звука и быстрой передачей смысла. Эта дилемма находит непосредственное отражение в мозге читателя. Во время чтения мы задействуем два пути обработки информации, которые сосуществуют и дополняют друг друга. Редкие и новые слова, а также те, что произносятся так, как пишутся, мы предпочитаем обрабатывать с помощью фонологического маршрута: сначала мы расшифровываем буквенную цепочку, затем преобразуем ее в звук и, наконец, пытаемся получить доступ к значению звукового паттерна (если таковое имеется). Когда же мы сталкиваемся со словами, которые употребляются достаточно часто или произносятся не так, как пишутся, мы выбираем другой маршрут: сперва мы извлекаем значение слова, а потом, на базе этой лексической информации, восстанавливаем его произношение (рис. 1.4).
Наилучшее доказательство существования двух механизмов чтения ученые получили в рамках изучения травм головного мозга и их психологических последствий. Некоторые пациенты после инсульта и других повреждений теряют способность быстро определять произношение написанных слов[72]. Очевидно, у таких людей поврежден механизм, преобразующий буквы в звуки. Хотя раньше они читали абсолютно нормально, налицо все признаки синдрома, называемого фонологической дислексией. Больные не могут читать вслух редкие слова, даже если те произносятся так, как пишутся (например, «секстант»), а также неологизмы и выдуманные слова (например, «гаджет», «сине-алый» или «киськисеп»[73]). Как ни странно, часто используемые слова они понимают и могут прочесть вслух, причем даже в том случае, если их произношение не совпадает с написанием (например, «глаз», «солнце», «мужчина»[74]). Иногда они путают одно слово с другим. Фонологический дислексик может, например, прочитать слово «мясо» как «еда»[75] или слово «живописец» как «художник». Сама природа этих ошибок свидетельствует о том, что доступ к значению слова в основном не нарушен. Если бы больной вообще не понимал слово, которое он пытается прочесть, он бы не смог извлечь даже приблизительное его значение. Пациенты с фонологической дислексией, по-видимому, узнают написанные слова, хотя определение их произношения становится практически невозможным. Складывается впечатление, будто один из маршрутов для чтения (от букв к звуку) у них заблокирован, в то время как по другому пути (от букв к смыслу) информация циркулирует по-прежнему.
Рис. 1.4. Чтение слов происходит по нескольким параллельным маршрутам. Чтобы перейти от написанного слова (внизу слева) к его произношению (внизу справа), мозг задействует пути, которые обозначены на рисунке прямоугольниками и стрелками. Если слово пишется так, как произносится, мы используем поверхностный маршрут и преобразуем буквы в звуки напрямую. Если слово пишется не так, как произносится, например «морковь», необходимо обратиться к более глубинным репрезентациям. Последние можно сравнить с ментальными лексиконами, которые придают значению словесную форму.
Возможна и противоположная ситуация. Люди, страдающие другим синдромом, так называемой поверхностной дислексией, лишены прямого доступа к значению слов и во время чтения вынуждены медленно проговаривать слово за словом. В этом случае особенно ярко проявляются ограничения «молчаливого голоса». Например, пациенты с поверхностной дислексией могут читать слова и неологизмы, которые произносятся так, как пишутся (например, «банан» или «мем»[76]), но не слова, написание и произношение которых отличаются. Обычно они стандартизируют их путем слепого преобразования в звуки. Один больной, например, прочитал «enough»[77] как [ɪnog], а затем уверял, что никогда не слышал этого странного слова. Очевидно, при поверхностной дислексии прямой путь от букв к ментальному лексикону заблокирован, в то время как преобразование букв в звуки продолжает функционировать.
Контраст между этими разновидностями дислексии подтверждает существование двух совершенно разных механизмов чтения. Кроме того, он свидетельствует о том, что ни один из них не позволяет читать все слова. Прямой путь – от букв к словам и их значениям – может быть использован для чтения большинства слов, если они употребляются достаточно часто, но не работает с редкими и новыми словами, которые отсутствуют в нашем ментальном лексиконе. И наоборот, альтернативный путь – от букв к звукам и от звуков к значению – не поможет при чтении омофонов (например, «блог» – «блок»[78]) и слов, которые пишутся не так, как произносятся (например, «мужчина»), но играет незаменимую роль в заучивании новых слов. Когда мы читаем, оба маршрута дополняют друг друга, и каждый вносит свой вклад в уточнение произношения. Большая часть фонем слова может быть извлечена из буквенной цепочки путем применения простых правил преобразования букв в звук. Периодически возникающие двусмысленности при этом разрешаются на основании подсказок более высоких лексических и семантических уровней. В детстве эти два маршрута не всегда скоординированы. Некоторые дети в основном полагаются на прямой маршрут. Они пытаются угадать слово и зачастую подменяют его синонимом (например, читают слово «здание» как «дом»[79]). Другие бормочут себе под нос все предложение, проговаривая каждую букву, но не могут перейти от звуков к значению. Необходимы годы тренировки, прежде чем эти два маршрута смогут создать единую интегрированную систему чтения, какую мы наблюдаем у взрослых.
Согласно большинству современных моделей чтения, беглое чтение предполагает тесное взаимодействие между двумя вышеописанными маршрутами. При этом роль каждого зависит как от слова, которое необходимо прочитать (известное – неизвестное; частое – редкое; произносится так, как пишется – произносится не так, как пишется), так и от поставленной задачи (чтение вслух – понимание текста). В 1980-х и 1990-х годах некоторые исследователи попытались объяснить эти наблюдения одномаршрутной системой. В то время особый интерес вызвали только появившиеся нейросетевые модели. Многие рассматривали их как универсальные самообучающиеся машины, способные овладеть любым навыком в отсутствие заранее заданной когнитивной структуры. Было предположено, что овладение навыком чтения можно смоделировать путем соединения буквенных входов с фонологическими выходами, а промежуточные связи настроить с помощью мощного алгоритма обучения. Таким образом ученые надеялись получить единую сеть, которая могла бы имитировать нормальное чтение и его патологии, но без необходимости принимать во внимание множественные пути обработки информации в коре. Хотя в то время такие сети рассматривались в качестве огромного шага вперед, особенно в сфере моделирования преобразования букв в звуки[80], большинство современных исследователей убеждены, что этот подход неверен. По моему мнению, невозможно смоделировать чтение без тщательного анализа структуры мозга, которая включает множество параллельных и отчасти избыточных путей. Практически все современные модели чтения, даже если они основаны на искусственных нейросетях, построены на идее множественных маршрутов[81]. Обсуждая церебральные механизмы чтения, мы увидим, что характерной особенностью строения коры является наличие различных параллельных путей. Таким образом, даже модель с двумя путями, вероятно, не отражает истинную сложность нейронных систем, отвечающих за чтение. Разделение на два пути – фонологический и семантический – создано исключительно для удобства.
Ментальные словари
Пока мы говорили о поверхностном маршруте, преобразующем графемы в фонемы, у вас могло сложиться впечатление, будто мысленное чтение сводится к короткому перечню относительно простых действий. Казалось бы, достаточно сохранить карту нескольких сотен графем и их произношений. Однако если мы посмотрим на то, как работает глубинный маршрут, позволяющий распознавать тысячи знакомых слов, то убедимся, что требуется хранилище побольше. Специалисты по когнитивной психологии сравнивают его со словарем или «ментальным лексиконом». Без сомнения, о ментальных словарях следует говорить во множественном числе: в наших головах содержится самая разная информация о словах. У всех нас есть свой собственный ментальный орфографический словарь, в котором собраны письменные формы всех известных нам слов. Эти орфографические воспоминания, вероятно, хранятся в виде иерархических деревьев букв, графем, слогов и морфем. Например, слово «морковь» должно выглядеть как [мор] + [ковь]. Кроме того, у нас имеется отдельный «фонологический словарь». Он подсказывает нам, что «морковь» произносится как [маркофь]. Третий словарь – грамматический: в нем указано, что «морковь» – существительное женского рода единственного числа, относится к 3-му склонению и так далее. Наконец, каждое слово ассоциируется с десятками семантических признаков, определяющих его значение: морковь – это съедобный овощ удлиненной формы, характерного оранжевого цвета и прочее. Все эти ментальные словари открываются один за другим по мере того, как наш мозг извлекает соответствующую информацию. Образно говоря, в нашем сознании имеется целая библиотека справочников – от руководств по правописанию до энциклопедий.
Количество словарных статей в ментальных словарях огромно. Объем лексических знаний человека, как правило, сильно недооценивают. Я сам слышал, как весьма сведущие люди отстаивали общепринятое представление о том, будто в пьесах Расина и Корнеля использовано не больше 2000 слов. Говорят, что бейсик-инглиш[82] – сильно упрощенный вариант английского языка, включающий всего 850 слов – позволяет успешно выражать мысли и эмоции. Некоторые даже утверждают, будто словарный запас подростков, проживающих в бедных районах мегаполисов, сократился до 500 слов! Это не так. Согласно научным данным, лексикон среднестатистического человека составляет несколько десятков тысяч слов. Стандартный словарь содержит около 100 000 статей; как показывают исследования на основе выборочного метода, любой носитель английского языка знает около 40 000 или 50 000 из них – и это без учета составных слов. Если добавить к ним примерно такое же количество имен собственных, аббревиатур (CIA, FBI), товарных знаков (Nike, Coca-Cola) и иностранных слов, получится, что в общей сложности каждый из наших ментальных лексиконов содержит от 50 000 до 100 000 записей. Эти числа – еще одно доказательство невероятных возможностей нашего мозга. Читая слово, любой человек с легкостью извлекает нужное значение из 50 тысяч возможных за десятые доли секунды. А ведь все, что у него есть в качестве источника – это несколько крошечных полосок света на сетчатке.
Собрание демонов
Работу системы чтения в условиях, близких к продиктованным нашей нервной системой, имитируют несколько моделей лексического доступа. Почти все они основаны на идеях, впервые сформулированных Оливером Селфриджем в 1959 году. Селфридж предположил, что наш лексикон похож на огромное собрание «демонов», или «пандемониум»[83]. Согласно этой метафоре, ментальный лексикон можно представить в виде гигантского полукруга, в котором десятки тысяч демонов соперничают друг с другом. Каждый демон реагирует только на одно слово и сообщает об этом криком. Всякий раз, когда на сетчатке возникает цепочка букв, все демоны «разглядывают» ее одновременно. Те, кто «видит» свое слово, громко вопят. Таким образом, когда появляется слово «scream» («крик»), отвечающий за него демон начинает кричать. Вместе с ним голосит и его сосед, который кодирует слово «cream» («сливки»). Так «scream» или «cream»? После непродолжительного состязания защитник «сливок» вынужден уступить – ясно, что его противник получил более сильную поддержку от стимульной строки «s-c-r-e-a-m». В этот момент слово распознается, и соответствующая информация может быть передана остальной системе.
За кажущейся простотой этой метафоры скрывается несколько ключевых идей о том, как именно функционирует нервная система во время чтения:
• МАССОВАЯ ПАРАЛЛЕЛЬНАЯ ОБРАБОТКА: все демоны работают одновременно. В результате нет никакой необходимости исследовать каждое из 50 000 слов в нашем ментальном словаре одно за другим. Следовательно, массовый параллелизм пандемониума приводит к существенной экономии времени.
• ПРОСТОТА: каждый демон выполняет элементарную задачу – он проверяет, в какой степени стимульные буквы соответствуют его целевому слову. Таким образом, модель пандемониума успешно обходится без гомункула, или маленького человечка, который, согласно народной психологии, управляет нашим мозгом. (А кто управляет его мозгом? Второй, совсем крошечный гомункул?) В этом отношении модель пандемониума можно сравнить с девизом философа Дэна Деннета: «Человек выбрасывает из схемы воображаемого гомункула и заменяет его армией идиотов, которые и выполняют всю работу»[84].
• КОНКУРЕНЦИЯ И НАДЕЖНОСТЬ: демоны борются за право представлять правильное слово. Конкуренция обеспечивает гибкость и надежность. Пандемониум автоматически приспосабливается к сложности поставленной задачи. Когда вокруг нет соперников, даже такое редкое, неправильно написанное слово, как «astrqlabe»[85], может быть распознано очень быстро – представляющий его демон, даже если изначально он кричит тихо, в конце концов одержит победу. Другое дело, если стимулом будет такое слово, как «lead». В этом случае активизируются многие демоны (например, «bead», «head», «read», «lean», «leaf», «lend» и прочие). Лишь после ожесточенных споров демон слова «lead» сумеет взять верх.
Все эти свойства (в упрощенном виде) согласуются с основными характеристиками нашей нервной системы. Человеческий мозг, состоящий почти из 100 миллиардов (1011) клеток, представляет собой архетип массово-параллельной системы, где все нейроны работают одновременно. Связи, которые их соединяют, так называемые синапсы, передают информацию о внешнем сенсорном стимуле. Некоторые из этих синапсов являются ингибирующими (тормозящими). Это означает, что при срабатывании исходного нейрона происходит подавление возбуждения других нервных клеток. Канадский нейрофизиолог Дональд Хебб уподобил результат сети «клеточных ансамблей» – коалиций нейронов, постоянно конкурирующих между собой. По этой причине неудивительно, что пандемониум Селфриджа послужил источником вдохновения для многих теоретических моделей нервной системы, включая первые нейросетевые модели чтения. На рис. 1.5 показана одна из самых ранних моделей, предложенная Джеем Макклелландом и Дэвидом Румельхартом в 1981 году[86]. Она включает три иерархических уровня нейроноподобных модулей:
• Нижние входные модули чувствительны к линейным сегментам, отображаемым на сетчатке глаза.
• В середине находятся детекторы букв, которые срабатывают всякий раз, когда появляется определенная буква.
• Верхние модули кодируют целые слова.
Рис. 1.5. Процесс идентификации слов подобен обширному собранию, где тысячи буквенных и словесных модулей сообща пытаются обеспечить наилучшую интерпретацию входной буквенной цепочки. В модели Макклелланда и Румельхарта, фрагмент которой приведен на рисунке, базовые характеристики входной цепочки активируют детекторы букв, а те подключаются к детекторам соответствующих слов. Связи могут быть возбуждающими (стрелки) или тормозящими (линии с черными кружками на конце). Конкуренция между лексическими модулями в конечном счете позволяет идентифицировать доминирующее слово – наиболее подходящую гипотезу о поступающей буквенной цепочке, которую выбирает сеть.
Все они соединены многочисленными связями. Подобное взаимодействие (коннективность) превращает сетевую динамику в сложную политическую игру, в которой буквы и слова поддерживают, критикуют или исключают друг друга. Если вы внимательно посмотрите на рисунок, то увидите возбуждающие связи, обозначенные стрелочками, и ингибирующие связи, обозначенные кружочками. Их роль заключается в распространении голосов каждого из демонов. Входной детектор, кодирующий некий базовый элемент, например вертикальную черту, посылает сигнал всем буквам, содержащим этот специфический компонент. Иными словами, каждый зрительный нейрон «голосует» за ту или иную букву. На следующем уровне детекторы букв избирают целые слова, стимулируя соответствующие им модули. Наличие букв «А» и «N», например, поддерживает слова «RAIN» и «TANK», частично выступает в пользу слова «RAIL», но совсем не реагирует на слово «PEST».
Не менее важную роль в отборе наилучшего кандидата играет и торможение. Благодаря тормозящим связям буквы могут «голосовать» против слов, которые их не содержат. Например, модуль, кодирующий букву «N», выступает против слова «RAIL» и оказывает на него сдерживающее влияние. Кроме того, конкурирующие слова подавляют друг друга. Таким образом, идентификация слова «RAIN» несовместима с присутствием слова «RAIL», и наоборот.
Нисходящие связи ведут от слов к составляющим их буквам. Этот процесс можно сравнить с сенатом, где буквы представлены словами. Слова же активно поддерживают буквы, которые за них «проголосовали». Взаимные связи позволяют создавать устойчивые коалиции, способные компенсировать случайное отсутствие буквы. Например, если в слове «крокдил» отсутствует «o», то его соседи все равно «изберут» слово «крокодил», а последний «проголосует» за наличие средней буквы «о», которой физически нет. В целом для интеграции многочисленных статистических ограничений, объединяющих уровни слов, букв и базовых элементов, требуются миллионы связей.
Другие тонкости позволяют всей сети работать бесперебойно. Например, словесным модулям могут быть присущи разные пороги активации. Слово, которое встречается часто, характеризуется более низким порогом, нежели редкое слово, и при равной восходящей поддержке имеет больше шансов на «победу». Самые последние модели также осуществляют подробное кодирование позиции буквы в слове. Такая сеть обладает столь сложной динамикой, что полностью описать ее математически невозможно. Приходится прибегать к компьютерным симуляциям – только так мы можем установить, сколько времени требуется системе, чтобы определить правильное слово и то, как часто она ошибается.
Параллельное чтение
Если когнитивисты до сих пор не отказались от всех подобных сложных моделей чтения, то это потому, что их прогнозы отлично согласуются с эмпирическими данными. Модели, вдохновленные идеей пандемониума Селфриджа, не только воспроизводят результаты классических экспериментов по скорости чтения и ошибкам, но и позволяют открыть новые явления, составляющие фундаментальные свойства нашего считывающего аппарата.
Допустим, вас попросили разработать программное обеспечение для распознавания письменной речи. Независимо от того, какое решение вы выберете, на длинных словах ваша программа, скорее всего, будет работать медленнее. Для программы, например, совершенно естественно обрабатывать буквы одну за другой, слева направо. В силу постепенной обработки можно ожидать, что слово из шести букв займет примерно вдвое больше времени, чем слово из трех букв. В любой последовательной модели время распознавания должно увеличиваться прямо пропорционально количеству букв.
Но это – машина. Для человеческого мозга правило «время чтения прямо пропорционально количеству букв» не выполняется. У грамотных взрослых время, затраченное на чтение слова, практически не зависит от его длины. Иначе говоря, если слова содержат не более шести или семи букв, их распознавание занимает приблизительно такое же количество времени, как и коротких[87]. Это значит, что наш мозг задействует механизм параллельной обработки букв, то есть он может обрабатывать все буквы одновременно. Этот результат несовместим с метафорой компьютерного сканера, зато в точности согласуется с гипотезой пандемониума, в рамках которой миллионы специализированных процессоров работают одновременно и параллельно на каждом из нескольких уровней (базовые элементы, буквы и слова).
Активное декодирование букв
Продолжим эту компьютерную метафору. В классической компьютерной программе информация обычно обрабатывается в несколько последовательных этапов – от простейших операций до самых сложных. Наиболее логичная цепочка выглядит так: первая подпрограмма распознает отдельные буквы, вторая группирует их в графемы, третья исследует потенциальные слова. Проблема в том, что такие программы, как правило, крайне нетерпимы к ошибкам. Любой сбой на первом этапе обычно приводит к срыву всего процесса распознавания. Даже самое лучшее программное обеспечение для определения символов, которое имеют современные сканеры, очень чувствительно к качеству изображения – несколько пылинок на сканирующем окне могут превратить идеальную страницу в искаженный текст, который компьютер считает тарабарщиной.
В отличие от машины, наша зрительная система обожает разрешать двусмысленности. Хотите убедиться в этом сами? Прочтите следующее предложение:
На шерраее шуршиш оеенняя лисшва[88].
Только что ваш взгляд успешно преодолел целый ряд сложностей, которые поставили бы в тупик любую классическую компьютерную программу. Вы заметили, что в слове «террасе» буквы «с» и «е» на самом деле написаны одинаково? То же самое мы видим в слове «осенняя», но ваша зрительная система воспринимает первую букву как «с», а вторую – как «е». Слово «шуршит» еще хуже. Буквы «ш», «т» и «и» так похожи![89] Подобные сложности разрешаются контекстом: цепочка букв «иуртиш» едва ли существует, а вот вариант «шуршит» отлично вписывается в остальное предложение.
Таким образом, неоднозначности, которые привели бы к сбою в любой машине, человек даже не воспринимает. Эта устойчивость к ошибкам, практически несовместимая с классической компьютерной программой, прекрасно согласуется с идеей пандемониума, где буквы, графемы и слова поддерживают друг друга за счет множества избыточных связей. Тайного «сговора» букв, слов и контекста достаточно, чтобы обеспечить необычайную надежность нашего считывающего аппарата. Альберто Мангуэль был прав: именно читатель придает смысл написанному тексту – его «опытный взгляд» вдыхает жизнь в то, что иначе осталось бы мертвой буквой. Идентификация букв и слов есть результат активного нисходящего процесса декодирования, в рамках которого мозг посылает к зрительному сигналу ту или иную информацию.
Психологи обнаружили любопытное проявление этого активного процесса декодирования – так называемый эффект превосходства слова. В классическом эксперименте Джеральда Райхера[90] взрослых испытуемых просят определить, какая из двух возможных букв (например, «D» или «T») появляется на экране. Уровень сложности корректируется таким образом, чтобы человек лишь изредка давал правильный ответ. Иногда буква показывается одна («D» или «T»), а иногда – в контексте других букв, образующих слово (например, «HEAD» или «HEAT»[91]). Обратите внимание, что дополнительные буквы не добавляют никакой полезной информации. Поскольку в обоих случаях присутствуют одни и те же начальные сочетания «HEA-», испытуемые должны принять решение исключительно на основе последней буквы. Как ни странно, все они гораздо хуже справлялись с задачей, если буква высвечивается на экране одна, а не в сопровождении трех других! Идентификация улучшается в разы, когда буква представлена в контексте слова. Похоже, предъявление целого слова помогает частично устранить шум во входном стимуле. Этот эффект сохраняется даже в том случае, если буква находится в составе неологизма («GERD» или «GERT»[92]) или в цепочке согласных, которая выглядит как настоящее слово («SPRD» или «SPRT»[93]). Однако это не работает со случайными последовательностями («GQSD» или «GQST»)[94].
Опять же это явление трудно объяснить с помощью линейной модели обработки информации, в которой идентификация отдельных букв обязательно предшествует их объединению в более крупные единицы. Эффект превосходства слова, напротив, подчеркивает избыточность и параллелизм процедур зрительного распознавания слов. Даже когда мы сосредотачиваем внимание на одной букве, мы автоматически обращаемся к контексту, в который она помещена. Если этот контекст является словом или его фрагментом, он дает нам доступ к большему количеству уровней кодирования (графемы, слоги и морфемы), чьи «голоса» добавляются к «голосам» букв и облегчают их восприятие. Большинство моделей чтения объясняют эффект превосходства слова следующим образом: буквы и слова взаимодействуют в рамках двустороннего процесса – детекторы графем и детекторы слов более высокого уровня поддерживают обнаружение букв, совместимых с интерпретацией исходной цепочки. Проще говоря, то, что мы видим, зависит от нашего восприятия.
Конкуренция в чтении
Итак, компьютерная метафора, сравнивающая человека со сканером, некорректна. Расшифровка слова не происходит строго последовательно, а время, необходимое для его чтения, не связано с количеством букв в нем. Поэтому вернемся к модели пандемониума, где распознавание осуществляется собранием демонов. Время, которое ему требуется для принятия важного решения («время конвергенции»), зависит не столько от содержания самой проблемы, сколько от споров, которые она вызывает. Когда все сенаторы согласны, самый сложный закон будет принят без длительных прений. И наоборот, даже незначительный вопрос, если он затрагивает деликатную проблему, может обернуться ожесточенными дебатами.
Исследования чтения показывают, что мозг во время этого процесса во многом ведет себя как ментальный сенат. Распознавание слова требует того, чтобы все задействованные системы пришли к согласию относительно интерпретации входящей информации. Таким образом, время, необходимое на чтение слова, в первую очередь зависит от конфликтов и коалиций, которые оно порождает в структуре коры.
Специалисты по экспериментальной психологии обнаружили, что конфликты могут возникать на всех уровнях обработки слова. Например, было установлено, что слова из ментального лексикона конкурируют со своими «соседями» – словами, которые отличаются от них всего на одну букву[95]. Так, слово «сом» сожительствует со словами «дом», «ком», «лом», «ром», «том», «сам», «сок», «сон» и «сор»[96], а слово «идея» – одинокий отшельник, «живущий» один. Опыт показывает, что количество соседей слова, в особенности их относительная частотность, играют ключевую роль в скорости, с которой мы это слово распознаем[97].
Во многих случаях наличие соседей помогает. Чем больше таковых имеет слово, тем быстрее мы можем определить, что оно принадлежит к лексикону нашего родного языка. Так, наличие соседей делает слово «сом» более типичным для русской орфографии, чем слово «идея». Кроме того, плотно заселенные «кварталы» обеспечивают больше возможностей для обучения. Например, у нас гораздо больше шансов запомнить написание и произношение слов, которые заканчиваются на «-ом», чем одного слова, заканчивающегося на «-дея». Поэтому этот «изгой» хуже кодируется как на зрительном, так и на фонологическом уровне.
Впрочем, много соседей – это не всегда хорошо. Как правило, чтобы понять или назвать слово, необходима однозначная идентификация. Следовательно, отделение от всех соседей – операция, требующая времени и усилий, особенно в том случае, если те употребляются часто, а, значит, выигрывают в лексической конкуренции. Например, называние слова «сом» происходит относительно медленно, поскольку оно конкурирует с такими часто встречающимися словами, как «сон»[98] и «сок»[99]. Наш лексикон – это арена, на которой идет жестокая борьба, причем более употребляемые слова имеют выраженное преимущество.
Конкуренция возникает и в рамках фонологического маршрута, преобразующего буквы в звуки. Например, чтобы вслух прочитать слово «beach», носителю английского языка требуется больше времени, чем слово «black». В слове «beach» исходная буквенная цепочка разбивается на сложные графемы «ea» и «ch», произношение которых отличается от произношения отдельных букв «e», «a», «c» или «h». Слово «black» проще, поскольку каждая из его букв непосредственно соответствует закрепленному за ней звуку. Чтобы продемонстрировать скрытый конфликт между уровнем букв и уровнем графем, обратимся к экспериментальной психологии. Как показывают исследования, определение слова, состоящего из сложных графем, включает короткий период бессознательной конкуренции, которая ведет к замедлению реакции. В результате называние слов с диграфами занимает больше времени, чем в случае с простыми словами, такими как «black»[100].
Примечательно, что большинство этих конфликтов разрешаются автоматически, без вмешательства сознания. Базовая стратегия, к которой прибегает наша нервная система при столкновении с неоднозначностью, состоит в том, чтобы не исключать ни одного возможного варианта. Разумеется, это выполнимо только в системе с множеством параллельных путей, обеспечивающих одновременное исследование нескольких интерпретаций. Ввиду такой открытой организации последующие уровни анализа могут делиться своими соображениями, пока не будет достигнуто решение, удовлетворяющее всех участников процесса. В некоторых случаях только контекст позволяет установить значение слова или его произношение. Возьмем следующее предложение: «Принц запер замок на замок»[101]. Эксперименты показывают, что в таких случаях мозг бессознательно активирует все возможные интерпретации слова, пока контекст не ограничит толкование одним значением[102]. К счастью, наши процессы чтения настолько эффективны, что мы редко осознаем подобные двусмысленности – если только они не очень смешные, как в случае с писательницей Дороти Паркер, которая во время медового месяца пропустила срок сдачи рукописи. «Скажите редактору, – попросила она своего агента, – что я была занята. Дела, знаете ли… Если честно, я просто затрахалась. Ну или без “за”»[103].
От поведения к мозговым механизмам
В этой главе мы убедились, что процесс чтения можно разложить на несколько последовательных этапов обработки информации. Все механизмы чтения, которые свойственны человеку – от обработки изображения в сетчатке и инвариантного распознавания букв до доступа к произношению, распознавания морфем и разрешения лексических конфликтов – невероятно эффективны. За доли секунды, без всяких видимых усилий, наш мозг решает задачу, которая не по силам ни одной современной компьютерной программе. Параллельная обработка всех знаков слова, искусное устранение двусмысленностей, мгновенный доступ к одному из 50 000 слов в ментальном лексиконе – все это указывает на то, что наш мозг идеально приспособлен к чтению.
Потрясающая эффективность процесса чтения только сгущает таинственный мрак, окутывающий его истоки. Как нашему мозгу удалось так хорошо адаптироваться к задаче, для которой он не был предназначен изначально? Каким образом всего за несколько тысяч лет структура мозга двуногого примата, превратившегося в охотника-собирателя, сумела приспособиться к функции зрительного распознавания слов? Чтобы найти ответ, обратимся к нейронным сетям, отвечающим за чтение. Как показывают недавние исследования, в коре нашего мозга имеется особая зона для письменных слов, очень похожая на первичную слуховую область или моторную кору, которые есть у каждого из нас. Но самое интересное, что эта область чтения одинакова у носителей английского, японского, итальянского и других языков. Значит ли это, что церебральные механизмы чтения универсальны?
2
«Буквенная касса» мозга
В 1892 году французский невролог Жозеф Жюль Дежерин обнаружил, что инсульт, поражающий небольшой участок зрительной коры в левом полушарии, ведет к частичному или полному нарушению чтения. Современные нейровизуализационные исследования подтверждают: эта зона играет такую важную роль в чтении, что ее по праву можно назвать «буквенной кассой» мозга. Она расположена в одном и том же месте у читателей по всему миру и автоматически реагирует на письменную речь. Менее чем за одну пятую долю секунды – слишком малый промежуток времени для сознательного восприятия – эта область распознает буквенную цепочку независимо от поверхностных изменений в размерах, форме или положении букв и передает информацию центрам в височной и лобной долях. Первые кодируют звуковой паттерн, вторые – значение.
Сколь несуразно привычно для нас волшебство, в силу которого несколько писанных знаков вмещают бессмертные вымыслы, замысловатые похожденья ума, новые миры, населенные живыми людьми, беседующими, плачущими, смеющимися… Что как в один прекрасный день мы, мы все, проснемся и обнаружим, что вовсе не умеем читать?
ВЛАДИМИР НАБОКОВ, «БЛЕДНЫЙ ОГОНЬ»[104]
Открытие жозефа жюля дежерина
Одним погожим парижским утром в октябре 1887 года месье К., бывший торговец и ценитель музыки, сидел в кресле и читал книгу, как вдруг с ужасом обнаружил, что больше не может прочесть ни единого слова! За несколько дней до этого он чувствовал слабость и онемение то в правой руке, то в правой ноге, а также иногда запинался при разговоре. Эти приступы дискомфорта длились недолго и не слишком его беспокоили. Теперь проблема была гораздо серьезнее: читать было просто невозможно! Как ни странно, месье К. по-прежнему мог говорить, распознавать предметы и людей вокруг и даже писать. Что же могло спровоцировать возникновение этой неприятной ситуации?
Месье К. рассудил, что ему просто нужны новые очки, и отправился на прием к известному офтальмологу Эдмунду Ландольту. Доктор Ландольт быстро понял, что, к сожалению, очки не решат проблему. Заподозрив инсульт, он обратился за помощью к выдающемуся французскому неврологу Жозефу Жюлю Дежерину из Королевской больницы Бисетр. Встреча с месье К. состоялась 15 ноября 1887 года. После тщательного психологического и анатомического обследования доктор Дежерин сумел поставить правильный диагноз и сделать первые научные выводы о мозговых основах чтения[105]. Состояние месье К. он назвал «чистой словесной слепотой», имея в виду частичную утрату способности к зрительному распознаванию букв. Само существование такой болезни подразумевало наличие в мозге специализированного «зрительного центра для букв», отвечающего за чтение.
Дежерин и Ландольт установили, что их пациент больше не распознавал отдельные буквы и слова:
…он думает, что сошел с ума: он понимает, что эти знаки – буквы, но не может их распознать, хотя настаивает, что прекрасно их видит, и способен обвести форму рукой. Если попросить его перерисовать слово, это дается ему с большим трудом. Он медленно копирует каждую букву по одному элементу зараз, словно работает над чертежом, и проверяет каждую деталь, дабы убедиться в точности своего рисунка. Несмотря на все усилия, он по-прежнему не может назвать ни единой буквы.
В этом и заключается парадокс словесной слепоты: пациент слеп только к буквам и словам. Острота зрения остается превосходной, распознавание предметов и лиц не нарушено. Больной по-прежнему может ориентироваться в новой обстановке и понимает изображения:
Когда ему показывают предметы, он называет их, не задумываясь. Он может назвать части всех инструментов в каталоге промышленных товаров. Ни разу во время этого обследования память не подвела его; рисунки мгновенно подсказывают нужное слово и способ использования каждого предмета… Когда ему дают его любимую газету Le Matin, пациент говорит: «Это Le Matin, я узнаю ее по форме», – но не может прочитать ни единой буквы в названии.
Однако в ходе клинического обследования Дежерину все же удалось выявить некоторые нарушения зрения. Справа от месье К. зрительный мир выглядел размытым: «Помещенные в правую половину поля зрения объекты кажутся более темными и менее четкими, чем в другой половине». (В неврологии это называется частичной правой гемианопсией.) Кроме того, месье К. больше не различал цвета справа (гемиахроматопсия): эта сторона мира представлялась ему в черно-белом цвете или в оттенках серого.
Впрочем, ни то ни другое не могло объяснить трудности с чтением. Месье К. осознавал свою зрительную ограниченность, а потому автоматически старался сделать так, чтобы слова, которые он пытался прочесть, оказывались левее точки фиксации. К сожалению, это не помогало – читать он все равно не мог.
Вероятно, лучшим доказательством избирательного нарушения способности к чтению служил один любопытный факт: хотя месье К. не мог читать буквы, он по-прежнему был способен распознавать цифры. Месье К. без труда читал последовательности арабских цифр и выполнял сложные вычисления. Это важное наблюдение подразумевает, что чтение цифр опирается на анатомические пути, частично отличные от тех, которые используются для чтения букв и слов.
С другой стороны, цифры и буквы похожи по форме; и те и другие произвольны и взаимозаменяемы. Действительно, многие культуры представляют числа с помощью буквенных знаков – в арабском языке, например, символы и , которые выглядят как греческие буквы, обозначают цифры 8, 7, 6, 5 и 4. Следовательно, любая диссоциация между цифрами и буквами не может быть объяснена исключительно потерей остроты зрения. Никакие очки, сколь бы совершенными они ни были, не могли излечить дефицит чтения у месье К. Его недуг проистекал из мозга. Это значит, что за чтение буквенных цепочек должна отвечать определенная область коры.
Другие наблюдения только подтвердили уникальность проблемы месье К. Доктор Дежерин настаивает, что интеллект и речь его пациента были сохранены. Месье К. ясно выражал свои мысли и после инсульта имел такой же обширный словарный запас, как и раньше. Не пострадала и письменная речь:
По своей инициативе больной пишет так же хорошо, как и говорит. Когда я сравниваю многочисленные образцы его письма, я не нахожу в них никаких недочетов, никаких орфографических ошибок, никакой перестановки букв… Под диктовку он пишет легко и бегло, но не может прочитать то, что записал всего минуту назад… Из-за этого пациент раздражается, пишет несколько букв одну за другой и восклицает: «Если я смог написать эти буквы, почему я не могу их прочесть?».
На самом деле Дежерин наблюдал незначительные нарушения письменной речи, но связал их с низкоуровневым зрительным дефицитом:
Если во время письма под диктовку его отвлекают, он запутывается и уже не знает, где остановился; допустив ошибку, он уже не может ее отыскать. Раньше он писал быстрее и лучше, теперь же буквы стали более крупными, а контуры менее уверенными. Сам больной объясняет это тем, что больше не может полагаться на зрение. И действительно, вид слов, написанных им, не только не помогает, но и, кажется, так сильно беспокоит его, что он предпочитает писать с закрытыми глазами.
Сохранность способности писать была связана с мышечной памятью. Месье К. по-прежнему мог читать буквы, если ему разрешали проследить их контуры пальцем: «Посему именно мышечное чувство пробуждает название буквы. Лучшим доказательством тому является его способность произносить слова с закрытыми глазами, когда я вожу его рукой в воздухе, дабы он мог проследить очертания букв». Годы спустя другие неврологи показали, что в таких случаях сохранным остается и тактильное чтение: пациент лучше расшифровывает буквы, когда их выводят у него на ладони, чем когда они представлены зрительно! Это ясно указывает на уровень, где возникает дефицит: моторная память буквенных форм не повреждена; нарушено только их зрительное распознавание.
Чистая алексия
Симптомы месье К. были настолько странные, что многие не восприняли их всерьез. Как он мог писать и даже произносить по слогам самые сложные слова, но не мог читать буквы? Может, он просто симулянт или истерик? Нет, говорил Дежерин, потому что «у нас есть несколько прекрасных клинических описаний этой разновидности словесной слепоты». И действительно, современная неврология подтвердила все первоначальные наблюдения Дежерина. В настоящее время описан