Книга Когнитивная наука Основы психологии познания том 1 Величковский Б М
Работа добавлена на сайт bukvasha.net: 2015-10-25Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
FOUNDATIONS OF HUMAN SCIENCES SERIES
Boris M. Velichkovsky
COGNITIVE SCIENCE:
FOUNDATIONS OF EPISTEMIC PSYCHOLOGY
Volume 1
The monograph describes in details methods and results of interdisciplinary studies of cognitive processes in humans. The emphasis is on the processes of perception and action, attention and consciousness, memory and knowledge representation, communication and thinking, interaction of affect and intellect as well as on philosophical, methodological and applied problems that are central for contemporary cognitive science. The monograph is of major interests for a broad readership from disciplines ranging from psychology, linguistics and philosophy to neurosciences, artificial intelligence and human factors engineering. It can be recommended as an advance textbook for undergraduate and graduate students in all these areas.
Boris M. Velichkovsky, Ph.D., Dr. habil., Professor and Head of the Institute for Work, Organizational and Social Psychology, Faculty of Mathematics and Natural Sciences, Dresden University of Technology. Past President of the Division of Cognitive Psychology, International Association of Applied Psychology. Interim President of the Association for Cognitive Studies. Member of the European Steering Committee for Cognitive Science. Leading expert of the EU Commission (Program NEST: New and Emerging Sciences and Technologies).
Борис M. ВЕЛИЧКОВСКИЙ
КОГНИТИВНАЯ НАУКА
ОСНОВЫ ПСИХОЛОГИИ ПОЗНАНИЯ
Том 1
Рекомендовано Советом психологии УМО
по классическому университетскому образованию
в качестве учебного пособия для студентов высших учебных заведений,
обучающихся по направлению и специальностям психологии
ACADEMA
Москва 2006
смысл
УДК 159.947.5(075.8) ББК 88.3я73 В276
Серия «Основы современного человекознания»
Охраняется законодательством РФ об авторском праве.
Воспроизведение всей книги или какой-либо ее части
без письменного разрешения издательства воспрещается
Рецензенты:
доктор биологических наук К.В.Анохин,
доктор психологических наук В.А.Иванников,
доктор филологических наук А. Е. Кибрик
Величковский Б.М.
В276 Когнитивная наука : Основы психологии познания : в 2 т. — Т. 1 / Борис М. Величковский. — М. : Смысл : Издательский центр «Академия», 2006. — 448 с.
ISBN 5-89357-217-3 («Смысл», т. 1)
ISBN 5-7695-2984-9 (Изд. центр «Академия», т. 1)
В первой на русском языке книге по когнитивной науке изложены результаты междисциплинарных исследований познавательных процессов у человека. Подробно рассмотрены восприятие и действие, внимание и сознание, речевое общение и мышление, память и представление знаний, взаимодействие интеллекта и аффекта, а также философские и прикладные проблемы, стоящие перед когнитивной наукой.
Для психологов, лингвистов, информатиков, физиологов, философов и всех специалистов, работа которых связана с учетом познавательных возможностей человека, а также студентов и аспирантов соответствующих специальностей, углубленно изучающих эту область.
УДК 159.947.5(075.8) ББК 88.3я73
ISBN 5-89357-217-3 («Смысл», т. 1)
ISBN 5-7695-2984-9 (Изд. центр «Академия», т. 1)
ISBN 5-89357-216-5 («Смысл») © Величковский Б.М., 2006
ISBN 5-7695-2983-0 (Изд. центр «Академия») © Издательство «Смысл», 2006
СОДЕРЖАНИЕ
ТОМ1
ОТ АВТОРА 10
ВВЕДЕНИЕ 14
ГЛАВА 1. ИСТОКИ КОГНИТИВНОЙ НАУКИ 24
1.1 Основные философские традиции 27
Культ механического естествознания 27
Эмпиризм и рационализм 31
Критика самонаблюдения и чистого разума 36
1.2 Ранняя экспериментальная психология 40
Первые методические подходы 40
Вильгельм Вундт и основание психологии 42
Первый кризис научной психологии 46
1.3 Поведенческие и физикалистские направления 53
Психология как наука о поведении и физических
гештальтах 53Опыт галилеевской перестройки психологии 57
Второй кризис научной психологии 61
1.4 Европейский идеал романтической науки 69
Романтизм как антитезис позитивизму 69
От натурфилософии к нейропсихологии 76
Вклад физиологии и психологии деятельности 81
ГЛАВА 2. ТРАНСФОРМАЦИЯ ПОДХОДОВ 90
2.1 Информационный подход 93
Кибернетика и статистическая теория связи 93
Инженерная психология и ее эволюция 97
Поиски ограничений пропускной способности 103
2.2 Компьютерная метафора 108
Ментальные модели и аналогия с компьютером 108
«Когнитивная психология» Улрика Найссера 116
Принципы символьного подхода 118
2.3 Модулярность познания и коннекционизм 126
Идея специализации обработки 126
Гипотеза модулярности: вклад Джерри Фодора 129
Нейронные сети в психологии 135
2.4 Усиливающееся влияние нейронаук 141
Интерес к нейропсихологическим данным 141
Новые методы и старые проблемы 146
Нейробиологические модели познания 153
ГЛАВА 3. СЕНСОРНО-ПЕРЦЕПТИВНЫЕ ПРОЦЕССЫ 162
3.1 Пространство и время восприятия 165
Зрительная пространственная локализация 165
Восприятие движения и времени 174
Перцептивные взаимодействия и маскировка 187
3.2 Взлет и падение «иконы» 194
Иконическая память 194
Эхоическая память 199
Микрогенез как альтернатива 202
3.3 Распознавание конфигураций 208
Традиционные психологические подходы 208
Влияние нейронаук и информатики 216
Роль предметности и семантический контекст 222
3.4. Восприятие и действие 233
3.4.1 Сенсомоторные основы восприятия
(и наоборот) 233
Уровни восприятия 241
Развитие и специализация восприятия 249
ГЛАВА 4. СОЗНАНИЕ И КОНТРОЛЬ ДЕЙСТВИЯ 256
4.1 Селективность восприятия и структурные модели 259
Определение понятий и ранние модели 259
Где расположен фильтр? 264
Зрительное селективное внимание 271
4.2 «Творческий синтез» как альтернатива 280
Позитивная трактовка внимания 280
Внимание как умственное усилие
и ресурсные модели 285
4.2.3 Проблема интеграции признаков 291
4.3 Автоматические и контролируемые процессы 299
4.3.1 Внимание как внутренний контроль 299
Критерии выделения автоматизмов 305
Двухуровневые модели, их критика
и альтернативы 309
4.4 Сознание и внимание в структуре деятельности 319
Непроизвольное (экзогенное) внимание 319
Произвольное внимание и контроль действия 327
Нейрофилософия и нейропсихология сознания 334
ГЛАВА 5. ФУНКЦИОНАЛЬНАЯ СТРУКТУРА ПАМЯТИ 346
5.1 Основные подходы и феномены 349
Анализ ошибок: узнавание и воспроизведение 349
Анализ времени реакции: поиск в памяти 356
Непрямые методы: имплицитная память 361
5.2 Теории непосредственного запоминания 367
Трехкомпонентные модели 367
Теория уровней обработки 375
Эволюция модели рабочей памяти 382
5.3 Системы и уровни памяти 391
Теория двойного кодирования 391
Системы памяти: модель 2000+ 399
От уровней памяти к стратификации познания 408
5.4 Память в повседневном контексте 414
Амнезии обыденной жизни 414
Обучение и формирование навыков 424
Развитие, старение и распад 436
СОДЕРЖАНИЕ ВТОРОГО ТОМА
ГЛАВА 6. КАТЕГОРИЗАЦИЯ
И ПРЕДСТАВЛЕНИЕ ЗНАНИЙ 10
6.1 Формальные и эмпирические подходы 13
Логика и проблема имплицитного знания 13
Психологические методы исследования 22
Нейропсихологические исследования 27
6.2 Категориальная организация знаний 31
Семантические сети и пространства 31
Понятия базового уровня 34
Роль примеров и ситуативных факторов 38
6.3 Межкатегориальная организация 44
Онтологии, схемы и образы 44
Репрезентация пространственного окружения 57
Сценарии и грамматики историй 62
6.4 От представления знаний к мышлению 69
Глобальные когнитивные модели 69
Теория перцептивных символьных систем 76
Наивная физика и психология обыденного сознания ... 82
ГЛАВА 7. КОММУНИКАЦИЯ
И РЕЧЕВАЯ АКТИВНОСТЬ 92
7.1 Восприятие и порождение речи 95
Фонологическое восприятие 95
Развитие языка и речевых действий 101
Нейропсихологические синдромы и модели
порождения ПО
7.2 Анализ процессов чтения 117
Развитие навыков чтения 117
Модели и нейропсихология чтения 123
7.2.3 Движения глаз при чтении 127
7.3 Когнитивные исследования грамматики 131
Проверка трансформационной модели 131
От глубинной семантики к когнитивной
грамматике 139
7.3.3 Современные модели и данные
нейролингвистики 149
7.4 Прагматика коммуникативных ситуаций 154
Принцип кооперативности и понимание 154
Несовпадение значения и смысла 161
Технологические применения прагматики 169
ГЛАВА 8. МЫШЛЕНИЕ И МЕТАПОЗНАНИЕ 176
8.1 Высшие познавательные функции 179
Разнообразие подходов и моделей 179
Мышление и речь — мышление для речи 188
Метапознание и творческое воображение 196
8.2 Процессы и модели умозаключений 206
Индукция, аналогия и прогноз 206
Дедуктивные умозаключения 215
Специализация и прагматика умозаключений 221
8.3 Процессы решения задач 229
Решение малых мыслительных задач 229
Сложные проблемы, творчество и открытие 235
Решение задач экспертами 244
8.4. Принятие решений и структура интеллекта 250
Эвристики и принятие решений 250
Новые веяния в исследованиях решений 257
Функциональная структура интеллекта 268
ГЛАВА 9. ПЕРСПЕКТИВЫ КОГНИТИВНОЙ НАУКИ 280
9.1 От дуализма Декарта к новой монадологии 283
Третий кризис научной психологии 283
Произвольность формальных моделей 289
Нейрокогнитивизм и теория идентичности 294
9.2 Перспектива методологического солипсизма 301
Искусственный интеллект и человеческий разум 301
Философия искусственного интеллекта 307
Виртуальные формы жизни 314
9.3 Перспектива прямого реализма 319
Экологический подход: вклад Джи Джи Гибсона 319
Исследования ситуативного действия 325
Телесная заземленность познания 330
9.4 Перспектива методологического плюрализма 335
Разнообразие подходов и моделей 335
Вертикальная интеграция и парадигмы развития 344
Когнитивно-аффективная наука 355
ЗАКЛЮЧЕНИЕ 372
ЛИТЕРАТУРА 380
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 410
ОТ АВТОРА
Каждый, кто изучает познавательные возможности человека или просто интересуется особенностями «человеческого фактора», должен разбираться в том клубке идей, методов и фактов, который принято называть сегодня «когнитивной наукой». С 1980-х годов это междисциплинарное направление присутствует, а иногда и доминирует, в программах университетской подготовки психологов, лингвистов, нейрофизиологов, философов, информатиков, антропологов и экономистов по всему миру. Если вынести за скобки все, что может быть просто проявлением моды, то остается некоторый «сухой остаток», который сводится к следующему. Во-первых, замечательно, что науки в своем развитии могут не только бесконечно делиться, но и объединяться. Во-вторых, такое объединение ресурсов отдельных дисциплин обещает продвижение в решении крупных фундаментальных и практических задач. Человек, по словам Платона, мера всех вещей. Как раз то, что, с точки зрения устоявшихся представлений, совсем или почти недоступно измерению в самом человеке — скорость восприятия и мысли, объем и содержание сознания, основания для субъективных предпочтений и принимаемых решений, — составляет предмет когнитивных исследований.
Разумеется, я попытался рассказать об истории, современном состоянии и перспективах когнитивного подхода с позиций моих знаний и интересов, опираясь на контекст современной психологии. Остается надеяться, что друзья и коллеги в соседних дисциплинах воспримут это как творческий вызов и вскоре на русском языке появятся многочисленные руководства, освещающие когнитивные исследования из несколько отличных перспектив лингвистики, нейрофизиологии, философии, искусственного интеллекта, нейроинформатики, антропологии, экономики и т.д. В любом случае можно быть уверенным, что вклад научной психологии в это общее развитие оказался достаточно весомым, чем и оправдывается двойное название книги.
Как и в случае первого варианта моей книги («Современная когнитивная психология», изд-во МГУ, 1982), главной ее задачей было помочь русскоязычному читателю познакомиться с понятиями, фактическим материалом и проблемами когнитивных исследований в психологии. Такая помощь представляется сегодня более необходимой, чем когда-либо. Текущая исследовательская литература слишком специальна: без достаточного знания языков и разнообразных, часто весьма специфических традиций конфронтация с ней может лишь отбить желание работать в этой области. Многочисленные зарубежные учебники, как правило, ма-10 лопригодны для этой цели — большинство из них трактует материал по-
верхностно и догматично. Как заметил однажды американский философ и историк науки Томас Кун, типичные учебники «сужают ощущение истории данной дисциплины, а затем подсовывают суррогаты вместо образовавшихся пустот» (русский перевод: Кун, 1977, с. 181).
Я попытался совместить позитивное изложение когнитивных исследований с их критическим анализом. Этот прием, надо сказать, рассчитан на зрелого читателя. Идеальный читатель должен был бы вынести из работы с этой книгой уважительное отношение к добытым знаниям вместе с пониманием того, что пресловутые «Монбланы фактов» все еще разделены в когнитивной науке широкими равнинами terra incognita. Более того, чем больше мы узнаем, тем более обширными оказываются эти неизведанные территории. Как каждому автору, мне хотелось рассказать и о собственных научных результатах, связанных прежде всего с изучением следов эволюционной организации в работе познавательных механизмов. Иногда эти результаты демонстрируют возможность альтернативных интерпретаций данных, на которых основаны некоторые из числа наиболее известных в когнитивной науке теоретических представлений. Эти страницы книги, по-видимому, очень субъективны, и остается только надеяться, что они не слишком искажают объективную картину исследований.
Книга имеет ряд других особенностей, которые надо упомянуть. На первом месте в ней находится содержательный анализ проблем, а не описание тех или иных формализмов. Кроме того, в книге многое вынесено за скобки, часто оставлены лишь достаточно общие указания на основные источники. В противном случае было бы необходимо вводить в текст дополнительно тысячи ссылок, и чтение стало бы затруднительным. Наконец, где это возможно, я старался упоминать практические приложения когнитивных исследований. Существование таких приложений — оправдание того удовольствия, которое время от времени дает научная деятельность в этой области. В человеческом обществе — на Востоке и на Западе, не говоря о Севере и Юге, — накопилось столько проблем, что для чистой науки больше не остается морального права на существование. Правда, как любил повторять Карл Бюлер, нет ничего практичнее, чем хорошая теория, а хорошая теория обычно может возникнуть лишь в рамках фундаментальных исследований.
Во время подготовки первого и второго издания книги мне оказы-1 валась щедрая помощь. Особенно ценным было общение с Петром Яковлевичем Гальпериным и Эккардтом Шеерером, каждый из которых обладал редким чувством исторического времени, знаменитого цайтгайста немецкой философии. Я с благодарностью хотел бы упомянуть здесь имена коллег Дорис и Норберта Бишоф, И.В. Блинниковой, Брюса Бридж-мена, Лекса ван дер Хайдена, СБ. Величковской, Т.Г. Визель, Винчи Ди Лолло, Саши Дорнхофера, В.П. Зинченко, Маркуса Иооса, М.С. Капицы, A.A. и А.Е. Кибриков, Фридхарта Кликса, Фергюса Крэйка, А.Б. и Н.Б. Леоновых, A.A. и Д.А. Леонтьевых, Эди Марбаха, Дика Найссера,
12
Коли Непейводы, H.H. Нечаева, Дона Нормана, Бастиана Паннаша, Иаака Панксеппа, Галины Парамей, В.В. Петрова, Майкла Познера, Марка Помплуна, Д.А. Поспелова, Володи Похилько, Зенона Пыли-шина, Герта Рикхайта, Хельги Риттера, Петера Рихтера, Дэвида Розен-таля, E.H. Соколова, В.Д. Соловьева, Дона Стасса, Барбары Тверски, Науми Уайсстейн, Ганса Флора, Тео Херрманна, Т.В. Черниговской. Все они, как и множество других людей, внесли свой вклад в написание этой книги. Большую работу по подготовке рукописи к изданию выполнили Н.В. Крылова, Констанция Либерс, Е.Г. Лунякова, Александра Ротерт и Н.С. Самбу.
Первый вариант книги был написан еще в 1980 году, когда я работал на кафедре Вундта Лейпцигского университета. Двадцать лет спустя я легкомысленно пообещал дружественному издателю слегка подправить старый текст для переиздания, на что и ушло... свыше шести лет. Отсутствовавшие в первом издании главы 7 и 9, а также существенно расширенные главы 2, 6 и 8 написаны при участии Б.Б. Величковского. Я очень признателен ему за эту помощь. Конечно, я признателен и тем, кто часто искал меня в последние годы, но редко находил — студентам и сотрудникам Дрезденского университета. Просто удивительно, с каким пониманием все это время они относились к моим опозданиям на лекции и на защиты диссертаций. Руководство университета в момент, когда решался вопрос о том, писать эту книгу или не писать, предоставило мне годичный творческий отпуск. Гамбургский фонд Кербеля вне рамок своей программы поддержал подготовку книги, а Центр патологии речи и нейрореабилитации Института психиатрии Минздрава РФ (директор института — В.Н. Краснов) предоставил мне условия для нейрокогни-тивных наблюдений во время пребывания в Москве.
Last but not least, я должен поблагодарить (еще и еще раз) моих близких. Именно их безграничная поддержка позволила мне закончить это начатое однажды дело.
Dresden / Истомила / Bonn / Санкт-Петербург / Paris
март 2006 года
Светлой памяти АЛЕКСАНДРА РОМАНОВИЧА ЛУРИЯ
ВВЕДЕНИЕ
Психология — молодая наука. От ее официального возникновения в Германии до сегодняшнего дня прошло немногим более 100 лет. Значительная часть этого времени прошла в борьбе школ, в спорах об определении понятий и в поисках сколько-нибудь надежных методов исследования. Еще 20—30 лет назад для обычного образованного человека психология была чем-то средним между учением Фрейда о сексуальных инстинктах и павловской теорией условных рефлексов. Если современная мировая психология превратилась в одну из самых динамично развивающихся научных дисциплин, то заслуга этого принадлежит относительно небольшому числу людей, доказавших практическое значение психологических знаний в таких областях, как образование, медицина, новые информационные технологии и стресс на рабочем месте. Любой репрезентативный опрос — в России, Западной Европе или Северной Америке — показал бы, что в число 10 ведущих психологов прошедшего столетия входит русский нейропсихолог А. Р. Лурия.
Более того, вклад Александра Романовича оказался наиболее конкретным и неоспоримым — ведь нет ничего естественнее допустить существование связи между психикой и мозгом. Многое из того, что было сделано Лурия в этой основной сфере его деятельности, можно пояснить, как это и делали сдававшие ему экзамены студенты, двигая указательным пальцем по поверхности головы. Поражает точность, с которой Лурия удалось описать функции различных структур мозга, в особенности лобных долей коры, причем за десятилетия до появления современных биофизических методов трехмерного мозгового картирования, позволивших буквально увидеть предсказанные им процессы и взаимосвязи. Каждая вторая обзорная статья по нейропсихологии высших, специфически человеческих психологических функций до сих пор начинается, а иногда и кончается ссылками на эти работы (см., например, Thompson-Schill, Bedny & Goldberg, 2005).
Биография А.Р. Лурия — история жизни потомственного российского интеллигента. Он родился в Казани на Волге в семье известного врача. В студенческие годы, совпавшие с Гражданской войной, увлекся психоанализом. В начале 1920-х годов он переехал в Москву, где стал работать в Институте психологии Московского университета. Здесь встретился с Львом Семеновичем Выготским и Алексеем Николаевичем Леонтьевым, ставшими его ближайшими друзьями и соратниками. В составе этой знаменитой ныне «тройки» Лурия начал работать над проектом новой, как он говорил, «конкретной психологии». В этом проекте 14 Лурия и его коллеги попытались объединить идеи развития психики в
ι
определенном культурном окружении с нейрофизиологическими и клиническими данными о специализации различных участков мозга. Перипетии этой филигранной, до сих пор неоконченной работы, происходившей на фоне глобальных катаклизмов середины прошедшего века, детально описаны в книгах и статьях его учеников и многолетних сотрудников, а также в воспоминаниях дочери, биохимика Елены Александровны Лурия. В этом предисловии к основной, на сегодняшний день, своей публикации я хотел бы рассказать о восприятии А. Р. Лурия глазами последнего знавшего его поколения студентов и учеников.
Одно из обстоятельств, которое я осознал только недавно, состоит в том, что, когда мы, первые студенты только что открывшегося факультета психологии МГУ, встретились с Александром Романовичем на нашей первой лекции (1 сентября 1966 года), он уже был в том возрасте, в котором активная научная и преподавательская деятельность профессоров университетов на Западе успешно завершается. Происходило бы это в стенах Гарварда или Сорбонны, а не aima mater на Моховой, то, быть может, никакого заслуживающего упоминания луриевского периода в нашей жизни и не было бы.
Эту луриевскую лекцию почти 40-летней давности можно было бы повторно прочитать и сегодня. Сразу подкупал простой разговорный язык и понятные примеры, для демонстрации которых он выбирал кого-нибудь из нас. Самое главное для будущего психолога — понять, что между мозгом и миром существует постоянное взаимодействие. Сказал, что в своей жизни знал только двух по-настоящему гениальных людей. (На лекции присутствовал старый друг Александра Романовича, основатель и первый декан факультета психологии А.Н. Леонтьев.) Лурия назвал умершего в середине 30-х годов Л.С. Выготского и физиолога H.A. Бернштейна. Большую часть лекции он рассказывал о культурно-исторической теории Выготского и о работах по восстановлению движений у пациентов с поражениями мозга, которые проводились Бернштейном во время и сразу после войны. Замечательной была разрабатывавшаяся Бернштейном идея эволюционных уровней организации — оказалось, что наше повседневное поведение может определяться несколькими, надстраивающимися друг над другом и сохраняющими относительную автономию структурами мозга. Культура, мозг и эволюция были тремя центральными понятиями этой лекции, как и всей его научной программы.
Мое более близкое знакомство с ним произошло случайно. В середине второго курса я заболел и надолго оказался в Боткинской больнице. Гуляя как-то по территории, я неожиданно увидел Александра Романовича, сидящего на скамейке с книгой. Он был привезен с пищевым отравлением из Парижа после банкета в штаб-квартире ЮНЕСКО. Узнав меня, Лурия оживился, долго расспрашивал о моей семье, о том, почему я вдруг выбрал среди множества факультетов психологию. Я признался,
15
что уже успел разочароваться в своем выборе. «Подожди немного, к началу 21-го века ты убедишься, что сделал правильный выбор».
Целый месяц по нескольку часов в день в маленькой палате, а чаще гуляя по парку, Лурия рассказывал мне о том, кто есть кто в мировой психологии. Там были все классики — немцы (особенно близкие его сердцу гештальтпсихологи Карл Бюлер и его красавица жена Шарлотта, а также послевоенный «скучный Метцгер»), австриец Конрад Лоренц, швейцарец Жан Пиаже, французы Поль Фресс и Анри Валлон, англичане (крупнейшие неврологи Head и Brain, то есть буквально «голова» и «мозг»), американцы («почти гениальные» исследователь поведения животных Скиннер и выдающийся лингвист Хомский), канадцы (прежде всего один из основателей современной нейропсихологии Дональд Хэбб, сказавший однажды, что «Большой мозг, как и большое государство, не может просто делать простые вещи»). Мировая наука была для него живым, постоянно развивающимся организмом. Одно луриевское замечание заменяло чтение десятка томов. То, что было реально — убогий уровень советской психологии в целом и некоторых ее «видных» представителей в особенности, — больше не было важным. Не важными были и такие дисциплины, как «Научный коммунизм», «История партии», «Политэкономия социализма». Это была другая система координат.
Как показали последующие наблюдения, Александр Романович и сам оказался гением. Им было написано свыше 25 книг, большинство из которых сразу же переводились на иностранные языки. Его собственные знания основных языков — немецкого, французского и английского — в разговорном и письменном вариантах были совершенными, о чем свидетельствует и многолетняя переписка с другими классиками психологии, начиная с Зигмунда Фрейда. В последний период жизни, который я мог наблюдать, он сначала писал книги и статьи по-английски, а затем переводил их на русский язык. Мнения о количестве языков, которыми он владел, расходятся, но большинство оценок превышает число 10. Как-то во время совместного отдыха в Пицунде я наткнулся на А.Р. Лурия, оживленно беседующего с местными жителями на абхазском языке!
В общении поражала его быстрота и обязательность. В отечественной научной среде, где большинство обещаний не выполняется вообще, а остальные выполняются с опозданием, даже как-то странно было видеть человека, по возможности ничего не откладывающего на потом. Сам он оправдывал эту особенность поведения стремлением разгрузить память для более важных дел. Помню, как однажды я подошел к нему в перерыве между лекциями и сказал, что на Западе появилось какое-то новое научное направление — «Когнитивная психология», — и попросил достать только что вышедшую в США книгу. Тут же на спине моего товарища на листочке из тетрадки в клеточку Лурия написал французскому редактору этого междисциплинарного руководства Жаку Мелеру: «Mon cher Jacques...». Эта просьба, как и сотни других, была выполнена,
видимо, столь же обязательным Жаком практически моментально — уже через пару месяцев мы держали в руках толстую книгу, испещренную лиловыми печатями советского цензурного комитета.
Интенсивность луриевской работы мне пришлось почувствовать, когда мы в составе группы из примерно дюжины студентов помогали ему в составлении авторского указателя для фундаментального руководства «Высшие корковые функции». К концу третьего дня наша команда с трудом дошла до буквы «Г». Посмотрев на эту печальную картину, Лурия оставил одного из нас — Петера Тульвисте (впоследствии ректора Тартуского университета, пару лет назад едва не ставшего президентом Эстонии), и вдвоем они за два полных рабочих дня кончили весь указатель. Позднее, когда после окончания университета я стал ассистентом Александра Романовича, мне было поручено подготовить набросок первой части большого университетского руководства по обшей психологии. Рукопись я принес Александру Романовичу. Он был дома в постели после своего первого инфаркта. Через неделю я получил полностью переписанный его рукой текст, причем на титульном листе он изменил порядок авторов, поставив мою фамилию, в соответствии с алфавитом, первой.
Эта совместная книга по психологии восприятия была затем переведена на многие языки, и до последнего времени ее потрепанные жизнью экземпляры отбирались у студентов на госэкзаменах по общей психологии. Кстати, здесь сам Лурия был предельно либерален: «Если студент не знает материал, то и списать не сможет». Он даже специально советовал студентам на консультациях перед экзаменами готовить шпаргалки. На экзаменах всегда задавал одни и те же вопросы с незначительными (но, как я сейчас понимаю, важными) вариациями. Вообще был добр к студентам и нетитулованным сотрудникам. Знал, кто нуждается в помощи, и помогал многим, в том числе и материально.
Одновременно Лурия вполне мог быть жестким и безапелляционным. В дискуссиях о роли учения Павлова в психологии публично говорил, что величие человека можно измерять тем количеством лет, на которое он задержал развитие науки. Там, где научные противоречия приобретали характер морального противостояния, проявлял себя как настоящий боец. Ненавидел карьеризм, плагиаторов и подонков от науки, серьезные моральные проступки не прощал даже друзям. Как пишет Елена Александровна Лурия, эти люди просто переставали для него существовать. Наученный опытом «средневековья», 1930—50-х годов, предупреждал о готовности многих в академической среде для достижения карьерных целей передвигаться по трупам. Частотным словом в лексиконе Лурия было слово «халтура». На кандидатских и докторских защитах он говорил правду в глаза и действительно останавливал проходимцев, по крайней мере, на том участке, где — и пока — он еще это мог сделать. «Вы ошиблись. Эту работу Вы должны были бы представить для защиты на кафедру научного коммунизма. Психология — экс-
периментальная наука. Вы ошиблись дверью». Многих это непосредственно задевало, и декан факультета, А.Н. Леонтьев, по секрету рассказывал о потоке анонимных «писем граждан» с немыслимыми обвинениями в адрес Александра Романовича.
Конечно, самое удивительное — это атмосфера, которую он умел создать вокруг себя. В глухие времена, когда даже самые специальные научные журналы попадали в университетскую библиотеку с годичным опозданием, после тщательного контроля их политического содержания, в его окружении не было никакого ощущения изолированности. С этой идеологической открытостью коррелировала открытость дома. Большая профессорская квартира в двух шагах от Ленинки была открыта не только для коллег, но и для студентов, которым даже разрешалось брать с собой книги. Помню, после первого посещения я ушел домой, бережно держа в руках роскошный экземпляр «Die Krise der Psychologie» Карла Бюлера. Оказывается, не одного меня, студента-второкурсника, беспокоило состояние этой науки.
Лурия следил за тем, чтобы его сотрудники и студенты выступали с докладами, и сам организовывал неформальные научные семинары, проходившие у него дома, в университете на Моховой или в госпитале Бурденко. Попадавшие в Москву знаменитости неизменно приглашались для таких выступлений. Он сам переводил выступления иностранных гостей, причем часто не выдерживал узких рамок этой роли и скорее комментировал сказанное. Прослушав первые фразы доклада крупнейшего американского специалиста по развитию ребенка Джерома Брунера, он вместо перевода вдруг сказал аудитории из примерно 100 человек: «Ну, здесь нет ничего нового — мы с Выготским знали все это 40 лет назад!»
Его забота о научной молодежи была удивительной. Когда в конце обучения я по рекомендации Лурия оказался в Берлинском университете, то еженедельно получал от него письма, хотя никоим образом не входил в число ближайших учеников и специализировался по другой кафедре. Лишь недавно я узнал, что письма он писал и тогдашнему директору Института психологии Берлинского университета. Главная мысль — молодежь должна попасть в хорошие руки. Изобретением Лурия и декана Леонтьева были Летние психологические школы (ЛПШ), проводившиеся на базе спортлагеря МГУ в Пицунде. Я был президентом одной из таких школ и, составляя список участников, совершил «серьезную политическую ошибку», не включив в него секретаря комитета комсомола... В этом и других, менее комичных эпизодах мне очень помогла поддержка Лурия и Леонтьева, очевидно, пытавшихся проводить собственную «кадровую политику», отличную от политики партийных функционеров. Что касается ЛПШ, то они оказались чрезвычайно удачной формой подготовки специалистов высшей квалификации, через которую прошли тогда все ведущие молодые психологи Московского университета. 18
Лурия использовал каждую возможность, чтобы увлечь других своим делом. Многие зарубежные и отечественные нейропсихологи признают, что выбрали профессию в результате встречи с ним. Проходя по университетскому двору, он часто подходил к группкам студентов: «Ну как же можно стоять вот так часами и совсем ничего не делать!» Когда я стал его ассистентом, меня и моих близких будили его звонки около 7 часов утра: «Боря, ты еще спишь?!» Он заставлял ходить на свои лекции (которые, увы, тогда казались мне скучными). Однажды предложил прочитать лекцию вместо себя. К этому выступлению я тщательно готовился неделю. Оказался перед амфитеатром внимательно смотрящих на меня лиц в одной из аудиторий старого здания МГУ (с характерным для того периода названием «Коммунистическая» или «Большевистская»), смешался и прочитал лекцию за 15 минут. «Замечательно, — сказал Лурия, — а теперь прочти еще раз!» Эта забота казалась естественной, как и возможность выяснить абсолютно любой вопрос. С течением времени, правда, он все чаще отвечал не на заданный вопрос, а на какой-то другой, который его в этот момент волновал.
То, какой шанс мы не использовали в своей жизни, стало ясным, когда Александра Романовича не стало, а затем умер и декан Алексей Николаевич Леонтьев. Факультет быстро посерел, новое, назначенное сверху «руководство советской психологии» было вполне на уровне своего куратора в научном отделе ЦК КПСС, по образованию то ли водопроводчика, то ли электрика. Глупость и провинциальная спесь, надежнее любого железного занавеса, на десятилетия отгородили нас тогда от внешнего мира.
Моим увлечением стала так называемая когнитивная психология, опирающаяся на естественно-научные аналогии и компьютерное моделирование восприятия, памяти и мышления. Как одна из основ для прикладных работ по искусственному интеллекту, это направление поддерживалось в «Большой академии» самым известным в стране «искусственным интеллигентом» Дмитрием Александровичем Поспеловым, а также вице-президентом академии, физиком Евгением Павловичем Велиховым. Нам казалось тогда, что анализ мозговых механизмов в этих исследованиях не столь существенен, ведь одна и та же программа вычислений может быть запущена на разных компьютерах. Нейропсихология все еще оставалась слишком интуитивной, ориентированной на отдельные клинические случаи. Она очень напоминала знаменитый тест чернильных пятен швейцарского психиатра Германа Роршаха, где в симметричных бессмысленных узорах каждый может увидеть то, что хочет. Недаром сам Лурия часто называл нейропсихологические данные «трехмерным Роршахом».
На всемирном психологическом конгрессе в Лейпциге 1980 года, приуроченном к 100-летнему юбилею основания психологии, после доклада о моих экспериментальных исследованиях зрительной памяти я
19
получил несколько приглашений продолжить работу на Западе. Среди прочих было и приглашение в Торонто — Мекку когнитивной психологии и нейропсихологии. Правда, безымянный коллега из советской делегации не поленился подсчитать число ссылок на советских и зарубежных авторов в моем докладе, так что в Москве меня неожиданно обвинили в использовании трибуны международного конгресса для... проамериканской пропаганды. После этого моя подготовленная для защиты докторская диссертация как-то сразу затерялась. Меня отстранили от лекций, а мои ученики долгое время могли защититься только под чужим, фиктивным руководством. Лишь с большим трудом и под личное поручительство тогдашнего директора издательства МГУ A.C. Аве-личева мне удалось в 1982 году выпустить посвященную памяти Александра Романовича книгу «Современная когнитивная психология».
Последовать приглашению друзей и классиков современной научной психологии, Фергюса Крэйка и Эндела Тулвинга, я смог лишь 10 годами позже. Интересно было разобраться, почему относительно/небольшое отделение психологии университета Торонто считается одним из лучших в мире. Оказалось, что в этом викторианском здании в историческом центре города царит именно та атмосфера, которую постоянно пытался культивировать Лурия. Во-первых, рыцарская преданность науке. Во-вторых, постоянная открытость классиков для общения со студентами (с характерным для США и Канады принципом приоткрытой двери — каждый может войти и задать вопрос, если, по его мнению, вопрос достаточно важен, чтобы прервать работу профессора). В-третьих, очень неформальные, но одновременно и обязательные научные семинары, названные в Торонто в честь пионера исследований памяти Германа Эббингауза «Эббингаузовской империей». В-четвертых, безусловный интернационализм, особенно подчеркиваемый пестротой студенческих лиц в аудиториях. В-пятых, отслеживание по минутам, что происходит в большом научном мире, благо для этого наконец-то появилось идеальное средство коммуникации — электронная почта.
В исследованиях памяти в начале 1990-х годов происходили важные изменения. Принятое в когнитивных теориях различение двух форм памяти — памяти на общие факты и на события собственной биографии — неожиданно стало подтверждаться результатами наблюдений за пациентами с различными формами амнезии и в особенности данными так называемой позитронной томографии, нового физического метода, позволяющего восстановить картину работы мозга при решении различных задач. Постепенно мировая научная психология, как большой неуклюжий корабль, стала поворачиваться на луриевский курс. Надо признать, что у Лурия не было надежного метода. Гипотезы о мозговой локализации функций можно было проверять только post mortem, после смерти пациента. То, что он угадывал благодаря своему опыту и уникальным способностям, с трудом могли повторить другие, даже в его 20 ближайшем окружении. Методы трехмерного картирования мозга изме-
нили ситуацию. Позитронная томография и ядерный магнитный резонанс — медленные, громоздкие, чудовищно дорогие — были воспроизводимы, в отличие от гениев.
Организаторы всемирного психологического конгресса 1992 года в Брюсселе предложили мне прочитать вечернюю лекцию, которую я посвятил современной трактовке идеи эволюционных уровней организации H.A. Бернштейна. В другой такой лекции Майкл Познер, психолог из штата Орегон, рассказал о применении позигронной томографии для локализации механизмов внимания. Он обнаружил три области мозга, связанные с вниманием, причем одну из них, локализованную в самых новых структурах мозга — лобной коре, он назвал вслед за Лурия областью культурного и социального внимания. Внимание, чувствительное к вниманию другого человека, — то, что Лурия и Выготский знали еще 60 лет назад, — впервые «увидел» фотонный счетчик. С лекции Познера коллеги расходились молча. На конгрессе в Монреале в 1996 году число докладов, использовавших функциональное картирование мозга, увеличилось до 18, и именно они оказались в центре внимания. На двух последних, к моменту написания этих строк, конгрессах (Стокгольм, июль 2000; Пекин, август 2004) таких сообщений было свыше 300. Иногда кажется, что уже и дипломные работы невозможны сегодня в престижных университетах без использования методов мозгового картирования. Искусство нейропсихологического обследования превратилось в технологию.
Но и новейшие технологии в целом, как это ни странно, нуждаются в психологической науке. Почему, несмотря на использование дорогостоящих и всепроникающих методов, подобных ядерному магнитному резонансу, в медицине сохраняется столь высокий процент ошибочных диагнозов? Дело в том, что любое сложное изображение по-разному воспринимается разными людьми. До тех пор, пока не удастся сделать видимым субъективное восприятие, интерпретация этих изображений останется зависящей от индивидуального опыта и ошибок конкретного специалиста. Точно так же, почему автоматизация в авиации и промышленности увеличивает долю ошибок человека? Потому, что существующие автоматические системы аутистичны. Они не понимают человека и не принимают в расчет его знания, намерения и состояния. Но помощь не к месту — когда мы и сами знаем, что нужно делать, — хуже отсутствия таковой. Массовым технологиям 21-го века предстоит научиться моделировать психическое состояние пользователя — определять направленность и качество его внимания, содержание восприятия и текущие намерения. И научить их этому могут лишь подготовленные для решения таких задач психологи.
Наше восприятие внешнего мира определяется работой двух надстраивающихся друг над другом нейрофизиологических систем. Одна, примитивная, развита уже у пресмыкающихся. Этот «рептильный мозг» отвечает за грубую пространственную локализацию объектов и территориальное поведение (а равно, судя по всему, за маленькие и большие 21
территориальные конфликты). Другая система, развитая в полной мере лишь у млекопитающих, обеспечивает внимательную идентификацию объектов и событий. Если эта вторая система не функционирует, то можно долго и упорно смотреть на предмет и не узнавать его. Известный американский нейропсихолог и последователь Лурия Оливер Закс описал примеры этого несколько лет назад в книге о «человеке, спутавшем свою жену со шляпой».
Колебания баланса этих двух основных систем восприятия и внимания происходят и при их нормальной работе, например, при чтении или при управлении автомобилем. В последнем случае это может иметь самые серьезные последствия. Существенно, что фазы общей пространственной ориентировки и, соответственно, внимательной идентификации событий удается определять по картине движений глаз, с помощью исключительно быстрой видеорегистрации поведения. Иными словами, можно определить, когда водитель будет путать красный свет с зеленым, а переходящего дорогу пешехода — с тенью от стоящего на обочине дерева. Видимо, именно данные о текущих параметрах движений глаз, а не результаты мозгового картирования будут в первую очередь использоваться для адаптивной автоматизации функционирования техники на транспорте, в промышленности и в быту.
Моя работа связана с 1994 года с кафедрой прикладных когнитивных исследований Дрезденского технического университета, где психология ведет начало с Карла и Шарлотты Бюлер (с ними Лурия был близко знаком в молодые годы). По соседству в Лейпциге возникли крупнейшие центры когнитивной нейропсихологии и эволюционной антропологии. В 1996 году на всемирном конгрессе по взаимодействию человека и компьютера в Ванкувере я прочитал вечернюю лекцию о технологиях, чувствительных к вниманию человека. Сегодня это становится .общезначимой проблемой и задачей прикладных исследований. Относительно недорогие варианты мозгового картирования планируется использовать для диагностики текущей работоспособности летчиков. Ряд автомобильных фирм работает над системами адаптивной поддержки водителя, основанными на этих идеях, а Европейское сообщество планирует многолетнюю программу поддержки работ по адаптивной автоматизации. В каком-то смысле это развитие представляет собой продолжение классических исследований Лурия и Выготского, показавших 70 лет назад, что объединение ресурсов внимания является предпосылкой совместной деятельности ребенка и взрослого. Просто задача состоит теперь в социализации «внимания» наших технических помощников.
Лурия был глубоко прав, когда предсказывал радикальное изменение статуса и характера работы психолога к началу 21-го века. Ни одна дисциплина не пользуется такой популярностью у студентов лучших университетов мира, как психология. Центральный вопрос, однако, со-22 стоит в том, как можно создать или воссоздать луриевскую атмосферу.
В принципе, здесь ничего не нужно придумывать заново. Очень хорошо, что вселенная, кажется, больше нигде не «заколочена досками», но этого еще недостаточно. Самое главное, чтобы молодежь попадала в хорошие руки. Это прежде всего означает, что она должна иметь возможность получать информацию от первых лиц — в живом общении, а не только из хрестоматий. Какое досадное недоразумение, что в МГУ до сих пор нет Луриевского семинара. Любой зарубежный коллега считал бы честью хотя бы раз в жизни выступить на подобном форуме. Так и только так привлекают лучших докладчиков Эббингаузовская империя и существующий с середины 1990-х годов Бюлеровский коллоквиум Дрезденского университета.
Сегодня, как и 30 лет назад, в каждой специальной области исследований подлинных точек роста не так уж и много, примерно столько же, сколько выделил Лурия тогда, в парке Боткинской больницы. Ясно, что включиться в эту работу никогда не поздно. Один из моих коллег и соавтор по нескольким публикациям большую часть жизни был профессиональным военным, полковником голландской армии, пока не был вдруг замечен на антивоенной демонстрации и срочно отправлен натовским начальством в отставку. В возрасте 40 лет он пошел учиться психологии в университет на первый курс (как когда-то Лурия пошел учиться на медицинский факультет) и постепенно стал одним из наиболее уважаемых во всем мире экспертов.
Никогда не поздно начать работать профессионально и попытаться вернуть утраченные за десятилетия глухого провинциализма (а часто — словами Лурия — и откровенной халтуры) позиции в постоянно обновляющемся междисциплинарном и международном разделении труда. Место российской психологии находится там, где его всегда видел А.Р. Лурия — среди передовых научных сообществ, которые уже свыше 100 лет определяют пути развития этой дисциплины, открывая все новые области ее практического применения. Мне кажется, что когнитивная наука как раз и является наиболее удобной на сегодняшний день платформой для такого междисциплинарного диалога. Этому развитию, направленному на преодоление искусственных барьеров между дисциплинами и между географическими регионами, просто нет никакой разумной альтернативы. Если, конечно, наш «рептильный» мозг не окажется в конце концов сильнее тонкого слоя нейронов переднелоб-ных структур коры. Надеюсь, Александр Романович имел в виду что-то другое, когда сказал при последней встрече, что Дарвин ошибался.
23
1
истоки когнитивной
НАУКИ
Структура главы:
1.1 Основные философские традиции
Культ механического естествознания
Эмпиризм и рационализм
Критика самонаблюдения и чистого разума
1.2 Ранняя экспериментальная психология
Первые методические подходы
Вильгельм Вундт и основание психологии
Первый кризис научной психологии
1.3 Поведенческие и физикалистские направления
Психология как наука о поведении
и физических гештальтахОпыт галилеевской перестройки психологии
Второй кризис научной психологии
1.4 Европейский идеал романтической науки
Романтизм как антитезис позитивизму
От натурфилософии к нейропсихологии
Вклад физиологии и психологии деятельности
Хотя возникновение когнитивной науки — междисциплинарных исследований закономерностей приобретения, сохранения и использования знаний человеком является феноменом последних нескольких десятилетий, сам этот подход, несомненно, связан с существенно более ранними представлениями о природе человека. В течение примерно двух столетий, предшествовавших отделению психологии от философии, не прекращались попытки построить психологию по образцу естественно-научных дисциплин, точнее, физики и химии. Для этого были веские основания. За относительно короткий срок физикой с практически исчерпывающей полнотой были изучены законы движения материальных тел — от шара на наклонной плоскости до планет Солнечной системы. Благодаря возрожденным атомистическим представлениям удалось установить химический состав воды, воздуха и других веществ. Возникли стройные математические теории, объяснявшие множество различных, иногда казавшихся мистическими явлений, таких как магнитные свойства железа или вспышка молнии. Почти в то же время, когда Вильгельм Вундт на собственные средства создавал первую в мире психологическую лабораторию, другой бывший ассистент Германа Гельмгольца — Генрих Герц — экспериментально доказал существование электромагнитных волн. Придав уравнениям электродинамики симметричную форму, он показал взаимосвязь электрических, магнитных и световых явлений, что сыграло огромную роль в понимании природы электромагнитных явлений и создании радиосвязи, телевидения и радиолокации.
Все это вместе с относительно поздним началом преобразований в биологии и общественных науках порождало веру в возможности распространения космического порядка, предполагаемого физическим редукционизмом, на движения человеческой души. Психология должна была стать «механикой представлений», «интеллектуальной физикой» или «ментальной химией». Так и не став ни первой, ни второй, ни третьей, она получила импульс движения, влияние которого прослеживается вплоть до современной когнитивной психологии. Лишь постепенно стала выявляться специфика психологии как чрезвычайно сложной науки. Эта специфика состоит в необходимости сочетания генетического, функционального и структурного подходов, то есть изучения развития, а не только структуры или функции. Оказалось, что в психологических исследованиях возможно и даже необходимо движение не только от простого к сложному, но и от сложного к простому — при условии, что сохраняется приверженность основным принципам научной методологии.
26
1.1 Основные философские традиции
1.1.1 Культ механического естествознания
Если общим признаком когнитивных течений является подчеркивание роли знания в качестве ведущего фактора, определяющего действия человека, то истоки этого подхода нужно искать в конце 16-го века — на рубеже Возрождения и Нового времени.'Именно в это время английский философ и политический деятель Фрэнсис Бэкон (1561—1626) с особой силой подчеркнул освободительную роль индивидуального опыта человека в преодолении «идолов» невежества и освященных авторитетом заблуждений. Опытное, рационально осмысленное знание — это важнейший элемент свободного человеческого действия. Давая человеку власть над природой, знание становится подлинной силой. Главным препятствием на пути построения системы опытного знания в это время оставалась средневековая схоластика, прежде всего переработанное отцами церкви учение Аристотеля (384—322 до н.э.), ставшее официальной научной доктриной католицизма. Культ природы и эстетические идеалы Возрождения нашли выражение в критике телеологизма учения Аристотеля: природа не может стремиться к совершенству, так как она есть совершенство1.
Наиболее значительным успехом нового эмпирического естествознания после открытия Коперника стала полная перестройка физического знания, осуществленная Галилео Галилеем (1564—1642). Руководствуясь принципами «Лучше найти истину в незначительных вещах, чем долго спорить о величайших вопросах, не достигая никакой истины» и «Измеряй всё, что измеримо, а что неизмеримо, делай измеримым», Галилей отверг аристотелевский перцептивно-натуралистический подход к описанию природы и фактически вернулся к атомизму Демокрита. В построенной им физической картине мира не нашлось места таким сенсорно-перцептивным качествам, как цвет, запахи, вкус и звук. Телеологическая направленность духа («энтелехии») на самовоплощение, составлявшая основу взглядов Аристотеля, была заменена всеобщей механической причинностью, а казавшиеся качественно различными виды движений (тяжелые тела стремятся вниз, легкие — вверх; движение земных тел хаотично, небесных — упорядочено и т.д.) были сведены к немногим математическим формулам, типа уравнения свободного падения. Это позволило Галилею в «Диалогах о двух основных системах мироздания» проанализировать и
1 Борьба со схоластической интерпретацией учения Аристотеля была важным эпизо
дом в истории науки и философии. Накал страстей в процессе этой борьбы сегодня труд
но представить. В 16-м веке в Сорбонне была даже защищена диссертация под названием
«Все, сказанное Аристотелем, ложно». Ее автор — Пьер де ла Раме — дал первый набро
сок иерархических семантических сетей, играющих важную роль в современных иссле
дованиях памяти и речи (см. 2.2.3 и 6.2.1). Он был убит своими идеологическими оппо
нентами на третий день после Варфоломеевской ночи. 27
снять ряд возражений против гелиоцентрической теории Коперника (см. 6.4.4 и 8.3.2).
Так сформировалась абстрактно-математическая перспектива гомогенного и гармонического описания природы. Важнейшей претеоре-тической метафорой этого подхода стала красота и внутренняя урав--новешенность, геометрически выражающаяся в симметрии. Хорошо известно, например, что законы движения планет Кеплера были побочным результатом его попыток создать учение о гармонии «музыки сфер» (искомые сферы, впрочем, оказались эллипсами). Первоначально эти астрономические законы даже были выражены в форме нотной записи. Уже в 20-м веке о значении подобной эстетической эвристики в естествознании хорошо сказал швейцарский математик Герман Вейль. «Симметрия является той идеей, посредством которой человек на протяжении веков пытался постичь и создать порядок, красоту и совершенство... Насколько я могу судить, все априорные утверждения физики имеют своим источником симметрию» (Вейль, 1968, с. 17 и 144). Наиболее универсальная формулировка эстетической эвристики принадлежит Нобелевскому лауреату по физике, американцу Ричарду Фейнману, по мнению которого «Истину можно узнать по ее красоте» (You can recognize truth by its beauty).
Благодаря Галилею, основным орудием научного познания впервые стал эксперимент — метод исследования, позволяющий проверять предположения о причинной связи явлений. Его также часто называют гипотетико-дедуктивным методом, поскольку любое утверждение (даже из самых авторитетных, допустим, церковных источников) первоначально считается гипотезой, а не принимается просто на веру. Некоторое утверждение считается истинным только тогда, когда эмпирически, то есть путем наблюдения в более или менее контролируемых условиях, подтверждаются следствия, выводимые из него путем логических — дедуктивных — умозаключений. Свою законченную, классическую форму механистическое описание мира приобрело в работах великого английского физика Исаака Ньютона (1643—1727), родившегося через год после смерти Галилея. Им же была дана близкая к современной трактовка эксперимента.
Подобно Бэкону, в господстве человека над природой видел цель науки один из основателей философии Нового времени Рене Декарт (1596—1650). Он оказал огромное влияние на современников и потомков своей убежденностью в том, что природа полностью объяснима законами математической механики и все физические, химические и физиологические (как мы бы сказали сегодня) процессы могут быть сведены к машинным моделям, типа модели рефлекторной дуги (рис. 1.1). Философия Декарта последовательно дуалистична, пассивная протяженная материя (Res extenso) и активная, но бестелесная мысль (Res cogitans) фигурируют в ней в качестве двух самостоятельных и одинаково реальных субстанций, объединенных третьей — Божеством. В то вре-28 мя как чисто механические законы управляют движениями предметов,
тела и, отчасти, страстями души (то есть эмоциями и аффектами), мышление человека является творческим и рациональным, соответствующим законам логики и математики. Подчиняющийся действию законов механики материальный мир может быть познан нами до конца, поскольку основу нашего мышления составляет врожденное понимание — интуиция — математических понятий и аксиом.
Стремясь найти конечные, «прочные как скалы» основания для всякого знания, Декарт приходит к знаменитому аргументу cogito ergo sum — можно усомниться абсолютно во всем, но при этом, по крайней мере, сама сомневающаяся мысль существует. За двенадцать столетий до Декарта к той же идее самоочевидности индивидуального сознания пришел крупнейший христианский теолог и философ Августин Аврелий (Блаженный Августин, 354—430), считавший первичным и непосредственно данным человеку лишь его рефлексивное знание о знании (scio me scire — «Я знаю, что я знаю»). Наряду с математической интуицией врожденными в этой концепции оказались идеи «Я» и Бога. Официальной доктрине церкви вполне отвечало и осторожное моральное учение воспитанного
29
иезуитами Декарта. В конфликтах между критическим разумом и страстями, приковывающими человека к материальному миру, человек должен стремиться обрести мир в своей душе. Для этого необходимо победить себя, а не судьбу, изменить свои желания, а не порядок вещей.
Тезис о независимости мысли и материи был навеян галилеевским принципом сохранения количества движения и объективно расчищал дорогу для строго научного объяснения физико-химических процессов. Вместе с тем влияние принимаемых нами сознательно и, по всей видимости, совершенно свободно решений на движения нашего тела создавало определенные трудности для подобной концепции. Надо сказать, что проблемы с научным (нейрофизиологическим) объяснением свободы воли сохраняются в полной мере по сегодняшний день, хотя современные авторы пытаются найти более экспериментальные подходы к анализу этого вопроса (см. 4.4.3 и 9.1.3). Подчеркивая дуализм духа и материи, сам Декарт все-таки допускал возможность их слабого взаимодействия, в форме изменения не количества, а лишь направления материального движения2. Последователи Декарта, однако, вскоре отвергли и эту возможность, так как изменение направления меняет ускорение, а следовательно, и общее «количество движения». Физическое и психическое надолго стали рассматривать как непересекающиеся, параллельные миры. Для пояснения принципа параллелизма при этом часто использовалась метафора часов: однажды заведенные и достаточно точные часы могут очень синхронно фиксировать одни и те же события, создавая видимость причинно-следственной связи, хотя механизмы часов будут оставаться при этом полностью независимыми друг от друга.
Знание о материальном мире и о других людях, таким образом, начинается с интуиции собственного существования, основанной на идее мыслящего «Я». Европейское Новое время быстро становилось эпохой индивидуализма и веры во всемогущество математического доказательства. Субъективизм, логико-математический редукционизм и индивидуализм были свойственны всем философским направлениям, опиравшимся на картезианство (от латинизированного варианта имени Декарта — Cartesius). Это относилось как к тем, главным образом, континентальным авторам, которые попытались развить рационалистические моменты учения Декарта, так и к представителям философии британского эмпиризма. Для последнего — особенно в варианте так называемого сенсуализма — было характерно признание чувственного, или сенсорного опыта единственным источником наших знаний о мире. Считалось, что всякое знание может быть либо непосредственно представлено как описание этого сенсорного опыта, либо в конце концов логически сведено к нему.
2 Местом такого взаимодействия души и тела Декарт, самостоятельно проводивший
анатомические наблюдения, считал единственный непарный орган головного мозга —
шишковидную железу (эпифез, или corpus pineale). Эта структура, согласно современным
30 данным, участвует в регуляции циклов сна и бодрствования.
1.1.2 Эмпиризм и рационализм
Наиболее видным продолжателем и интерпретатором Декарта стал выдающийся исследователь законов аффективной жизни Бенедикт (Ба-рух) Спиноза (1632—1677). Его концепция представляет собой попытку синтеза основных понятий картезианской философии, выполненную «геометрическим методом», то есть представленную как совокупность аксиом и выводимых из них теорем по образцу «Начал» Евклида. Основанием для синтеза послужила присутствующая у Декарта третья субстанция, Божество. Согласно Спинозе, все конечное и конкретное в мире является лишь модификациями этой единственной субстанции, называемой им Богом-природой. Она имеет атрибуты протяженности и духовности (духа), которые могут находиться в разных состояниях («модусах»). Для протяженности такими модусами являются покой и движение, а для духа — рассудок (ratio), разум (intellectus), воля, желание и аффект. Более того, каждый из модусов представлен одновременно и в сфере психического и в сфере телесного. Здесь Спиноза явно выходит за рамки картезианского представления о бестелесной мысли и о чисто машино-подобных движениях организма.
Особенно важными в концепции Спинозы оказываются аффекты. Спиноза подробно рассматривает в своих работах несколько разновидностей аффектов, такие как любовь, ненависть, ревность, удовольствие, печаль, уважение, презрение, надежда и страх. Наблюдая их телесные проявления, индивидуальная душа впервые осознает свое существование, в результате чего появляется самосознание. Кроме того, анализ аффектов служит решению задачи когнитивного обоснования этики. Спиноза определяет аффекты, в особенности отрицательные, как смутные идеи и считает их основной причиной «рабской несвободы» наших мыслей и действий. Человек становится свободным и рациональным по мере того, как он познает необходимую связь вещей, тем самым освобождаясь от аффектов. Конечные цели процессов познания и нравственного развития, таким образом, полностью совпадают — они приближают нас к отчетливому осознанию необходимого и вечного, являясь выражением нашего инстинктивного стремления к истине, или, по формулировке Спинозы, нашей интеллектуальной любви к Богу3.
3 Современники неоднократно обвиняли Спинозу в атеизме. В лекциях по истории
философии Гегель (Hegel, 1833—36/1971) подчеркивает, однако, его несомненный пан
теизм. Гегель отмечает далее вводящую в заблуждение (нем. verwirrend) терминологию, а
также сугубо формальный подход Спинозы к решению многих проблем. Так, тезис о един
стве аффекта и интеллекта доказывается Спинозой путем ссылки на введенное ранее в
качестве аксиомы объединение обоих в качестве модусов единой субстанции Бога-при
роды. Рассматривая подобные объяснительные схемы, Гегель упоминает замечание од
ного из современиков Спинозы, который иронически спрашивал, как мог единый Бог
допустить, что две его модификации — турки и австрийцы — сражаются сейчас друг с
другом в предместьях Вены. 31
Другой видный критик Декарта, основатель эмпиризма Джон Локк (1632—1704) считал, что непосредственно осознавать можно лишь отдельные сенсорные состояния («идеи»). Некоторым из них соответствует объективное содержание. Это так называемые первичные качества — движение, протяженность, телесность, форма, число, иными словами, именно те категории, которые были включены в картину мира галилеев-ско-ньютоновской физики. Другие категории, подобно цвету, звукам, запахам, являются субъективными. Хотя эти вторичные качества и вызываются воздействием внешних раздражителей на наши органы чувств, в мире им ничего прямо не соответствует. Физическое и психическое выступают у Локка не как две самостоятельные субстанции, а как две формы нашего сознательного опыта — внешняя (ощущения) и внутренняя (рефлексия). В этой схеме не оставалось места ни для чего внеопытного, априорного. Поэтому Локк подверг критике картезианское утверждение о существовании интуиции и врожденных идей: «В интеллекте нет ничего, чего не было бы ранее в наших ощущениях».
Взамен врожденного знания Декарта им были предложены законы образования сложных идей из простых ощущений. Этими законами Локк считает упоминавшиеся уже Аристотелем законы ассоциаций ощущений по близости в пространстве и времени, а также по внешнему сходству. В вопросе о роли ассоциаций Локк полностью следует взглядам своего предшественника, английского политического философа 17-го века, сторонника механистического детерминизма Томаса Гоббса (1588—1679). Таким образом, двумя британскими авторами, Гоббсом и Локком, было положено начало длительной истории ассоцианизма в философии и психологии Нового времени (см. 1.2.2 и 1.3.3). К числу формирующихся на основании чувственного индивидуального опыта сложных идей были отнесены, прежде всего, центральные для процессов познания идеи причинно-следственных отношений. Под влиянием жизненных обстоятельств, по мнению Локка, формируются и идеи нравственности. Эта концепция этической относительности (нравственного релятивизма) была навеяна первыми этнографическими описаниями нравов «дикарей», разительно отличавшихся от правил поведения жителей пуританской Англии. В правилах нравственности, следовательно, нет ничего абсолютного — какая среда, такая и мораль.
Локковская «психология без души» повлияла на представителя механистического материализма, англичанина Д. Гартли (1705—1757), а также на французских просветителей 18-го века и на Э. Кондильяка (1715—1780) — французского переводчика Локка. Работы Кондильяка особенно интересны обсуждением проблемы возможного управляющего воздействия языка на наше мышление (она была названа позднее проблемой лингвистической относительности — см. 8.1.2). Согласно его «всеобщей теории знаков», ощущения есть знаки вещей и задача мышления состоит в непротиворечивом соединении таких знаков. Наиболее 32 универсальным средством мысленного расчленения явлений и соеди-
нения их элементов в новые образования служит звуковая речь. Это средство постоянно доступно нам благодаря легкости артикуляции слов и их устойчивой ассоциации с представлениями. Для тех же целей управления познавательной активностью используются и другие системы знаков, такие как язык жестов или, например, математическое исчисление бесконечно малых величин.
На идеалистическом фланге учение Локка было развито его соотечественниками Джорджем Беркли (1685—1753) и Дэвидом Юмом (1711— 1776). Как Беркли, так и Юм подчеркивали роль страстей и эмоций, независимо выступив с такой же критикой гиперрационализма Декарта, с какой ранее выступил Спиноза. Субъективный идеализм епископа (ирландца по рождению) Беркли выразился в приравнивании мира к совокупности идей индивида — он отрицал реальное существование не только вторичных, но и первичных качеств4. Агностик Юм отказывался даже рассматривать вопрос о существовании объективной реальности. Его «методологический солипсизм» оказал в дальнейшем непосредственное влияние на представителей «философии естествознания» (позитивизма и неопозитивизма — см. 1.1.3 и 3.3.2), а через них и на психологию. Примером является недавний призыв американского философа и психолингвиста Джерри А. Фодора (Fodor, 1980) сделать методологический солипсизм главной стратегией исследований в когнитивной науке (см. 9.2.2).
В одной из своих главных работ «Исследование о человеческом познании» Юм хотя и следует философской линии Бэкона и Локка, но при этом подчеркивает не столько силу, сколько ограниченность знаний человека. В первом разделе он пишет: «Философы другого рода считают человека скорее разумным, чем действующим существом... Они видят в природе человека предмет спекулятивных размышлений и, точнейшим образом, проверяя эти размышления, устанавливают те принципы, которые управляют нашим познанием, возбуждают наши чувства и заставляют нас одобрять или порицать определенный объект, поступок или образ действий» (Юм, 1966, т. 2, с. 8). Причисляя себя к этой группе философов, Юм продолжает: «...довольно значительную часть науки составляет рас-
4 Кондильяк писал, что воззрения Беркли, конечно, безумны, но ни одна философс
кая система так не сложна для опровержения, как его. Опираясь на работы политическо
го деятеля 19-го века Фридриха Энгельса, объективность как первичных, так и вторич
ных качеств отмечал С.Л. Рубинштейн (1889—1960). С его точки зрения, выявляемые во
взаимодействии предметов первичные качества не более реальны, чем вторичные, ко
торые выявляются во взаимодействии человека с предметным миром (Рубинштейн, 1957,
с. 58—59). Попытки доказательства объективности не только сенсорных качеств, но и зна
чений предпринимались и другими авторами: гештальтпсихологами (см. 1.3.1), А.Н. Ле
онтьевым (см. 3.3.3), Дж.Дж. Гибсоном (см. 9.3.1), а в последнее время также приматоло
гом и психолингвистом М. Томаселло (Tomasello, 1999a). Общим подходом к этой про
блеме является гипотеза трех миров философа Карла Поппера (2002; Popper, 1984). Он
пЪдчеркнул сосуществование мира физических объектов, мира психических состояний и
мира культуры, призвав к изучению связывающих их отношений. 33
познавание различных операции духа, их отделение друг от друга, подведение под соответствующие рубрики и устранение того кажущегося беспорядка и запутанности, в которых они находятся, когда предстают в качестве объектов размышления и исследования» (Юм, 1966, т. 2, с. 16).
Последовательное рассмотрение законов внутренней жизни идей натолкнуло Юма на фундаментальную проблему, которой современные авторы предлагают присвоить его имя (см. 2.2.1 и 9.1.3). В своем внутреннем опыте каждый из нас легко находит образы предметов. Если органы чувств постоянно поставляют нам красочные картинки, то должен быть и наблюдатель — маленький человечек в голове, или гомункулус, который эти картинки рассматривает. Но (и в этом состоит «проблема Юма») как тогда объяснить восприятие гомункулуса? Постулировав гомункулуса второго порядка? Совершенно аналогично, если понимание предложения, как считал еще Августин, предполагает его перевод на некоторый универсальный «язык мысли», то как может быть понят сам этот внутренний язык (lingua mentalis — см. 9.2.1)? Проблемы возникли и с понятием души, которую Аристотель определял как «первичную энтелехию». Ведь если душа приводит наше тело в движение, то она должна иметь для этого соответствующие органы, и все тот же, по сути дела, вопрос состоит в том, как (с помощью каких органов второго и более высоких порядков) инициируются движения этих гипотетических органов души.
Отчетливо сознавая, что во всех этих рассуждениях возникает опасность бесконечного регресса, Юм попытался описать впечатления и идеи вне какой-либо связи с активностью «Я». Результатом оказалась строго механистическая теория субъекта, понимаемого как совокупность атомарных ощущений («идей»), взаимоотношения которых полностью задаются формальными законами ассоциаций по близости (во времени и в пространстве) и по внешнему, перцептивному сходству.
В рационализме вершиной индивидуализма стала монадология Г.В. Лейбница (1646—1716). Согласно этой философской концепции, реальный мир состоит не из одной, как у Гоббса и Спинозы, и не из двух, как у Декарта, а из бесчисленного количества автономных и психически деятельных субстанций, или монад. Сам этот термин использовался уже пифагорейской школой древнегреческой философии, но содержательным прообразом монад стали простейшие организмы, наблюдавшиеся Лейбницем с помощью одного из первых микроскопов. То, что на поверхности кажется нам единым телом, в действительности есть совокупность множества монад. Каждая монада содержит в себе фрагменты знаний об истории и, отчасти, о будущем мира, который независимо от этого знания непрерывно развертывается во времени по изначально заданной программе. Эта программа, или «предустановленная Богом гармония», определяет и отношения монад между собой. Монады отличаются рядом особенностей, например, минералы и растения представляют собой как бы спящие монады с бессознательными пред-
ставлениями, тогда как монады, образующие животных, могут быть способны к ощущениям и памяти5. Монады отличаются также перспективой, под которой им открывается история мира, и отсутствием различения деталей — когда другие монады удаляются настолько, что скрываются из вида. Фактически это индивиды, одиноко блуждающие во Вселенной.
«Предустановленная Богом гармония» совсем не случайно напоминает множество однажды заведенных часовых механизмов. Речь идет все о той же картезианской проблеме свободы воли (см. 1.1.1 и 4.4.3). Намеченный Лейбницем подход к объяснению произвольных движений постулирует иерархическую организацию монад, образующих человеческое тело. В верхней части такой иерархии расположены монады, способные к относительно более отчетливому восприятию себя и Вселенной. Одна из них занимает при этом абсолютно главенствующее положение, репрезентируя то, что можно было бы назвать «душой человека». Предполагается, что эта монада способна к особенно ясному восприятию (апперцепции) и самовосприятию (интроспекции). Именно в ее интересах в норме и происходят разнообразные движения тела. Иными словами, когда рука движется, выполняя некоторое волевое действие, то цель производимого рукой движения в общем случае соответствует целям и точке зрения главенствующей монады («души»), а не возможным локальным целям и ограниченному полю зрения («малым перцепциям») любой из многочисленных монад, составляющих руку или тело. В этом и только в этом смысле, по мнению Лейбница, допустимо говорить о произвольности движений тела и даже о свободе воли вообще (см. 9.1.3).
С рационалистических позиций Лейбниц критически оценил сенсуализм своего главного оппонента Локка: «Нет ничего в интеллекте, чего не было бы раньше в наших ощущениях — кроме самого интеллекта^. Великий математик и логик, Лейбниц ввел в употребление ряд центральных понятий будущей когнитивной науки, такие как «алгоритм», «изоморфизм» и «модель». Следуя более ранним соображениям Томаса Гоббса, он последовательно развивает мысль о машинном моделировании мышления человека: если бы удалось присвоить каждой простой мысли некоторое число, то при возникновении научных и житейских споров всегда можно было бы попытаться найти рациональное решение с помощью математических вычислений, опирающихся на за-
5 Нейрокогнитивные и модулярные подходы последних двух дсятилетий обнаружива
ют некоторое сходство с этой глобальной концепцией мозаичной огранизации мира (см.
2.3.2 и 9.1.3). Более гого, в современной науке некоторые акторы готовы идти дальше
Лейбница, доказывая, например, существование примитивных форм памяти и интеллек
та у растений (Trewavas, 2003).
6 Карл Поппер (Popper, 1984) считает, что впервые обмен именно этими аргументами
состоялся более чем за два тысячелетия до Локка и Лейбница — между древнегреческими
философами Протагором и Парменидом. 35
коны логики. В письме к одному из потенциальных спонсоров, принцу Евгению Савойскому, Лейбниц пишет, что такой универсальный вычислительный аппарат («Универсальная Характеристика») мог бы быть создан при условии достаточного финансирования «группой способных людей» за какие-нибудь «5 лет». Надо сказать, что, будучи не только философом, но и известным юристом, Лейбниц на этом поприще прекрасно владел искусством возможного, подчеркивая необходимость компромиссов, разумность которых часто имела мало общего с рациональностью математических выкладок (см. 8.4.1).
Таким образом, оба философских лагеря — рационалисты и эмпи-рицисты — обнаружили в своих работах одинаковое стремление к формально-редукционистскому объяснению феноменов индивидуального сознания. Это вполне соответствовало духу времени. Его ярко выразил типичный представитель научного мировоззрения 18-го столетия, французский математик и механик Пьер Симон Лаплас, считавший принципиально возможным выразить все совершающееся в мировом порядке одной всеобъемлющей математической формулой. Он же последовательно критиковал представление о свободе воли: зная исходное состояние Вселенной и используя одни лишь законы ньютоновской механики, можно с любой степенью точности предсказать ее состояние в некоторый будущий момент времени. Конечно, этот подход явно не благоприятствовал возникновению научной психологии. Из трех постулатов кар-тезианско-локковской традиции — индивидуализма, математического редукционизма и интроспекционизма — критике стал первоначально подвергаться третий, видимо, как наименее существенный для традиции в целом7.
1.1.3 Критика самонаблюдения и чистого разума
Рационализм начал критику валидное™ интроспекции (или самонаблюдения) как научного метода значительно раньше, чем эмпиризм. Спиноза с материалистических, а Лейбниц с идеалистических позиций выступили против использования интроспекции как единственного источника данных в научных исследованиях. Спиноза в своем учении об аффектах прямо подошел к мысли о необходимости их объективного изучения, ведь люди «свои действия осознают, а причин, которыми они определяются, не знают» (Спиноза, 1957, с. 460). Для Лейбница критика интроспекции была связана с различением способности одних монад только к самому общему, нерефлексивному восприятию внешнего мира — перцепции, а других, сравнительно малочисленных, также к
7 Веру в то, что интроспекция непосредственно дает субъекту знания о его психичес
ких состояниях, современный историк науки М. де Мэй назвал недавно «концепцией
белого ящика» — по контрасту с понятием «черный ящик», введенным кибернетикой в
36 середине 20-го века.
внимательному и детальному самосознанию — апперцепции. По его мнению, распространенное убеждение в том, что в душе имеются только такие восприятия, которые она осознает, является величайшим источником заблуждений.
Проблема метода и самой возможности психологии как эмпирической науки с особой остротой была поставлена немецким философом Иммануилом Кантом (1724—1804). Он попытался синтезировать методологический скептицизм Юма в отношении познаваемости мира и картезианскую веру в существование отличного от физического мира бестелесного разума. Результатом стала сложная трехуровневая система, включающая чувственность (die Sinnlichkeit), рассудок (das Verstand) и разум (der Vernunft). Последний способен преодолевать «трансцендентальный барьер» между явлением и сущностью («вещью в себе»), но только в теоретическом плане, что обязательно придает основанной на рефлексивном сознании (самосознании) познавательной деятельности гипотетический характер. Еще проблематичнее оказывается оценка результатов чувственного познания. Компонентами всякого акта восприятия являются чувственный (сенсорный) опыт и априорные категории (формы) нашего рассудка, такие как пространство и время. Проблема состоит в том, что эти компоненты не существуют друг без друга, поэтому самонаблюдение позволяет осознать лишь некоторую интегральную, далее нерасчленяемую амальгаму обоих (см. 8.4.3). При самонаблюдении также отсутствует должная дистанция между исследователем и объектом его исследования. Разумеется, все это накладывает принципиальные ограничения на возможность использования самонаблюдения в качестве научного метода.
В предисловии к «Метафизическим началам естествознания» Кант пишет, что «эмпирическое учение о душе» (так он называет будущую психологию) никогда не сможет сравниться по своему научному статусу с естествознанием, «потому что к феноменам внутреннего опыта (der innere Sinn) и его законам неприменима математика, ибо тогда пришлось бы объявить лишь о законе непрерывности потока внутренних изменений... Ведь чистое самонаблюдение, в котором должны конструироваться явления души, есть время, которое имеет только одно измерение. Точно так же самонаблюдение никогда не приблизится к химии и в качестве аналитического метода, или экспериментирования, так как при самонаблюдении наблюдаемое получает лишь кажущееся расчленение, которое нельзя удержать и по желанию повторить. Еще менее можно заставить другого мыслящего субъекта подчиниться намерениям нашего опыта. К тому же всякое самонаблюдение меняет и искажает состояние наблюдаемого» (цит. по: Кант, 1964—1966, т. 6, с. 60).
Критикуя самонаблюдение, Кант, однако, не отверг полностью возможность психологических исследований. Он проанализировал проблему связи мотивации с познанием и действием, а также указал в своих работах по антропологии перспективу неинтроспекционистской мето- 37
дологии, связанной с изучением продуктов деятельности человека — прежде всего, в области языка. Им же — вслед за Аристотелем — были описаны некоторые глобальные операции нашего рассудка, такие как СРАВНЕНИЕ. Наконец, в «Критике чистого разума» Кант вводит понятие «схема», оказавшееся впоследствии одним из основных теоретических понятий когнитивных исследований (см. 2.2.2 и 6.3.1). Под схемой он понимал обобщенный формат представления знаний и одновременно правила творческого (продуктивного) воображения, позволяющие рассудку в процессе познания накладывать категории на непрерывно меняющиеся чувственные данные, а также восстанавливать эти данные в отсутствие предмета8.
Говоря о значении работ Канта, надо отметить, что с течением времени центральной для него стала проблема специфики осознания нравственных принципов по сравнению с научным познанием законов природы. Большое влияние на него оказали при этом работы двух франкоязычных авторов — Вольтера (1694—1778) и в особенности Жан Жака Руссо (1712—1778). Разочарование в нравственном состоянии общества, чрезвычайно низком, несмотря на весь научный прогресс века Просвещения (или, может быть, как раз вследствие этого прогресса), заставило их обратиться к поиску истоков морали, отличных от знаний и религиозных предписаний. В характерной для рационализма манере Кант в этом вопросе выступил против взглядов Локка — его концепции этической относительности (см. 1.1.2). По Канту, законы морали абсолютны, несводимы к индивидуальному эмпирическому опыту. В отличие от знания природных закономерностей, которое всегда остается неполным, более или менее гипотетическим, моральные суждения выступают в качестве категорического императива, или безусловных (хотя и далеко не всегда выполняемых) требований человека к самому себе.
Исключительно важную роль в общей концепции Канта играет введенное им в «Критике чистого разума» и развитое затем в других работах различение теоретического (трансцендентального) и практического (или эмпирического) разума. Теоретический разум пытается ответить, прежде всего, на главный вопрос теории познания «Что я могу знать?». Практический разум первичен по отношению к теоретическому и необходим нам для ответов на вопросы с выраженной нравственной составляющей — « Что я должен делать?» и «На что я могу надеяться?». В сфере практического разума Кант полностью восстанавливает в правах аристотелевскую категорию цели. Распространив свой крити-
8 Вполне современно выглядит следующее его определение: «Понятие "собака" обо
значает правило, по которому мое воображение может нарисовать четвероногое живот
ное в общем виде, не будучи ограниченным каким-либо единичным, частичным обли
ком, заданным мне в опыте, или каким бы то ни было возможным образом in concrete»
(Кант, 1964—1966, т. 3, с. 223). Интерпретация этой идеи Канта обсуждается нами в ттос-
38 ледуюших главах (см. 7.3.2 и 8.1.3).
ческий анализ на эту сферу, Кант дает положительный ответ и на вопрос о свободе воли, но ответ не научный или теологический, а сугубо этический. Венцом философии рационализма оказывается не абстрактно-математическое ratio Декарта, а совесть каждого из нас.
Действительно, подлинно нравственные поступки не могут быть навязаны нам извне или же преследовать, сколь угодно опосредованно, утилитарные цели, даже такие возвышенные, как благополучие человечества. Во-первых, и это самое главное, подобная внешняя детерминация ставит под сомнение самостоятельность принимаемых человеком решений, а следовательно, ответственность и достоинство его личности. Во-вторых, обоснование морали стремлением к благополучию наталкивается на эмпирическое противоречие. Как пишет один из видных исследователей Канта: «По крайней мере, для отдельного индивидуума изо всех средств достижения благополучия моральность является самым неверным. Если бы природа предназначала нас для благополучия, она не смогла бы сделать ничего неразумнее, как вложить в человека... сохранение моральной обязанности, которое всегда будет становиться ему поперек дороги» (Виндельбанд, 2000, т. 2, с. 129). Поэтому личная свобода и достоинство для Канта — два главных условия нравственности. В наших действиях и поступках всегда должна присутствовать свобода выбора — поступил так, но мог поступить и иначе (см. 9.4.1).
Через несколько десятилетий после смерти Канта отрицательную позицию по вопросу о возможности построения психологии как науки о феноменах сознания занял и Огюст Конт, основатель позитивизма. Это направление европейской философии второй половины 19-го века было специально разработано в качестве методологии опытного, эмпирического естествознания. По своим основным положениям позитивизм тяготел к эмпиризму, с характерной релятивистской трактовкой проблем этики и морали. Отмечая в одной из своих работ «огромные научные успехи», которых добилось «со времен Фрэнсиса Бэкона» основанное на экспериментальном методе и объективных, проводящихся из внешней позиции наблюдений естествознание, Конт затем обрушивается на интроспективную психологию: «Результаты отвечают исходным предпосылкам. В течение двух тысячелетий метафизики пытаются развивать психологию, и все же до сих пор они не смогли договориться ни об одном утверждении. И сейчас они расколоты на школы, которые заняты спорами о самых первых элементах своих учений. Пресловутое самонаблюдение порождает практически столько же разноречивых мнений, сколько есть людей, верящих в то, что они им занимаются» (Конт, 1900, с. 17).
39
1.2 Ранняя экспериментальная психология
1.2.1 Первые методические подходы
В этой критической атмосфере физиком и физиологом Германом Людвигом Фердинандом фон Гельмгольцем (1821 — 1894), философом и математиком Густавом Теодором Фехнером (1801 — 1887) и относительно менее известным голландским офтальмологом Францем Корнелисом Дондерсом (1818—1889) был сделан решающий шаг на пути к созданию экспериментальной психологии9.
В 1850 году Гельмгольц, раздражая в двух точках нервное волокно лягушки (а затем и человека) и сравнивая время мышечного сокращения, определил скорость распространения нервного возбуждения, которую его учитель, физиолог Иоханнес Мюллер10 объявил незадолго до этого равной или даже превосходящей скорость света. Она оказалась не такой уж большой — около 50 м/с. Фехнер создал основы психофизики, описав два ее раздела: внешнюю (измерение ощущений в терминах параметров физических раздражителей) и внутреннюю психофизику (не реализованную самим Фехнером идею измерения отношений между психическими и физиологическими процессами — см. 1.3.1, 5.3.1 и 6.3.1). Что касается Дондерса, то он, использовав схему хронометрических опытов Гельмгольца, разработал общий методический прием — метод вычитания, с помощью которого попытался измерить длительность исключительно быстрых, интроспективно не наблюдаемых психических процессов.
Логика метода Дондерса очень проста. Если время от подачи раздражителя до реакции испытуемого состоит из последовательности событий, в том числе последовательности некоторых ментальных (то есть психических, но не обязательно осознанных) процессов, то можно определить их продолжительность, разработав серию задач, в которой ре-
9 Мы не ставим своей целью реконструкцию истории психологии, для чего потребо
вался бы значительно более детальный анализ вклада как упомянутых, так и множества
не упомянутых в этой книге действующих лиц. Речь идет лишь о сравнительной истории
двух-трех идей, существенных для когнитивной науки. То, что, с точки зрения историо
графии психологии, можно было бы назвать «доисторическим периодом», на деле было
временем возникновения и заката целых направлений — психологии способностей, мо
ральной психофизики, френологии, философских и полуфилософских концепций пси
хики. Достаточно сказать, что первая книга под названием «История психологии» была
опубликована... в 1808 году. Она содержала обзор более 100 работ, выполненных в преды
дущем, 18-м столетии.
10 Иоханнес Мюллер ввел в науку понятие «специфических энергий органов чувств»,
под которыми он понимал генерируемые каждой сенсорной системой качественно раз
личные ощущения. В современной философской литературе вместо этого громоздкого
выражения используется понятие «квалия» (например, Dennett, 1992), которое приобре
ло дополнительный оттенок принципиально некоммуницируемой основы индивидуаль-
40 ного сознания (см. 9.3.1).
шение каждой следующей задачи предполагает на один такой процесс больше, чем решение предыдущей. Дондерс предложил три такие задачи, обозначив их первыми буквами латинского алфавита: «А-реакция» — простая двигательная реакция (п стимулов — один ответ), «B-реак-ция» — реакция выбора (п стимулов — η ответов), «С-реакция» — реакция различения (п стимулов — два ответа). По его мнению, решение задачи «С» по сравнению с простой двигательной реакцией включает дополнительный процесс различения (категоризацию) стимулов, а решение задачи «В» — еще и процесс выбора ответа.
В 1865—1868 годах он провел опыты (Donders, 1868/69), в которых зачитывал своим испытуемым бессмысленные слоги, регистрируя время реакции в каждой из трех ситуаций. Были получены следующие средние величины:
«А» — 201 мс,
«B» = 284 мс,
«С» = 237 мс.
После этого с помощью вычитания можно было определить время, уходящее на различение стимулов и, соответственно, на выбор ответа:
«С»—«A» = 36 мс,
«В»—«С» = 47 мс.
Таким образом, время выполнения некоторой относительно элементарной ментальной операции оказалось равным примерно 1/20—1/30 секунды.
Хронометрические опыты Дондерса вызвали критику современников, главным образом, из-за недостаточной опоры на интроспективные данные, а также из-за действительно спорного допущения, что новая задача лишь добавляет или «вычитает» некоторый частный процесс, оставляя неизменными процессы, определяющие решение других задач (см. 2.2.3 и 5.1.2). Однако характерно, что ровно через 100 лет в авторитетном обзоре исследований времени реакции выбора были выделены примерно те же самые процессы, или операции, дополненные лишь вполне очевидными этапами предварительной сенсорной обработки и осуществления ответа (Smith, 1968). Кроме того, разновидность метода вычитания, с теми же в принципе нерешенными проблемами, широко используется в новейших методах трехмерного картирования работы мозговых механизмов, при так называемой нейровизуализации {brain imaging — см. 2.4.1).
Хотя все эти результаты были получены либо с помощью объективных методов, либо с помощью процедур, в которых, как в сенсорной психофизике, субъективный момент был сведен к минимуму, перехода к использованию возможностей гипотетико-дедуктивного эксперимента в изучении ментальных процессов и состояний не произошло. Одной из причин этого было влияние второй волны позитивизма, или эмпириокритицизма. Это направление философии конца 19-го века интенсивно
41
критиковалось в марксистской литературе и поэтому хорошо известно русскоязычным читателям старшего поколения под названием «махизм». Эрнст Мах был не только выдающимся физиком, но также одним из самых ярких исследователей восприятия. В классическом труде «Анализ ощущений и отношения физического к психическому» (Мах, 1886/1907) он подчеркнул непосредственную данность субъекту содержаний его сознания, считая гипотетические атомарные элементы внутреннего опыта — ощущения — общим основанием как психологии, так и физики. Вслед за Юмом (и предвосхищая взгляды некоторых современных авторов — см. 1.1.2 и 6.4.2) Мах описывает человеческое «Я» как совокупность фиксированных в памяти телесных ощущений. Что касается физического мира, то Мах сравнивал его с полотнами французских импрессионистов, где общее впечатление оказывается результатом воздействия на наблюдателя множества локальных цветовых пятен. Как заметил по поводу этой импрессионистической модели физического мира американский историк психологии Эдвин Боринг (Boring, 1929), для Маха палка, опущенная в воду, действительно искривляется, а если при этом и есть какая-то иллюзия, так это то, что она остается прямой. Махистское понятие «элемента», по мнению ряда авторов, легло в основу системы философских взглядов основателя научной психологии Вундта.
1.2.2 Вильгельм Вундт и основание психологии
Сегодня, более чем через столетие после того как бывший ассистент Гельмгольца, философ и физиолог Вильгельм Вундт (1832—1920) основал в 1879 году при Лейпцигском университете на собственные средства первую в мире психологическую лабораторию, подлинное значение его труда для современной научной психологии и междисциплинарных когнитивных исследований продолжает оставаться предметом оживленных споров. Противоречивость высказываемых мнений наводит на мысль, что идейное наследие Вундта стало чем-то вроде гигантского проективного теста, где каждый современный исследователь может увидеть практически все, что захочет". Следует также учитывать, что взгляды самого Вундта неоднократно менялись на протяжении 60 лет активной научной деятельности, причем иногда от одного издания его наиболее известного труда, «Основы физиологической психологии», к другому.
11 В литературе по истории психологии высказывается мнение, что такие интерпрета
торы и биографы Вундта, как О Кюльпе и Э.Б. Титченер, исказили взгляды своего учите
ля, придав им выраженную позитивистскую окраску Действительно, однозначности не
было даже в оценках учеников, если для одних учеников Вундт был основателем структу
рализма, то другие считали его одним из первых представителей функционализма в пси
хологии (см. 1.2.3). Выяснение истины затрудняется объемом научного наследия Вундта,
насчитывающим свыше 53 000 страниц По подсчетам еще одного ученика, американца
Стэнли Холла, это примерно в два раза превышает общий объем написанного Кантом,
42 Гегелем и Дарвином
«Психология, — писал Вундт в своей первой крупной работе, — не должна начаться там, где она вероятнее всего и закончится» (Wundt, 1862, S. XIT). Возможность психологии как самостоятельной науки гарантируется, по его мнению, тем обстоятельством, что в галилеевско-ньютоновской механистической картине мира не нашлось места для вторичных качеств объектов. Поскольку эти качества, тем не менее, существуют для нашего сознания, должна существовать и научная дисциплина, занимающаяся их разработкой. Подобно Декарту, Вундт проводит жесткое разграничение между непосредственной доступностью данных самонаблюдения и косвенным характером знания о внешних физических событиях. Использовав ряд положений эмпирицистов, в особенности английского философа, логика и экономиста Джона Стюарта Милля (1806—1873), он в еще большей степени опирался на национальную немецкую линию философского рационализма, представленную работами Лейбница (правда, без монадологии последнего).
Это влияние нашло выражение в вундтовской теории двух уровней сознания — перцепции и апперцепции, которым соответствуют два типа объединения психических элементов — ассоциативный и апперцептивный. Первый уровень относительно примитивен, на нем господствуют механические законы ассоциаций по смежности и по общему сходству. Интереснее уровень отчетливого и детального, или апперцептивного сознания. Как подчеркивает Вундт, апперцептивное объединение ощущений и эмоционально окрашенных чувствований отличается от случайных цепочек механических ассоциативных связей (Wundt, 1893—1895). Оно является результатом творческого синтеза, который сопровождается чувством волевого усилия и приводит к «переводу» апперципируемого содержания в фокальную зону внимания, или «фиксационную точку» сознания (Wundt, 1908—1911). Апперцептивные объединения элементов сознания в структурированные системы отношений подчиняются далее законам особой психологической причинности. Одним из таких законов является зависимость части от целого. Психологическая причинность трактовалась Вундтом по аналогии с химическими реакциями, также ведущими к неаддитивным результатам. Само понятие «ментальная химия» в качестве синонима психологии было введено несколько ранее Дж.С. Миллем.
Апперцептивная организация в ее понимании Вундтом похожа на то, что современные авторы называют межкатегориальной, или схематической организацией знаний (см. 6.3.1). Вундт описывает различия апперцепции и ассоциации с помощью следующего лингвистического примера (Wundt, 1893—1895, Bd. 1, S. 122—123). Ассоциативная связь (das Verhältnis) представляет собой механическую цепочку элементов А—В—С..., не имеющую определенного направления развертывания. Здесь мы имеем дело со связями двух и более изолированных понятий, причем сами эти связи не имеют значения, полностью определяясь ха-
43
рактером исходных понятий. Например, понятия «птица» и «ворона» ассоциативно связаны между собой и с более общим понятием «живое существо». Значение каждого из понятий не зависит от этих связей. Напротив, в случае выражения «птица на дереве» главное понятие — «птица» — определяется вторичным понятием — «дерево» — посредством отношения (die Beziehung) места. Из такого отношения двух понятий возникает новое понятие (новый образ). Апперцептивные отношения несводимы к ассоциативным связям. Направление движения в этих структурных образованиях задается интересами субъекта, а не механическими ассоциациями, то есть зависит от психологических причин (отсюда принцип «психологической причинности» для процессов апперцептивного уровня).
Согласно Вундту, психические процессы всегда одновременно (параллельно) разворачиваются на двух разных уровнях. Если число ассоциативных связей нижнего уровня при этом никак не ограничено, на верхнем, апперцептивном уровне одновременно могут быть представлены только две (максимум три) группы понятий. Ограниченность числа групп на верхнем уровне организации мышления Вундт связывал с пределами объема апперципируемого содержания. Точно так же современные авторы склонны объяснять ограниченностью объема внимания, или рабочей памяти, множество разнообразнейших фактов, например, то, что на каждом уровне схематического описания текста обычно встречается не более двух-трех эпизодов (см. 6.3.3).
Эти теоретические соображения были распространены Вундтом и на область надындивидуальной «психологии народов», изучение которой, по его мнению, должно было дополнить естественно-научный по методу (экспериментальная физиология) и по теоретической модели (химия) анализ индивидуального сознания. С течением времени Вундт склонен был уделять историческому анализу таких «продуктов человеческого духа», как язык и разнообразные культурные артефакты, все большее внимание, одновременно ограничивая возможности для строю контролируемого лабораторного эксперимента преимущественно простыми познавательными процессами (Wundt, 1910—1912). В области «психологии народов», как он полагал, эксперимент был невозможен, но, к счастью, и не нужен, так как там уже «проэкспери-ментировала история». Эта идея сочетания экспериментального и исторического методов, последний из которых распространялся и на сферу человеческой культуры, осталась просто непонятой в обстановке радикально индивидуалистической трактовки предмета психологии.
Для когнитивных исследований важен вклад Вундта в развитие экспериментального метода. Некоторые из возникших в его лаборатории методик не потеряли значения по сегодняшний день. Так, почти 100 лет спустя было проведено детальное повторение опытов Вундта, позволяющих оценить зависимость времени восприятия зрительных и слуховых событий от направленности внимания на одну из этих сенсорных мо-44
дальностей (Sternberg & Knoll, 1973). Типичной для многочисленных хронометрических исследований тех лет является работа М. Фридриха (Friedrich, 1883). Эта выполненная под руководством Вундта работа лег- ' ла в основу самой первой психологической диссертации в мире.
Задача состояла в изучении свойств и времени акта апперцепции. Было предположено, что он входит в качестве одного из этапов в следующую последовательность событий: «1) проведение раздражения от органа чувств к мозгу; 2) перевод в поле сознания, или перцепция; 3) перевод в фокус внимания, то есть апперцепция; 4) проведение моторного импульса к мышцам и освобождение их энергии» (Friedrich, 1883, р. 39). Определялось время простых двигательных реакций на вспышки света и реакций различения цветовых оттенков или чисел. Количество альтернативных стимулов менялось от одного до шести. Кроме самого Фридриха, в опытах участвовали еще трое испытуемых, среди них — Вундт и Стэнли Холл. Время апперцепции измерялось с помощью метода Дондерса. Для этого из времени реакции различения вычиталось время простой двигательной реакции. Продолжительность акта апперцепции (порядка 200 мс) возрастала при увеличении числа альтернатив. Кроме того, при предъявлении цифрового материала она была больше, чем при показе оттенков цвета. Результаты получили интерпретацию в духе двухуровневой теории Вундта. Рост времени апперцепции с увеличением числа альтернатив объяснялся тем, что всякое отчетливо осознаваемое содержание составляет со смутно осознаваемым материалом (альтернативными стимулами) единую структуру. Акт апперцепции также требует больше времени при увеличении сложности материала, то есть при переходе от цвета к цифрам.
Это исследование, помимо недочетов в планировании (основы планирования эксперимента были созданы английским математиком Рональдом Фишером в первой половине следующего, 20-го века), обнаруживает две характерные особенности. Во-первых, эксперимент понимается как ситуация для проведения интроспективных наблюдений. Во-вторых, он не служит еще средством целенаправленной критической проверки теоретических предположений — гипотез, хотя, конечно, уже и не сводится к их простой иллюстрации. То же самое можно сказать и о других известных исследованиях Вундта и его сотрудников. Например, разработанная им трехмерная теория эмоций, предполагавшая возможность локализации всех содержаний сознания в координатах «удовольствие — неудовольствие», «напряжение — расслабление», «возбуждение — успокоение» (см. 2.1.3), была введена первоначально с помощью интроспективного примера, а затем Вундт попытался уточнить ее с помощью объективных психофизиологических измерений аффективных реакций (Wundt, 1908—1911).
Особое значение для будущей когнитивной психологии имело представление об ограниченности объема внимания. Теоретически оно было заложено уже в лейбницевской концепции апперцепции. Ограниченность внимания была проиллюстрирована в школе Вундта наблюдениями субъективной группировки элементов в слуховой и зрительной
45
модальностях, а также опытами Джеймса Маккина Кеттела12, описавшего так называемый эффект превосходства слова — после кратковременного (сотые доли секунды) предъявления можно воспроизвести примерно пять изолированных букв либо такое же количество коротких слов, то есть в несколько раз букв больше (см. 7.2.1). Независимо от Кеттела эта же закономерность была обнаружена и одним из первых французских психологов, создателем знаменитого теста интеллектуального развития Альфредом Бине (1857—1911). В своих исследованиях Бине сравнивал запоминание отдельных слов и коротких осмысленных фраз. Таким образом, в случае экспериментальных исследований школы Вундта речь идет скорее об уточняющих демонстрациях заранее известных общих представлений о структуре сознания, а не об их эмпирической проверке и возможном опровержении. Поскольку состояния сознания по-прежнему считались непосредственно данными субъекту, «не гипотетическими», то эксперимент не мог выполнять обычную для него роль гипотетико-дедуктивного инструмента познания. Он оставался лишь вспомогательным средством для выявления и фиксации интроспективных данных. Успех такой странной, с точки зрения зрелых естественно-научных дисциплин, исследовательской программы целиком зависел от убедительности исходных философских («метафизических») взглядов. Многочисленные дискуссии конца 19-го — начала 20-го века, в ходе которых Вундт тщетно пытался утвердить свою точку зрения по ряду центральных теоретических и методологических вопросов, показали, что философские взгляды основателя психологии не разделялись многими психологами, в первую очередь, его собственными учениками.
1.2.3 Первый кризис научной психологии
Наиболее радикальный характер, отчасти изменивший ход последующего развития психологической науки, имели работы профессора философии Вюрцбургского, а затем Венского университетов Франца Брентано (1838—1917). До него ассоцианисты, да и сам Вундт описывали феномены сознания как более или менее сложные структуры элементов. Эта процедура была типичной для структурализма в психологии. В своей работе «Психология с эмпирической точки зрения» Брентано (Brentano, 1874) обратился к совершенно иной философской традиции — казалось бы, окончательно отвергнутому европейским Новым временем учению Аристотеля в его схоластической интерпретации, данной Фомой Аквинским (1225—1274). Определяющим принципом функционирования всего пси-
12 Этот ученик Вундта, работавший у него в лаборатории в период с 1880 по 1887 год,
стал позднее одним из основателей американской версии функционалистской психоло
гии (см. 1.2.3) и прославился введением в психологический оборот понятия «тест», а так
же основанием (вместе с Болдуином) двух профессиональных журналов — Psychological
46 Bulletin и Psychological Review
хического для Фомы Аквинского являются inîensiones animi — духовные силы человека, направленные на деятельное воплощение и преодоление возникающих при этом трудностей. В результате феномены сознания были описаны Брентано не в виде ассоциаций ощущений, а как интен-ционально направленные на предметы психические акты, или действия.
Подобная постановка вопроса была первым симптомом появления функционализма в психологии, то есть перехода к рассмотрению возможных функций сознания, таких как регуляция активности, удовлетворение потребностей и, в конечном счете, биологическая адаптация в самом широком смысле слова. Влияние функционализма оказалось весьма выраженным за пределами Германии, причем вместо спекулятивной философии здесь роль катализатора сыграли новые биологические представления, широко распространившиеся во второй половине 19-го века, прежде всего, теория эволюции Чарльза Дарвина (1809—1882). Дарвин трактовал положительные и отрицательные эмоции как проявление имеющих приспособительное значение поведенческих тенденций приближения или, соответственно, избегания (см. 9.4.3). Под влиянием общей эволюционной трактовки эмоций у животных и человека с функционалистских позиций стали рассматриваться и познавательные процессы у человека. Зачастую при этом происходило уточнение и ограничение функций сознания, которое постепенно перестало восприниматься как синоним психики.
Физиолог Иван Михайлович Сеченов (1829—1905) выступил в России с программой неинтроспективного изучения психических процессов как множества центральных, заторможенных корой головного мозга рефлексов. Сеченов доказал в простых экспериментах на мозге лягушки существование такого механизма центрального физиологического торможения. Точка зрения, согласно которой феномены сознания возникают тогда, когда кора мозга начинает контролировать посредством торможения автоматическое развертывание рефлекторных процессов, намного опередила свое время. Она, в частности, хорошо вписывается в современные двухуровневые модели взаимоотношений сознательных («контролируемых») и автоматических процессов (см. 4.3.2, 5.1.3 и 7.2.2). Сеченов же одним из первых обратил внимания на значение сочетания эволюционного и онтогенетического анализа феноменов психики, подчеркнув, что научная психология прежде всего должна ответить на вопрос о происхождении разнообразных «психических деятельностей» (см. 9.4.2).
Во франкоязычной психологии и неврологии Теодюль Рибо (1839— 1916), Эдуар Клапаред (1873—1940) и особенно ученик Рибо Пьер Жане (1859—1947) подробно описали так называемые психические автоматизмы — зачастую весьма сложные формы активности, разворачивающиеся целиком или частично вне сферы сознания. «Французская школа» выявила многочисленные примеры диссоциации сознания и поведения, причем как в норме (гипноз), так и в патологии (истерия). Рибо (одновременно с Джеймсом и датчанином Ланге) разработал так называемую
моторную теорию сознания, суть которой состоит в признании внутренней, идеомоторной активности основой феноменов восприятия, внимания и воображения (см. 5.4.1 и 9.3.3). Он же последовательно призывал к эволюционному анализу высших психических процессов и личности. Согласно «закону Клапареда», осознание отнюдь не является постоян.-ным атрибутом психических процессов и специфически связано лишь с моментами затруднений в реализации привычных действий.
В Северной Америке практическое значение сознания для успешной адаптации к среде подчеркивалось в философии прагматизма, прежде всего в работах Чарльза Пирса (1839—1914) и Уильяма Джеймса (1842—1910). Пирс стал основателем семиотики — общей науки о знаках и их функциях, которую веком ранее пытался создать Кондильяк (см. 1.1.2). Философ и психолог Джеймс предложил различать «те» и «/» как, соответственно, познаваемую и познающую части самосознания личности13. В качестве особой школы американская функционалистская психология — Дж. Эн-джел, Дж. Дьюи, Э.Л. Торндайк, Р. Вудвортс и другие — пыталась сочетать анализ сознания с изучением поведения, просуществовав примерно до конца 30-х годов прошлого века. Следует особенно подчеркнуть влияние работ Роберта Вудвортса (1869—1962), «Экспериментальная психология» которого позволила сохранить итоги раннего периода изучения познавательных процессов. Перевод этого руководства на русский язык (книга вышла в разгар так называемой «борьбы с космополитизмом») сыграл важную роль в развитии отечественной психологии.
Обсуждение интенциональности (предметной направленности) сознания стало центральным для феноменологии и экзистенциализма — ведущих направлений философии 20-го века. Основатель феноменологии Эдмунд Гуссерль (1859—1917) начинал как ученик математика Вейерштрасса, но познакомившись с Брентано, превратился в его восторженного последователя. Описывая феномены сознания, он лишает их психологического оттенка. Эмпирическое «Я» выполняет при этом лишь функцию точки отсчета, делающей возможной интенциональное отношение к предметам. Последние также понимались им как идеальные, не выходящие за пределы «чистого сознания» («Bewusstsein rein als es selbst») конструкты, подобные математическим понятиям. Представители экзистенциализма (ученик Гуссерля М. Хайдеггер, М. Мерло-Понти и Ж.П. Сартр) вернулись к функционалистской трактовке. Они подчеркнули значение обыденного сознания, включенного в направленную на решение жизненных задач активность (по принципу «in-der-Welt-sein» — «бытия в мире»). Эта форма сознания отличалась ими от отстраненного, рефлексирующего сознания предыдущих философских учений (4.4.3 и 9.3.3). На практике это
13 При ближайшем рассмотрении это напоминает кантианское различение практи
ческого и теоретического разума (см. 1.1.3). Джеймс поясняет, что «те» — это «эмпири
ческое эго» («мое»), тогда как в случае «/» речь идет о «теоретическом эго», то есть о транс
цендентальном, недоступном для эмпирического анализа первоисточнике всякой твор-
48 ческой активности.
напоминает предположение Клапареда об осознании эпизодов, которые нарушают привычный ход событий. Так, рефлексивное осознание некоторого предмета, например молотка, обычно происходит при нарушении привычного потока активности, когда молоток слишком тяжел или у него внезапно ломается рукоятка.
Точка зрения Брентано на значение интенциональной трактовки психики повлияла и на ряд его учеников-психологов, прежде всего Освальда Кюльпе (1862—1915) и Карла Штумпфа (1848—1936). Кюльпе унаследовал кафедру философии Вюрцбургского университета, которую когда-то занимал его учитель, а Штумпф при поддержке Гельм-гольца основал в 1902 году институт психологии в Берлинском университете. Через 10 лет именно в этом институте появилось новое научное направление, ставшее известным во всем мире как берлинская школа гешталыппсихологии (см. 1.3.1). Одним из последствий интереса Кюльпе к функциям сознания в поведении стал анализ процессов понимания и решения задач, приведший к созданию еще одного нового направления исследований — вюрцбургской школы психологии мышления.
По мнению представителей вюрцбургской школы, при решении задач возникают направленные на достижение цели процессы — мысли, которые отличаются от имеющих чувственную (сенсорную и аффективную) окраску элементов вундтовской психологии прежде всего своим процессуальным и безобразным характером. Использовав простые хронометрические эксперименты, представители этого направления показали, что испытуемые обычно значительно быстрее понимают афоризмы и сложные метафоры, чем сообщают о возникновении в сознании каких-либо сопутствующих сенсорных ощущений или образов. Сначала Кюльпе, а затем его ученик Карл Бюлер (1879—1963) подчеркнули целенаправленный и операциональный характер мышления14. Подобно тому как в арифметике есть не только числа, но и операции над ними, «решающие последние константы в мышлении — это вовсе не чувственные представления, которые одно за другим разворачиваются в нас, а мыслительные операции над меняющимся материалом образов представлений» (Buehler, 1927, S. 13). Попытка последовательного описания мышления в терминах множества операций, трансформирующих условия задачи в направлении искомого решения, была предпринята несколько позднее Отто Зельцем (1881— 1944), однако его исследования были прерваны известными политическими катаклизмами 30—40-х годов прошлого века15.
14 Любопытно, что уже тогда различение «статичного» и «динамичного» имело выра
женный оценочный оттенок. «Динамичность» феноменов сознания неизменно подчер
кивали Вундт и Титченер. Взгляды критиковавших их с «динамических позиций» пред
ставителей вюрцбургской школы, в свою очередь, были подвергнуты критике из-за от
сутствия «динамики» Куртом Левином.
15 Никто не знает, как могло бы пойти развитие научной психологии в Германии, если
бы не приход к власти национал-социалистов. Видные гештальтпсихологии эмигрирова- 49
В целом вюрцбургская школа не смогла решить своих задач, так как мысли и операции выступили лишь в роли новых элементов сознания. Был сохранен и усилен аналитический характер метода самонаблюдения, что вызывало возражения даже у Вундта (Wundt, 1910—1912). В еще большей степени опора на самонаблюдение была характерна для основных оппонентов вюрцбургской школы — представителей школы аналитической интроспекции Эдварда Титченера (1867—1927), пытавшегося развивать традиционный структуралистский подход ассоциативной психологии. На одном из этапов развития своих взглядов Тит-ченер пришел к выводу, что сознание состоит примерно из 44 000 элементов, которые в разных комбинациях порождают все восприятия, мысли и эмоции: «Дайте мне мои элементы и позвольте мне соединить их при психофизических условиях, и я обещаю вам показать психику взрослого человека как структуру без пропусков и изъянов» (Titchener, 1899, р. 294). Бесплодность дискуссии обоих направлений о роли чувственных образов в мышлении сыграла не последнюю роль в крушении старой менталистской психологии.
Вундт старательно избегал использования термина «память» в своих работах, считая его отголоском донаучной психологии способностей. Поэтому он откровенно критически относился к проекту Германа Эб-бингауза (1850—1909), поставившего своей целью изучить законы памяти, которые определяют временную динамику ассоциаций. В силу этих теоретических разногласий Вундт даже активно препятствовал публикациям результатов экспериментов Эббингауза, что послужило одной из причин создания, по инициативе и под редакцией Гельмголь-ца, первого собственно психологического журнала в мире — Zeitschrift für Psychologie16. Первый номер этого журнала открывается статьей Эббингауза, посвященной обзору основных результатов его исследований.
Благодаря экспериментам Эббингауза по запоминанию рядов бессмысленных слогов были построены так называемые кривые забывания (см. 5.4.1), а также впервые был описан эффект края — лучшее воспроизведение первых и последних элементов ряда по сравнению с центральными элементами. Этому действительно очень выраженному эффекту суждено было позднее сыграть важную роль в создании моделей памяти когнитивной психологии (см. 2.2.1 и 5.2.1). На частые обвинения оппонентов в механицизме Эббингауз отвечал, что ориентируется
ли. Карл Бюлер и его жена Шарлотта (одна из основательниц гуманистической психологии) сначала сменили Дрезден на Вену, а затем бежали в США. Дункер покончил жизнь самоубийством. Зельц погиб на пути в концентрационный лагерь.
16 В определенной степени Вундт предвосхитил взгляды и тип исследований англий
ского психолога Фредерика Бартлетта, который, кстати, тоже крайне критически оцени
вал вклад Эббингауза в психологию познания (см. 1.4.2). Вундта и его сотрудников инте
ресовали процессы запоминания и узнавания сложного осмысленного материала. Счи
талось, что решающую роль в узнавании сложного материала играет чувство «знакомое -
50 ти» (сам этот термин был введен в психологию датчанином Гёффдингом).
не на ньютоновскую механику, а на физику Маха, устанавливая лишь математические отношения между независимыми и зависимыми переменными. Использование бессмысленного материала, вызванное стремлением изучать законы памяти в «чистом виде», было включено потом в необихевиористскую традицию «вербального научения». Следует отметить, однако, что даже при таком намеренно обессмысленном материале частота осмысленных ассоциаций оказалась переменной, которая играла едва ли не ведущую роль в запоминании.
Несколько менее известными латаются исследования другого видного немецкого психолога того периода leopra Элиаса Мюллера (1850—1934). Вместе с А. Пильцекером Мюллер обосновал в 1900 году теорию двух различных форм памяти — динамической («персеверирующей») и постоянной. В основе перехода от динамического к постоянному формату сохранения знаний, по их мнению, должен лежать некоторый (в то время совершенно гипотетический) процесс нейрофизиологической консолидации следа (см. 5.3.2). Соответствующее различение было использовано и в первых моделях запоминания когнитивной психологии, как различие процессов в первичной (кратковременной) и вторичной (долговременной) памяти (см. 2.1.3 и 5.2.1)17. Мюллер также разработал вполне созвучную последующим моделям когнитивной психологии теорию, в которой попытался, исходя из юмовской схемы ассоциации элементов сознания, объяснить целенаправленный характер мышления. Решение этой задачи оказалось возможным лишь благодаря построению иерархической системы, в которой категориальные представления оказались под контролем некоторого более высокого уровня, принимающего решения о торможении или активации ассоциативных связей (см. 8.1.1).
Учеником Мюллера А. Иостом были описаны два общих закона динамики прочности следа памяти. Согласно первому из законов Моста, из двух ассоциаций равной прочности, но разного возраста более старая забывается медленнее. Второй закон имеет отношение к заучиванию материала: приращение прочности следа, вызванное новым заучиванием, обратно пропорционально исходной прочности следа. Оба закона легко формализуются с помощью дифференциальных уравнений:
dx/dt = — kx
dx/dT = m (λ - x),
имеющих следующие решения:
xt = xoe-kt
χτ = λ - (λ - xe)e-mT,
где χ — прочность следа или ассоциации; k, m и λ — константы; t — время при забывании, а Т — время или число попыток заучивания. Первый закон Иоста до сих пор используется в когнитивной психологии при анализе процессов забывания, а второй — широко использовался в исследованиях «вербального научения» (см. 5.2.1 и 5.4.1).
17 По феноменологическим основаниям (а именно сохраняется ли некоторое содер
жание непрерывно в сознании или нет) первичную и вторичную память различали в кон
це 19-го века также немецкий физиолог Эркнер и один из основателей философии праг
матизма Джеймс. 51
52
Особого упоминания заслуживают исследования зрительных образов, начатые уже Фехнером, который посвятил их классификации несколько глав второй части своих «Элементов психофизики» (такого рода исследования были названы им «внутренней психофизикой» в отличие от «внешней психофизики», занимающейся измерением ощущений физических стимулов). Родственник Дарвина Фрэнсис Гальтон ( 1822— 1911) провел самые ранние дифференциально-психологические исследования отчетливости, или «яркости» зрительных представлений, в то время как Г.Э. Мюллер проанализировал зависимость пространственных характеристик образов объектов от субъективных (совпадающих с осями тела субъекта, или эгоцентрических) и объективных (определяемых верхом, низом, левой и правой стороной и т.д. самих предметов — экзоцентрических) систем координат.
Вместе с тем и в этой области исследований вновь отчетливо выступила невозможность однозначной интерпретации интроспективных данных. Кюльпе и К. Пэрки, работавшая у Титченера в Корнельском университете, пришли к противоположным выводам о характере влияния зрительных образов на восприятие зрительных сигналов околопороговой интенсивности, при этом Кюльпе полагал, что одновременное представливание мешает восприятию. Окончательно этот вопрос не выяснен до сих пор, хотя современные работы скорее подтверждают мнение Пэрки, считавшей, что в результате активного, «встречного» пред-ставливания стимула происходит снижение сенсорных порогов (см. 6.4.2). Никто из этих исследователей, при всем внешнем различии их позиций, не пошел дальше доступных в то время механистических и химических аналогий. Так, Кюльпе объяснял образы последействием ощущений, а Эббингауз сравнивал их с фотографическими отпечатками.
Бездоказательность подобных аналогий и неопределенность выводов по основным проблемам привели к тому, что уже в конце 19-го века стал обсуждаться вопрос о кризисе психологии, а так называемым номо-тетическим (то есть основанным на выделении законов, «объясняющим») наукам были противопоставлены науки идеографические (описательные, или «понимающие»). Один из видных участников этих событий следующим образом охарактеризовал ситуацию: «Вереница сырых фактов; немного разговоров и споров вокруг отдельных мнений; немного классификации и обобщения на скорее описательном уровне; строгое убеждение, что нам доступны состояния сознания и что наш мозг как-то влияет на них: но ни одного закона в смысле законов физики, ни одного утверждения, из которого можно было бы вывести надежные следствия. Мы даже не знаем терминов, в которых можно описать то, по отношению к чему эти законы могли бы быть установлены. Это не наука, а лишь надежда на науку... В настоящее время психология находится в состоянии физики до Галилея... и химии до Лавуазье...» (James, 1892, р. 468).
1.3 Поведенческие и физикалистские направления
1.3.1 Психология как наука о поведении и физических гештальтах
Начиная с 10-х годов прошлого века изучение образов представлений, восприятия, внимания и мышления резко затормозилось. «Попробуйте доказать мне, — писал основатель бихевиоризма Джон Уотсон (1878— 1958), — что вы обладаете зрительными представлениями, слуховыми представлениями или какими-либо другими видами психических (бестелесных) процессов. До сих пор у меня есть лишь ваши невероятные и решительно ничем не подкрепленные заявления, что вы обладаете всем этим. Наука же нуждается в объективных доказательствах, которые только и могут служить надежной основой для ее теорий» (Watson, 1928, р. 75). Американский бихевиоризм и немецкая («берлинская») школа гештальтпсихологии независимо друг от друга, но практически одновременно предприняли попытку построения психологии как естественнонаучной дисциплины.
Появление бихевиоризма было связано, во-первых, с критикой вунд-товской психологии, которую прагматизм вел начиная с 1880-х годов. Уже тогда Чарльз Пирс отрицал прямую доступность знания о внутреннем мире: «Нет оснований для веры в возможность интроспекции, и, следовательно, единственный способ изучения психологических вопросов состоит в анализе внешних фактов» (Peirce, 1931 — 1958, ν. 3, p. 47). К концу жизни эта точка зрения стала оказывать все большее влияние и на Джеймса, хотя ни тот, ни другой не отрицали традиционное понимание предмета психологии как науки о феноменах сознания. Вторым, собственно научным источником и даже образцом методологии исследования стали работы Нобелевского лауреата (1901 года) по физиологии Ивана Петровича Павлова (1849—1936), доказавшего возможность исследования научения (формирования условных рефлексов) в рамках строго объективного, физикалистского анализа поведения. Именно Павлов стал штрафовать своих сотрудников за использование менталистской, то есть основанной на понятиях психологии сознания терминологии. Наконец, третьим, прежде всего историко-культурным фактором стала популяризация в США (в результате активной поддержки ученика Вундта Стэнли Холла) идей создателя психоанализа Зигмунда Фрейда (1856—1939) и его последователей18.
18 В том, что касается собственно экспериментальных исследований познавательных
процессов, вызывает понимание позиция Эйнштейна, отмечавшего, что он ценит Досто
евского как ученого, а Фрейда как писателя. Психоанализ оказал, однако, заметное вли
яние" на современные теоретические модели памяти и внимания, особенно на так назы
ваемый энергетичесий подход, рассматривающий внимание в качестве недифференциро
ванного «пула ментальных ресурсов» (см. 4.3.1). Кроме того, в своем раннем «Проекте
научной психологии» Фрейд (Freud, 1895/1981) предсказал современное значение нейро-
сетевых и нейрогуморальных исследований (см. 2.3.3 и 9.4.3). 53
Хорошим примером могут служить работы ученика Джеймса, видного представителя функционализма Эдварда Л. Торндайка, сформулировавшего три общих закона научения у человека и животных:
закон эффекта — реакции на некоторую ситуацию («стимул»), ко
торые получают положительное подкрепление, постепенно зак-,
репляются и становятся привычными ответами на эту ситуацию;закон готовности — серия последовательно подкрепляемых реак
ций постепенно образует цепной рефлекс;закон упражнения — ассоциативные связи между стимулами и
реакциями укрепляются при повторении и ослабевают при его
отсутствии.
С помощью этих законов, как считал Торндайк, можно объяснить усложнение поведения в процессах развития, не прибегая к традиционной терминологии психологии сознания. Законы научения Торндайка стали основой для описания процессов так называемого оперантного научения в бихевиоризме и необихевиоризме (см. 1.3.2).
Гештальтпсихология была более радикальным направлением психологической мысли, чем бихевиоризм. Уотсон и его наиболее известный последователь Б.Ф. Скиннер (1904—1992) не сомневались в валидное™ аналитического метода, восстанавливая в терминах стимулов и реакций сенсуалистскую модель пассивного («пустого») организма. Основатель гештальтпеихологии Макс Вертхаймер (1880—1943) и его наиболее известные последователи (В. Кёлер, К. Коффка, К. Левин, К. Дункер) получили широкое философское и естественно-научное образование. В философии гештальтистов привлекали идеи Канта об априорных формах созерцания, а также современной им феноменологии. Образцом научных исследований стала физика. Институт психологии Берлинского университета, созданный при поддержке ректора этого университета Гельмгольца, был (и до сих пор остается) частью физического факультета. Коллегами гештальтпеихологов по факультету были Нобелевские лауреаты по физике Макс Планк и Альберт Эйнштейн. Это, в частности, позволило Вертхаймеру провести основанный на личных беседах с Эйнштейном анализ истории создания теории относительности (см. 8.3.2). Физическая наука в целом находилась тогда в состоянии беспрецедентного подъема. Ее понятия, прежде всего понятие поля, не могли не быть привлекательны для людей, которые были способны ими воспользоваться. Это объясняет многое в том, что и как гештальтисты собирались изменить в психологии.
Они не только отказались от терминологии менталистской психологии, но и выдвинули программу изучения априорных качеств целост-ностных форм — Gestaltqualitaeten, описанных ранее в физике Э. Махом и в философии учеником Брентано Христианом фон Эренфельсом. Таким качеством целостности, например, обладает мелодия. Она легко узнается нами при проигрывании в другом музыкальном ключе, хотя при -. этом меняются все физические звуки, а следовательно, и предполагае-
мые сенсорные составляющие восприятия (или «ощущения»). Целостным гештальтом является любое наше восприятие, так как воспринимаемая картина неизбежно организуется нами на имеющую «характер предмета» (и феноменально как бы выступающую вперед) фигуру и имеющий «характер субстанции» (и как бы продолжающийся за фигурой) фон. Само описание фигуры и фона было введено ранее в психологию датчанином Эдгаром Рубином — одним из учителей создателя квантовой механики Нильса Бора. Гештальтпсихологами были выявлены основные закономерности такого разделения. С их точки зрения, разделение феноменального (воспринимаемого) поля на фигуру и фон — объективный процесс, определяемый так называемыми законами перцептивной организации.
Первоначально Вертхаймером было выделено 6 таких законов, которые затем стали объединять в некоторый единый «закон прегнантно -сти». Объекты, которые
расположены близко друг к другу («закон близости»),
имеют похожие яркостные и цветовые характеристики («сходства»),
ограничивают небольшую, замкнутую («замкнутости»)
и симметричную область («симметрии»),
естественно продолжают друг друга («хорошего продолжения»),
движутся примерно с равной скоростью в одном направлении («об
щей судьбы»),
скорее будут восприняты как единое целое, или фигура, а не как разрозненные элементы среды, или фон (рис. 1.2А)19.
Надо сказать, что в психологическом сообществе гештальтисты были настоящими «возмутителями спокойствия». Прежде всего они высмеяли попытки описания ощущений как «сырых» элементов сознания. В этой критике Вольфганг Кёлер (1886—1967) во многом опирался на более ранние соображения Канта (см. 1.1.3). Далее, в лице Курта Коффки (1886—1941) гештальтпсихологи выступили против умозрительной концепции «уровней сознания» («эйдетики») марбургской психологической школы (эта концепция позднее стала официальной психологической доктриной национал-социализма — см. 5.3.1). Они критиковали попытки объяснить целостность восприятия существованием некоторых иерархических более высоких образований, объединяющих нижележа-
19 Разделение на фигуру и фон не только универсально для нашего восприятия (при
сутствуя, например, в восприятии музыки — Sloboda, 2003), но и далеко выходит за рамки
перцептивных эффектов. Так, в эмоциональной сфере ему соответствуют понятия «чув
ство» и «настроение». В начале 21-го века это различение продолжает оставаться одной
из важнейших проблем психологии, лингвистики и когнитивной науки в целом (см. 3.3.1,
7.3.2 и 8.1.2). Хотя новые исследования во многом дополняют классические взгляды, их
основное содержание остается неизменным, за одним исключением. Описывая законы
перцептивной организации, гештальтпсихологи пытались избежать использования мен-
талистского термина «внимание». Современными авторами те же самые эффекты зачас
тую трактуются как проявление внимания (см. 4.2.2). 55
56
Рис. 1.2. Примеры перцептивной организации: А. Законы близости, сходства, хорошего продолжения и симметрии; Б. Какой хорошо знакомый объект содержится в данной конфигурации?
щие элементы или процессы (именно так объясняли возникновение качеств гештальта австрийские психологи, представители школы Граца А. Майнонг и В. Бенусси). Аналогично, один из оппонентов гештальт-психологии Г.Э. Мюллер предположил, что образование гештальтов — результат быстрых сдвигов фокуса внимания от одних элементов к другим по типу процесса сканирования, встречающегося в современных моделях переработки информации человеком (см. 3.2.1). Уже в случае восприятия слов, как считал Кёлер, это требует чрезмерно сложного управления — в дополнение к отдельным актам внимания к буквам нужен еще один акт для объединения их в целое. Целое первично по отношению к элементам, подобно тому как кантианские категории пространства и времени первичны по отношению к любому акту восприятия.
В своих работах гештальтпсихологи не уставали критиковать метод аналитической интроспекции, отрицали роль прошлого (ассоциативного) опыта и сильно сомневались в полезности таких центральных для традиционной психологии сознания понятий, как «ощущение», «внимание» и «бессознательные умозаключения». Не ограничиваясь критическим анализом, гештальтпсихологи обосновывали свои утверждения с помощью простых демонстративных примеров. На рис. 1.2Б показана конфигурация, содержащая некоторый, очень хорошо известный каждому читателю из прошлого опыта объект. Однако практически никому не удается спонтанно его обнаружить (речь идет о цифре «4» на пересечении горизонтальной линии и двух окружностей). Данный эффект маскировки знакомого объекта объясняется тем, что законы перцептивной организации (в данном случае речь идет о законе хорошего продолжения) несоизмеримо сильнее влияют на структурирование нашего восприятия, чем прошлый опыт и предположительно связанные с ним «ассоциативные тенденции».
Новизна исследовательской программы гештальтпсихологов состояла и в том, что они призывали двигаться «от сложного к простому», а не «от простого к сложному» (см. 1.4.2). С этой точки зрения можно сравнить элементаристский подход к объяснению решения задач в вюрц-бургской школе и особенно в бихевиоризме с пониманием мышления гештальтпсихологами. Для них мышление было процессом, имеющим, подобно мелодии, начальные, промежуточные и финальные фазы. Основу финальной фазы составлял инсайт (английский перевод немецкого термина Einsicht) — целостное переструктурирование проблемной ситуации, после которого решение становилось очевидным. Решение задач по типу инсайта у животных было обнаружено Кёлером в его исследованиях интеллекта человекообразных обезьян (шимпанзе вида Pan trogloditis), которые проводились им во время интернирования на острове Тенерифе с 1913 по 1920 год. Творческий характер мышления человека был особенно убедительно продемонстрирован на материале решения задач одним из учеников Вертхаймера и Кёлера, Карлом Дункером (1896-1940)20.
Результаты этих работ имели фундаментальное общеметодологическое значение. Они первыми показали, что обходные пути часто короче прямых, а простые решения неадекватны в сложных ситуациях или в стратегической перспективе (см. 8.3.2 и 8.4.2). Такое понимание мышления разительно отличалось от описания процессов решения задач их современниками и главными оппонентами — бихевиористами, которые считали, что процессы решения задач основаны на механическом повторении проб и ошибок. В конце жизни Вертхаймер и Дункер заинтересовались проблемой природы морали и человеческих ценностей, подготовив своими работами условия для возникновения гуманистической психологии. Берлинская школа довольно быстро стала элитарной группой внутри мировой психологии. Не случайно столь тесными были многолетние научные и личные контакты гештальтпсихологов с ведущими американскими психологами, Э. Толменом (см. 1.3.3) и Дж.Дж. Гибсо-ном (см. 9.3.1), а также с представителями Московской школы культурно-исторической психологии во главе с Л.С. Выготским и А.Р. Лурия (Scheerer, 1980).
1.3.2 Опыт галилеевской перестройки психологии
Как известно, однако, многие гештальтпсихологи, прежде всего Кёлер, были сторонниками крайней формы физического редукционизма, получившей позднее название теории идентичности психики и мозга (см.
20 В наиболее известной из дункеровских задач испытуемым предлагалось найти ме
тод разрушения раковой опухоли внутренних органов с помощью внешнего источника
радиации без повреждения здоровых тканий (см. 8.2.1). 57
9.1.3). Факторы, определяющие динамику гештальтов, были переведены ими из области психических феноменов — «феноменального» — в область физико-химических процессов, разворачивающихся в коре головного мозга. В философском плане гештальтпсихологи придерживались представления о тройном изоморфизме — структурной идентичности физических, физиологических и психических процессов. В перспективе они надеялись свести феноменальные явления к состояниям мозга. Если нет психологических законов, которые не были бы одновременно законами процессов в нервной системе, то достаточно полное описание состояний живого человеческого мозга должно позволить до последней детали восстановить субъективные переживания. Законы внутренней психофизики (то есть законы отношений физиологических и психических процессов) мыслились при этом по типу законов, описывающих огромный класс физических процессов: от формирования кристаллов в перенасыщенном растворе до образования галактик21.
Именно эту черту гештальттеории — стремление найти единообразное объяснение для, казалось бы, совершенно различных феноменов — и относил к примерам так называемого «галилеевского способа образования понятий» сотрудник кёлеровского института Курт Левин (1890—1947). В программной статье, опубликованной в органе нового философского направления — неопозитивизма — журнале «Познание» («Erkenntnis»), Левин (Lewin, 1930/31) призвал окончательно преодолеть пережитки аристотелевского мышления в психологии. Эта статья сразу же была переведена на английский язык и стала известна значительно более широкому кругу психологов на Западе, чем другие крупные исследования причин первого кризиса психологии — например, так и оставшаяся непереведенной книга Бюлера (Buehler, 1927) или вообще не публиковавшаяся в течение нескольких десятилетий методологическая работа Л.С. Выготского (1982—1984).
Статья Левина начинается с анализа методологических принципов физики Нового времени. Он подчеркивает здесь отказ от телеологических объяснений и качественных, чаще всего дихотомических классификаций, характерных для физики Аристотеля. Выявление общих («гено-типических») законов типа закона свободного падения, к которым можно свести различные группы феноменов, он называет гомогенизацией. Считая значительную часть современной ему психологии еще аристотелевской, Левин отмечает, что помимо гештальтпсихологии галиле-евские тенденции характерны для бихевиоризма и рефлексологии. Наибольшей похвалы удостоен психоанализ: «В области психологии
21 Кёлер (Koehler, 1924) в своей работе о физических гештальтах указывает и адекват
ный, с его точки зрения, математический аппарат. Речь идет о разновидности дифферен
циальных уравнений, созданных французским математиком Пьером Симоном Лапласом.
То, что эта новая «мировая формула» порождает гармонические функции, завершает кар-
58 тину основанного на эстетической эвристике физического редукционизма.
потребностей, аффектов и характера учение Фрейда... устранило границы между нормальным и патологическим, между повседневным и чрезвычайным и тем самым наметило гомогенизацию всей психологии, которая... уже сейчас может быть поставлена рядом с гомогенизацией "земного" и "небесного", осуществленной физикой Нового времени» (Lewin, 1930/31, S. 446). В конце статьи Левин демонстрирует возможность объяснения поведения ребенка с помощью векторной алгебры и намечает перспективу использования топологии для разработки теории личности. Психология, по мнению Левина, подошла к историческому моменту галилеевской перестройки ее понятийного аппарата.
Работа Левина является примером применения идей неопозитивизма, или логического позитивизма. По своей направленности неопозитивизм является продолжением линии эмпиризма, современной его формой. В результате создания теории относительности и квантовой механики — великих революций в физике начала 20-го века — представители этого направления (М. Шлик, Р. Карнап, Р. Райхенбах и др.) выдвинули задачу очистить язык науки от остатков ненаучных, метафизических понятий. Они утверждали, что осмысленными научными высказываниями являются лишь два класса утверждений: логико-математические высказывания, валидность которых оправдана соответствующими формальными правилами, и так называемые «протокольные предложения» — констатации, непосредственно проверяемые физическим наблюдением.
На рис. 1.3 показана общая, восходящая к Канту схема критического реализма. Позитивист может считать себя находящимся либо в левой, либо в правой части этой схемы, одновременно отрицая как метафизический вопрос о существовании чего-либо по другую сторону трансцендентального барьера. Соответственно, «протокольные предложения» будут проверяться либо физическими, либо интроспективными наблюдениями. Такие предшественники неопозитивизма, как Беркли, Юм и Мах, находились на субъективно-идеалистических позициях. Склонность к солипсизму была характерна и для ранних этапов развития неопозитивизма. Но затем господствующей стала линия физикализма: утверждалось, что все научные высказывания можно перевести на некоторый объективный язык, описывающий физические события. Этот подход был распространен его основателями и на психологию, где встретил полное понимание, подготовленное общей неудовлетворенностью положением дел в традиционной психологии сознания. Особенно сильное влияние на психологию оказал операционализм — разновидность неопозитивизма, разработанная американским физиком П. Бриджменом. Согласно этому автору, значение всякого понятия исчерпывается описанием физических операций (например, инструкций для измерения), с помощью которых может быть проверена правомерность его использования.
59
Трансфеноменальный мир
Феноменальный мир
организм
,ЦПФС с критически-феноменальный ми внешний мир
Рис. 1.3. Общая модель критического реализма (по: Bischof, 1966). ОЧ — органы чувств, СМ — схема мира, СТ — схема тела, ЦПФС — центральные психофизиологические структуры; 1, 2, 3 — процессы, включенные соответственно в непосредственное восприятие, физическое и нейрофизиологическое исследование; А — то, что относится к внешнему миру, или схеме мира; Б — то, что относится к организму, или схеме тела; а — сенсорно-перцептивные процессы; б — рациональное мышление.
Со времени левиновского призыва перестроить понятийный аппарат психологии «по Галилею» прошло более 70 лет, и можно утверждать, что стремление свести качественно различные феномены к возможно меньшему числу фундаментальных законов или моделей, формально характеризующихся качествами симметрии, сохранения и равновесия, действительно определило облик значительной части мировой психологии 20-го века, будь это психоанализ с конечной редукцией всех форм эмоциональной жизни к энергии «либидо», топологическая теория личности самого Курта Левина или, например, гомеостатическая концепция психологии развития — «генетическая эпистемология» — швейцарского психолога и биолога Жана Пиаже (1896—1984)22.
60
22 Генетическая эпистемология также многим обязана операционализму Бриджмена. По словам Пиаже, «...операционализм обеспечивает действительную основу для связи логики и психологии. С тех пор как логика основывается на абстрактной алгебре и занимается символическими преобразованиями, операции... играют в ней чрезвычайно важную роль. С другой стороны, операции — актуальные элементы психической деятельности, и любое знание основывается на системе операций» (Пиаже, 1969, с. 579).
Наиболее явное влияние логический позитивизм оказал на необихевиоризм, видные представители которого Эдвард Толмен (1886—1959), Кларк Халл (1884—1952) и С.С. Стивене (1906—1973) посвятили анализу этого философского направления специальные работы. Историческая заслуга самого необихевиоризма состоит в том, что он впервые поднял культуру гипотетико-дедуктивного экспериментирования в психологии до уровня физико-химических наук (напомним, что у Вунд-та и гештальтпеихологов исследования имели еще характер отдельных демонстраций). В стремлении показать научную строгость нового подхода Халл даже построил изложение своей версии теории научения в форме гипотетико-дедуктивных постулатов, явно повторяющей структуру «Принципов» Ньютона.
В необихевиоризме также весьма отчетливо выступила и тенденция к гомогенизации различий. Так, длительное время в употреблении был один-единственный принцип (вместо трех законов Торндайка — см. 1.3.1), объяснявший все виды поведенческого (оперантного) научения: «Комбинация стимулов, сочетавшаяся с некоторым движением, при повторном появлении увеличивает вероятность возникновения того же движения». Удивительным образом в этой формулировке нет упоминания ни специфики (например, модальности) стимулов, ни характера (а тем более цели!) самого движения. Утверждение сделано в форме констатации абстрактного отношения двух переменных. Исключались и какие-либо межвидовые различия: «Я убежден, — писал Толмен, — что абсолютно все существенное для психологии... может быть установлено в ходе упорного... анализа поведения крысы в... лабиринте» (Tolman, 1938, р. 34). Наконец, Б.Ф. Скиннер приводит в одной из своих работ три очень похожие кривые научения, отмечая в подписи к рисунку, что одна из них принадлежит голубю, другая — крысе, а третья — обезьяне. «Кошка, собака и человеческий ребенок могли бы добавить другие кривые к этому рисунку» (Skinner, 1959, р. 374).
1.3.3 Второй кризис научной психологии
Начав с гаяилеевских претензий на научное объяснение феноменального мира и поведения, оба ведущих направления зарубежной психологии середины 20-го века пришли вскоре к отрицанию ведущих постулатов. Так, в частности, выяснилось, что законы образования гештальтов не только не всеобщи, но не распространяются даже на те феномены, по отношению к которым они первоначально были сформулированы. Оптико-геометрические иллюзии оказались зависящими от культурных факторов (Лурия, 1974) и, как стало выясняться в последнее время (см. 3.4.1), от характера осуществляемых по отношению к объектам действий. Нейрофизиологические исследования, в свою очередь, не подтвердили идеи физикалистского редукционизма в его кёлеровском понимании (При-брам, 1980). Вместо единого, описываемого лапласовскими уравнения- 61
ми закона целостности уже в 1930-е годы насчитывалось свыше ста законов перцептивной организации (Helson, 1933). Сегодня для нас геш-тальтпсихология — это не грандиозное обобщение закономерностей физических, физиологических и психических процессов, а множество изолированных, хотя подчас и чрезвычайно любопытных феноменов. ■
Еще более демонстративную неудачу потерпел необихевиоризм. Накопленные в результате исследований данные заставили пересмотреть предположение об атомарной, сенсомоторной (ассоциативные цепочки пар «стимул-реакция») основе научения. Так, оказалось, что крысы, постепенно научившиеся пробегать лабиринт, сразу же находят нужный путь, если им неожиданно приходится преодолевать его вплавь. Очевидно, основой навыка не могут быть просто цепочки заученных зрительно-двигательных связей, поскольку они полностью меняются при изменении характера движений. Вероятной основой могло бы быть некоторое более абстрактное топографическое знание, своего рода когнитивная карта лабиринта (см. 6.3.2). Точно так же поисковая активность животных в лабиринте обычно оказывается не совсем случайной. Вместо простого накопления совершенно случайных проб и ошибок наблюдается скорее что-то вроде систематического обследования участков лабиринта, которое можно сравнить с проверкой одной частной «гипотезы» за другой.
После подобного операционального введения Толменом понятий «намерение», «гипотеза», «викарные пробы и ошибки», «когнитивные карты» критики, прежде всего представитель ортодоксального бихевиоризма Э. Газри, усмотрели в этом возвращение к психологии сознания. Наличие направляющей поисковую активность животного когнитивной карты, по их мнению, с необходимостью предполагает и существование внутреннего наблюдателя — гомункулуса — со всеми вытекающими последствиями в отношении бесконечного регресса объяснительных конструктов («проблема Юма» — см. 1.1.2).
Эдвард Толмен, разработавший когнитивную теорию поведения (или так называемый молярный бихевиоризм) и широко использовавший некоторые термины психологии сознания, несомненно, был одним из предшественников когнитивной психологии в современном ее понимании. В его работах нашли отражение гештальтпсихология, взгляды создателя вероятностного функционализма Э. Брунсвика и их общего учителя К. Бю-лера23. Специфической особенностью необихевиоризма Толмена было подчеркивание целенаправленности поведения. Но понятие целенаправленности отсутствовало в галилеевско-ньютоновской модели мира и фактически представляло собой возвращение к аристотелевскому спо-
23 После защиты диссертации под руководством Гуго Мюнстерберга Толмен в 1913 году
работал у Коффки, а в 20-е годы приезжал в Германию и Австрию для ознакомления с
62 достижениями гештальтпсихологии и консультаций у Бюлера (см. Helson, 1975).
собу мышления. Надо сказать, что это развитие было предсказано Бю-лером еще в 1927 году в работе о кризисе психологии: «Бихевиоризм практически (sachlich) не способен определить единицы и упорядоченность наблюдаемой картины поведения, не внося момента направленности на цель, то есть вне телеологической системы координат» (Buehler, 1927, S. 37).
Как отмечалось, необихевиоризм служит примером гомогенного объяснения научения. Это допущение было поставлено под сомнение не кем иным, как Куртом Л евином (1942/2001), отметившим после нескольких лет пребывания в США, что гомогенное объяснение всех форм научения эквивалентно попытке описать самые разнообразные химические реакции одной единственной формулой. Еще один видный гештальтист, Карл Дункер (Dunker, 1939), в работе, посвещенной основаниям этики, выступил против релятивистской трактовки морали как закрепленного в результате воспитательных воздействий навыка (см. 1.1.2 и 9.4.1). Этому пониманию противоречат факты гибкости нашего поведения. Даже в жаркий день никто не станет разгуливать по улицам города в купальном костюме, вполне пристойном для пляжа. Фотомодель в ателье или пациентка на приеме у врача могут какое-то время, не испытывая обычного при других обстоятельствах чувства стыда, оставаться существенно раздетыми. Сам процесс раздевания, однако, скорее всего, будет происходить за ширмой. Хотя правдивость — одна из целей нравственного воспитания, мораль позволяет нам быть в различной степени правдивыми в ситуации беседы у постели тяжело больного, при ответе на бестактный вопрос или же при вызове в суд для дачи свидетельских показаний.
Универсальность законов научения была затем опровергнута в ходе экспериментальных исследований самих американских психологов. Прежде всего оказалось, что законы научения не могут быть перенесены на человека: необихевиористские исследования относительно элементарных форм «вербального научения», продолжившие эббингаузовскую линию анализа запоминания последовательностей слогов и изолированных слов, к началу 1960-х годов установили, что решающую роль при этом играет не чисто механическое повторение стимулов, а психологические факторы значимости ассоциативных связей, их осознания и ожидания повторного использования (см. 5.4.2).
Важную роль в судьбе бихевиоризма сыграли первые систематические исследования поведения животных в естественных условиях, проведенные европейскими этологами, двое из которых — ученик Бюлера Конрад Лоренц (1903—1986) и голландец Нико Тинберген (1907—1984) — были удостоены Нобелевской премии. При детальном анализе поведения с помощью этологических методов наблюдения вскрылось такое разнообразие форм научения и столь тонкое их соответствие экологии (типичным условиям обитания) конкретного биологического вида, что «гарвардский закон научения» образца 1972 года уже гласил: «При наи- 63
более строго контролируемых условиях проклятое животное делает только то, что ему хочется!»
Коррекции и многочисленные дополнения к бихевиористским законам научения практически свели на нет их гомогенный характер. Примером может служить установленный Дж. Гарсия (например, Garcia,· McGowan & Green, 1972) новый тип научения, настолько отличающийся от известных типов условных реакций, что автору открытия (ученику Толмена) в течение нескольких лет не удавалось опубликовать результаты ни в одном психологическом журнале. Речь идет об избегании крысой того вида пищи, поедание которой сопровождалось инъекцией слабой дозы отравляющего вещества. Научение оказалось одноразовым, эффективным лишь при задержке инъекции на время, не превышающее нескольких часов, и распространялось преимущественно на ту пищу, которая выделялась по вкусу на фоне всего, что животное ело в этот период. Этот феномен легко понять с телеологических (аристотелевских) позиций, учитывая биологическое значение и временную динамику усвоения пищи24. Интересно, что отрицательное подкрепление вкуса пищи ударами электрического тока не приводило к аналогичному обучению, независимо от того, сколько раз такое подкрепление осуществлялось.
Самый серьезный удар по необихевиоризму был, однако, нанесен не психологами и биологами, а практически мало кому известным тогда молодым лингвистом. Когда Б.Ф. Скиннер в 1957 году попытался в работе «Вербальное поведение» распространить крайний эмпиризм на объяснение психологических особенностей речи, ему был дан ответ с крайне рационалистических позиций. В рецензии на эту книгу Ноам Хомский (Chomsky, 1959) указал на ряд проблем и протийоречий, возникающих при попытках бихевиористов объяснить те аспекты поведения человека, которые выходят за рамки простых условных реакций на отдельные физические стимулы. В самом деле, что является тем физическим стимулом, который заставляет человека, подошедшего к картине, внезапно сказать: «Рембрандт»? Что было тем прошлым подкреплением, которое позволяет правильно понять и отреагировать на впервые слышимый вербальный стимул «Кошелек или жизнь»? Не очень вразумительные ответы необихевиористов на эти вопросы последовали только через 13 лет.
Вклад Хомского в создание когнитивной науки этим далеко не ограничился. Он ввел в современную лингвистику, а заодно и в психологию понятие «правило», с помощью которого можно объяснить, каким
24 Современный бихевиоризм претерпел странную метаморфозу. В последние десяти
летия потребности, фрустрации, антиципации, аппетитные состояния, страхи, любопыт
ство, а также приятные и неприятные эмоции настолько бессистемно заполняют страни
цы немногочисленных журналов этого направления, что возникающие при этом трудно
сти определения понятий оказываются вполне сопоставимыми с трудностями анализа
64 интроспективных отчетов в лабораториях Кюльпе и Титченера.
Рис 1.4. Примеры структур, порожденных повторным применением относительно простого алгоритма (так называемых L-грамматик — по: Prusinkiewicz & Lindenmayer, 1996).
образом индивид способен понять или «породить» новое, никогда ранее не слышанное им высказывание. В качестве наглядной иллюстрации подобных порождающих, или генеративных возможностей даже очень простых правил, объединенных в логический алгоритм (программу, или грамматику), мы приводим рис. 1.4, в котором множество элементов сложных визуальных структур созданы в результате повторного (рекурсивного — см. ниже) применения всего лишь нескольких графических операций. Изменение параметров правил позволяет построить структуру другого типа, вплоть до создания динамических репрезентаций, допустим, изображения дерева на ветру с синхронно гнущимися ветками и трепещущими листьями!
Эти идеи были применены первоначально в области теоретической лингвистики и психологии речи. Как подчеркнул американский психолингвист Джордж Миллер, особенно много сделавший для распространения подхода Хомского в психологии, взрослый человек способен легко понять более 1020 предложений, что совершенно непонятно, если исходить из представлений о бессознательном накоплении ассоциаций или о намеренном заучивании конкретных сочетаний слов. Точно так же уже в раннем онтогенезе дети всех народов мира обнаруживают удивительную компетентность и систематичность в области грамматики — при выстраивании в определенном порядке и согласовании сравнительно немногих известных им слов при порождении высказываний. То, что успешность внешнего поведения может зависеть от использования ограниченного числа внутренних, применяемых по отношению к новым ситуациям правил, далеко выходило за рамки сугубо ассоцианистских
объяснительных схем сторонников необихевиоризма и стало одним из краеугольных положений когнитивной психологии.
Теория Хомского (Chomsky, 1957; 1959), разработанная в эти годы, получила название генеративная (порождающая) грамматика, так как она имела отношение к порождению и пониманию лишь формальной, синтаксической стороны речи. Содержательная сторона речи — семантика (значение слов) и прагматика (соответствие речи социальной ситуации общения) — при этом фактически не рассматривалась (как не рассматривается она и в ряде последующих модификаций концепции Хомского, которая по сегодняшний день остается центрированной на синтаксисе — см. 7.3.1 и 7.3.2). В порождающей грамматике различаются два типа правил: правила структурирования фразы (правила перезаписи) и правила трансформации (рис. 1.5). Те и другие по существу являются алгоритмами, позволяющими описать абстрактную глубинную структуру предложения и создать множество синтаксически (а следовательно, и семантически) правильных парафраз этого предложения — его поверхностных реализаций.
The tall boy saved the dying woman
(Этот высокий мальчик спас умирающую женщину)
66
Рис. 1.5. Генеративная грамматика Хомского («стандартная теория»): А. Пример правил перезаписи (S — предложение, NP — группа существительного, VP — группа глагола, M— прилагательное, N — существительное, О — артикль); Б. Пример разбора синтаксической структуры предложения; В. Основные компоненты генеративной грамматики.
Чтобы понять высказывание, нужно прежде всего реконструировать его глубинную структуру. Так, высказывания «Маша бросила мяч» и «Мяч был брошен Машей» описывают одну и ту же сцену, несмотря на различия поверхностного описания, возникающие за счет использования во втором предложении одного из комплексных правил трансформации — перехода к пассивному залогу. Возьмем в качестве примера несколько более сложное высказывание «Эта обширная усадьба, ставшая музеем и исследовательским центром в начале 1970-х годов, когда ее подарила фонду дочь Лоренца, находилась к югу от города». На этом примере легко видеть роль глубинной структуры, состоящей в данном случае из рекурсивно вложенных друг в друга простых фраз25. Ассоциативные модели понимания бихевиористской психолингвистики в общем случае не способны эффективно справиться с подобными многослойными конструкциями. Они стали бы искать референт предиката «находилась в южной части города» на основании признака линейной близости в цепочке слов, двигаясь от «Лоренца» к «дочери» и лишь в последнюю очередь к «дому». В генеративной грамматике проблема решается автоматически за счет того, что в первую очередь выделяется многослойная глубинная структура этого сложноподчиненного предложения.
В своих работах Хомский в явном виде опирался на рационалистическую традицию, восходящую к Декарту, и даже назвал одну из главных книг «Картезианская лингвистика» (Chomsky, 1966). Многочисленные последователи Хомского в лингвистике и за ее пределами попытались обосновать представление о биологической врожденности абстрактно-математических правил генеративной грамматики. Так, в одной из последних работ Хомский и его коллеги проанализировали системы коммуникативных сигналов, используемые различными видами животных (птицами, обезьянами, дельфинами), и пришли к выводу, что при всем разнообразии и возможности повторов «темы» в этих сигналах отсутствуют признаки рекурсивного вложения фрагментов, составляющего формальную основу генеративных возможностей человеческого языка (Hauser, Chomsky & Fitch, 2002). Выдвинутые Хомским в ранних работах аргументы не только расчистили путь для когнитивного подхода — они по сегодняшний день сохранили свою актуальность и служат предметом интенсивных научных споров, уточняющих наши представления о природе языка и познания (см. 2.3.3, 6.1.1 и 7.1.2).
25 Рекурсивное применение некоторой генеративной операции ведет к появлению
структур многослойного (матрешечного) и/или древовидного типов. Оно отличается, тем
самым, от простого повторения этой операции (итерации). Когнитивные исследования
содержат множество указаний на сушествование у человека рекурсивно организованных
репрезентаций в областях, отличающихся от синтаксиса речи, например, при представ
лении пространственного окружения (см. 6.3.1), текстов (по принципу «текст в тексте»,
см. 7.4.1) и проблемных ситуаций (см. 8.3.2). 67
68
Итак, в 1950-е годы произошла общая дискредитация бихевиористской программы исследований и психология вторично за свою короткую историю оказалась в состоянии методологического кризиса (см. 9.1.1). В эти годы в американской социальной психологии и психологии личности появляются первые когнитивные теории, развиваемые учениками эмигрировавших в США гештальтпсихологов. Например; ученик Вертхаймера и Кёлера Фриц Хайд ер (Heider, 1958) предположил в теории когнитивного баланса, что действие побуждается неуравновешенностью отношений между компонентами — знаниями, людьми, группами, вещами — актуальной психологической ситуации. Важную роль в мотивации поведения играют, по Хайдеру, процессы каузальной атрибуции — различные субъективные стратегии объяснения причин успешных и неуспешных действий. Так, успехи близких нам людей мы скорее склонны объяснять устойчивыми личностными характеристиками («способностями»), тогда как неудачи списываем на случайное стечение обстоятельств (см. 6.4.3 и 8.4.1). Аналогично, ученик Левина Леон Фестингер (Fesünger, 1957) подчеркнул, в своей теории когнитивного диссонанса, мотивирующую роль несоответствия ситуации имеющимся у человека знаниям.
В этот же период в общей психологии проблемами познания продолжали заниматься с функционалистских позиций Вудвортс и ученик Бюлера, представитель «вероятностного функционализма» Эгон Брунс-вик (1903—1955), который отметил, что в силу сложности среды наши познавательные процессы — от восприятия до мышления — могут быть лишь вероятностной «игрой в угадывание», чреватой возникновением иллюзий, как только условия отклоняются от типичных. Он же первым поставил вопрос об экологической валидности, соответствии условий исследования типичным условиям жизни. Надо сказать также, что сотрудники европейских исследовательских центров, работавшие в области психологии, вообще не испытали чрезмерного влияния бихевиоризма. Их исследовательские задачи остались связанными скорее с анализом роли ментальных репрезентаций в поведении. Все это подготовило в середине 20-го века почву для быстрого когнитивного переворота в психологии. Тот факт, что когнитивный подход оказался вначале ближе к структурализму, был связан с влиянием кибернетики и теории информации. Это влияние выразилось в широком использовании компьютерной метафоры — сравнении человеческого познания с процессами переработки и хранения информации в электронно-вычислительной машине (см. 2.1.1 и 2.2.3).
1.4 Европейский идеал романтической науки
1.4.1 Романтизм как антитезис позитивизму
Попытки построения психологии по образцу физики и химии, как мы видели, хотя и привели к созданию основ научной методологии и организационному отделению психологии от философии, но не обеспечили ее стабильного развития, которое вновь и вновь ставилось под сомнение с позиций функционалистских направлений, ориентирующихся скорее на биологические дисциплины, а также со стороны ценностно-ориентированных подходов: от ранней «понимающей» психологии до многочисленных вариантов гуманистической психологии второй половины 20-го века. Действительно, две особенности традиционной картезианско-локков-ской парадигмы психологии — физикалистский атомизм (редукционизм) и имплицитная антропология абстрактно-изолированного субъекта — далеко не бесспорны26. Последняя особенность этой традиции характерна не только для общей, но даже и для социальной психологии, в которой другие люди длительное время трактовались как переменные, хотя и влияющие непосредственно на исход эксперимента, но обычно рассматриваемые вне специфического культурно-исторического контекста.
В этом разделе мы попытаемся описать другой источник идей современной когнитивной науки, включая и когнитивную психологию. Эта, отчасти альтернативная линия влияния прорисовывается значительно менее четко, чем линия, ведущая к позитивизму и неопозитивизму. Ее истоки следует искать в конце 18-го века, когда в европейской культуре возникла широкая негативная реакция на наметившиеся итоги Просвещения и на Новое время в целом. Одним из первых с призывом вернуться к естественному состоянию человека и общества выступил Жан Жак Руссо. Концентрированное выражение эта реакция нашла в таком получившем максимальное выражение в первой половине 19-го века общекультурном явлении, как романтизм.
Можно выделить четыре принципа, отличающие эстетику романтизма от других современных ему культурных течений. Первый принцип состоит в подчеркивании сложности, часто загадочности мира, а не раздробленности на атомарные элементы. Для романтиков (как ранее для Аристотеля и впоследствии для гештальтпсихологов) целое, безусловно, больше суммы частей. Признаком этого отношения служит использование прилагательного «живой»: живая природа, живой организм, живое слово. Вторым принципом является подчеркивание активности и
26 Субъективно-индивидуалистический оттенок имеет и вся лексика обычного язы
ка, относящаяся к процессам познания. Однако, по всей видимости, так было не все
гда: Примером может быть русское «со-знание» или английское «consciousness» (см. 4.4.3).
На рубеже 4 и 5-го веков Августин отмечал, что латинское «cogito» происходит от соче
тания «co-agito», что можно перевести как «совместно волновать/побуждать/двигать/
действовать». 69
постоянного становления, развития. Вместо поиска «мировой формулы» романтики ищут «мировую душу». Происходит как бы удвоение мира: в центре внимания романтиков находится не только и не столько реальное (Istwert), сколько возможное и должное (Sollwert). Развитие есть целенаправленное и целесообразное изменение природы в направлении воплощения моральных и эстетических идеалов. Третий принцип — культурно-историческая специфичность. Стилизованные шотландские баллады, испанские рыцарские романсы (собственно и давшие название данному направлению) и разнообразные «песни западных славян» составляют прототип ический материал романтической литературы. Наконец, четвертым принципом, отражающим общие установки романтизма, является примат личности, рельефно выраженный в популярной среди романтиков социальной метафоре Шекспира: «Всякий человек — это малое королевство».
Немецкая идеалистическая философия артикулировала отдельные аспекты романтического мироощущения. Если философские предшественники романтиков рассматривали сознание как зеркало, пассивно отражающее падающие на него извне воздействия, то сами романтики впервые предложили рассматривать его как лампу, освещающую жизненный путь и формирующую индивидуальный опыт (Abrams, 1953). В этом же контексте в философии впервые стало подчеркиваться значение индивидуальной активности. Иоганн Готлиб Фихте (1762—1814) поставил в центр своей философской системы свободное действие и личность, одновременно попытавшись преодолеть индивидуализм этических воззрений Канта (см. 1.1.3). Деятельность получила в работах Фихте статус надындивидуальной протосубстанции, первичной по отношению к картезианским субстанциям материи и мысли (см. 1.1.1 и 9.1.3)27.
Это новое понимание с блеском выразил основатель романтизма как художественного течения, поэт и публицист Новалис (Фридрих фон Харденберг, 1772—1801): «Деятельность и есть собственно реальность. Понятие личности (нем. Identität) должно включать понятие деятельности. Тому, что я есть, я обязан деятельности. И для деятельности справедливо правило, что она должна рассматриваться в ее связях, а не в отдельности. Она всегда есть отношение к предмету и к собственному состоянию» (Novalis, 1800/1926, S. 403). Свое основное, геологическое образование Новалис получил в Горной академии небольшого саксонского городка Фрайберга. Он впервые стал использовать, наряду с другими геологическими аналогиями, выражение «глубины
27 Подчеркивая «самоцельность» потока деятельности, Фихте вызвал критику исто
риков философии и одновременно предвосхитил последующие феноменологические опи
сания, зафиксированные в таких психолого-философских понятиях, как «поток созна-
70 ния» (Джеймс, 1902) и «опыт потока» (Csikszentmihalyi, 1990).
души», положившее начало психоанализу («глубинной психологии»), а также поиску различных слоев и уровней психики28. В самой геологии эта задача называется стратификацией (см. 2.4.3). Геологические находки окаменелых остатков доисторических животных послужили основой и для первых, отчасти вполне фантастических эволюционных гипотез.
Георг Вильгельм Фридрих Гегель (1770—1831) создал всеобъемлющую концепцию развития и саморазвития надындивидуального «абсолютного духа». Всякое начальное развитие рассматривается в его концепции как довод — тезис — в некотором нескончаемом споре. Дальнейшее развитие приводит к противоречию — антитезису, которое «диалектически снимается» на высшей стадии развития, или синтезисе. Известный философ, журналист и политический деятель Карл Маркс (1818—1883) также подчеркивал роль противоречий и деятельности в изменении мира (прежде всего, современного ему буржуазного общества), последовательно критикуя механистический материализм. Признаками последнего является то, что действительность «берется только в форме объекта или в форме созерцания, а не как человеческая чувственная деятельность, практика, не субъективно» (Маркс, т. 3, с. 12). В деятельности человек «не только изменяет форму того, что дано природой, он осуществляет вместе с тем и свою сознательную цель, которая как закон определяет способ и характер его действий и которой он должен подчинить свою волю» (Маркс, т. 23, с. 189).
Наиболее полно принципы романтического движения получили выражение в натурфилософии, или философии природы, разработанной Фридрихом Вильгельмом Шеллингом (1775—1854). Он полагал, что различные частные науки связаны между собой круговой зависимостью, в силу чего биология и психология должны играть при объяснении природы не меньшую роль, чем физика и химия. Эта система междисциплинарных взглядов, в известной степени, представляла собой возвращение к рассмотрению природы в духе несколько осовремененного телеологизма Аристотеля. Мощную поддержку натурфилософии оказали работы создателя первой целостной концепции эволюции и даже самого термина «биология» Жана Батиста Ламарка (1744—1829), для которого основным двигателем развития видов было стремление природы к совершенству. Эти аристотелевские моменты и были потом темати-зированы, как мы видели выше (см. 1.2.3), Францем Брентано. Уже в 20-м веке работы Брентано оказали влияние, с одной стороны, на философскую феноменологию, а с другой — на гештальтпсихологию и вюрцбургскую школу психологии мышления (см. 1.3.1).
28 Так, по характерному для данного подхода замечанию Л.С. Выготского, в психике
человека «...различные генетические формы сосуществуют, как в земной коре сосуществу
ют напластования самых разных геологических эпох» (Выготский, 1982, т. 2, с. 176). 71
Считается, что к середине 19-го века в результате прогресса физико-химических наук натурфилософия потерпела полное фиаско. Фактическая ситуация была более сложной. Примером сочетания научной и натурфилософской стратегий исследований стало создание Д.И. Менделеевым в 1869 году Периодической системы элементов (понимание причин периодичности химических свойств пришло значительно позже — в середине следующего, 20-го века). До сих пор остался актуальным поставленный Шеллингом вопрос о том, является ли при всех условиях безусловно целесообразной методология аналитического редукционизма, то есть стратегия расщепления изучаемого феномена на все более дробные составляющие. Один из последних натурфилософов (и один из первых Нобелевских лауреатов), дрезденский химик В. Освальд выдвинул аргумент, повторявшийся многими психологами, от отвергавших аналитический подход гештальтистов до U.C. Выготского и его последователей. Согласно этому аргументу, для объяснения свойств воды (скажем, того, что она позволяет тушить огонь) важно вовремя остановить процесс анализа на уровне молекулы воды, так как дальнейший анализ, то есть выделение кислорода и водорода, приводит к выявлению веществ, обладающих совершенно другими свойствами (поддерживают горение). Самой последней по времени попыткой возрождения идеи синтеза частных научных дисциплин можно считать когнитивную науку (см. 9.4.1).
Редукционизму как одному из приемов объяснения противостоит стратегия наблюдения, особенно полезная на ранних этапах развития любой эмпирической науки. Никто иной, как Аристотель дал пример описания и классификации явлений, направленных на указание их системных качеств и чуждых стремлению к поспешной редукции. Материалистическая трактовка качеств объектов, включая те, которые через две тысячи лет получили название «вторичных»; первое упоминание перцептивной организации и уровневой организации психики в целом; наконец, критика утверждения, что душа представляет собой «самодвижущееся число», — все это заставляет разделить вывод: «Психология Аристотеля — великая страница в развитии науки о человеческой душе. Ее проблемы, недостатки, заблуждения исторически объяснимы, ее достоинства удивительны, беспримерны» (Асмус, 1975). Примерно в те же годы, когда Курт Левин призывал преодолеть пережитки аристотелевского мышления в психологии, Бюлер в книге «Кризис психологии» именно в возвращении к Аристотелю видел шанс для выхода из кризиса. При этом его вдохновляли не столько описательные установки Аристотеля, сколько телеологический, или телеономный29, характер объяснений. Такие объяснения необходимы при анализе процессов управления,
29 Термин «телеономный» был введен в середине 20-го века этологами, чтобы провес
ти грань между научными представлениями о целенаправленности поведения и иррацио-
налистической концепцией витализма. Характерно, что создатель термина «витальный
порыв» французский философ и психолог Анри Бергсон получил в 1932-м году Нобелев-
72 скую премию по литературе, а не по физиологии.
составляющих, по мнению Бюлера, основную функцию психики в поведении (см. 1.4.3)30.
От Аристотеля путь развития естествознания ведет не только к Галилею и Ньютону, но и к Линнею, Ламарку и Дарвину. Функциональное, или телеономное объяснение — с характерным и главным для него вопросом «для чего?» — занимает в биологических и социальных науках такое же место центральной эвристики, которое в математике и физико-химических науках занимает эстетическая эвристика симметрии и внутренней красоты (см. 1.1.1). Функциональное объяснение позволяет понять картину наблюдаемого поведения не как ассоциативную цепочку чисто механических реакций на гипотетические атомарные стимулы, а как гибкую структуру процессов, направленных на достижение главных и промежуточных целей, реализующих прикрывающие маневры, выравнивающих нарушенное в результате собственной активности равновесие, обнаруживающих реликты предыдущих приспособлений и т.д.
Казалось бы, с появлением теории естественного отбора Дарвина и особенно молекулярной генетики в биологических науках должен был окончательно возобладать аналитический редукционизм. Однако даже недавняя расшифровка генома человека не делает биологию полностью редукционистской, так как невыясненными остаются функции и возможные взаимодействия фрагментов ДНК. Само понятие «ген» претерпело значительные изменения с конца 1970-х годов, потеряв былую определенность атомарных рекомбинируемых единиц наследования биологических признаков (Portin, 2002). Накапливается все большее число наблюдений, свидетельствующих о ко-эволюции биологических и культурных черт (Mesoudi, Whiten & Laland, 2006 in press). Более того, на клеточном и субклеточном уровне неожиданно новое звучание приобретают ранние адаптационные идеи Ламарка и его последователей, десятилетиями упоминавшиеся преимущественно в пренебрежительном контексте. Так, оказалось, что некоторые виды клеток — стволовые клетки — способны развиваться в разные органы в зависимости от культуры тканей, в которую они помещаются. Сегодня, в начале нового века и тысячелетия, молекулярная биология и генная инженерия представляют собой не только наиболее передовые в техническом отношении научные дисциплины, но, возможно, и самые романтические из них. Они
30 Ограниченность редукционистской стратегии объяснения подчеркивал В.И. Вер
надский. По его словам, она встречается «в полном объеме у забытых авторов 17-го века.
Таковы представления о социальной физике и социальной механике..., которые одно время
считались созданием Огюста Конта». Однако в движении человеческого познания «мы,
наряду с развитием математики и естествознания, видим колоссальное развитие наук ис
торических. Их существование, столь далекое от математических умозрений и механи
ческих моделей, делает попытки внести эти модели в область социологии столь же мало
вероятными, как делало их в 18-м столетии развитие нового естествознания. К тому же и
сейчас... математические формулы и механические модели играют роль не большую, чем
прежде, если только мы обратим внимание не на отдельные области знания, а на всю
науку в целом» (Вернадский, 1981, с. 222—223, 227). 73
непрерывно порождают новые романтические иллюзии — вплоть до внезапно возникшей вне религиозного или какого-либо иного эзотерического контекста надежды на физическое бессмертие.
Нередукционистским также является тип объяснения, описывающий происхождение феномена из исторически более ранних форм. Представители натурфилософии первыми заинтересовались отношением филогенеза и онтогенеза. Разнообразие форм жизни и принцип развития были объединены представлением о рекапитуляции, то есть быстром повторении основных фаз эволюции в процессе индивидуального развития. Дрезденский физиолог, представитель романтической медицины Карл Густав Карус (1789—1869) и основатель эмбриологии Карл Максимович Бэр (1792—1876) провели исследования, которые позволили уточнить представление о рекапитуляции. Согласно установленным законам биологического развития, онтогенез повторяет лишь эмбриональные, а не взрослые предшествующие формы. Кроме того, развитие происходит от общего к более специфическому. Эти положения повлияли на взгляды Герберта Спенсера (1820—1903) и Эрнста Геккеля (1834— 1919), видных представителей дарвинизма второй половины 19-го века. Геккель оставил яркое графическое описание эволюции (см. рис. 1.6). Он же ввел в науку понятие «экология», играющее важную роль и в сегодняшних дискуссиях (см. 9.3.1)31. Некоторые следствия из работ эмбриологов для психологии, лингвистики и нейрофизиологии стали экспериментально анализироваться лишь в последние годы (Deacon, 1996).
Гипотеза рекапитуляции, в форме «биогенетического закона» Геккеля, оказала влияние на научные взгляды первых психологов развития — Стэнли Холла (1844—1924) и Джеймса Болдуина (1861—1934). Холл попытался прямо сопоставить этапы онтогенеза ребенка с эволюционным развитием биологических видов. Болдуин, напротив, подчеркивал роль социальной имитации. У него, кстати, можно найти практически весь понятийный аппарат разработанной позднее Жаном Пиаже теории интеллектуального развития (например, такие понятия, как «аккомодация», «ассимиляция», «циркулярная реакция», «схема»...), а также общее представление об умственном развитии ребенка как переходе от стадии прелогичного к стадии логического, а затем и к стадии «сверхлогического», или формального мышления (см. 8.1.1). В последнем случае содержание мыслительных операций перестает играть какую-либо роль, остается лишь их голая оболочка, или форма — отсюда термин формальное мышление.
Сам Пиаже (а вместе с ним и наиболее влиятельная в 20-м веке Женевская школа психологии развития) был убежденным привержен-
31 «Общая наука об отношениях организма к окружающему миру, к которому мы отно
сим все "условиях существования" в широком смысле слова, то есть имеющие как орга-
'4 ническую, так и неорганическую природу» (Haeckel, 1866/1988, S. 17).
Рис. 1.6. Генеалогическое дерево человечества (по: Haeckel, 1866/1988).
75
цем романтической идеи единства (круговой взаимосвязи) наук и очень широкой аналогии между филогенезом, историческим развитием науки и онтогенезом интеллекта ребенка. В основу его теории онтогенеза было положено представление о спонтанном развитии ментальной логики в сознании ребенка. Коррективы в эти представления были вне-сены так называемым культурно-историческим подходом в психологии, создатель которого, Лев Семенович Выготский (1898—1934), подчеркнул очевидное различие условий возникновения исходных филогенетических достижений и культурного развития ребенка в онтогенезе. Обе теории до сих пор служат примерами двух различных подходов к проблемам развития. Как Пиаже, так и Выготский сочетали интерес к психологии со знаниями других дисциплин, а именно биологии и лингвистики. Наряду с основателями психологии (см. 1.2.1), они были одними из наиболее ярких ранних представителей широкого междисциплинарного направления исследований, которое известно сегодня как когнитивная наука.
1.4.2 От натурфилософии к нейропсихологии
Романтизм в культуре и науке неоднократно обнаруживал способность к модификациям и повторному возникновению. Его влияние оказалось значительным в случае русской и советской науки. Формирование русской интеллигенции пришлось на период максимального распространения романтизма, так что практически все ведущие национальные поэты 19-го века были романтиками. Федор Тютчев, близко знавший Ф.В. Шеллинга в мюнхенский период своей жизни, оставил выразительное поэтическое описание сути натурфилософии32. Во-вторых, философия марксизма, вобравшая в себя многие положения натурфилософии и классической немецкой философии, в течение ряда десятилетий была популярна в стране и даже имела статус государственной идеологии. Наконец, официальной доктриной искусства в советский период стал так называемый социалистический реализм. Но поскольку действительность была не вполне социалистической, этот «реализм» мог быть либо агитпропом, либо вариантом романтизма. Влияние последнего — с типичным для романтизма приемом контрастирования обыденного и загадочного, настоящего и будущего — отчетливо прослеживается у О.Э. Мандельштама, В.В. Маяковского и Б.Л. Пастернака (см. 8.1.3).
Для русской психологической науки изоляция советского периода имела множество отрицательных последствий, таких как сравнительно
32 «Не то, что мните Вы, природа: не слепок, не бездушный лик — в ней есть душа, в
ней есть свобода, в ней есть любовь, в ней есть язык». Романтизм и натурфилософия
Шеллинга парадоксальным образом оказали особенно сильное влияние на взгляды русо
фильской части национальной интеллигенции, придерживавшейся позиции уникально-
76 сти и обособленности России (и славянского мира в целом) от Западной Европы.
слабое знакомство с культурой эксперимента, для овладения которой нужно было бы «переболеть» необихевиоризмом. Но зато при этом сохранился романтический настрой и общее представление о целостном и функциональном характере предмета психологии. Известно, какое значение придавалось целеустремленности живых систем в советской психофизиологии Петром Кузьмичом Анохиным (1898—1974) и основателем современной биомеханики Николаем Александровичем Берн-штейном (1898—1966). По мнению H.A. Бернштейна, вопрос «для чего?» имеет при изучении процессов двигательной активности не меньшее значение, чем вопросы «что?» и «как?». Такой подход совершенно явно противостоит редукционистским попыткам сведения поведения к атомарным, далее не разложимым составляющим: «рефлекс — не элемент действия, а элементарное действие».
Натурфилософия осталась коротким эпизодом истории философии. Однако романтический идеал единой науки не исчез, он продолжает оказывать влияние на современные исследования и, по крайней мере, дважды был назван прямо по имени — крупнейшим лингвистом, одним из основателей так называемой Пражской лингвистической школы Романом Осиповичем Якобсоном (1896—1982) и, спустя 40 лет, его коллегой и другом, нейропсихологом Александром Романовичем Лурия (1902—1977), посвятившем «романтической науке» последнюю главу своей биографии. Ретроспективно это объясняет многое в их научных предпочтениях, например, неверие в дарвинизм — как последнее слово в объяснении эволюции — и довольно прохладное отношение к ориентированной на синтаксис теории порождающей грамматики Хомского. В их работах по психологии речи, лингвистике и нейролингвистике доминировало представление о высокой степени интерактивности различных компонентов речевой активности, а также отчетливо выступал интерес к семантике и даже поэтике.
О причинах подобного интереса хорошо сказал известный русский литературовед Михаил Михайлович Бахтин (1895—1975), создавший еще в предвоенные годы основы теории речевого общения, или мета-лингвистики. Согласно Бахтину, всякое высказывание, участвующее в процессах живого человеческого общения и мышления, внутренне диалогично. Строя высказывание, мы стараемся рефлексивно предвосхитить возможный ответ. Этот предвосхищаемый ответ, в свою очередь, оказывает воздействие на наше высказывание — мы парируем возражения, которые предвидим, прибегаем к оговоркам и т.п. Иными словами, в процессе речевой коммуникации мы всегда учитываем интеллектуальный и эмоциональный фон восприятия нашей речи собеседником — то, насколько он осведомлен в ситуации, его знания и убеждения, его предубеждения, интересы, симпатии и антипатии. Подобный учет прежде всего определяет выбор жанра высказывания, композиционных приемов и лишь затем-собственно языковых средств, семантики и синтаксиса высказывания (см. 6.3.3). Бахтин особо подчеркивал, что для пони- 77
мания наиболее сложных форм речемыслительной деятельности необходимо исследовать поэтическую речь: «Только в поэзии язык раскрывает все свои возможности, ибо требования к нему здесь максимальные: все стороны его напряжены до крайности, доходят до своих последних пределов; поэзия как бы выжимает все соки из языка и язык превосходит здесь самого себя». Металингвистика Бахтина предвосхитила некоторые из числа наиболее интересных современных исследований обучения (см. 5.4.2), понимания (см. 7.4.1) и мышления (см. 8.1.3).
В конце жизни А.Р. Лурия вспоминал о встречах и спорах с И.П. Павловым во время их работы в Принстонском университете летом 1932 года. Павлов резко отзывался о работах Кёлера по изучению интеллекта человекообразных обезьян, так как в этих работах был нарушен галиле-евский принцип движения от простого к сложному. По его мнению, основой поведения являются рефлексы, от изучения которых можно было бы перейти к изучению научения, а затем и к анализу процессов решения задач. Лурия же пытался защищать романтическую стратегию движения от сложного к простому. Разумеется, Лурия и его ближайшие коллеги не были одиноки в их исследовательских установках. В 1950-е годы канадский психолог Дональд Хэбб (1904—1982), создатель термина нейропсихология, риторически спрашивал: «Почему психология должна быть проще, чем ее большие сестры — физика и химия?» И приводил следующий аргумент: «Большой мозг, как большое государство, не может просто делать простые вещи». Действительно, предположение, что изучаемые психологией феномены сложнее, чем они кажутся на первый взгляд, во многих случаях оказалось эвристически полезным33.
Хэбб был учеником основателя американской психофизиологии Карла Лэшли (1890—1958). Своеобразной доминантой исследований Лэшли был поиск материального субстрата приобретаемого в ходе обучения опыта. Для его локализации он удалял крысам фрагменты коры, проверяя, как это влияет на поиск пути в знакомом лабиринте. Оказалось, что не место удаления, а только общая масса удаленной ткани влияет на навык. Лэшли, таким образом, занял антилокализационистскую позицию34. Пытаясь объяснить эти данные, Хэбб предложил в класси-
33 В книге о когнитивной науке важно отметить, что приведенное наблюдение, по-
видимому, имеет общеметодологическое значение. Под названием «парадокс изобрета
теля» крупнейший венгерский математик Д. Пойа первым отметил парадоксальные взаи
моотношения простоты и сложности разных уровней описания в науке. Так, для доказа
тельства простых утверждений обычно приходится использовать особенно сложные лем
мы. В современной прикладной логике также показано, что чем эффективнее компью
терная программа, тем более абстрактные идеальные понятия должны использоваться для
ее обоснования (Непейвода, 2000).
34 Если бы, удаляя участки коры подопытных животных, Лэшли двинулся на несколь
ко миллиметров вглубь височных долей, к структурам так называемого гиппокампа, его
мнение о природе мозговых механизмов памяти могло бы быть совсем иным (см. 5.3.2).
Точка зрения на локализацию психологических функций многократно менялась на про-
'·» тяжении последних 200 лет. Узкий локализационизм доминировал в начале 19-го века —
ческом труде «Организация поведения» (Hebb, 1949) распределенную модель хранения опыта с помощью множества одновременно активируемых при решении некоторой задачи нейронных (клеточных) ансамблей. (Эти представления интенсивно используются сегодня в когнитивной нейрофизиологии, в частности, в так называемых коннекционистских моделях — см. обсуждение «правила Хэбба» в 2.3.3.) Связь нейронов и их «коммутаторов», синапсов, может быть, с этой точки зрения, временной и функциональной, а не только пространственно-анатомической. Несколько позднее, уже в 1970-е годы, ученик Лэшли и Кёлера Карл Прибрам выдвинул предположение о распределенном хранении информации по голографическому принципу, когда хранение обеспечивается фиксацией интерференционных узоров волн активации в массе нейронов коры.
Интересно сравнить эти представления со взглядами Лурия. Центральным для него является понятие функциональной системы. В этом понятии «функциональность» означает включенность в деятельность, направленность на решение определенных задач (ср. описание «функционализма» как методологического подхода в 1.2.3 и 1.4.1). «Системность» означает сложную соподчиненность — координацию — задействованных мозговых и даже внемозговых («экстрацеребральных») компонентов. В существовании последних нет ничего мистического, речь идет о возможных внешних средствах и источниках поддержки, от узла на платке и записной книжки до другого человека, готового вмешаться и помочь (см. 5.4.1 и 9.3.3). Системность также означает неприемлемость как жесткого локализационизма, так и полного отрицания специализации мозговых структур. Специализация имеется, но она подчиняется целям действия и может меняться в ходе развития (см. 9.4.1). В результате возможны случаи, когда некоторая мозговая структура будет включена в целый ряд функциональных систем, а одна и та же система будет вовлекать в решение задачи в разные моменты времени различные анатомические структуры.
Так, поражение левой теменно-затылочной коры ведет не только к ошибкам в зрительном восприятии, но и к нарушениям счета про себя, а также к трудностям интерпретации речевых конструкций типа «брат отца» и «отец брата». С другой стороны, одна и та же задача может решаться с помощью различных стратегий организации активности, вовлекающих разные мозговые структуры. Запоминать можно опираясь на внешние предметы-знаки, выделяя акустическую ритмику сообщения, а
в период расцвета так называемой френологии, в конце 19-го — начале 20-го века и вновь
в конце 20-го века. В настоящее время вновь возрастает интерес к глобальным механиз
мам (см. 2.4.3 и 9.4.3). Одновременно совершенствование методов нейровизуализации и
метаанализа данных позволяет надеяться на дальнейшее уточнение локализации, вплоть
до выявления функционального значения отдельных архетонических полей коры и дру
гих анатомических структур мозга (например, Brass et al., 2005). 79
также применяя сложные стратегии образного или понятийного кодирования (см. 5.1.1). Слово можно читать букву за буквой, а равно пытаться распознать его в целом, как сложный зрительный паттерн, или угадать из контекста. Все это вовлекает в работу очень разные мозговые структуры, причем различные культуры письменности специфически поддерживают лишь некоторые из этих способов. О роли такого культурного окружения для мозговой локализации развивающихся механизмов решения тех или иных задач говорят некоторые факты, обнаруженные Лурия в самом начале его клинической карьеры. Оказалось, что похожие по локализации травмы мозга имеют разные последствия для русских и китайцев. В силу опоры на логографическую письменность у китайских пациентов серьезные нарушения чтения («дислексии») наблюдаются при поражениях правого, а не левого, как у русских и других европейцев, полушария (см. 7.2.2).
Представления Лурия о пластичности и изменении компонентов некоторой функциональной системы во времени связаны с идеями Л.С. Выготского. В «Мышлении и речи» Выготский (1934) дал пример анализа сложного феномена — сопровождающих решение задач вокализаций ребенка, — при котором вопрос о структурной организации неизменно дополнялся вопросами о функции и происхождении. Структурные особенности речи ребенка (грамматический состав, сокращен-ность и т.д.) оказались связанными с выполняемой ею функцией (вначале это речь для других, позднее также речь для себя) и с этапами генетического процесса интериоризации — перехода речи из внешнего развернутого плана в полностью свернутый внутренний, то есть превращение речи из средства коммуникации с другими в средство планирования и произвольного управления собственной деятельностью, «внутреннюю речь» (см. 4.4.2 и 9.4.3). Совершенно очевидно, что на разных этапах этого процесса различными окажутся и мозговые компоненты соответствующих функциональных систем35.
Вслед за Выготским, Лурия различал натуральные (природные) и высшие психические функции. Особенностью последних является опос-редованность речевыми значениями, которая возможна лишь на человеческой стадии развития. Надо сказать, что в этом пункте анализ по-
" В последних своих работах Выготский (1934/1995) обратился к нейропсихологии развития, попытавшись обобщить закономерности развития и распада психических функций. Когда психика только формируется в онтогенезе, то высшие функции зависят от более элементарных, уже сформировавшихся. Поэтому при поражениях развивающегося мозга ребенка у него преобладают симптомы гибели более высоких функций по сравнению с непосредственно пораженными. При поражении зрелого мозга высшие функции страдают значительно меньше, так как они уже сформировались и получили определенную автономию. Более того, симптомы нарушений следует ожидать скорее «снизу» от ло-куса поражения, поскольку теперь элементарные функции находятся под контролем более высоких. В этом эскизном описании просматриваются очертания некоторой многоуровневой концепции психической организации, детали которой стали уточняться лишь относительно недавно (см. 1.4.3, 8.4.3 и 9.4.2).
следствий мозговых поражений продемонстрировал недостаточность двухуровневой классификации Выготского и Лурия, весьма похожей на более ранние попытки разделения элементарных и высших, опосредованных речью процессов (близкое различение встречается уже у Вунд-та — см. 1.2.2). В частности, некоторые из обследованных А.Р. Лурия пациентов сохраняли способность к интеллектуальной, творческой деятельности, несмотря на массивные нарушения речи, а внутри речевых функций были выявлены относительно более сложные феномены (такие как основанная на метафорическом использовании значений поэтическая речь или, скажем, ирония), явно свидетельствующие о многоуровневой организации самих процессов речевой коммуникации (см. 7.4.1). Недостаточно дифференцированным, конечно, является также первоначально использовавшееся Выготским и Лурия описание перцептивных и сенсомоторных процессов просто как натуральных психических функций.
1.4.3 Вклад физиологии и психологии деятельности
Уточнение взглядов Выготского и Лурия в направлении разработки более реалистических, многоуровневых представлений об организации психических процессов возможно, если обратиться к научному наследию их ближайших коллег — одного из создателей современной биомеханики Николая Александровича Бернштейна и автора психологической теории деятельности Алексея Николаевича Леонтьева (1903—1979). Остановимся сначала на научном наследии первого из этих авторов. Свою концепцию Бернштейн называл физиологией активности. Его вклад в когнитивную науку прежде всего связан с анализом того, что обычно считается «низшими» психофизиологическими функциями, а именно с изучением разнообразных вариантов и форм двигательного взаимодействия с окружением. В 1947 году он опубликовал монографию «О построении движений», в которой обобщил опыт диагностической и реабилитационной работы советских нейропсихологов во время Второй мировой войны. Эта книга содержит описание четырех эволюционных уровней построения движений, от простейшего, субкортикального уровня палеокинетических регуляций А до полностью кортикального уровня предметных действий D.
В таблице 1.1 представлено очень краткое «резюме» уровневой архитектуры сенсомоторных процессов, как ее понимал Бернштейн. Наряду с выполняемой каждым из уровней функцией указаны также основные мозговые механизмы. В классической монографии 1947 года можно найти обсуждение эволюционного происхождения некоторых из этих механизмов, их взаимосвязи с экологией больших биологических классов животных и, в особенности, симптомов выпадения отдельных уровней при локальных мозговых поражениях и различных заболеваниях нервной системы у человека. Ближе к концу этой книги мы попыта-
81
Таблица 1.1. Уровни построения движений (по: Бернштейн, 1947)
Уро- | Название | Функция | Субстрат |
вень |
|
|
|
D | Предметные | Движения, с учетом | Ассоциативные зоны |
| действия | специфики предметов, | теменных и фрон- |
|
| например, рабочих | тальных зон коры |
|
| инструментов |
|
С | Пространственное | Разовые целевые дви- | Новая часть базаль- |
| поле | жения, соотносимые с | ных ганглиев (стриа- |
|
| метрикой пространства | тум) и проекционные |
|
|
| зоны коры |
В | Синергии | Ритмические движе- | Таламус и древняя |
|
| ния, перемещающие | часть базальных |
|
| организм как целое | ганглиев (глобус |
|
|
| паллидум) |
А | Палеокинетические | Регуляция тонуса, | Стволовые отделы |
| регуляции | простейшие защитные | головного мозга и |
|
| и вестибулярные | спинной мозг |
|
| рефлексы |
|
емся представить несколько осовремененную модель уровневои архитектуры, позволяющую рассматривать не только построение движений, но и «построение образа» — координационные механизмы когнитивных процессов (см. 8.4.3).
Подход Бернштейна на десятилетия опередил свое время и во многом опирался скорее на смелые предположения, чем на проверенные данные. Надо сказать, что сам принцип одновременного рассмотрения мозговых механизмов и их функциональных проявлений начинает утверждаться в когнитивной науке только в последние годы (см. 2.4.1 и 9.1.3). Бернштейн не мог, даже если бы и поставил перед собой эту цель36, распространить уровневый нейропсихологический анализ на собственно познавательные процессы, которые в то время оставались почти неизученными. Он, однако, отмечал возможное существование «одного или двух» уровней высших символических координации («координации группы Е»), специфически связанных с речью и мышлением. Например, круговое движение руки учительницы, в процессе объясне-
82
36 Свидетельством интереса H.A. Бернштейна к познавательным процессам, прежде всего восприятию и памяти, является его опубликованная лишь совсем недавно (Бернштейн, 2003) монография второй половины 1930-х годов. Эта работа свидетельствует о его хорошем знании гештальтпсихологии и о тесных научных контактах с Л.С. Выготским и А.Н. Леонтьевым.
ния геометрической теоремы рисующей на доске окружность, находится под контролем подобных символьных координации. Очень похожее движение руки гимнастки при выполнении спортивных упражнений, напротив, будет контролироваться значительно более низким уровнем синергии (уровень В). Номенклатура задействованных мозговых механизмов определяется, таким образом, «смысловой стороной» стоящей перед субъектом задачи.
К сожалению, вскоре после опубликования эта классическая монография Бернштейна была запрещена в Советском Союзе, а сам автор потерял возможность работать. Причиной была критика Бернштейном теории условных рефлексов Павлова в ее догматической интерпретации, характерной для конца 1940-х годов. Поэтому концепция уровней построения движений не получила должного развития и, по сравнению с другими идеями Бернштейна (см. 9.3.2), осталась почти незамеченной в мировой психологической литературе. «Сверхзадача» нашей книги состоит в том, чтобы восполнить, насколько это возможно, данный пробел, показав перспективность уровневого подхода к данным, накопленным в когнитивных исследованиях, в частности, в центральной для когнитивной науки области высших форм понимания и мышления (см. 3.4.2,5.3.3 и 8.4.3).
Другой влиятельной концепцией, получившей широкое распространение в советской психологии 1960-х годов, была теория деятельности А.Н. Леонтьева. Эта теория разделяет поток активности человека на три взаимодействующих слоя:
деятельности, имеющие молярный характер и направленные на до
стижение стратегических, часто неосознаваемых мотивов (вопрос
«для чего?»);действия, направленные на достижения промежуточных, осознава
емых целей (вопрос «что?»);более дробные, тактико-технические операции, которые приспосаб
ливают действие к конкретным условиям достижения цели и в при
вычных условиях не осознаются (вопрос «как?»).
Для когнитивной психологии особенно существенна постановка Леонтьевым вопроса о возможной расчлененности высших психических функций на две подсистемы. По Выготскому и Лурия, специфика этих функций состоит в том, что они опосредованы речевыми значениями. В 1940-е годы Леонтьев провел важное различение между значением и смыслом. Оно внешне напоминает некоторые различения в формальной логике и семиотике, однако фактически отлично от них и глубоко психологично (см. 6.1.1). Если значение (речевое значение) является единицей фиксированного в языке общественно-исторического опыта (в соответствии с идеями марксистской философии и культурно-исторического подхода Выготского), то под смыслом имеется в виду «личностный смысл» — субъективное отношение к ситуации, которое может от-
83
личаться и обычно отличается от нормативно общественного37. Как значение, так и смысл являются, по мнению Леонтьева, равноправными образующими индивидуального сознания38.
Тем самым А.Н. Леонтьев фактически предположил существование некоторого более высокого уровня управления поведением, чем тради-, ционные, опосредованные речевыми значениями высшие психические функции в понимании Выготского и Лурия. Это предположение имеет ряд серьезных последствий. Так, существование особого механизма реализации личностного отношения могло бы скорректировать некоторые, типичные для части когнитивной психологии и более ранних подходов (особенно ассоцианизма и бихевиоризма) представления о центральной роли прошлого опыта — «знаний» — в детерминации поведения. Как отмечает Леонтьев, при достижении личностного уровня развития меняется отношение человека к своему прошлому: «Вопреки своей распространенности, взгляд на личность как на продукт биографии человека является неудовлетворительным... Упускается главный психологический факт, а именно что человек вступает в отношение к своему прошлому, которое по-разному входит в наличное для него — в память его личности» (Леонтьев, 1975, с. 217).
Длительное время понятие личностного смысла использовалось лишь гуманистически-ориентированными направлениями психологии. Вплоть до последнего времени никто, похоже, даже не задумывался серьезно о нейропсихологической реальности его механизмов и возможности их изучения в рамках естественно-научного, позитивистского подхода. Это случилось только после нового кризиса экспериментальной психологии в 1980-е годы (см. 2.3.1 и 9.1.1) и последовавшей смены парадигмы когнитивных исследований. В результате сегодня мы можем значительно более объективно, с учетом требований современной науки разграничить значение и смысл как в отношении поведенческих проявлений, так и с точки зрения поддерживающих их мозговых механизмов (см. 5.3.3 и 7.4.2).
Разумеется, культурно-историческая линия анализа и учет эволюционного контекста не были уникальной особенностью работ небольшой группы ведущих советских психологов и физиологов. Близкие идеи можно найти и у ряда американских и западноевропейских авто-
37 Утверждать нечто подобное в СССР в середине 20-го века было актом личного му
жества. А.Н. Леонтьев следует здесь романтическому принципу примата деятельности и
личности (см 1.4.1). В несколько упрощенном виде его подход послужил прототипом для
ряда известных концепций в области психологии труда и инженерной психологии, преж
де всего для теории контроля действия немца Винфрида Хакера и трехуровневой модели
регуляции поведения датчанина Йенса Расмуссена (см. 2.1.2).
38 Третьей и последней образующей сознания, наряду со значением и смыслом, по
мнению А.Н. Леонтьева, является «чувственная ткань». По содержанию это понятие близ
ко понятиям «квалия» и «феноменальное сознание», широко используемым в современ-
84 ных когнитивно-ориентированных философских исследованиях (см. 1.2.1, 4.4.3 и 8.4.3).
ров предвоенного периода. Главным отличием этих работ была лишь несколько иная база эмпирических исследований, в частности, сравнительно ограниченный доступ к данным о локальных поражениях мозга (для создания своих концепций Лурия и Бернштейну, правда, также понадобился обширный материал о последствиях черепно-мозговых ранений, накопленный во время Второй мировой войны).
Первым таким автором был неоднократно упоминавшийся выше Карл Бюлер, профессор Дрезденского, а затем Венского университетов. Лурия, а через него и Выготский были хорошо знакомы с работами Бю-лера и, вероятно, с ним лично. Практически одновременно с Выготским и Куртом Л евином, в 1927 году, Бюлер написал книгу «Кризис психологии», где выступил за объединение трех линий исследований:
субъективной (традиционная экспериментальная психология со
знания по образцу и подобию вюрцбургской школы психологии
мышления);объективной (исследования поведения человека и животных);
культурно-исторической (психология народов, продуктов деятель
ности и языка в продолжение поздних работ Вундта).
Общим форматом такого объединения, по мнению Бюлера, должна была бы стать психологическая теория действия, в которой он подчеркивал аспект когнитивной целесообразности действий человека. Различие целенаправленной и целесообразной активности иллюстрирует следующий пример: собака, лающая на локомотив, делает это хотя и целенаправленно, но не целесообразно.
Работы Бюлера по психологии развития ребенка (они были сразу же переведены на русский язык под редакцией Л.С. Выготского) содержали описание трехуровневой теории фило- и онтогенеза с этапами инстинкта, научения и интеллекта. Чтобы понять специфику интеллекта человека, Бюлер обращается в 1930-е годы к изучению языка и значения, которые трактовались им с позиций теории социального действия39. Согласно его точке зрения (близкую позицию занял и основатель теории деятельности А.Н. Леонтьев), значение — это то, что мы узнаем о Мире посредством и через среду языковых знаков (Buehler, 1934).
Карл Бюлер подготовил блестящую плеяду учеников, среди которых были Эгон Брунсвик, Конрад Лоренц, Карл Поппер и, отчасти, Эдвард Толмен. Многие из его учеников внесли важный вклад в когнитивную переориентацию психологических исследований во второй
39 В результате анализа индоевропейских языков Карл Бюлер пришел к выводу, что
понимание предложения связано с реконструкцией выраженных в нем схем социального
действия: «Сопоставляя предложения "Пауль ухаживает за больным отцом" и "Пауль пьет
воду", мы легко замечаем различия... То, что происходит между Паулем и его отцом — это
действие, распределенное между двумя партнерами: мы можем перевернуть мысленно их
роли, так что отец будет ухаживать за больным Паулем. То, что происходит между Паулем
и водой — тоже действие, но мы едва ли можем представить себе, как вода пьет Пауля,
если не придадим этому какое-либо метафорическое значение» (Buehler, 1934, S. 239). 85
половине 20-го века. Эмигрировавший в Англию австрийский философ и методолог науки Карл Поппер подчеркнул значение теорий в процессах эмпирического познания. От Фрэнсиса Бэкона до бихевиористов и представителей логического позитивизма (неопозитивизма) в науке доминировало представление о необходимости строго индуктивного, полностью непредвзятого описания фактов (см. 1.3.2). На своих лекциях Поппер просил студентов взять лист бумаги и непредвзято описать все, что они наблюдают. Студенты не могли этого сделать и спрашивали, на что они должны обратить внимание40. Поппер также выдвинул ставший широко известным методологический принцип фальсифицируемости теорий, согласно которому всякая научная, основанная на эмпирических данных теория должна допускать возможность ее опровержения. Ирония состоит в том, что применение этого принципа к взглядам его учителя Бюлера могло бы быть затруднительно в силу их чрезвычайной общности.
Вторым конгениальным автором был крупнейший французский психолог, профессор Коллеж де Франс Пьер Жане (1859—1947). Он продолжил функционалистские исследования эмоций, воли и памяти, начатые его учителем Рибо, и связал их с идеями французской социологической школы конца 19-го — первой половины 20-го века. Для представителей этой школы (социолога Дюркгейма, психологов Блонделя и Хальбвакса, а также, несколько позднее, антрополога Леви-Брюля) формирование психики и поведения человека определялось культурно-историческими факторами. К этим факторам относились как материальные продукты деятельности, так и характеризующие определенную культурно-историческую среду идеальные объекты — социальные представления4'.
Жане попытался создать всеобъемлющую теорию эволюционного развития и иерархического строения психики (от рефлексов до социально обусловленных интеллектуальных действий), основанную на понимании психологии как науки о поведении. Однако в отличие от бихевиористов он не сводил поведение к двигательным актам, подчеркивая интегративную роль сознания, в особенности применительно к высшим
40 Современные исследования внимания содержат множество примеров так называе
мой «слепоты невнимания», когда испытуемые не воспринимают объекты и события, если
не ожидают увидеть их при данных обстоятельствах (см. 4.1.3 и 4.2.1). Огромный факти
ческий материал истории когнитивной психологии также содержит большое количество
иллюстраций того, как один и тот же феномен не только описывался, но даже и воспри
нимался довольно различным образом, в зависимости от доминирующего теоретическо
го подхода.
41 Критикуя индивидуализм традиционных философских и психологических концеп
ций, Дюркгейм подчеркивал зависимость нашего сознания от социальных представле
ний: «Мы являемся жертвами иллюзии, которая заставляет нас верить, что мы создали
то, что на самом деле лишь управляет нашей волей извне» (Durkheim, 1895/1982, р. 13). В
современной когнитивной науке предпринимаются попытки уточнить и развить взгляды
86 о социокультурной обусловленности индивидуального опыта (см. 6.3.3 и 9.4.2).
формам поведения. Такими высшими формами поведения, по его мнению, являются опосредованные сначала примитивными знаками (по типу зарубок на дереве или завязанных «на память» узелков), а затем и речевыми значениями воля, память, мышление и самосознание. Для иллюстрации идеи опосредования Жане и его коллегами использовались не только клинические случаи психических расстройств (они рассматривались как примеры дезинтеграции сознания), но и эксперименты на запоминание, проводившиеся с применением предметов-знаков — вполне в духе последующих работ школы Выготского. Возникновение языка Жане связывал с развитием памяти и, в особенности, представлений о времени. Мышление генетически становится заместителем реального действия и опирается в своих развитых формах на внутреннюю речь.
Для полноты картины нам нужен был бы лишь пример из англоязычной психологии. Здесь лучшим примером являются классические исследования профессора Кембриджского университета, основателя знаменитого Отделения прикладной психологии {Applied Psychology Unit, A PU) при Британском медицинском совете Фредерика Бартлетта (1886—1969). До того как стать изобретательным психологом-экспериментатором, он получил широкое философское и антропологическое образование, что позволило ему подойти к решению психологических проблем с позиций социальной и культурной детерминации поведения. Особую известность (правда, в основном, уже после его смерти) Барт-летту принесли его исследования сложных, социально-опосредованных форм памяти и мышления.
Убежденный, как ранее Вундт, что эксперименты эббингаузовско-го типа не столько способствуют, сколько препятствуют выявлению реальных закономерностей памяти, Бартлетт (Bartlett, 1932) первым начал изучать в 1920-е годы особенности припоминания осмысленного текста и даже некоторых реальных событий (они обычно разыгрывались его ассистентами прямо во время лекции). Он обнаружил, что память никогда, за исключением случаев цитирования хорошо известного текста, не бывает буквальной, так что воспроизведение обычно сопровождается изменениями исходного материала. Изменения включают не только отдельные пропуски (забывание), но и качественные модификации и даже введение совершенно новых фрагментов. При произвольном воспоминании некоторого эпизода человек сначала восстанавливает общее эмоциональное отношение к нему, а затем, используя свой прошлый опыт, реконструирует и, отчасти, конструирует детали. Такая конструктивная перестройка приводит материал в соответствие с социокультурными нормами и стереотипами, принятыми в данной среде. Поэтому воспроизведение одного и того же рассказа оказывается различным у представителей разных этнических и социокультурных групп.
87
Для объяснения этих данных Ф. Бартлетт воспользовался понятием «схема», которое широко применялось его близким знакомым, неврологом Генри Хэдом во время и после Первой мировой войны при описании нарушений моторики, памяти и речи, вызванных локальными поражениями мозга. Эти работы, в частности, показали, насколько устойчивым во многих случаях остается субъективный образ тела, или схема тела, продолжающий включать фантомы конечностей даже через длительное время после их ампутации. Бартлетт вложил в понятие «схема» более глубокое значение — для него это одновременно и форма обобщенной, социокультурной организации прошлого опыта и инструмент, используемый в выполнении любого хорошо адаптированного поведенческого акта, в том числе процессов решения задач на припоминание. Всякое новое знание пополняет схематическую организацию опыта, который творчески, с элементами непредсказуемой вариативности используется для решения следующих задач. В последнем можно видеть сходство с идеями Канта, который понимал под схемами правила творческого (продуктивного) воображения (см. 1.1.3).
Позднее Бартлетт (Bartlett, 1958) распространил этот подход и на психологию мышления. Оно понималось им по аналогии со сложными двигательными навыками, но выполняемыми, главным образом, во внутреннем плане. В своих исследованиях Бартлетт первым описал ряд качественно различных форм мышления, таких как мышление ученого-экспериментатора, художника и юриста. Эти профессионально-специфические формы мышления Бартлетт противопоставил так называемому «обыденному» (или повседневному — англ. everyday) мышлению каждого из них. Он также провел очень важное разграничение между мышлением в закрытых (заданные условия необходимы и достаточны для решения) и открытых системах (список условий потенциально бесконечен, а задача не имеет строгого логического, формального решения). В целом, в подходе этого автора постоянно, на протяжении нескольких десятилетий подчеркивалась роль творческих трансформаций материала, семантики и специфического социокультурного опыта, а не врожденных формальных правил, подобных правилам трансформационной грамматики.
Таким образом, Выготский и его коллеги действительно были не одиноки в своих поисках. Естественно задать вопрос, почему эти линии исследования не привели уже тогда к обновлению научной психологии, созданию своего рода «культурно-исторической нейропсихологии развития»? Очевидно, главная проблема состояла и, отчасти, все еще состоит в отсутствии надежных методов. Многое делалось и объяснялось в режиме ad hoc. Например, в изучении развития доминировал метод наблюдения (причем часто, как в работах Пиаже, наблюдения проводились над собственными детьми). Что касается нейропсихологических
гипотез, то они длительное время могли проверяться лишь post mortem, 88
после смерти пациента. Положение стало быстро меняться в последние годы — в результате прогресса методологии эксперимента, расширения спектра междисциплинарных работ и, наконец, революционных изменений технической базы исследований. Поэтому синтез позитивистской и романтической ориентации становится сегодня реальной научной задачей. Ее решение зависит от возможности достаточно строгого контроля «романтических переменных». Анализу достигнутых на этом пути результатов, в известной степени, и посвящена данная книга.
89
2
ТРАНСФОРМАЦИЯ ПОДХОДОВ
Структура главы:
2.1 Информационный подход
Кибернетика и статистическая теория связи
Инженерная психология и ее эволюция
Поиски ограничений пропускной способности
2.2 Компьютерная метафора
Ментальные модели и аналогия с компьютером
«Когнитивная психология» Улрика Найссера
Принципы символьного подхода
2.3 Модулярность познания и коннекционизм
Идея специализации обработки
Гипотеза модулярности: вклад Джерри Фодора
Нейронные сети в психологии
2.4 Усиливающееся влияние нейронаук
Интерес к нейропсихологическим данным
Новые методы и старые проблемы
Нейробиологические модели познания
92
На рубеже 1960-х годов произошла быстрая смена сферы интересов и теоретической ориентации мировой экспериментальной психологии. Термин «когнитивный» стал относиться не только к высшим познавательным процессам, но также к восприятию и даже моторике, мотивации и эмоциям. Складывается впечатление, что иногда он используется, по словам голландского психолингвиста Флореса д'Аркэ, «в качестве модной этикетки, позволяющей сбыть залежалый товар» (Flores d'Arcais, 1975, p. 45). Отдельным примерам такого рода, несомненно, противостоит — особенно в лице междисциплинарной когнитивной науки — ведущее направление современных научных исследований поведения и психики человека. Это направление постоянно развивается и имеет значительное число способных и активных сторонников.
Главным достижением когнитивной психологии стало то, что она полностью восстановила прерванное бихевиоризмом почти на полвека изучение познания. После появления вычислительных машин анализ внутренних психических процессов и состояний внезапно перестал казаться чем-то сомнительным. Но и внутри области познавательных процессов оказались неожиданные пробелы. Так, на первых порах из рассмотрения выпала проблема обучения. Дело в том, что известные до тех пор компьютеры были устройствами, которые не обучались, их возможности были жестко заданы «хардвером» и программным обеспечением. Типичный компьютер последовательно оперирует дискретными символами. Для него характерно отделение активного процессора от пассивной памяти. Процессор имеет ограниченную пропускную способность, тогда как пассивная память, напротив, является существенно более емкой. Те же черты стали находить и в организации когнитивной сферы человека. Потребовалось более двух десятилетий и тысячи экспериментов для выявления противоречий и начала интенсивных поисков альтернативных архитектур. На первый план выдвинулись представления о параллельной обработке. Появились новые методы, позволяющие реконструировать и даже в какой-то мере «увидеть» процессы, разворачивающиеся в самих структурах мозга. В когнитивных исследованиях компьютерная метафора в различных ее модификациях все более уступает место теориям и моделям, основанным на анализе реальных нейрофизиологических механизмов и их эволюционного развития.
2.1 Информационный подход
2.1.1 Кибернетика и статистическая теория связи
Решающее значение для появления когнитивной психологии имела кибернетическая революция в науке и технике, истоки которой, в свою очередь, связаны с развитием формальной и математической логики. В середине 19-го века Дж.С. Милль и Дж. Буль были убеждены, что их системы логики описывают законы мышления (именно так называлась вышедшая в 1858 году книга Буля, содержавшая описание двоичной алгебры). Отличительной чертой психологических теорий, которые ориентировались на эти достижения, уже тогда был более или менее отчетливый отказ от рассмотрения физиологических механизмов, которые, правда, в то время были еще практически неизвестны.
В 1900 году немецкий математик Давид Гильберт сформулировал ряд нерешенных в 19-м столетии проблем, часть из которых была связана с формальным обоснованием таких аксиоматических систем, как арифметика, геометрия, пропозициональная логика. Речь шла о полноте, непротиворечивости и вычислимости выражений, записанных в терминах «языка» этих систем. Несмотря на усилия выдающихся авторов и полученные ими принципиальные результаты, заметное продвижение в решении этих проблем произошло только в 1930-е годы, благодаря работам Гёделя, Колмогорова, Поста, Чёрча и Тьюринга (см. 9.2.2). Английский логик Алан Тьюринг проанализировал проблему эффективности процедур вычисления. Идея эффективности близка лейбницевской идее алгоритма — последовательности операций, ведущих через определенное (конечное) число шагов к решению. Тьюринг показал, что любая эффективная процедура может быть реализована с помощью простого абстрактного автомата, получившего название «машины Тьюринга». Состояния и изменения состояний этой «машины» могут быть описаны с помощью четырех или пяти элементарных логических операций, считывающих и записывающих двоичные числа в ячейки передвигаемой вперед и назад бесконечной ленты. Эта работа сделала возможной очень наглядное теоретическое обоснование функционирования вычислительной техники, так как с формальной точки зрения всякое цифровое вычислительное устройство является ничем иным, как физическим воплощением «машины Тьюринга».
«Кибернетика» американского математика и физика Норберта Винера, вышедшая в свет в 1948 году и переведенная потом на многие языки (например, Винер, 1958), зафиксировала начало новой научно-технической революции, основанной на теории управления и сервомеханизмов, статистической теории связи и применении программируемых вычислительных устройств. Как пишут А.И. Берг и Б.В. Бирюков, «Кибернетика осуществляет формализованный подход к объектам различной природы — техническим, биологическим, социальным. Смысл
этого подхода состоит в том, чтобы выделить в них стороны, связанные с управлением и переработкой информации... Кибернетика влечет за собой изменение привычных взглядов на некоторые философские категории. Например, концепция управления как перевода управляемого объекта из одного состояния в другое в соответствии с целью (задачей) управления влечет за собой определенное переосмысление телеологического... подхода. Если до кибернетики представление о цели обычно считалось неотделимым от идеализма, то теперь становится очевидным, что это понятие органически входит в число наиболее общих понятий, используемых для описания реальности» (Берг, Бирюков, 1975, с. 503).
Так была реабилитирована одна из характерных особенностей того, что Курт Левин и неопозитивисты называли «аристотелевским способом образования понятий» (см. 1.3.2). Кибернетика стала первым опытом широкого синтеза научных дисциплин в 20-м веке, про-образом современной когнитивной науки. Многое в кибернетике было подготовлено работами не только математиков и физиков, но и философов, физиологов, психологов1. Уже у Аристотеля можно найти прекрасный образ управления кораблем, который может вестись к цели различными способами: капитаном по звездам, местным лоцманом по береговым ориентирам и т.д. Карл Бюлер в своей книге о причинах первого кризиса психологии (Buehler, 1927) прямо называл изучение процессов управления поведением на основе психического отображения (нем. Darstellung) окружения — центральной задачей этой научной дисциплины.
В более узком исследовательском контексте Кёлер (см. Metzger, 1975) дал анализ фиксационных движений глаз в терминах работы механизма с отрицательной обратной связью (англ. feedback). Примерно та же самая задача удержания прицела на движущемся объекте интересовала и Винера, который занимался созданием вычислительной машины для управления зенитным огнем. Важно отметить, что в случае систем с обратной связью, особенно если эти системы включают несколько уровней организации, теряет свою объяснительную силу столь важное в механике и в науках о неживой природе понятие линейных причин-
1 Ближайшим сотрудником Винера и его соавтором по статье «Поведение, целена
правленность и телеология» (Винер, 1958) был физиолог Розенблют. Разработка идеи це
ленаправленности была дана ранее такими физиологами, как П.К. Анохин, H.A. Берн-
штейн, В.ф. Вайцекер и Э.ф. Хольст. В последнее время нейрофизиология вновь стано
вится источником идей для всего комплекса когнитивных исследований (см. 2.4.3 и 9.1.1 ).
При этом происходит поиск понятий, которые могли бы лучше выразить сложность изу
чаемых систем, чем ставшие привычными понятия кибернетики. Так, по предложению
американского биолога Дж. Эдельмана (Нобелевская премия 1972 года за работы по им
мунологии) в когнитивной науке начинает использоваться понятие «повторного ввода»
(англ. re-entry), близкое понятию «обратная связь», но подчеркивающее значение само
организации нейронных систем живого, частично осознающего себя организма (напри-
94 мер, Edelman, 1985).
но-следственных связей. На место этого понятия выдвигается представление о круговой причинности. Например, в физиологических исследованиях картезианское понятие рефлекторной дуги было еще в 1930-е годы, то есть в период доминирования основанных на схемах «стимул-реакция» бихевиористских концепций и до официального появления кибернетики, заменено представлением о рефлекторном кольце, причем произошло это практически одновременно на Востоке (H.A. Бернш-тейн) и на Западе (Виктор фон Вайцекер). Так яблоки, по словам Гёте, одновременно падают осенью в разных садах.
Начиная с 1942 года в США стали практически регулярно происходить встречи, в которых участвовали ведущие кибернетики, лингвисты, физиологи и психологи. Междисциплинарные конференции и семинары, на которых закладывалась основа для совместных исследований, в духе последующей когнитивной науки, участились с окончанием войны и в других странах, в частности, в Советском Союзе. В 1950-е годы появились возможности и для прямых международных контактов разрозненных до того времени национальных групп. Из многочисленных достижений и нововведений кибернетики в психологию проникли первоначально, пожалуй, только положения статистической теории связи, изложенной в доступной для психологов форме Шенноном и Уивером (Shannon & Weaver, 1949). Эта теория — она стала известна потом как теория информации — предлагала простой формальный аппарат для оценки количества информации, содержащейся в том или ином сообщении.
Количество информации Н, передаваемое сообщением о реализации одного из N равновероятных событии, определяется по формуле:
Количество информации измеряется, таким образом, в двоичных логарифмических единицах, или битах. Передача количества информации, равного одному биту, позволяет уменьшить неопределенность ситуации вдвое, двух битов — вчетверо и т.д. Множество всех возможных событий, естественно, заранее должно быть известно на принимающей стороне. Приведенная выше формула описывет максимально возможное количество информации, достигаемое в случае, когда система событий совершенно случайна. Если система событий структурирована, так что разные события возникают с различной вероятностью/>, то среднее количество информации для множества из N событий определяется несколько более сложной формулой:
Именно эта информация Я при продолжительном предъявлении сигналов определяет нагрузку на канал связи. Разница между максимально
96
возможным и фактическим количеством информации определяет далее так называемую избыточность системы событий. Избыточность является ничем иным, как мерой организации такой системы, степени ее отличия от совершенно случайного, хаотичного состояния. Важным источником избыточности в канале связи являются, наряду с абсолютной вероятностью возникновения событий, условные вероятности следования события друг за другом. Так, поскольку появление, а главное, следование отдельных фонем друг за другом в звуках человеческой речи далеко не равновероятны, общая избыточность системы фонем (или же букв при письме и чтении) естественных языков оказывается довольно большой, примерно равной 70%.
С инженерной точки зрения, можно говорить далее о различной степени оптимальности процессов кодирования информации. Оптимальным является такое кодирование событий, например в виде последовательностей двоичных символов «0» и «1», при котором более вероятные события будут представлены, более короткими цепочками символов. Интересно, что соответствующая эмпирическая зависимость — чем частотнее слово в языке, тем оно короче — действительно известна в лингвистике, где она называется «вторым законом Ципфа». При оптимальном кодировании канал связи, имеющий пропускную способность С бит/с, будет передавать С/Н двоичных символов в секунду. Если кодирование не оптимально, то фактическая скорость передачи информации уменьшится. Она в принципе никогда не может превзойти пропускную способность канала С, а тем более стать бесконечной (Яглом, Яглом, 1973).
Первой претеоретической метафорой будущей когнитивной психологии стало, таким образом, понимание человека как канала связи с ограниченной пропускной способностью. Это понимание буквально совпадало с тем специфическим аспектом рассмотрения возможностей человека, который был характерен для проводившихся еще в годы Второй мировой войны инженерно-психологических исследований. Поскольку экстремальные условия войны и начавшегося сразу после нее военно-индустриального соревнования Востока и Запада вновь и вновь обнаруживали специфические слабости человеческого звена в системе человек—машина, необходим был единый язык описания ограничений как техники, так и самого человека-оператора. Теория информации была воспринята многими психологами и инженерами как своего рода лапласовская «мировая формула» (см. 1.1.2), позволяющая единообразно описать возможности не только технических звеньев человеко-машинных систем, но и большое количество собственно психологических феноменов.
2.1.2 Инженерная психология и ее эволюция
В силу их значительного и продолжающегося влияния на когнитивный подход, нам следует хотя бы кратко остановиться здесь на особенностях и эволюции исследований «человеческого фактора» {human factor engineering), получивших в Западной Европе и СССР название инженерной психологии. Появление этой области исследований было вызвано целым рядом случаев отказа человеко-машинных систем, произошедших по вине человека. Один из наиболее драматических, хотя и малоизвестных эпизодов случился в декабре 1941 года на американской военно-морской базе Перл-Харбор, когда инженеры, обслуживавшие один из первых образцов только что поступивших на вооружение радиолокаторов, отчетливо увидели на экране отраженные от приближающихся японских самолетов сигналы, но просто не поверили, что такое количество сигналов возможно, и решили отправить аппаратуру на ремонт вместо того, чтобы сообщить в штаб флота о возможном нападении.
Потребовалось целое десятилетие, чтобы научиться аккуратно описывать подобные ситуации. Для этого инженерными психологами наряду с теорией информации стала использоваться заимствованная из радиотехники и психофизики теория обнаружения сигнала (Wald, 1950). Благодаря ряду допущений, эта теория позволила описать работу оператора в задачах на обнаружение с помощью всего лишь двух параметров: чувствительности (а") и критерия (β). Если первый параметр описывает сенсорные возможности различения сигнала на фоне шума, то второй, как мы сказали бы сегодня, связан именно с когнитивными переменными: представлением о вероятности появления сигнала, а также оценкой относительной «цены» последствий двух возможных и неизбежных в ситуации обнаружения ошибок — пропуска сигнала и ложных тревог. На основании этих когнитивных переменных формируется готовность оператора при прочих равных условиях подтверждать наличие сигнала (низкий, или либеральный критерий) либо воздерживаться от такого подтверждения (высокий, или консервативный критерий). С формальной точки зрения, именно завышенное положение критерия помешало операторам в Перл-Харборе подтвердить приближение воздушных целей.
На рис. 2.1 показаны два идеализированных примера ситуации обна
ружения сигнала для простейшего случая, при котором появление сигна
ла не меняет разброса значений распределения шума, а просто сдвигает
это распределение вправо по оси величин регистрируемой в сенсорных
каналах активности. Распределение шума (аналог спонтанной сенсорной
активности) предполагается нормальным и стандартным, так что его сред
нее равно нулю, а стандартное отклонение — единице. Верхний график
описывает ситуацию обнаружения слабого сигнала, сдвигающего рас
пределение шума лишь на 0,5 его стандартного отклонения. Величина 0,5
и есть значение параметра чувствительности, обычно обозначаемого как
d' (произносится «дэ штрих»). Нижний график иллюстрирует обнаруже- „_
Ρ =2,0 сигнал и шум шум
β = 0,0 нет да
-2,0 -1,5 -1,0 -0,5 0 0,5 1,0 1,5 2,0
d" сенсорное возбуждение
-2,0 -1,5 -1,0 -0,5 0 0,5 1,0 1,5 2,0
Рис. 2.1. Примеры использования аппарата теории обнаружения сигнала для описания ситуаций обнаружения слабого (А) и сильного (Б) сигналов на фоне шума. 98 ние более мощного сигнала. Расстояние между распределениями и, следовательно, чувствительность здесь больше: d' = 1,5. На обоих графиках также приведены по два возможных значения параметра критерия выбора ответа, β («бета»). Оператор, принимающий более низкий из этих двух критериев (β = 0,0), будет сообщать о появлении сигнала всякий раз, когда величина сенсорной активности превышает среднее для распределения шума значение. Критерий β = 2,0 означает, что о присутствии сигнала будет сообщаться, если величина сенсорной активности превысит два стандартных отклонения распределения шума. Лейтмотивом множества исследований, проведенных с использованием аппарата теории обнаружения сигнала, стало представление о субоптимальности решений человека в ситуациях обнаружения. Особенно проблематичным оказалось постепенное ухудшение результатов обнаружения с увеличением времени наблюдения. Это ухудшение обычно состоит в ужесточении критерия принятия решений, что ведет к уменьшению числа ложных тревог, но чревато также и все более вероятными ошибками пропуска сигнала. Особенно яркими примерами этого явились сбои в обнаружении воздушных целей при охране наиболее важных государственных объектов системами противовоздушной обороны (ПВО) СССР и США в 1980-е годы. Так, в 1987 году немецкий летчик-любитель Маттиас Руст пересек со стороны Финляндии советскую границу, незамеченным долетел до Москвы и приземлился на Красной площади. Некоторое время спустя похожий инцидент произошел и в США, где недовольный налоговой политикой правительства фермер, захватив охотничье ружье, беспрепятственно долетел до центра Вашингтона, но разбился при попытке посадить свой самолет в саду Белого Дома. В обоих случаях операторы ПВО были «обезоружены» многолетним ожиданием вражеского нападения: стремясь избежать ложных тревог, они постепенно ужесточали критерии и в конце концов практически перестали замечать потенциально опасные цели. О субоптимальности работы человека-оператора также говорили данные, собранные на основе экспертных оценок и представляемые в инженерной психологии в виде так называемых «МАВА—МAВА таблиц». Эти таблицы сравнивают между собой области деятельности и отдельные задачи, в которых человек оказывается лучше машины (Men-are-better-at) или, напротив, машина лучше человека (Machines-are-better-at). Так, задачи по обнаружению сигнала в силу колебаний внимания и отмеченной тенденции к завышению критерия принятия решений человеком лучше было бы доверить машине. С другой стороны, запоминание больших массивов информации и узнавание изображений первоначально считалось одной из областей, в которых человек был эффективнее машины. Разумеется, по мере развития компьютерных технологий количество таких областей стало постепенно сокращаться. Лишь наиболее сложные задачи, требующие глобальной оценки ситуации и выработки новых решений, причем часто на основании неполной информации, пока что прочно остаются в компетентности человека2. 2 Качество принимаемых человеком решений резко снижается в условиях стресса, К компетенции человека продолжают и, безусловно, будут продолжать относиться задачи по принятию решения в условиях многокатегориального выбора. В отличие от рассмотренной задачи обнаружения сигнала, где основания для решения могут быть представлены в виде одной-един-ственной переменной, в подобных задачах существует несколько качественно различных систем критериев и несколько (обычно более двух) альтернативных решений. Специфически человеческим звеном здесь является прежде всего оценка относительной важности (весовых коэффициентов) различных критериев. Такая оценка всегда довольно субъективна и не может быть сведена к одному критерию, даже такому существенному, как критерий стоимости. Например, если речь идет о выборе проекта нового предприятия, то наряду с критерием стоимости строительства (возможно, в сочетании с ожидаемыми доходами — критерий cost/ benefit) важную роль в том или ином контексте могут играть также и другие критерии, такие как критерии престижности или экологической безопасности. Сравнительную оценку важности критериев в каждом конкретном случае может дать только лицо (группа лиц), принимающее решение. Помимо самой оценки специфическая сложность задач многокритериального выбора состоит в том, что «при их рассмотрении все доводы "за" и "против" не присутствуют в уме одновременно; иногда присутствует одна часть, в другое время — иная, причем первая исчезает из вида. Следовательно, различные цели или склонности по очереди берут "верх" и появляется неопределенность, которая озадачивает и мучает нас»3. В качестве простейшей исчерпывающей процедуры получения весовых коэффициентов отдельных критериев и их агрегации в общую оценку альтернатив в литературе по методам поддержки принятия решений (Ларичев, 2002) рекомендуется следующая последовательность шагов: Упорядочить критерии по важности. Присвоить наиболее важному критерию оценку 100 баллов и, ис Сложить полученные баллы, а затем произвести нормировку кри Оценить значение каждой альтернативы по каждому из критери Определить общую оценку каждой альтернативы, используя фор 3 Эта цитата взята из письма Бенджамина Франклина, датированного сентябрем 1772 года. Франклин рекомендует далее записывать аргументы «за» и «против» на левой и правой стороне листа: «Когда я имею все это в поле зрения, я пытаюсь оценить их веса; если я найду два, каждый на другой стороне, которые кажутся мне равными, я их вычеркну... Если я считаю, что некоторые два довода "за" равны трем доводам "против", я вычеркиваю все пять; продолжая таким образом, я нахожу со временем, где находится баланс». Эти соображения можно считать эскизом современных компьютерных программ, поддерживающих процессы принятия решений (см. 8.4.2). Проблемы данной области связаны с нетранзитивным и нелинейным характером человеческих предпочтений, накладывающим ограни-100 чения на математические операции с балльными оценками (см. Ларичев, 2002). 6. Выбрать в качестве лучшей альтернативу, получившую наибольшую общую оценку. Развернувшиеся во второй половине 20-го века работы по автоматизации отдельных функций и областей деятельности человека в целом проходили под лозунгом его освобождения от тяжелых и несвойственных ему сенсомоторных задач. Предполагалось, что за человеком-оператором постепенно останутся только функции когнитивного контроля за работой технических систем. С развитием информатики, электроники и когнитивных исследований стали создаваться системы относительно полного технического контроля и исполнения действий (такие как Flight Management Systems, используемые в военной и гражданской авиации для автоматического управления основными режимами полета). Постоянное увеличение степени сложности техники требовало от человека-пользователя сопоставимых, все более серьезных усилий по обучению и пониманию работы систем. Одновременно, из-за технических и финансовых ограничений автоматизации часто подвергались относительно изолированные фрагменты деятельности. Результаты подобной фрагментарной замены человека компьютерными системами часто оказывались неудовлетворительными. В этих полуавтоматизированных системах скорее сам человек оказался под контролем автоматов, чем наоборот. Известный отечественный инженерный психолог Б.Ф. Ломов (например, Ломов, 1966) еще в начале 1960-х годов предупреждал об опасности такого развития, выдвинув вместе со своими коллегами принцип «активного оператора». Главным недостатком, или, по словам современной английской исследовательницы Лизанн Бэйнб-ридж, иронией автоматизации стало сегодня то, что оператору или, например, летчику временами приходится действовать в еще более экстремальном диапазоне нагрузок, чем прежде. Относительно легкие задачи упростились за счет их автоматизации, тогда как трудные задачи стали более сложными в силу усложнения самих человеко-машинных систем, а также из-за того, что решать их приходится внезапно и из состояния недонагрузки. При внезапных повышенных нагрузках в условиях жестких временных ограничений возникает состояние острого стресса, меняющее протекание практически всех познавательных процессов. Стресс, в частности, ведет к эффекту так называемого туннельного зрения — резкому ограничению размеров функционального поля зрения и фиксации внимания на отдельных деталях, а не на сцене в целом (см. 4.2.2 и 9.4.3). Центральной проблемой сегодня становится выравнивание этого дисбаланса, то есть избирательная поддержка (вплоть до полной замены4) 4 Речь идет о временной передаче управления автоматам. Примером могут служить человека в тех случаях, когда он находится на пределе своих возможностей, и, напротив, эпизодическая передача ему дополнительных функций (например, ручного управления самолетом) в периоды потенциально опасной недонагрузки. В результате возникает новая задача адаптивной автоматизации. Она предполагает психологический мониторинг функционального состояния человека с текущей оценкой степени и характера его внимания, содержаний восприятия, понимания актуальной ситуации (или «осознания ситуации» — situation awareness) и, насколько возможно, также непосредственных намерений. Хотя в общем виде эта задача еще очень долго не будет иметь решения, ее частные решения, похоже, возможны; они опираются на результаты прикладных когнитивных исследований и также обсуждаются на страницах этой книги (см. 3.4.2 и 7.4.3). Инженерную психологию всегда интересовала задача нахождения некоторого единого языка для описания работы человека и функционирования технических систем. Наиболее подходящим языком такого описания вначале считалась теория информации. С накоплением опровергающих это мнение данных (см. 2.1.3), а затем и с возникновением задачи адаптивной автоматизации стали меняться акценты, так что иногда сами машины стали описываться в антропоморфных терминах как продукты (артефакты) деятельности человека. Так, датчанин Йене Расмуссен (Rasmussen, 1986) предложил рассматривать все компоненты человеко-машинных систем в контексте трех, известных из теории деятельности вопросов: «для чего?», «что?» и «как?» (см. 1.4.3). Им же была предложена трехуровневая модель операторской деятельности, в которой на самом низком уровне поведение находится под контролем автоматизированных навыков, на втором — хранящихся в памяти правил и на третьем — знаний о ситуации. Данная модель используется прежде всего для классификации ошибок оператора. В зависимости от уровня возникновения такие ошибки влекут за собой разную степень ответственности. Например, авиадиспетчер может просто перепутать похожие команды (неудачно расположенные рядом кнопки) или же, подумав, сознательно направить два самолета на одну и ту же посадочную полосу (см. 9.1.3). Недостатком этой и аналогичных ранних моделей является то, что они были совершенно недостаточно обоснованы с точки зрения фундаментальных исследований. В частности, их авторы полностью игнорировали нейрофизиологические и нейропсихологические данные, столь важные, как становится очевидно в последние годы, для создания более реалистических представлений о специфических особенностях и ограничениях возможностей человека в его взаимодействии с техническими системами (см. 7.4.3 и 8.4.3). Эти данные впервые заложили теоретико-экспериментальную основу для прикладных исследований на границе психологии и новых технологий, подтверждая старое правило «Нет ни-102 чего практичнее хорошей теории». Кроме того, классическая для этой области проблематика стресса и утомления обусловила постоянный диалог исследований когнитивной организации с анализом функциональных состояний (см. 9.4.3). Таким образом, развитие инженерной психологии и такого нового ее раздела, как когнитивная эргономика (дисциплина, занимающаяся оптимизацией взаимодействия человека и компьютерных систем), сегодня находится под прямым влиянием исследований в широкой области когнитивных и аффективных нейронаук. 2.1.3 Поиски ограничений пропускной способности Вернемся к ситуации, в которой оказались исследования познавательных процессов в 1950-е годы. Основные экспериментальные работы этого периода имели прикладной характер и были направлены на возможно более точное описание ограничений информационной пропускной способности человека. К числу основных феноменов, иллюстрирующих такие ограничения, обычно относят следующие: Время реакции выбора — замедление времени реакции с увеличени Избирательность (селективность) внимания — невозможность од Колебание внимания — невозможность в течение сколько-нибудь Объем непосредственной памяти — невозможность запомнить после Психологический рефрактерный период — задержка реакции на вто В последующих главах эти феномены будут рассмотрены нами в контексте современных представлений о возможных ограничениях познавательных процессов. Мы остановимся здесь подробно на самом первом в списке этих феноменов. Еще в 1885 году один из учеников Вундта Меркель установил, что время реакции выбора («В-реакция» Дондерса: η стимулов и « реакций) линейно зависит от логарифма числа стимулов. Этот же результат был получен почти 70 лет спустя американцами Хиком и Хэйменом, которые объяснили его как следствие зависимости времени реакции от количества средней информации: ВР = а+ в*Н, где а — параметр, задаваемый временем передачи информации на входе и выходе канала; в — величина, обратная пропускной способности канала, и Η — среднее количество информации, определяемое по формулам, приведенным в начале этой главы. Это соотношение, получившее ЮЗ название закона Хика, сохраняется при различных способах варьирования средней информации: изменении числа альтернатив, изменении абсолютных вероятностей при постоянном числе альтернатив и, наконец, введении различных вероятностей следования одних сигналов за другими (рис. 2.2А). В рамках инженерно-психологических исследований ограничений избирательного внимания и непосредственной памяти Дональд Брод-бент (ученик Бартлетта и бывший военный летчик, участвовавший в воздушной битве за Англию) опубликовал в 1954 году статью под названием «Механическая модель внимания и непосредственной памяти человека», где впервые описал внимание как фильтр, осуществляющий отбор релевантной с точки зрения задачи сенсорной информации. Этот фильтр расположен на входе в непосредственную память — «центральный информационный канал с ограниченной пропускной способностью» — и осуществляет отбор релевантной информации по принципу «все или ничего» (рис. 2.3). Близкие идеи легли в основу монографии Бродбента «Восприятие и коммуникация», вышедшей в свет в 1958 году. В этой работе был обобщен гигантский объем данных, полученный в рамках информационного подхода. Это развитие целиком соответствовало неопозитивистским канонам — как и в необихевиоризме автором проводился формальный анализ наблюдаемых переменных, а человек трактовался как относительно закрытый «черный ящик». Очерки психологии с точки зрения статистической теории связи появились в конце 1950 — начале 1960-х годов. Однако это было время, когда информационный подход стал подвергаться серьезной критике. 2 3 0 1 количество информации, бит Рис. 2.2. Закон Хика — зависимость времени реакции выбора от информативности сиг-104 налов: А. Первоначальные данные; Б. Данные, собранные за последующие 10 лет. Прежде всего, установленные законы стали обрастать дополнениями и оговорками, учитывающими субъективную значимость и естественность различных ситуаций. Так, едва ли не центральной проблемой инженерной психологии в эти годы стала проблема естественного соответствия сигналов и ответов испытуемого: время реакции ускоряется, если, например, на акустический сигнал, подаваемый справа, нужно отвечать правой рукой. Разумеется, этот эффект можно попытаться объяснить строго физикалистски, проследив движение информации по нейрофизиологическим путям — от правого уха в контрлатеральное левое полушарие, которое, в свою очередь, иннервирует преимущественно правую часть тела. Однако такое объяснение может быть легко поставлено под сомнение. Если попросить испытуемого скрестить руки, то на сигналы, поступающие справа, он начинает быстрее отвечать левой рукой. Существенной, таким образом, оказывается близость сигналов и ответов в феноменальном, а не физическом пространстве5. Встает типичный для собственно когнитивной психологии вопрос о форме репрезентации — о том, каким образом могут быть внутренне представлены внешнее окружение, сигналы и схема тела. Исследования времени реакции выбора постепенно выявили чрезвычайно пеструю картину, совершенно не укладывающуюся в прокрус- 5 Надо сказать, что подчеркивание роли таких переменных, как значимость и естественность, типично как раз для «аристотелевского», а не «галилеевского» способа образования понятия (см. 1.3.1). 105 106
вызываемого в первую очередь недостатком времени. Поэтому, например, в современной
ядерной энергетике предпринимаются специальные меры для того, чтобы в течение 10—
20 минут фиксировать развитие событий, не давая человеку возможности реализовать
слишком поспешные решения. Подобные задержки «на обдумывание», к сожалению,
невозможны в работе летчика или водителя, где действовать часто приходится в интерва
лах времени порядка долей секунды (за 1 секунду автомобиль, движущийся со скоростью
60 км/час, проезжает около 17м). 99
ходя из попарного отношения критериев по важности, дать в бал
лах оценку каждому из них.
териев (вычислить их весовые коэффициенты), разделив присво
енные баллы на сумму весов.
ев в отдельности по шкале от 0 до 100 баллов.
мулу взвешенной суммы баллов (то есть просуммировать оценки
данной альтернативы по всем критерием с учетом весовых коэф
фициентов последних).
современные системы предотвращения столкновения с земной поверхностью (GCAS —
Ground Collision Avoidance System), используемые в военной авиации. Эти системы оцени
вают параметры движения самолета и с учетом рельефа местности, а также времени реак
ции пилота автоматически уводят самолет в случае необходимости из опасной зоны. 101
ем числа альтернатив.
новременно и в равной степени следить за содержанием двух раз
личных сообщений.
продолжительного времени с одинаковой «бдительностью» (vigi
lance) следить, скажем, за экраном радиолокатора.
однократного предъявления более чем 5—7 не связанных между со
бой объектов или символов.
ром из двух следующих друг за другом с достаточно малым интер
валом (менее 150 мс) стимулов.
Рис. 2.3. Одна из первых информационных моделей памяти и внимания, предложенная Бродбентом (Broadbent, 1958).
тово ложе закона Хика (рис. 2.2А). Для разных типов сигналов и ответов, а также для различных их комбинаций параметры получаемых зависимостей оказались разными. Наиболее «неудобными» являются те случаи, в которых вообще не было обнаружено сколько-нибудь выраженной зависимости времени реакции от количества информации в идентифицируемых сигналах (функции «ж», «з», «и», «к» на рис. 2.2Б). При интерпретации этих данных с помощью закона Хика получался бессмысленный вывод о безграничной пропускной способности. Единственный закон, который был подтвержден этими исследованиями, состоял в демонстрации почти безграничной адаптируемости человека к подобным искусственным условиям: в одной из британских работ по времени реакции выбора, продолжавшейся в течение пяти месяцев, число проб превысило 45 000, но время реакции испытуемого все еще продолжало снижаться.
В 1956 году видный американский психолингвист и последователь Хомского Джордж Миллер опубликовал ставшую классической работу «Магическое число семь, плюс или минус два» (см. Миллер, 1964). Он показал, что ограниченность объема кратковременной памяти определяется совсем не количеством объективно измеренной в битах информации, а относительно небольшим количеством (порядка 7) «единиц», или «кусков» («чонков» от англ. chunks) субъективной организации материала. В качестве подобных единиц организации материала в непосредственной памяти могут выступать буквы или цифры, слова или, например, короткие предложения. Количество информации будет во всех этих случаях совершенно различным. Размеры этих единиц, как показал Миллер в опытах на себе, меняются в процессе обучения. Так, для человека, совершенно незнакомого с вычислительной техникой, слово «IBM» представляет собой последовательность трех единиц, тогда как для всех лиц, знающих, что это название крупнейшей компьютерной фирмы, — всего лишь одну единицу.
Точно так же в исследовании зрительного различения было установлено, что комбинация перцептивных признаков, которая с логической точки зрения не меняет неопределенность стимулов (а следовательно, не меняет и количество информации), тем не менее, приводит к значительному изменению пропускной способности. Так, в случае одномерных стимулов, варьирующих только по цвету, яркости или величине, испытуемый может перерабатывать 2,75 бита информации, чему соответствуют безошибочные различения и категоризация примерно 7 стимулов. Если же стимулы меняются одновременно по всем трем параметрам, причем меняются полностью коррелированным (избыточным) образом, так что формально по-прежнему есть только одно стимульное измерение, количество передаваемой информации возрастает до 4,11 битов. Это означает успешную категоризацию уже 17 стимулов. После таких результатов необходимость изучения внутренней репрезентации цвета, яркости, величины и других перцептивных категорий станови-
I лась понятной даже наиболее позитивистски ориентированным пред-
ставителям информационного подхода.
Важную роль в создании методологического климата, сделавшего
возможным переход к когнитивной психологии, сыграл принцип кон
вергирующих операций Гарнера, Хэйка и Эриксена (Garner, Hake &
Eriksen, 1956), означавший либерализацию и даже ревизию требований
ортодоксального неопозитивизма (см. 1.3.2). Основная мысль состояла
в том, что изучать можно и то, что не является непосредственно наблю
даемым. Границы подобного, «скрытого за поверхностью» регистрируе
мых событий предмета исследований, лучше всего могут быть намечены
при движении по различным, но сходящимся (конвергирующим) на
правлениям. Например, если обнаруживается сходство оценок продол
жительности работы некоторого гипотетического внутреннего механизма,
| полученное с помощью двух или большего числа независимых методичес-
! ких процедур, то можно допустить, что такой механизм действительно
существует — даже если результаты отдельных методик для этого допу
щения недостаточно убедительны. Авторы попытались в первую очередь
разделить сенсорные аспекты восприятия и чисто моторные реакции,
заменив радикальное операционалистское утверждение: «восприятие =
определенный способ реагирования на сенсорную стимуляцию» на бо-
1 лее осторожное: «восприятие = некоторое внутреннее событие, кото-
1 рое может проявляться в моторных реакциях, но принципиально от
I них отлично».
1 В результате психология восприятия была вновь выделена в качестве
самостоятельной области исследований. Поскольку понятия гештальт-психологии казались слишком широкими и слишком менталистскими, была предпринята попытка использовать для количественного описания структуры восприятия аппарат статистической теории связи. «Многие из гештальтистских принципов, — писал один из ведущих представителей информационного подхода Фрэд Эттнив, — связаны с количеством информации. Хороший гештальт — это форма с более высокой степенью избыточности. Такие законы перцептивной организации, как законы близости, сходства, хорошего продолжения и общей судьбы, совершенно очевидно относятся к ситуациям, в которых происходит уменьшение неопределенности» (Attneave, 1965, р. 117). Однако применение теории информации для описания перцептивной организации также натолкнулось на трудности. Искусственным было уже требование, согласно которому наблюдатель заранее должен знать весь набор возможных событий. Гештальтпсихологи, например, всегда утверждали, что восприятие является процессом, который строится «здесь и теперь»: в конкретной ситуации и вне зависимости от прошлого опыта.
Следует отметить, что еще в 1950 году английский кибернетик До
нальд М. Маккай (МасКау, 1950) предупреждал о принципиальных про
блемах с применимостью статистической теории связи в психологии,
1 предлагая создать или, по крайней мере, подумать о создании теории, в
которой информация в некотором сообщении оценивалась бы числом когнитивных операций, которые осуществляются при моделировании
его содержания. Маккай даже создал вариант применимой для психологических целей методики измерения «структурной информации». Как и ряд аналогичных попыток, его теория структурной информации не получила сколько-нибудь широкого распространения (за исключением отдельных исследований восприятия формы и цвета — см. 3.3.1). Не получил широкого распространения и сам кибернетический подход, предложивший интересные, но очень математизированные средства описания процессов управления в сложных динамических системах. Напротив, чрезвычайно популярной стала общая идея реконструкции организмом своего окружения и мысленной работы с этой внутренней моделью. Эта идея легла в основу следующей метафоры экспериментальной психологии.
2.2 Компьютерная метафора
2.2.1 Ментальные модели и аналогия с компьютером
Новый подход к анализу психических процессов, возникший в начале 1960-х годов, имел длительную предысторию. В 1894 году ученик Гельм-гольца Генрих Герц писал: «Отношение динамической модели к системе, моделью которой она считается, это в точности отношение образов вещей, которые создает наш разум, к самим вещам... Согласованность между разумом и природой может быть, таким образом, приравнена согласованности двух систем, являющихся моделями друг друга; мы даже могли бы объяснить эту согласованность, предположив, что наш разум способен создавать динамические модели вещей и работать с ними» (Hertz, 1894, S. 177). Через полстолетия эту мысль развил сотрудник Бартлетта и один из создателей инженерной психологии Кеннет Крэйк: «Если организм несет в голове мелкомасштабную модель внешнего окружения и своих возможных действий, он способен проверять различные альтернативы, определять наилучшие из них, реагировать на будущее развитие ситуации и вообще во всех отношениях вести себя более полноценно, безопасно и компетентно, попадая в сложные условия» (Craik, 1943, р. 61 )6.
Анализируя «внутренние модели» пространственного окружения, мы сразу же обнаруживаем, что они имеют «матрешечную» организацию, то есть обычно состоят из нескольких рекурсивно вложенных друг в
6 Элегантную формулировку сути когнитивного подхода в нейрофизиологии (не используя, впрочем, термина «когнитивный») несколько позже предложил H.A. Бернштейн: «Мозговое отражение (или отражения) мира строится по типу моделей Мозг не запечатлевает поэлементно и пассивно вещественный инвентарь внешнего мира.., но налагает на него те операторы, которые моделируют этот мир, отливая модель в последовательно уточняемые и углубляемые формы» (1966, с. 287).
друга репрезентаций. Например, мы можем представить себе карту северо-востока России, так что Санкт-Петербург будет при этом представлен чем-то вроде точки, а затем развернуть эту «точку» в полномасштабное пространственное представление и т.д. (см. 6.3.2). Рекурсивный характер имеют наши представления о других людях и их знаниях о нас (см. 7.4.1). Наконец, рекурсивность типична для нашего языка, что подчеркивалось в теории порождающей грамматики Хомского (см. 1.3.3 и 8.4.3). Используя эту теорию, можно было сделать следующий шаг — объявить различия всех этих форм репрезентации поверхностными и постулировать единый абстрактный формат представления знаний на уровне глубинных структур, допускающих алгоритмическое описание. Вот почему в начале 1960-х годов процессы познания стали трактоваться по аналогии с процессами вычислений в компьютере. Понимание того, что человек активно «перерабатывает информацию», строя внутренние модели (репрезентации) окружения, означало переход от информационного подхода в узком смысле слова к когнитивной психологии.
Эта компьютерная метафора когнитивной психологии открыла принципиально новые теоретические возможности, заменив характерное для психологии 19-го — первой половины 20-го веков представление об энергетическом обмене организма со средой на представление о значительно более быстром и гибком информационном обмене. Так, Вундт и его современники полагали, что только что открытый закон сохранения энергии требует признания строгого психофизического параллелизма, то есть признания — в полном согласии с картезианской философской традицией (см. 1.1.1 и 9.1.3) — полной независимости (в смысле причин и следствий) телесных и ментальных событий. Но вычислительное устройство, потребляя весьма незначительное количество энергии, может управлять огромными механизмами. Поэтому требование психофизического параллелизма перестало вдруг казаться строго обязательным. Далее, хотя трудно сказать, какие процессы лежат в основе некоторой чисто психической работы, например, восприятия картины Рембрандта, можно легко представить компьютер или специализированный электронный прибор, осуществляющий переработку информации, которая заканчивается адекватным ситуации ответом.
Первыми работами нового направления можно считать исследования процессов образования искусственных понятий Джеромом Бруне-ром и сотрудниками, а также работы Ньюэлла, Саймона и Шоу, создавших ряд машинных моделей мышления, в том числе «Логик—теоретик» и «Универсальный решатель задач». Общими чертами этих работ являются не только массивное использование формально-логического анализа (например, используемый в монографии Брунера теоретический аппарат совпадает с правилами индукции Дж.С. Милля), но и восстановление авторитета более ранних, «добихевиористских» исследований познания. В случае Ньюэлла и его коллег это были Отто Зельц и геш-тальтпсихология, а в случае Брунера — вюрцбургская школа и диссер-
ПО
тационная работа Кларка Халла 1920 года по формированию понятий, выполненная на материале китайских иероглифов. Отдавая должное другим влияниям, Брунер писал позднее, что на него произвело в эти годы глубокое впечатление знакомство с традицией изучения познания в советской психологии. Действительно, в его работах отчетливо выступает интерес к анализу развития познавательных процессов, которые он вслед за Бартлеттом, Леонтьевым, Гальпериным и Пиаже связывает с формированием внешней деятельности. При этом, впрочем, он, как и Выготский, подчеркивает моменты символьного взаимодействия ребенка с другими людьми, а не чисто сенсомоторные компоненты.
Использование «менталистской» терминологии в когнитивной психологии было обусловлено вначале эвристическими соображениями; она оказалась необходимой потому, что сложность рассматриваемых феноменов не позволяла дать их осмысленную интерпретацию в других терминах. Переход к неоментализму сопровождался попыткой осмысления философских проблем, которые он за собой влечет. Практически в течение одного 1960 года появилось несколько работ, в которых ставился вопрос о характере объяснения активности познавательных процессов. Эти работы содержат предположение, что проблема бесконечного регресса к гомункулусам, поставленная ранее в споре между Толменом и Газри (она известна также как проблема Юма — см. 1.1.1 и 1.3.3), может быть обойдена, если предположить, что процессы переработки информации организованы в иерархические, все более абстрактные структуры, а сам гомункулус выполнен из нейроноподобных элементов.
В статье под названием «В защиту гомункулусов» Фрэд Эттнив (Attneave, 1961) отмечает, что если на более ранних уровнях переработки информации будут выполняться некоторые функции гомункулуса, то в конечном счете для моделирования познавательной активности во всей ее сложности потребуется система с конечным числом уровней. Блок-схема переработки информации человеком, центральное место в которой занимает гомункулус (блок Н), показана на рис. 2.4. Блок H является местом конвергенции сенсорной и аффективно-оценочной информации; его выход представляет собой произвольное поведение, в то время как рефлексы и автоматизированные навыки реализуются другими структурами. Его активность необходима для осознания, а также для всякого сколько-нибудь продолжительного запоминания информации. Эттнив легко включает в свою модель данные об ограниченности внимания и непосредственной памяти, считая, что вход в блок H ограничен 7+2 единицами предварительно организованного перцептивной системой (блок Р) материала. Совершенно очевидно, что Эттнив вкладывает в уже имевшиеся к тому времени информационные модели познавательных процессов традиционное для психологии сознания содержание. Статья завершается призывом пересмотреть вопрос о научной респектабельности гомункулуса (см. 4.4.2 и 5.2.3).
Проприоцепция
Рис. 2.4. Модель переработки информации человеком по Эттниву (Attneave, 1961). Ρ — перцептивная система, А — аффективно-оценочная система, Η — гомункулус, M — моторная система
Сдвиг от необихевиоризма к неоментализму когнитивной психологии был зафиксирован и в известной книге Дж. Миллера, Н. Галантера и К. Прибрама «Планы и структуры поведения» (русский перевод — Миллер, Галантер, Прибрам, 1964). Авторы описали элементарную структуру действия, включив в нее операцию когнитивной оценки, TEST. Эта структурная ячейка действия получила название TOTE {TEST-OPERATE—TEST—EXIT). Этими же авторами также еще раз была выдвинута задача изучения «центральных процессов», с помощью которых можно заполнить «пропасть между стимулами и реакциями». Образы были уподоблены планам, или компьютерным программам, иерархическая организация которых допускает возможность «самопрограммирования» и позволяет, по мнению авторов, обойтись без гомункулуса. Наряду с другими аналогичными призывами к изучению «центральных процессов», это был не просто субъективный бихевиоризм, но уже когнитивная психология, в ее специфической форме, подчеркивающей аналогию между внутренними репрезентациями и программами вычислений.
Значительная часть развернувшихся с конца 1950-х годов исследований склонялась к другой версии компьютерной метафоры, связанной с выявлением и анализом возможных структурных блоков переработки информации и принципов их объединения в единую функциональную архитектуру. Не случайно большинство этих работ было направлено на
111
выделение процессов и видов памяти, аналогичных процессам преобразования и блокам хранения информации вычислительных устройств. Благодаря экспериментам англичанина Брауна и американцев Питерсо-нов, здесь, прежде всего, удалось установить критическую роль активного повторения для всякого продолжительного сохранения информации: если после показа некоторого материала (цифры, слоги и т.д.) для запоминания испытуемый должен выполнять какую-либо интерферирующую активность (например, отнимать тройки от некоторого достаточно большого числа), то уже через 10—20 секунд вероятность правильного воспроизведения приближается к нулевой отметке7.
Джордж Сперлинг (Sperling, 1960), а несколько позднее и другие авторы, использовав методику частичного отчета (инструкция, определяющая характер воспроизведения материала, предъявляется в этой методике уже после окончания предъявления самой информационной матрицы), пришли к выводу, что сразу после кратковременного предъявления зрительная информация примерно в течение трети секунды сохраняется в виде относительного полного сенсорного образа, после чего она исчезает или переводится в какую-то другую, вероятнее всего, вербальную форму (см. 3.2.1). Предположение об обязательном участии вербального повторения в переводе информации в долговременную память, то есть во всяком, сколько-нибудь продолжительном запоминании материала (включая абстрактные фигуры), получило название гипотезы вербальной петли (см. 5.2.1).
Для объяснения этих данных сначала Н. Во и Д. Норман (Waugh & Norman, 1965), а затем Р. Аткинсон и Р. Шиффрин (русский перевод — Аткинсон, 1980) предложили модель, в которой выделили три блока переработки информации в памяти человека: сенсорные регистры (например, «ультракороткая зрительная память» из работ Сперлинга), первичную память (кратковременная память с ограниченным объемом и вербальным повторением в качестве способа сохранения информации) и вторичную память (долговременная семантическая память с очень большим объемом пассивно сохраняемой информации). Легко видеть, что эта модель в общих чертах описывает архитектуру универсальной цифровой вычислительной машины (см 5.2.1 ). Вместе с тем, она вполне тради-ционна. Так, различение первичной и вторичной памяти можно найти уже у Джеймса или еще раньше у немецкого физиолога Экснера. Первичной памятью они называли непрерывное сохранение представления в пределах поля сознания, вторичной — повторное возвращение представления в сознание, после того как оно его покинуло. Первичная (кратковременная) память оказывается, таким образом, удивительным
7 Полученные этими авторами результаты совпали с данными исследования А Дани-елса (Daniels, 1895), выполненного в конце 19-го века Его интересовала продолжитель-112 ность сохранения впечатления в «поле сознания»
образованием, одновременно имеющим сходство с сознанием, гомункулусом, каналом связи и микропроцессором компьютера!
К числу других проблем этих ранних исследований относились вопросы о локализации и модусе работы селективных фильтров (внимания), осуществляющих отбор релевантной и подавление иррелевантной информации, последовательной или параллельной организации процессов в задачах поиска, характера взаимодействия восприятия и памяти при распознавании конфигураций. Так, ученица Бродбента Энн Трисман предположила, что перцептивные процессы разворачиваются последовательно на нескольких уровнях обработки информации, начиная с анализа сенсорных признаков материала и кончая анализом семантических. Такие работы представляли не только абстрактный научный интерес. Одной из практических проблем, изучению которой были посвящены в середине 20-го века десятки экспериментов, стала проблема вечеринки {cocktail party problem) — механизмы выделения релевантного речевого сообщения на фоне множества других одновременно ведущихся разговоров. Исследования показали, что отбор осуществляется преимущественно на основании элементарных сенсорных признаков, таких как определенное пространственное положение источника или специфический тембр голоса8. Было установлено, что семантическая связность сообщения также способствует лучшей настройке на релевантный канал (см. 4.1.2).
Значительное число работ 1960-х годов было посвящено описанию организации семантической информации в памяти. Одна из методик состояла в анализе группировки (кластеризации) словесного материала по семантическим категориям в задаче полного воспроизведения. Устойчивые ассоциативные связи между словами изучались с помощью методики свободных ассоциаций (см. 6.1.2). Еще один подход был связан с анализом феномена «на кончике языка», описанного Джеймсом, а также, в литературной форме, А.П. Чеховым (в рассказе «Лошадиная фамилия»). Браун и Макнил давали испытуемым словарные определения редких слов. В тех случаях, когда испытуемые не могли назвать слово, но утверждали, что знают его и вот-вот вспомнят, их просили угадать число слогов, примерное звучание, положение ударения, отдельные буквы и т.д.
8 Несмотря на легкомысленное название, «проблема вечеринки» возникла в серьезном контексте ведения воздушного боя, когда пилоты общались на одной радиоволне и нужно было научиться выделять в хоре голосов релевантное сообщение В разгар «холодной войны» данные о селективности внимания использовались в СССР при глушении западных радиостанций Поскольку женские и мужские голоса существенно отличаются базовой частотой, для глушения передач в какой-то момент стал применяться акустический «салат» из одновременно звучащих мужских и женских голосов Возникающая при этом маскировка была более полной, чем при использовании так называемого белого шума, в равной степени включавшего разные акустические частоты В настоящее время наблюдается новый всплеск интереса к этим механизмам, поскольку технические системы распознавания речи оказались неспособными к решению «проблемы вечеринки» и пытаются одновременно обрабатывать все, что произносится в их окружении (см 7 4 3)
113
Оказалось, что часто они оказывались в состоянии воспроизвести эту фрагментарную информацию об отдельных признаках слова (см. 7.1.3). Внутренняя репрезентация значений слов стала описываться как многомерный вектор свойств. В одной из первых теорий значения когнитивной психологии Катц и Фодор описали значение в терминах атомарных, иерархически организованных признаков, или предикатов: «быть мужчиной», «быть человеком», «быть живым существом» и т.д.
Так, например, понятие ХОЛОСТЯК задается, согласно теории Кат-ца и Фодора, сочетанием всего лишь трех дихотомических признаков: «быть мужчиной (+)», «быть взрослым (+)», «быть женатым (—)». Данный подход, казалось бы, наконец-то открывал путь к чисто автоматическому, машинному вычислению истинности понятий и составленных из них логических высказываний, пропозиций (см. 2.2.3). Вместе с тем, подобная абстракция исключала из рассмотрения многие пограничные или особые случаи, определяемые такими факторами, как социокультурные традиции и предписания. Можно ли, в самом деле, считать «холостяками» иерархов римской католической церкви, хотя в их случае выполняется приведенное выше требование сочетания элементарных семантических признаков? Точно так же, можно ли считать «холостяками» лиц нетрадиционной сексуальной ориентации или же членов формально незарегистрированных гетеросексуальных пар, которые длительное время живут вместе со своими партнерами? Очевидно, при определении даже такого простого понятия перечисление признаков оказывается недостаточным и приходится учитывать более широкий контекст — специфические особенности социокультурного института женитьбы/замужества (см. 6.3.1).
Близость этих когнитивных теорий значения структуралистским представлениям создателей экспериментальной психологии и философии 18—19-го веков неоспорима. Уже для Вундта, впрочем, всякое воспоминание было интегрировано в системе координат его трехмерной теории эмоций: «удовольствие — неудовольствие», «напряжение — расслабление», «возбуждение — успокоение». Ее более современным аналогом может служить трехмерное семантическое пространство конно-тативных (то есть аффективных) значений, построенное в 1950-е годы с помощью статистической процедуры факторного анализа Чарльзом Осгудом и его сотрудниками (Osgood, Suci & Tannenbaum, 1957). Эта модель имеет очень похожие на вундтовские координаты: «хороший — плохой» (шкала оценки), «сильный — слабый» (шкала силы), «активный — пассивный» (шкала активности). На базе модели была создана методика семантического дифференциала, в которой значение слов оценивалось всего лишь по трем отмеченным шкалам — оценки, силы и активности. Использовав данную методику, Осгуд и его коллеги продемонстрировали, например, каким образом меняется отношение к словам, имеющим аффективное значение, у пациентки с синдромом раз- двоения личности (рис. 2.5).
Рис. 2.5. Изменения в оценке коннотативного (аффективного) значения группы понятий у пациентки с раздвоением личности до (А), во время (Б) и после (В) кратковременного обострения состояния (по· Osgood, Suci & Tannenbaum, 1957).
Надо сказать, что сам Осгуд, несмотря на его активное участие в первых междисциплинарных конференциях когнитивистов и значительный фактический вклад в когнитивную науку, представлял необихевиористское направление психолингвистики. Поэтому он трактовал значение как осуществляющийся на основе ассоциативных связей внутренний медиаторный ответ (rj на внешний стимул. То, что Осгуд и другие психолингвисты середины 20-го века описывал как изменение отношения к понятиям, для представителей только что возникшей когнитивной психологии означало изменение внутренней структуры репрезентации понятий в семантической памяти. Это различие еще раз оттеняет специфику когнитивного подхода, с его общей неоменталистской ориентацией, отрицающей исследование моторики и поведения в целом. Современные психологические, а также и нейрофизиологические исследования различных форм представления знания будут подробно рассмотрены нами в следующих главах. Для новых работ становится характерным известный плюрализм — объединение этих и ряда других, первоначально противопоставлявшихся друг другу точек зрения и методических подходов (см. 6.1.3 и 9.4.1).
115
2.2.2 «Когнитивная психология» Улрика Найссера
Итоги первого этапа развития когнитивной подхода были подведены в книге Улрика Найссера «Когнитивная психология», вышедшей в свет в 1967 году. Уже во введении он пишет, что конструктивный характер наших познавательных процессов является фундаментальным фактом. Задача когнитивной психологии состоит в том, чтобы понять, каким образом «воспринимаемый, воспоминаемый и осмысляемый мир порождается из такого малообещающего начала, как конфигурация рети-нальной стимуляции или узоры звукового давления в ухе» (Neisser, 1967, р. 4). Заимствуя идею у Фрейда (работа «Влечения и их превращения»), Найссер, пишет, что «эту книгу можно было бы назвать "Стимульная информация и ее превращения". "Познание" — это обобщенное название для всех процессов, посредством которых сенсорная информация трансформируется, редуцируется, усиливается, сохраняется, извлекается и используется. Оно имеет отношение к этим процессам даже тогда, когда они разворачиваются в отсутствие релевантной стимуляции, как это имеет место при воображении или галлюцинациях. Такие термины, как ощущение, восприятие, воображение, запоминание, припоминание, решение задач и мышление... относятся к гипотетическим стадиям или аспектам процесса познания» (там же).
Найссер с осторожностью подходит к определению ведущей метафоры когнитивной психологии. Отмечая, что компьютерная метафора, по-видимому, уступает по своей эвристичности программной (сравнению психических процессов с машинными программами в духе Миллера, Галантера и Прибрама), он подчеркивает, что речь идет лишь о сходстве, но не об идентичности машинных программ и психических процессов. Значение обеих метафор состоит не только в доказательстве правомерности изучения внутренних психических процессов, но и в том, что они позволяют делать это без учета нейрофизиологических данных. В самом деле, если психика — это нечто вроде компьютерных программ, или «софтвера» (англ. software), а мозговые механизмы — собственно «хардвера» (англ. hardware), то очевидно одни и те же программы могут быть запущены на разных, в смысле физической реализации элементов, компьютерах (кремний, пневмоника, фотоника и т.д.). Найссер отмечает, что конечная задача когнитивной психологии состоит в демонстрации роли знания в детерминации поведения человека.
Особенно подробному анализу подвергается судьба сенсорной информации. Ее «превращения» начинаются с попадания в периферические блоки памяти: «иконическую» для зрения и «эхоическую» для слуха. Затем эта информация поступает в вербальную кратковременную память, где сохраняется с помощью процессов скрытого или явного про-говаривания. Подчеркивая конструктивный характер как низших, так и высших познавательных процессов, Найссер различает в них две фазы. Первая — фаза предвнимания — связана с относительно грубой и парал-
дельной обработкой информации. Вторая — фаза фокального внимания — имеет характер конструктивного акта, отличающегося «осознанной, внимательной, детальной и последовательной» обработкой. Только на этой второй фазе становится возможным вербальное кодирование информации, служащее предпосылкой для ее длительного сохранения в памяти и последующей реконструкции (см. 4.2.1).
Тезис об активности познавательных процессов развивается на примере психолингвистической модели «анализа через синтез». Согласно этой модели, при восприятии речи мы пытаемся построить внутреннюю репрезентацию предложения, максимально похожую на оригинал. Если слово предъявляется на фоне шума, то предвнимательный анализ первоначально может выделить лишь отдельные различительные признаки или слоги, после чего последовательно синтезируются несколько вероятных слов, пока одно из них не совпадет с информацией на входе. Это встречное моделирование — антиципация — может происходить на разных уровнях описания материала: буквы, слоги, слова, целые предложения. Результатом являются такие известные феномены, как ошибочное восприятие слов, которые отсутствовали в сказанной фразе, но хорошо подходят по контексту, пропуск ошибок в типографском тексте и, наконец, эффект превосходства слова Кеттела, то есть более быстрая и вообще более эффективная обработка слов, чем случайных последовательностей тех же самых букв (см. 3.3.3 и 7.2.2).
Значительное место в книге Найссера отводится феноменам памяти, в том числе зрительным образам, вновь возвращенным из бихевиористского изгнания. Найссер интерпретирует эти феномены по аналогии со зрительным восприятием. Последнее означает для него развернутый процесс интеграции получаемых во время отдельных фиксаций «кадров» зрительной информации, или «икон». Речь идет «о постоянно развивающейся схематической модели, к которой каждой фиксацией добавляется дополнительная информация» {там же, с. 180). Для такой развернутой во времени интеграции необходимо, очевидно, некоторое пространство — зрительная память. «Схематические зрительные объекты» могут быть синтезированы повторно. Это и есть образы представлений, которым, следовательно, свойствен такой же конструктивный характер, как и восприятию. «Существует аналогия между ролью хранящейся информации при воспроизведении и ролью стимульной информации в восприятии. В том и в другом случае информация не попадает прямо в сознание... В области психологии памяти... можно предложить модель работы палеонтолога, которую мы использовали для объяснения восприятия и внимания: по нескольким сохранившимся костям мы восстанавливаем динозавра» {там же, с. 285).
В связи с этим вариантом концепции творческого синтеза перед Найссером встают две проблемы. Первая, называемая им «проблемой исполнителя», заключается в необходимости устранения гомункулуса из объяснительных схем. Вторая проблема, возникающая в теории Найссе-
pa, это адекватность восприятия. Если восприятие, воображение, галлюцинация — наши внутренние конструкции, то как различить подлинное восприятие, представление имевших когда-то место событий и нечто впервые воображаемое? Ответ Найссера на этот вопрос довольно формален и, вообще говоря, не очень убедителен: «Индивид имеет образы представлений тогда, когда он вовлечен в выполнение некоторых из тех же самых когнитивных процессов, которые имеют место и при восприятии, но когда отсутствуют раздражители из внешнего мира, вызывающие это восприятие»9.
Книга Найссера представляла собой пример широкого, хотя и несколько эклектического синтеза различных подходов. На базе компьютерной метафоры были объединены структурализм Вундта и функционализм Бартлетта, гештальтпсихология и лингвистика Хомского. По сути дела (например, с точки зрения разделения процессов предвнима-ния и фокальной обработки, соответствующих тому, что столетием ранее называлось перцепцией и апперцепцией — см. 1.2.2), эта работа больше всего напоминала осовремененный вариант вундтовской экспериментальной психологии. Плюрализм, распространявшийся также и на методологию исследований, где соседствовали гипотетико-дедуктивный метод и самонаблюдение, несомненно, оказался одной из привлекательных черт когнитивного подхода в целом, позволившей представителям разных психологических традиций, а также специалистам в соседних с психологией областях принять это новое глобальное направление.
2.2.3 Принципы символьного подхода
В течение 1970-х годов в психологии и за ее пределами, прежде всего в работах по искусственному интеллекту, сложилось относительно единое мнение о теоретических основаниях, методах и моделях когнитивных исследований. Перед тем как перейти к обсуждению более современных подходов и проблем, мы попытаемся кратко обрисовать основные черты этих представлений, которые можно было бы назвать «консенсусом 1970-х годов». С точки зрения терминологии специалистов в области теории и истории науки, речь идет о частном случае так называемой «парадигмы нормальной науки» (см. 9.1.1), то есть о совокупности явно или неявно разделявшихся тогда абсолютным большинством исследова-
9 Начиная со следующей после «Когнитивной психологии» работы «Познание и реальность» (русский перевод, 1981), Найссер связывает возникновение образов с неподтверждением наших ожиданий изменения вида объектов и окружения в процессах реальной или интериоризированной активности (см 5 3 1 и 6 3 1) Примерно так же можно интерпретировать объяснение возникновения внутреннего — психологического, или «идеального» — плана активности и в работах некоторых психологов, исследовавших процес-118 сы отногенеза, прежде всего Π Я Гальперина и Ж Пиаже
телей теоретических и методологических допущений. С известной долей условности можно выделить четыре принципа традиционной парадигмы ранней когнитивной психологии:
приоритет знания и рационального мышления над поведением,
привычками и аффектом,использование компьютерной метафоры,
предположение о последовательной переработке информации,
акцент на формальном моделировании вместо изучения мозговых
механизмов.
Итак, самым первым принципом, отличающим этот подход от бихевиоризма и, скажем, психоанализа, было подчеркивание роли знаний и рационального мышления: люди — это автономные и рациональные существа, использующие свои знания для того, чтобы в рамках доступных ресурсов оптимизировать взаимодействие с окружением.
Второй принцип заключался в аналогии между психологическими процессами и переработкой символьной информации в универсальном вычислительном устройстве. Предполагалось, что знания могут быть описаны как комбинации символов, которые репрезентируют объекты и события, но не похожи на них. Подобно тому, как слово «стул» фонетически и графически не более похоже на слово «шкаф», чем на слово «шарф», возможное перцептивное сходство самих символов никак не связано со сходством или различием репрезентируемых ими значений. Роль образца при этом, безусловно, выполняла теория Хомского, разделявшая два уровня репрезентации — поверхностный и значительно более абстрактный глубинный. Точно так же и в традиционном когнитивном подходе подчеркивался амодальный и условный характер (глубинных) когнитивных репрезентаций, связанных со значением. Задача когнитивной психологии понималась как возможно более детальная спецификация подобных абстрактных репрезентаций и осуществляемых над ними операций.
Общим допущением было, что познавательные процессы характеризуются определенными ограничениями, которые имеют структурные и, возможно, другие (например, энергетические — см. 4.2.2) основания. С ограничениями пропускной способности связан третий принцип когнитивного подхода: из-за конечной пропускной способности переработка символьной информации должна осуществляться главным образом последовательно. Вследствие последовательного характера обработки полезным источником сведений о внутренней организации процессов познания является измерение времени реакции в различных задачах. Поскольку измерение времени реакции — ментальная хронометрия — стало одним из основных методических приемов когнитивной психологии, рассмотрим соответствующие методики несколько подробнее.
В ряде случаев речь идет о методе вычитания Дондерса (см. 1.2.1). Логика этого метода использовалась, например, американским инже-
119
I
120
нерным психологом, впоследствии специалистом по когнитивной ней-ронауке Майклом Познером. В работах, направленных на анализ стадий переработки информации в задаче абстрагирования свойств буквенно-цифрового материала, он предъявлял испытуемым пары букв, предлагая быстро оценивать совпадение/несовпадение визуальных характеристик, «имен» букв или же их принадлежности к классам согласных и гласных звуков. В результате были измерены времена, необходимые для выделения информации все более высоких уровней абстракции. Как и в работах Дондерса, основной недостаток таких исследований состоит в предположении, что новые задачи в чистом виде добавляют или отнимают некоторые стадии переработки, не меняя остальных. Общим приемом выделения стадий, свободным от этих недостатков, стал предложенный в 1969 году сотрудником Белловских лабораторий Солом Стернбергом (Sternberg, 1969) метод аддитивных факторов. Идея этого методического приема связана с использованием факторного планирования эксперимента и дисперсионного анализа (они были разработаны в 1920-х годах Рональдом Фишером, 1890—1962).
Допустим, что решение некоторой хронометрической задачи включает несколько последовательных этапов переработки информации, например, тех трех этапов, которые описал еще Дондерс: детекция стимула, его различение и выбор ответа (см. 1.2.1). Тогда в случае наиболее сложной задачи времени реакции выбора (п стимулов -» и реакций) можно было бы попытаться найти такие независимые переменные, или факторы, которые, селективно влияя на продолжительность каждого из этих этапов, не вызывают изменения времени переработки информации на других этапах. Наличие отдельных этапов выразилось бы в аддитивном влиянии этих факторов на общее время реакции выбора. Аддитивность двух факторов А и В означает, что при всех значениях одного фактора влияние другого постоянно. Формальным критерием аддитивности служит ситуация, при которой величина взаимодействия факторов (АхВ) в дисперсионном анализе не достигает уровня значимости. При графическом представлении результатов аддитивность выражается в появлении параллельных зависимостей.
Действительно, многочисленные данные демонстрируют существование переменных, которые, влияя на время решения тех или иных задач, не взаимодействуют между собой (Sternberg, 1969; 1999). Как показано на рис. 2.6А, к их числу в простейшем случае относятся оптическая зашумленность («читабельность») предъявляемых зрительно цифр и естественность соответствия стимулов и ответов: в соответствующих экспериментах испытуемый должен был либо просто называть показанную цифру, либо называть цифру, на единицу большую. Аддитивность (независимость) влияния этих двух факторов на время реакции свидетельствует о существовании, по крайней мере, двух независимых этапов в процессах решения данной задачи. Содержательно их можно было бы назвать этапами перцептивного кодирования и организации ответа. Время перцептивного кодирования избирательно зависит от читабельности
естеств. неестеств естеств. неестеств.
Соотношение стимулов и реакций
Рис. 2.6. Примеры аддитивного (А) и неаддитивного (Б) влияния на время реакции в задаче называния цифры (по· Sternberg, 1999).
цифр, а время организации ответа — от его естественности. С другой стороны, третий экспериментальный фактор — число альтернатив — взаимодействует в той же задаче как с читабельностью цифр, так и с естественностью ответов. Можно сделать вывод, что этот фактор влияет на продолжительность каждого из выделенных выше этапов переработки, а его полезность для тестирования процессов на одном из этих этапов ограничена.
Таким образом, метод аддитивных факторов заключается в поиске пар не взаимодействующих между собой факторов с целью расчленения процесса решения задачи на отдельные стадии. Это выявление внутренней структуры процессов переработки информации оказывается возможным чисто психологическими методами, без использования физиологических и нейропсихологических процедур. Ограничением метода аддитивных факторов является то, что он может использоваться только в хронометрических экспериментах, причем в режиме относительно безошибочной работы. Следует подчеркнуть последний момент: в силу взаимозависимости скорости и точности ответов (больше времени — точнее работа и наоборот) число ошибок в хронометрических исследованиях, за исключением специальных случаев, должно оставаться на очень низком и примерно одинаковом уровне (порядка 2—3%). Данный метод был использован в огромном числе когнитивных исследований, прежде всего для систематического анализа закономерностей поиска информации в памяти (см. 5.1.2).
121
Четвертый принцип традиционного когнитивного подхода состоял в нарочито нечетком определении связи психологических и нейрофизиологических процессов. Считалось, что хотя процессы переработки символьной информации как-то связаны с мозговым субстратом, эта зависимость не является жесткой. Скорее всего, работающий мозг .— необходимое, но не достаточное условие формирования символьных репрезентаций и психологического контроля поведения. Для представителей искусственного интеллекта, кстати, мозговой субстрат не был даже необходимым условием — предполагалась, что полноценные когнитивные репрезентации могут быть сформированы также и достаточно мощной компьютерной программой. В силу нечеткости психофизиологической связи, для многих научных и практических целей вполне достаточным представлялось формальное описание вовлеченных в переработку информации процессов, даже если их мозговой субстрат остается неизвестным. Подобное формальное описание строилось на базе формализации предложений естественного языка, то есть предполагалось, что внутренние репрезентации знания имеют в своей основе вер-бально-логический характер.
Представления об абстрактно-символьной природе внутренних репрезентаций были наиболее полно разработаны Аланом Ньюэллом. Подобные представления были необходимы, чтобы полностью использовать потенциал компьютерной метафоры и показать, что знания и следствия из них (умозаключения) могут в буквальном смысле слова вычисляться. Единицей знания при этом (см. также 5.3.1, 7.1.3 и 8.1.1) считается пропозиция — логическое суждение (утверждение), которое может быть либо истинным, либо ложным.
В логике и лингвистике существуют разные подходы к описанию пропозиций. Традиционный подход близок к описанию структуры предложения и состоит в выделении в составе пропозиции субъекта, предиката (отношения, свойства) и объекта. Этот подход, однако, проблематичен, так как субъект и объект легко могут меняться местами без изменения истинности утверждения: «Россия продала Аляску Америке» и «Аляска была продана Россией Америке». Поэтому более современным, отвечающим духу математической логики подходом является трактовка предиката как логической функции, или отношения, в которое могут подставляться различные аргументы (объекты отношения). В зависимости от характера предиката (отношения) пропозиция может допускать различное количество аргументов. Примером одноместного предиката служит выражение твердый (карандаш), двуместного — на (книга, стол), трехместного — подарить (Маша, Летя, яблоко) и т.д. В качестве аргументов таких выражений могут выступать не только существительные, имена собственные и местоимения, но и целые пропозиции, в связи с чем говорят о предикатах второго порядка. Например, предикат установления причинно-следственной связи, cause, способен рекурсивно объединять серию более элементарных пропозиций:
cause [подарить (Маша, Петя, яблоко), благодарить (Петя, Маша)].
живое существо
птица
Мурка
Чижик
Рис. 2.7. Пример простейшей семантической сети.
На базе пропозициональных репрезентаций возможно выполнение вычислений, для которых используется пропозициональная логика, называемая также исчислением предикатов. Подчеркивание роли пропозиционального описания знания, таким образом, тесно связано с поставленной еще Лейбницем (см. 1.1.2) задачей автоматического вывода и моделирования умозаключений. Существует большое количество производных от пропозиций средств моделирования, наиболее известными из которых являются семантические сети. Они представляют собой пространственные структуры, включающие узлы (понятия, объекты, аргументы) и связи между ними (отношения, функции, предикаты). Пример фрагмента простейшей семантической сети показан на рис. 2.7 С помощью подобных сетей возможно моделирование процессов категоризации и простых умозаключений (см. 6.2.1 и 8.2.1). Так, если два понятия «лебедь» и «щука» объединены иерархически более высоким узлом «живое существо», то возможен перенос части свойств, приписанных данному узлу, с одного понятия на другое. Иными словами, интерпретация и репрезентация понятий в символьном подходе прямо зависят от процессов категоризации: как только понятие относится к некоторой более
123
абстрактной категории, оно наследует семантические признаки этой категории10.
В конце 1970-х годов появились и другие средства моделирования когнитивных процессов, прежде всего так называемые системы продукций или марковские алгоритмы, названные так в честь русского математика A.A. Маркова (1858—1922). Одним из примеров могут служить правила перезаписи порождающей грамматики Н. Хомского (см. 1.3.3). Они представляют собой колонку пар (продукций) типа «условие» —» «действие»: если на вход системы продукций попадает одно из «условий», то оно автоматически приводит к соответствующему «действию». Продукции можно представить как определенные правила, например: «Если идет дождь, то нужно взять с собой зонт», хотя речь может идти и о средствах моделирования простых связок: «стимул» —» «реакция» Управление начинается сверху колонки и последовательно спускается вниз до нахождения первого подходящего условия. После осуществления операций — «действий» — управление вновь начинается с верхней строчки В отличие от обычных машинных программ системы продукции практически не обладают структурой, в них, в частности, отсутствует обычный для многих языков программирования оператор перехода к другим участкам программы (оператор «go to»). Простота систем продукций привела к тому, что они стали широко использоваться при когнитивном моделировании (см. 6 4.1 и 9 2.1). В связи с упоминанием «действий» много надежд было связано и с возможным использованием систем продукции для дополнения моделей когнитивных функций (прежде всего памяти и мышления) моделями сенсомоторных процессов.
Оценивая перспективы когнитивной психологии, один из ее представителей писал в эти годы: «Развитие этого направления науки обещает оказать на нашу философию влияние, которое будет, по крайней мере, столь же существенным, как влияние дарвинизма» (Broadbent, 1961, р. 11). Этот энтузиазм разделялся большинством психологов. Пожалуй, единственным крупным автором в американской психологии, который позволил себе публично выразить сомнение, был специалист по восприятию Джеймс Джером Гибсон: «Многие психологи, видимо, думают, что сейчас нужно только собрать воедино все наши научные достижения. Их самоуверенность удивляет меня. Ведь эти достижения очень сомнительны, а сама научная психология, по-моему, плохо обоснована. В любой момент все может опрокинуться, как тележка с яблоками» (Gibson, 1967, р. 142). Может показаться удивительным, но именно его взгляды оказали особенно сильное влияние на более поздние работы одного из основателей когнитивной психологии Найссера, а также на многие ведущиеся сегодня дискуссии (см. 9.3.2).
124
10 Следует иметь в виду, что речь идет о процессах индуктивного вывода, которые в случае реальных семантических категорий всегда могут сопровождаться ошибками Например, свойство (предикат) ЛЕТАЕТ, приписывемое концептуальному узлу ПТИЦА, не может быть распространено на некоторые примеры этой категории, такие как СТРАУС и ПИНГВИН (см 6 2 1)
Действительно, традиционный когнитивный подход оставлял нерешенными много серьезных проблем. Так, не вполне понятной оказалась проблема первичного определения значений — «проблема заземления символов» (symbol grounding problem). На поздних этапах изучения языка понятия могут задаваться посредством определения и ссылок на другие символы (см. 6.1.1). Но можно ли выучить китайский язык с самого начала, имея в распоряжении лишь китайско-китайский толковый словарь, к тому же без картинок (см. 9.2.2)? Очевидно, первичное «заземление» понятий возможно в контексте непосредственного восприятия и предметных действий, однако именно они были исключены из рассмотрения. Акцент на вербально-логическом, амодальном описании знаний оставлял открытым также вопрос о природе образных явлений (их изучение привлекло поэтому внимание многих талантливых исследователей — см. 5.3.1 и 6.3.1). Далее, наши действия и восприятия явно непрерывны, поэтому их трудно описывать дискретными логическими функциями. Программы символьной обработки, например, так и не позволили смоделировать элементарный феномен восприятия — разделение видимого поля на фигуру и фон (см. 1.3.1). Вместе с тем, они оказались достаточно успешны при моделировании решения логических задач и даже игры в шахматы.
Из возникших в тот период дискуссий и новых данных к концу 1980-х годов постепенно возникли подходы, поставившие под сомнение универсальную применимость символьного подхода. В центре внимания оказались процессы параллельной обработки и «субсимвольной репрезентации» знания, в частности, процессы, лежащие в основе нашего непосредственного взаимодействия с окружением — локомоций, восприятия и действия с предметами. Новые нейрофизиологические методы, такие как трехмерное картирование активности мозга (см. 2.4.2), были быстро включены в арсенал средств психологических исследований. Радикально изменился и сам характер когнитивных теорий, в фокусе которых, наряду с нейропсихологическими механизмами, все чаще оказываются проблемы развития и коммуникативного взаимодействия. Можно сказать, что сегодня мы имеем дело с другой психологией и другой когнитивной наукой. Они стали в большей степени соответствовать представлениям об объединяющей различные научные дисциплины и субдисциплины единой романтической науке (см. 1.4.3 и 9.4.1), чем это могли представить себе создатели первых метафор данного направления.
125
2.3 Модулярность познания и коннекционизм
2.3.1 Идея специализации обработки
Вплоть до начала 1980-х годов единственной претеоретической метафорой когнитивной психологии оставалась компьютерная метафора, с характерной для нее аналогией между психологическими процессами и переработкой информации в универсальном вычислительном устройстве. Такие компьютеры, во-первых, имеют однопроцессорную архитектуру. Во-вторых, для них характерно разделение пассивных данных и активных операций над ними, причем последние объединены в более или менее сложные, заранее написанные программы. В вычислительной технике и информатике эти вычислительные устройства иногда называются «фон-неймановскими», по имени венгеро-американского математика и логика Джона фон Неймана, предложившего в 1947 году, на пороге масштабной компьютерной революции, соответствующую схему физического воплощения машины Тьюринга (см. 2.1.1)".
Изобретение и распространение микропроцессоров в самых разных областях техники привело к созданию и повсеместному внедрению множества специализированных вычислительных устройств, значительно более простых, чем фон-неймановские компьютеры, но зато более эффективных в решении своих частных задач — балансировании тяги ракетных двигателей, регуляции температуры и влажности воздуха в помещении, определении времени суток и дня недели для любой даты в течение ближайшего тысячелетия и т.д. Стремление увеличить скорость обработки информации, а равно надежность получаемых результатов, в свою очередь, обусловило создание компьютеров с несколькими одновременно задействованными процессорами (один из первых прототипов даже получил характерное имя «Нон-фон» — «Не фон-неймановский компьютер»!). Число таких параллельных процессоров может достигать в современных суперкомпьютерах десятков тысяч, так что главной проблемой здесь становится разбиение общего массива вычислений на подзадачи и коммутирование (англ. connection) работы отдельных микропроцессоров между собой.
Первым автором, в явном виде использовавшим термин «модулярность» для описания организации психологических процессов, был американский нейроинформатик Дэвид Марр (Магг, 1976; 1982). Его интересовали частные, с точки зрения когнитивного сообщества, аспекты моделирования процессов зрительного восприятия (см. 3.3.2) и работы
126
11 С еще большим основанием, впрочем, такую схему можно было бы назвать «фон-цузевской», по имени создателя первых программно управляемых вычислительных машин, немецкого инженера и математика Конрада фон Цузе. В период с 1938 по 1944 годы он спроектировал и построил целую серию вычислительных машин, длительное время остававшихся неизвестными научной общественности из-за секретного характера этих, проводившихся в Германии во время войны, работ.
нейронных сетей мозжечка. В своем «принципе модулярной организации» Марр предположил, что «любой большой массив вычислений должен быть реализован как коллекция частей, настолько независимых друг от друга, насколько это допускает общая задача. Если процесс не организован подобным образом, то небольшое изменение в одном месте будет иметь последствия во многих других местах. Это означает, что процесс в целом будет очень трудно избавить от ошибок или улучшить, как путем вмешательства человека, так и посредством естественной эволюции — ведь любое изменение, улучшающее один из фрагментов, будет сопровождаться множеством компенсаторных изменений в других местах» (Магг, 1976, р. 485).
Идея разбиения большого массива вычислений на относительно независимые автономные задачи, решаемые специализированными механизмами (подпрограммами или модулями) была очевидной для биологов и информатиков, но первоначально оставалась скорее малоубедительной для специалистов по когнитивной психологии, вполне удовлетворенных возможностями классической компьютерной метафоры. Кроме того, научная психология в целом, как мы видели в предыдущей главе, ориентируясь на опыт «больших сестер» — физики и химии, постоянно стремилась дать возможно более единообразное, или «гомогенное», объяснение частным феноменам и процессам (см. 1.3.2). Модулярный подход, напротив, постулирует нечто принципиально иное, а именно существование множества качественно различных ме- · ханизмов, обеспечивающих специализированные способы решения для разных групп задач.
Возможно, что именно из-за методологической установки на гомо
генизацию длительное время оставались незамеченными и данные
психодиагностических исследований интеллекта. Эти исследования,
по крайней мере, с начала 1930-х годов, сигнализировали об относи
тельно низкой корреляции способностей в таких областях, как, напри
мер, вербальный и практический интеллект (см. 8.4.3). Последователь
ное применение процедур факторного анализа по отношению к
индивидуальным результатам выполнения разнообразных когнитив
ных задач (тестов) привело уже в наше время к дальнейшему расщеп
лению списка способностей. Так, в одной из современных работ (мы
рассмотрим их позднее — см. 8.1.1) было выделено в общей сложности
52 способности, что отдаленно напоминает список из 37 способностей,
выделенных на основании сугубо спекулятивных соображений френо
логами еще в первой половине 19-го века (см. 2.4.3). Другим важным
различением в психометрических исследованиях интеллекта стала идея
о различии «кристаллизованного» (основанного на знаниях и устояв
шихся навыках) и «текучего» (основанного на абстрактных мыслитель
ных способностях) интеллекта. Это различение также в какой-то сте
пени предвосхитило современные попытки разделить когнитивные
процессы на специализированные (или модулярные) и более универ
сальные (центральные) системы. 127
В порядке ретроспективного отступления можно отметить также, что представление об относительно узкой специализации различных когнитивных механизмов периодически возникало в истории психологии, в частности, оно было широко распространено в американской функционалистской психологии. Торндайк и Вудвортс еще в 1901 году подчеркивали: «Психика (mind) — это машина для осуществления специализированных реакций на конкретные ситуации. Она работает очень детально, адаптируясь к доступному ей опыту.. Улучшение одной из ментальных функций редко сопровождается сопоставимым улучшением других, независимо от того, насколько они между собой похожи, ибо функционирование каждой ментальной функции обусловлено специфическими особенностями конкретной ситуации» (Thorndike & Woodworth, 1901, ρ 249—250). При желании, в этом описании можно легко усмотреть сходство с современными модулярными представлениями и даже с идеей функциональных систем («функциональных органов») отечественной психофизиологии (см. 1.4.2).
К середине 1980-х годов общая ситуация в когнитивных исследованиях восприятия и высших форм познания существенно изменилась. На смену эйфории, вызванной первыми успехами в создании компьютерных моделей человеческого интеллекта (типа «Универсального решателя задач» Ньюэлла и Саймона) или в выявлении очертаний архитектуры хранения информации в памяти человека (разделение кратковременной и долговременной памяти), пришло более или менее отчетливое понимание сложности исследуемых задач и разнообразия участвующих в их реализации психологических и нейрофизиологических механизмов. Стали отчетливо раздаваться голоса о новом (то есть третьем по счету) полномасштабном кризисе психологии (см. 2.3.3 и 9.1.1). Один из ведущих специалистов в области психолингвистики и мышления Филипп Джонсон-Лэйрд писал в эти годы: «Двадцать лет интенсивных исследований процессов переработки информации у человека еще не привели к формулированию их общих принципов. Более того, кажется, что эта задача вообще неразрешима. Что делать дальше?» (Johnson-Laird, 1978, р. 108).
На этом фоне неожиданно актуальной стала точка зрения самого инициатора когнитивного переворота в психологии и лингвистике Хомского. Согласно его мнению, таких «общих принципов», может быть, и не существует. Например, речевые процессы являются не только врожденными, но и «специальными» (или домено-специфическими — domain-specific), в смысле их независимости как от когнитивных способностей в других столь же специальных областях, так и от интеллекта в целом. Аналогично, в исследованиях памяти было высказано сходное предположение, что долговременная память на самом деле не едина, а разделена, как минимум, на две автономные подсистемы — вербальную и образную (см. 5.3.1). Множество предположительно параллельных подсистем обработки сенсорной информации было обнаружено при
психофизических и нейрофизиологических исследованиях восприятия, причем как в случае отдельных модальностей (зрение, слух и т.д.), так и субмодальностей, например, восприятия формы, пространственного положения или цвета объектов (см. 3.1.3). Все эти данные требовали совершенно других объяснительных схем.
2.3.2 Гипотеза модулярности: вклад Джерри Фодора
Последователь Хомского, видный американский лингвист и философ Джерри Фодор выступил в 1983 году с манифестом нового подхода к пониманию когнитивной архитектуры, названным им концепцией модулярности (Fodor, 1983). Фодор предположил, что «специальность» речи, о которой говорил Хомский, представляет собой не частный, а общий случай. Архитектура познания представляет собой, с этой точки зрения, скорее мозаику множества параллельных и относительно автономных в функциональном отношении процессов, а совсем не организованное в единый механизм целое. Как образно пишут в наши дни последователи этого подхода: «По-видимому, психика больше напоминает швейцарский офицерский нож, чем некий универсальный инструмент. Швейцарский нож "компетентен" в таком обилии ситуаций благодаря большому числу специализированных компонентов: штопор, ножик, открывалка, пинцет, ножницы — каждый из этих компонентов прекрасно приспособлен, но только для решения своих собственных задач» (Cosmidis & Tooby, 1994).
Базовая таксономия механизмов включает в себя, по Фодору, три уровня: так называемые «проводники» (transducers), системы входа и центральные системы. Под проводниками имеются в виду органы чувств, обеспечивающие преобразование физической информации на рецепторных поверхностях в некоторую первичную форму представления проксимальной стимуляции, с которой могут работать модулярно организованные перцептивные системы — системы входа. Функция систем входа заключается в вычислении параметров предметного окружения. С этими репрезентациями, в свою очередь, работают центральные системы, обеспечивающие функционирование высших когнитивных процессов, а именно формирование мнений и убеждений, принятие решений и планирование разумных действий. Таким образом, психика имеет смешанную архитектуру. Если вынести за скобки относящиеся к сфере интересов сенсорной физиологии проводники, то остаются лишь два уровня элементов. Системы входа (и, по-видимому, просто упущенные Фодором из вида «системы выхода» — механизмы контроля моторики, речевых артикуляций и т.п.) специализированы на эффективном решении ограниченного класса задач. Центральные системы, напротив, универсальны и «изотропны»: они допускают возможность использова-
129
ния и интеграции любого источника информации, построения любой мыслимой и, можно сказать, «немыслимой мысли».
Важное значение имеет тезис о том, что научная психология и, шире, когнитивная наука могут успешно заниматься исследованием исключительно модулярных компонентов познания. Препятствием для научного анализа центральных систем служит классическая проблема фрейма — невозможность фиксации какого-либо определенного контекста или конечного объема знаний, отслеживанием которых можно было бы ограничиться при анализе исследуемых феноменов12. В самом деле, такие центральные процессы, как формирование мнений и принятие решений, предполагают взвешенный, подчас многократный просмотр и пересмотр существующих сведений и возможных последствий предпринимаемых действий. Эти процессы принципиально отличаются от дедуктивного вывода, поскольку их результаты не следуют с необходимостью из посылок. Отсутствие ограничений на ассоциации, аналогии и субъективные предпочтения делает научное отслеживание и оценку функционирования центральных систем практически безнадежной задачей.
Тем большее внимание уделяется Фодором модулярным системам. Он сформулировал в общей сложности 8 критериев, или признаков, которые в совокупности позволяют идентифицировать когнитивные модули. К ним относятся:
узкая специализация,
информационная закрытость,
обязательность,
высокая скорость,
поверхностная обработка,
биологическое происхождение,
селективность выпадений,
фиксированность нейроанатомических механизмов.
Первым признаком модулярности является узкая специализация, или, другими словами, ограниченность области (или домено-специфич-ность — от англ. domain-specificity), в рамках которой этот гипотетический механизм получает необходимые для работы данные и обеспечивает вычисления, ведущие к определенному выводу. Фодор подчеркивает, что внутри широких областей, таких как зрение, слух или речь, имеются многочисленные подобласти, которые вполне могут анализироваться своими собственными подсистемами, например, в случае зрения — детекция края и движения, восприятие цвета, оценка бинокулярной дис-
12 Проблема фрейма впервые была сформулирована в работах по философским основаниям искусственного интеллекта и особенно интенсивно обсуждается сегодня в когнитивной роботике, где она связана с трудностями четкого ограничения подмножества знаний о мире, требующих пересмотра в связи с движениями и действиями робота в этом 130 мире (см. 9.2.2).
паратности и т.д. Некоторые сложные перцептивные функции, имеющие особое биологическое значение, такие как узнавание лиц или обработка звуков речи, также вполне могут быть основаны на работе собственных когнитивных модулей. Вместе с тем, специфичность области обработки недостаточна сама по себе для идентификации когнитивных модулей в смысле теории Фодора. Так, многие навыки, типа навыков вождения автомобиля, весьма специфичны, но едва ли можно предположить, что они обеспечиваются работой некоторого специализированного модуля (см. 5.4.2).
При всей осторожности, необходимой при оценке этого и других критериев модулярности, следует признать, что имеются некоторые удивительные примеры подобной специализации. Изучение одного из них — синдрома Уильямса — началось уже после публикации Фодора. Этот синдром возникает вследствие врожденного выпадения около 20 генов хромосомы 7, участвующей в кальциевом обмене и, по-видимому, в каких-то других, пока не вполне понятных процессах (см. 9.4.2). Дети с синдромом Уильямса часто демонстрируют абсолютный слух, а также нормальные или даже выдающиеся показатели речи при серьезном интеллектуальном отставании, с показателями IQ (коэффициента интеллекта) порядка 50—60% (рис. 2.8). Как пишет психолингвист Стивен Пин-кер, «Попросите нормального ребенка назвать нескольких животных,
норма синдром Уильямса Ш-] синдром Дауна
JQ
100 -
вербальный интеллект
невербальный интеллект
Рис. 2.8. Результаты тестов на вербальные и невербальные интеллектуальные способности у трех групп детей: контрольная группа нормальных детей, дети с синдромом Дауна и синдромом Уильямса (неопубликованные данные, с разрешения Department of Psychology, Emory University).
131
и вы получите стандартный список обитателей зоомагазинов и пригородных ферм: собака, кошка, лошадь, корова, свинья. Попросите об этом ребенка с синдромом Уильямса, и вы получите более интересный набор: единорог, птеранодон, як, ибекс, саблезубый тигр, коала, дракон и, к особой радости палеонтологов, бронтозаврус реке» (Pinker, 1994, р. 53). В одной из недавних публикаций итальянских нейропсихологов приводится случай 9-летнего мальчика с этим синдромом, который был лучшим в своем классе по развитию навыков чтения. В то же время интеллектуально он был так слаб, что играя в любимую игру — футбол, так и не мог понять разницу между своими и чужими воротами.
Второй признак модулярности — информационная закрытость соответствующих механизмов (Фодор использует более выразительный термин «инкапсулированность»). Лучше всего этот признак иллюстрируется хорошо известными оптико-геометрическими иллюзиями, такими как иллюзия Мюллера-Лайера (рис. 2.9). Выраженность этой иллюзии не меняется при полном знании о физическом равенстве центральных отрезков13, а значит, процессы восприятия оказываются когнитивно непроницаемыми для наших знаний о ситуации. Соавтор Фодора по ряду публикаций Зенон Пылишин считает когнитивную непроницаемость основным критерием анализа фиксированных компонентов архитектуры познавательных процессов. Для Фодора существенными являются и некоторые другие признаки. Третий признак в его классификации — это обязательный («мандатный») и баллистический характер модулярных процессов: если на входе некоего модуля оказывается соответствующая информация, то ничто уже не может остановить или изменить его работу. Так, если, открыв дверь, мы наблюдаем некоторую сцену, мы не в состоянии не увидеть ее или увидеть ее иначе, если нам не нравится то, что мы видим.
Перцептивные процессы и потенциально любые другие, модуляр-но организованные процессы переработки информации, с этой точки зрения, являются вычислительными рефлексами. Из этого, в частности, естественно следует четвертый признак: модули работают очень быстро. Пятый признак тесно связан с предыдущим и заключается в том, что результатом работы модулярных систем оказываются сравнительно поверхностные репрезентации, зачастую служащие лишь сырым материалом для дальнейшего использования центральными системами.
Три последних признака модулярности, описываемые Фодором, оказали в дальнейшем особое влияние на переориентацию всего комп-
13 Более того, как показали наблюдения одного из классиков гештальт-психологии Вольфганга Метцгера, иллюзорному искажению подвержены даже металлические балки (!), если они образуют соответствующую перцептивную конфигурацию (Metzger, 1941/ 2001) В последние годы были, впрочем, получены новые данные, описывающие условия, при которых данная и некоторые другие оптико-геометрические иллюзии не возни-132 кают (см. 3.4.1)
Рис. 2.9. Иллюзия Мюллера-Лайера — выраженный иллюзорный эффект сохраняется, несмотря на знание истинных размеров и наличие линейки.
лекса когнитивных исследований. Согласно шестому признаку, очень похожие когнитивные модули могут встречаться у представителей различных биологических видов. Седьмой признак заключается в том, что нарушения и распад работы некоторого модуля обнаруживают свою собственную картину симптомов и могут происходить на фоне полной сохранности других механизмов. В нейропсихологии соответствующая особенность организации мозговых процессов по сути дела давно предполагалась таким методическим приемом, как поиск двойных диссоциаций: выявления такой пары мозговых поражений, которые селективно вызывают один из двух контрастируемых неиропсихологических синдромов (см. 2.4.1). Не удивительно, что последним, восьмым признаком когнитивных модулей оказывается фиксированность их нейроанатоми-ческой локализации. В целом, эта группа признаков позволяет сделать дополнительный и, надо сказать, достаточно сильный (если не провокационный) вывод о врожденности модулярных компонентов когнитивной архитектуры.
Вызванные книгой Фодора дискуссии продолжаются в психологии и за ее пределами, не утихая, и по сегодняшний день. Оценивая эту работу, следует отдельно обсудить ее конкретные положения, часть из которых не выдерживает критики, и те, скорее неспецифические последствия, которые она имела для современных когнитивных иссле-
133
дований в целом. Конкретные положения действительно вызывают множество вопросов. Насколько правомерны, например, приписывание модулярных характеристик перцептивным «системам входа» и подчеркнуто «изотропная» интерпретация функционирования «центральных систем»?
Одной из базовых функций перцептивных механизмов (то есть «систем входа», по Фодору) является пространственная локализация объектов и самого наблюдателя. По ряду параметров процессы пространственного восприятия, однако, трудно отнести к типичным модулярным механизмам. Так, восприятие пространства связано с широкой интермодальный интеграцией сенсорной информации (зрение, слух, кинестезия, гаптика и т.д.) и сенсомоторных навыков, основанных на опыте активных локомоций и действий (см. 3.1.1 и 3.4.3). Далее, восприятие пространства оказывается чрезвычайно пластичным, способным корректировать драматические изменения сенсорной информации. Пластичность восприятия сохраняется и у взрослых индивидов, как это было показано в многочисленных экспериментах с адаптацией к искажающим изображение на сетчатке оптическим устройствам (см. 3.4.3). При этом может учитываться также и семантическая информация — на промежуточных этапах адаптации к переворачивающим ретинальное изображение линзам свечка, видимая сначала в перевернутом положении, иногда вдруг воспринимается правильно, если ее поджигают и пламя начинает указывать направление «вверх» (O'Reagan & Noe, 2001).
Обращаясь к центральным системам, можно, напротив, найти массу примеров отклонений от предполагаемой гомогенности («изотропности») высших когнитивных процессов. Лучше всего это иллюстрируют работы по нейропсихологическим механизмам социального интеллекта. Узкая функциональная специализация, типичная картина выпадения, известная как аутизм, и даже возможная узкая локализация мозговых механизмов, которые предположительно связаны с префронтальными областями коры (см. 8.1.1), — все эти признаки механизмов социального интеллекта вполне соответствуют их модулярной интерпретации. Следует сказать, что многочисленные последователи Фодора пытаются в последние годы модифицировать его исходную концепцию, причем главным образом путем распространения модулярного подхода на самые разные, в том числе на высшие познавательные функции (Cosmides & Tooby, 1994). На основании данных, полученных с помощью методов трехмерного мозгового картирования, распространенным становится представление о модулярной организации именно высших форм познания и контроля деятельности (см. подробнее 2.4.2, 4.4.2 и 8.2.3).
В следующих главах мы будем часто упоминать разнообразные специализированные механизмы познавательной активности и анализировать ведущиеся вокруг этого комплекса вопросов дискуссии. Широта и интенсивность споров демонстрируют тот факт, что публикации Фодора по модулярности спровоцировали настоящий всплеск интереса (иногда, впрочем, с элементами протеста) к классическим проблемам
развития и мозговых механизмов познавательных процессов. Хотя соответствующие упоминания работ Выготского, Пиаже и Лурия давно уже стали в когнитивной психологии правилом хорошего тона, лишь с конца 1980-х годов интересовавшие этих авторов проблемы постепенно перемещаются в фокус внимания междисциплинарного научного сообщества когнитологов (см. 9.1.3 и 9.4.2). С этой точки зрения, поиск относительно автономных когнитивных модулей и их возможных нейрофизиологических механизмов действительно может считаться одним из числа наиболее влиятельных и интересных подходов в новейших исследованиях познания.
2.3.3 Нейронные сети в психологии
Другим влиятельным подходом в течение последних 20 лет стал так называемый PDP-подход (от parallel distributed processing = параллельная распределенная обработка), широко известный также как коннекцио-низмн. И в этом случае речь идет об отказе от компьютерной метафоры в ее символьном варианте, связанном первоначально с логико-математическими работами Алана Тьюринга и Джона фон Неймана. Однако, если концепция когнитивных модулей Фодора и его последователей лишь допускает определенную параллельность обработки в каких-то звеньях когнитивной архитектуры, в коннекционизме параллельность обработки становится уже всеобщим принципом. Речь идет о массивной параллельности обработки — все элементы системы, интерпретируемой как обширная нейронная сеть, рассматриваются как потенциально связанные между собой и одновременно участвующие в формировании ответа на стимульную конфигурацию.
Типичная коннекционистская сеть показана на рис. 2.10. Наличие нескольких слоев элементов: входного и выходного слоя плюс не менее одного промежуточного (или «скрытого», от англ. hidden) слоя — отличительная черта современных коннекционистских моделей. Попытки демонстрации вычислительных возможностей сетей формальных нейронов предпринимались американскими нейрофизиологами Мак-Кал-локом и Питтсом еще в 1940-е годы. В последующие два десятилетия простые (один входной и один выходной слой) сети под названием «персептроны» использовались для машинного распознавания изображений, однако без особого успеха, так как оказалось, что они неспособны к строгой дизъюнкции («либо А» — «либо В») — логической операции, необходимой для различения состояний мира. Лишь в начале
14 Распространенный сегодня в психологии и за ее пределами термин «коннекцио-
низм» в историческом контексте впервые был использован Эдвардом Торндайком (на
пример, Thorndike, 1932) для обозначения его основанной на ассоциативных связях сти
мулов и реакций бихевиористской теории научения (см. 1.3.2 и 5.4.2). 135
1980-х годов было показано, что добавление по крайней мере одного «скрытого» слоя нейроноподобных элементов снимает эту проблему, позволяя осуществлять на базе параллельных архитектур весь спектр логических операций. В 1986 году Румелхарт и Макклелланд опубликовали двухтомную «библию» коннекционизма (McClelland & Rumelhart, 1986; Rumelhart & McClelland, 1986), содержащую, наряду с описанием формального аппарата моделирования, многочисленные примеры психологических и нейрофизиологических применений этого подхода.
Главное преимущество коннекционистских моделей по сравнению с традиционными когнитивными моделями — это возможность ассоциативного (контентно-адресованного) и распределенного хранения информации, а также, что особенно важно, адаптивного обучения. Первая особенность означает, что любой фрагмент первоначальной ситуации или любое сопутствующее обстоятельство способны ассоциативно поддержать припоминание. «Распределенным» хранение является потому, что его субстратом является в каждом конкретном случае не какой-то отдельный элемент, а сеть в целом, то есть состояния всех ее узлов и весовые коэффициенты их связей. Наконец, коннекционизм позволяет естественно описывать некоторые элементарные формы обучения. Процессы обучения в искусственных нейронных сетях имеют известную специфику, которая должна стать понятной из нижеследующих примеров. Простейшая, сугубо ассоциативная процедура обучения в нейронных сетях
активация на выходе
выходной слой тренируемые связи
скрытый слой
входной слой
активация на входе
136
Рис. 2.10. Однонаправленная (feedforward) коннекционистская сеть, включающая скрытый слой элементов
восходит к классическим идеям проторения путей павловской физиологии и клеточных ансамблей Дональда Хэбба (см. 1.4.2).
В «Организации поведения» Хэбб (Hebb, 1949) предположил, что повторная стимуляция тех же рецепторов постепенно ведет к функциональному объединению нейронов ассоциативных областей мозга, так что этот клеточный ансамбль может сохранять активацию после окончания стимуляции и вновь возбуждаться при возникновении похожего узора стимуляции. В нейроинформатике используется следующее правило Хэбба: между всеми одновременно (синхронно) активированными нейронами (то есть элементами сети) снижаются пороги синаптических связей (повышаются весовые коэффициенты активационных связей). В результате многократных повторений распространение активации при возникновении на входе той же ситуации происходит быстрее, группа элементов, «ансамбль», активируется как целое, и, что важно, эта активация происходит даже при изменениях ситуации, например, выпадении каких-то компонентов изображения, а равно «отмирании» части «нейронов» самой сети. Тем самым удается моделировать особенности целостного восприятия, описанного гештальтпсихологией (см. 1.3.1). Подобная терпимость (graceful degradation) к искажениям на входе и к нарушениям механизма обработки информации разительно контрастирует с хрупкостью обычных символьных программ, где лишний пропуск или неправильно поставленная запятая способны остановить работу программы и даже самого компьютера. Кроме того, пластичность синаптических связей, лежащая в основе формирования ансамблей, позволяет дать физиологическое объяснение процессам обобщения (категоризации) отдельных стимульных ситуаций.
Недостатком описанного механизма самоорганизации нейронных связей является его чрезвычайно медленный, требующий сотен и тысяч повторений характер. В 1981 году немецко-американский нейрофизиолог К. фон дер Мальсбург предположил, что для объяснения одноразового обучения должны существовать быстрые синапсы, меняющие свои характеристики в ответ на однократное возникновение некоторой, обычно новой или значимой ситуации. Мальсбург назвал их «хэббов-скими синапсами». Такие синапсы действительно были обнаружены в последнее время и по предложению Нобелевского лауреата по биологии Фрэнсиса Крика иногда называются теперь «мальсбургскими». Мы подробнее остановимся на обсуждении этих нейрофизиологических механизмов в последующих главах, посвященных сознанию и памяти (см. 4.4.3 и 5.3.2).
Примером более эффективного компьютерного алгоритма обучения в самой нейроинформатике служит предложенный канадским информатикой Джеффри Хинтоном и его коллегами метод обратного распространения ошибки (backpropagation of error). В этом случае сети предъявляется некоторая конфигурация, а затем ответ на выходе сравнивается с идеальным, желаемым ответом. Результат подобного сравнения того, что должно быть (Sollwert), с тем, что есть (Istwert), вычисляется и пропускается затем в обратном направлении: от выхода сети к ее входному слою, причем на каждом промежуточном этапе осуществляются некоторые
коррекции весовых коэффициентов связей элементов с целью последующей минимизации рассогласования. Телеологизм этих процессов и необходимость эксплицитного надсмотра за обучающейся сетью порождают, с одной стороны, множество смутных психологических аналогий, а с другой стороны, известный скептицизм в оценке «обратного распространения» как подходящего средства моделирования когнитивных процессов. Дело в том, что «контролируемая минимизация рассогласования» оставляет сильное впечатление произвольного подбора желаемого результата15.
Ряд коннекционистских моделей использует обратные связи для повторного пропускания продуктов обработки через нейронную сеть. Это свойство, называемое рекуррентностью, позволяет обрабатывать конфигурации на входе в контексте предыдущих событий («прошлого опыта»). Два варианта рекуррентных сетей, использовавшихся для моделирования синтаксического анализа речи, показаны на рис. 2.11. Существует практически открытое множество других вариантов коммутации элементов, а также возможность соединения коннекционистских моделей с традиционными символьными архитектурами в рамках гибридных моделей, включающих как символические, так и коннекцио-нистские компоненты. Так, в литературе интенсивно обсуждается возможность существования разных нейролингвистических механизмов для работы с регулярными и нерегулярными глаголами (Pinker, 2000). В случае регулярных глаголов, склоняемых по определенным фиксированным правилам, в памяти могла бы сохраняться лишь корневая морфема, по отношению к которой осуществляются традиционные символьные трансформации (скажем, добавление «-ed» при переходе к прошедшему времени в английском языке). Работа с нерегулярными глаголами, напротив, требует заучивания индивидуальных паттернов (как в случае грамматических форм английского глагола «to be»: am, are, is, was, were). При моделировании такого, скорее механического, заучивания могли бы помочь нейронные сети (см. 7.1.3).
Коннекционизм не мог не вызвать острых научных дискуссий. Они возникли прежде всего с представителями символьного и модулярного подходов (Fodor & Pylyshin, 1988), для которых подобное применение идеи параллельности ведет слишком далеко, вплоть до отказа от основных принципов переработки символьной информации, выделенных к началу 1980-х годов. В самом деле, в распределенных архитектурах не выполняются основные логические требования к символьной записи информации, а следовательно, к коннекционистским репрезентациям не применимы средства исчисления предикатов (см. 2.3.3). Поэтому,
15 Вне психологии — нейроинформатика, компьютерное зрение и роботика — широко используются алгоритмы обучения нейронных сетей, не требующие внешнего надсмотра. Речь идет прежде всего о разновидности разработанных финским информатикой 138 Т. Кохоненом самоорганизующихся карт (self-organizing maps).
- контекстные нейроны ''
Рис. 2.11. Рекуррентные нейронные сети, применяющиеся для (А) моделирования построения форм прошлого времени английских глаголов и (Б) предсказания грамматической категории следующего слова в предложении (по: Cooper, 1996).
кстати, сами коннекционисты говорят об изучении субсимвольных процессов. Для некоторых видных психологов и лингвистов (например, Levelt, 1990) попытки моделирования познания с помощью обучающихся искусственных нейронных сетей представляют собой лишь слегка осовремененную редакцию упрощенных ассоцианистских взглядов. Интересно, что слабые и сильные стороны более традиционных символьных и относительно новых коннекционистских моделей различаются между собой. Символьные программы относительно удобны при реализации эксплицитных правил и практически беспомощны в области интуитивных достижений, таких как разделение сцены .на фигуру и фон в процессах зрительного восприятия (см. 1.3.1 и 4.3.3). Искусственные нейронные сети, напротив, впервые позволили легко смоделировать эффекты перцептивной организации и, скажем, эффекты ассоциативного обучения и запоминания, но они плохо, путем многочисленных повторных приближений справляются с выделением, казалось бы, совсем простых правил. Это позволяет предположить, что наиболее вероятным будущим в области моделирования познавательных возможностей человека и животных станет использование интегральных или гибридных архитектур, сочетающих достоинства символьного и субсимвольного подходов (и, будем надеяться, свободных от их недостатков!).
Одним из самых первых примеров интегрального подхода, заполняющего брешь между субсимвольными и символьными репрезентациями,
139
являются работы ученика Румелхарта Пола Смоленского (Smolensky, 2005). Использовав математический аппарат тензорного исчисления, он доказал принципиальную возможность построения коннещионистско-символъных когнитивных архитектур (ICS = Integrated Connectionist/ Symbolic), в которых свойства символьных преобразований реализуются
1 на макроуровне описания, тогда как на микроуровне ментальные репре-
зентации описываются как массивно-параллельные процессы распространения волн активации по нейронным сетям. Этот подход был применен Смоленским и его коллегами в области теоретической лингвистики, где они, прежде всего, попытались объяснить разнообразные феномены маркированности — использование специальных лингвистических средств для выражения относительно нетипичных (или «менее гармоничных») в данном контексте языковых конструкций (см. 7.3.2 и 8.1.2). Несмотря на то, что их реализация осуществляется посредством нейро-сетевых механизмов, подобные «гармоничные грамматики» способны, по мнению Смоленского, полностью заменить генеративные грамматики при описании общих принципов функционирования языка. Процесс порождения речевых звуков (модель относится пока преимущественно к сфере фонологии речи — Prince & Smolensky, 1997) описывается при этом как оптимизация решения, удовлетворяющая нескольким гетерогенным правилам, таким как запрет на возникновение последовательностей из большого числа согласных звуков (см. 7.1.1).
В столь динамичной области, как когнитивная наука, трудно предсказывать будущее развитие событий. В рамках работ по вычислительной нейронауке (нейроинтеллекту) и эволюционному моделированию в последнее время начинают рассматриваться более реалистичные, с биологической и биофизической точки зрения, альтернативы искусственным нейронным сетям (такие как самоорганизующиеся карты, клеточные автоматы и, в отдаленной перспективе, квантовые компьютеры — см. Doyle, 2003; O'Reilly & Munakata, 2003). При увеличении объема мозга в процессе эволюции исходный сетевой принцип «всё связано со всем» перестает выполняться, возникают элементы модулярной макроорганизации (Striedter, 2004). Кроме того, при моделировании познания до сих пор практически никак не учитывалась роль нейро-трансмиттеров, химических передатчиков сигналов между нейронами и модуляторов их активности. Диффузное, не ограниченное одним лишь преодолением синапсов действие нейротрансмиттеров может, лежать в основе регуляции эмоциональных состояний и интеграции нейронов в сложные самоорганизующиеся системы. Последнее представляется очень существенным — ведь целостный мозг демонстрирует не только способности решения тех или иных узкопознавательных задач, но и множество других биологически и социально необходимых функций, в частности, связанных с эмоциями и мотивированным поведением (см. 2.4.3 и 9.4.3).
140
2.4 Усиливающееся влияние нейронаук
2.4.1 Интерес к нейропсихологическим данным
Глобальная тенденция, ярко выступившая в течение последнего десятилетия 20-го века, связана с ростом интереса к мозговым механизмам — реальной архитектуре познавательных процессов. Возникновение когнитивного подхода многие психологи восприняли первоначально как освобождение от (пусть часто лишь декларируемой) необходимости интересоваться мозговым субстратом и возможными нейрофизиологическими механизмами тех или иных познавательных процессов. Если уподобить психику компьютерным программам, то очень важно, что одна и та же программа может быть запущена на разном «хардвере» — на различных реализациях машины Тьюринга. Есть, следовательно, известная независимость программного обеспечения, или «софтвера», от машинного субстрата. Суть ранней компьютерной метафоры состояла в предположении о том, что психика относится к мозгу так же, как программа относится к машинному субстрату. Компьютерные программы в качестве психологической теории позволяют интерпретировать наблюдаемые в исследованиях эффекты, «не дожидаясь — по словам Найссера — пока придет нейрофизиолог и все объяснит» (см. 2.3.2).
В 1982 году Дэвид Марр (Магг, 1982), изучавший сенсорные механизмы зрительного восприятия и координации движений, сформулировал альтернативный методологический принцип, предполагающий одновременный анализ как биологических, так и искусственных систем переработки информации на трех уровнях их описания:
общий функциональный анализ решаемых системой задач;
алгоритмическое описание выполняемых операций;
анализ воплощения этих алгоритмов на конкретном субстрате, или
«хардвере».
В последующие годы с появлением множества нестандартных архитектур в коннекционизме и, в особенности, в связи со спекуляциями о мозговой локализации тех или иных «когнитивных модулей» естественно стал возникать вопрос о том, как эти гипотетические механизмы реализованы на самом деле. Требование Марра к доведению анализа до уровня нейрофизиологического «воплощения» постепенно стало если не необходимым, то во всяком случае желательным элементом любого претендующего на научную полноту когнитивного исследования.
Все это, наряду с наметившимися трудностями проверки формальных моделей (см. 9.1.2), привело к настоящему всплеску интереса к нейропсихологическим данным о нарушениях и мозговых механизмах познавательных процессов. Изменился и сам характер когнитивных исследований, которые в значительной степени опираются сегодня на данные нейропсихологических и нейрофизиологических работ. Поэтому общие очертания многих моделей познавательных процессов в нача-
Рис. 2.12. Новая метафора когнитивных исследований: А. Левое полушарие коры с обозначением долей: (1) фронтальных, (2 теменных, (3) затылочных и (4) височных; Б. Продольный разрез мозга, позволяющий увидеть некоторые субкортикальные структуры, такие как таламус и средний мозг.
ле 21-го века напоминают рис. 2.12. Напротив, начиная с 1990-х годов ослабло влияние собственно компьютерной метафоры и машинных (или машиноподобных) моделей. В связи с этим развитием в психологических работах стали использоваться анатомо-физиологические термины, в частности, для обозначения локализации возможных мозговых механизмов: антериорные (передние), постериорные (задние), дорзаль-ные (расположенные в верхней части коры), вентральные (в нижней ее части), латеральные (на боковой поверхности), медианные (вблизи разделяющей кору на два полушария продольной борозды). Типичным стало и упоминание долей коры головного мозга: фронтальных (лобных), темпоральных (височных), париетальных (теменных), окципитальных (затылочных), а также и более локальных их областей16.
Традиционным нейропсихологическим подходом является выделение разнообразных синдромов — систематического сочетания отдельных симптомов нарушения поведения и работы мозга. Значение синдромного анализа двояко. Во-первых, он позволяет относительно упорядочить материал клинических наблюдений, главным образом, поведенческих коррелятов локальных поражений мозга. Во-вторых, он дает возможность, хотя бы в самом первом приближении, опреде-
142
16 В этой книге при упоминании различных долей коры используются принятые в русскоязычной литературе термины с одним исключением — вместо термина «лобные доли» мы вынуждены чаще использовать международный термин «фронтальные доли». Это связано с тем, что вслед за упоминанием общего региона сегодня часто приходится вводить дальнейшие уточнения локализации, такие как «префронтальные» или «фронтополяр-ные» структуры (см. 4.4.2). Соответствующих производных от прилагательного «лобные» не существует.
лить области мозга, ответственные за те или иные функциональные проявления — речь (синдромы афазии), память {амнезия), восприятие (агнозия), программирование и реализацию действий (апраксия) и т.д. Некоторые из числа наиболее известных синдромных нарушений приведены в таблице 2.1.
Таблица 2.1. Наиболее известные синдромы клинической нейропсихологии
Синдром | Область нарушений |
Речевые процессы (см. 7.1.3 и 7.3.3) | |
Афазия Брока | Произношение и грамматическая правильность речи |
Афазия Вернике | Понимание речи, использование подходящих слов |
Проводниковая афазия | Повторение услышанных (и понятых) слов и предложений |
Аномия | Нахождение слова в памяти |
Словестная глухота | Узнавание слова на слух и его повторение |
Алексия/Дислексия | Чтение, понимание и повторение написанного |
Аграфия | Различные аспекты навыка письменной речи |
Другие символические координации | |
Акалькулия | Математические способности, счет в уме |
Восприятие и сенсомоторные процессы (см. 3.3.1 и 3.4.2) | |
Агнозия | Узнавание предметов в той или иной модальности |
Прозопагнозия | Зрительное узнавание лиц |
Апраксия | Произвольные движения и сенсомоторные навыки |
Внимание (см. 3.4.2 и 4.4.3) | |
Синдром Балинта | Интеграция локальных впечатлений в целостный образ |
Игнорирование полупространства | Внимание к предметам, латерализованным в пространстве |
Память (см. 5.1.1 и 5.3.2) | |
Амнезия | Процессы произвольного припоминания и узнавания |
Мышление и планирование деятельности (см. 4.4.2, 5.2.3 и 8.1.3) | |
Лобный/Дезэкзе-кутивный синдром | Произвольный контроль действий, достижение целей, а также их смена в случае изменения обстоятельств |
Несколько иная стратегия исследований связана с анализом отдельных случаев, когда в первую очередь подчеркивается индивидуальная картина нарушения и личности пациента, а не то общее, что роднит данный случай с множеством аналогичных, как при описании обобщенных синдромов. Настоящим мастером анализа отдельных случаев был А.Р. Лурия. Этот жанр чрезвычайно распространен и в современной когнитивной науке, особенно в работах известного американского нейро-психолога Оливера Закса (например, Sacks, 1995). Наконец, третья стратегия исследований, называемая методом двойных диссоциаций, состоит в поиске таких пар отдельных случаев (или, если повезет, синдромов), которые представляют собой как бы зеркальную картину друг друга.
В связи с тем, что поиск двойных диссоциаций — это весьма распространенная стратегия в современных когнитивных исследованиях, остановимся на ней несколько подробнее. Этот прием предназначен для контроля правильности интерпретации отдельных случаев. Рассмотрим конкретную проблему. В последние годы описано несколько случаев пациентов с интересной формой семантической агнозии. Эти пациенты способны узнавать и семантически классифицировать неодушевленные предметы, но испытывают сильные затруднения в узнавании живых существ. Можно ли на основании этих данных сделать вывод о том, что семантическая память и ее мозговые механизмы разделены на две подструктуры по принципу живой—неживой? Очевидно, такой вывод был бы преждевременным, поскольку узнавание живых существ может быть просто более сложным процессом, превышающим ослабленные познавательные возможности пациентов с поражениями мозга. Поэтому если бы удалось найти двойную (парную) диссоциацию — один или более случаев сохранного узнавания живых существ и трудностей с узнаванием неодушевленных предметов, то о возможном расщеплении механизмов семантической памяти можно было бы говорить с большей степенью определенности (см. 6.1.3).
Первоначально в когнитивной психологии роль нейропсихологи-ческих данных была связана с обсуждением отдельных, особенно ярких клинических случаев. Однако вскоре стало ясно, что они могут играть важную роль и при проверке справедливости некоторых, подчас весьма общих психологических теорий. Так, Т. Шаллис и Э. Уоррингтон (Shallice & Warrington, 1970) описали пациента, у которого есть долговременная, но нарушена кратковременная память. Существование такого нарушения означает, что едва ли может быть правильной распространенная в когнитивной психологии трактовка запоминания, в которой информация, чтобы попасть в блок долговременного хранения, обязательно должна пройти через блок кратковременной памяти (см. 5.2.1).
Аналогично и несколько ранее А. Р. Лурия (1968) описал знаменитого мнемониста Ш., исследования памяти которого заставляют усомниться в том, что способности к кратковременному запоминанию всегда ог-144
раничены «магическим числом» Миллера17. На самом деле, между кратковременной и долговременной памятью Ш. не было большого различия (см. 5.1.1). Следует заметить, что описание личности и специфических возможностей (а также ограничений) памяти, восприятия и мышления Ш., конечно же, не было «клиническим случаем» в прямом смысле этого слова, однако по характеру анализа оно остается одним из лучших исследований нейропсихологического типа (case study, Einzelfallanalyse) в мировой научной литературе.
С возникновением гипотезы модулярной организации познания (см. 2.3.2) в середине 1980-х годов нейропсихологическим данным как таковым начало уделяться повышенное внимание. Более того, многие модели познавательных процессов стали в явном виде строиться как нейрофизиологические модели, причем не только нормального, но и аномального функционирования мозга. Серьезной проблемой на этом пути оказался неэкспериментальный, корреляционный характер ней-ропсихологических данных. Всякое мозговое поражение — это своего рода уникальный «эксперимент природы». У клинического нейропси-холога нет возможности выполнить требования, необходимые для подлинного эксперимента: произвольно воспроизводить поражение или создать контрольную ситуацию, которая бы отличалась от исходной исключительно фактом данного поражения. Поэтому в случае клинических данных всегда остается вероятность того, что наблюдаемая картина в какой-то степени обусловлена особенностями, сложившимися еще до возникновения патологических изменений.
Конечно, если бы было возможно временно «выключать» и затем «включать» без каких-либо последствий отдельные мозговые структуры или, быть может, даже «видеть» их функционирование по ходу нормального решения задач, то можно было бы надеяться на получение значительно более надежных и общих результатов, чем при анализе клинических данных. Такие методы действительно появились в течение последних 10—15 лет, став особенно мощным стимулом нейропси-хологической и нейрофизиологической переориентации заметной час-
17 Об этом же могут говорить наблюдения канадского нейрохирурга У. Пенфидда, раз
дражавшего во время операций на мозге различные участки коры бодрствующих пациен
тов. Примерно в 40 случаях (из 520) электрической стимуляции нижних височных облас
тей возникал своеобразный феномен, названный «вспышками пережитого». Они пред
ставляли собой живые зрительные и слуховые образы, которые всегда переживались па
циентом как воспоминания из его далекого прошлого, а не актуальные события. Ни в
одном из описанных случаев не наблюдалось обратного течения событий или пересече
ний воспоминаний из различных периодов жизни пациента. Воспоминания прекраща
лись с остановкой стимуляции, но иногда могли быть возобновлены с прерванного мо
мента при повторном раздражении той же точки коры. При интерпретации этих данных
возникают трудности, связанные прежде всего с идентификаций сообщений как аутен
тичных переживаний из прошлого пациента. Возможно поэтому наблюдения Пенфидда
уже около 50 лет остаются непроверенными другими авторами. 145
ти современной научной психологии и когнитивных исследований в целом. Речь идет о создании и начавшемся широком применении новых методов трехмерного картирования мозга и его функциональных состояний {brain imaging). Разработка этих методов была отмечена в 2003 году присуждением Нобелевской премии. Мозговое картирование используется сегодня как в клинических, так и в чисто исследовательских целях, в частности, во все большем числе относительно традиционных психологических экспериментов, проводимых с обычными испытуемыми.
2.4.2 Новые методы и старые проблемы
Вплоть до самого последнего времени существовали две основные группы методов изучения нейрофизиологических механизмов in vivo: анализ ЭЭГ и микроэлектродное отведение активности отдельных нейронных структур. Первая группа методов использует регистрацию интегральных электрических ритмов мозга, или электроэнцефалограммы (ЭЭГ). Это делается с помощью внешних, наложенных на кожу головы испытуемых электродов и не требует при использовании соответствующих усилителей сигнала создания особых условий, выходящих за рамки обычного лабораторного окружения. Вместе с тем, как правило, картина регистрируемых колебаний столь зашумлена, что по ней невозможно прямо судить о влиянии отдельных экспериментальных переменных, а лишь о глобальных стадиях изменения функциональных состояний, таких как бодрствование или сон. Поэтому в когнитивных исследованиях получила распространение модификация, известная как метод регистрации вызванных потенциалов мозга (ERPs — event-related potentials).
В этом случае предъявление стимула многократно повторяется, а затем сегменты записи ЭЭГ, синхронизированные с моментом отдельных предъявлений, накладываются друг на друга и суммируются. Случайные, разнонаправленные колебания компенсируют друг друга, и вырисовывается электрический ответ коры мозга на само стимульное событие. Этот ответ демонстрирует ряд характерных особенностей, например, негативное отклонение потенциалов через 100—200 мс после предъявления (этот пик в картине вызванных потенциалов получил название N1) и положительное отклонение примерно через 300 мс (РЗ). По расположению и амплитуде этих отклонений, несколько отличающихся в случае разных областей коры и для разных модальностей стимуляции (рис. 2.13), можно в определенной степени судить о временной развертке процессов переработки информации. Данный метод позволил подойти к решению некоторых фундаментальных проблем когнитивной психологии. Так, сравнение вызванных потенциалов на акустические стимулы в условиях направленного внимания и при его отвлечении показало, что внимание усиливает компоненты вызванных 146 потенциалов уже через 40—60 мс после стимульного события (Woldorff
-10 -0,2 0,6
0,2 0,4 Секунды
Рис. 2.13. Типичная картина вызванных потенциалов мозга (А) и подготовка эксперимента по регистрации электрической активности мозга в процессах социального взаимодействия (Б).
et al., 1993). Очевидно, это важный аргумент в пользу гипотезы так называемой ранней селекции в спорах сторонников различных моделей селективного внимания (см. 2.2.1 и 4.1.2).
Недостатком, ограничивающим применение ЭЭГ в ее различных вариантах, является низкое пространственное разрешение, а также то обстоятельство, что при этом методе регистрируются электрические изменения на поверхности, а не в глубине мозга. Метод микроэлектродного отведения активности — второй классический метод нейрофизиологического анализа — чрезвычайно точен, позволяет работать с отдельными нейронами или группами нейронов, которые расположены в любых, в том числе глубинных отделах мозга, но его применение трудоемко и, по понятным причинам, ограничено почти исключительно экспериментами на животных. Несмотря на выдающиеся результаты, полученные, например, в исследованиях зрительной сенсорной обработки (см. 3.3.2) и памяти (см. 5.3.2), значение этого метода непосредственно для когнитивных исследований относительно невелико.
Предпосылки для современных методов трехмерного картирования работы мозга были созданы благодаря компьютерным программам, обеспечивающим реконструкцию объемной пространственной модели регистрируемых процессов. Наиболее известным из числа этих новых методов до сих пор является позитронно-эмиссионная томография {ПЭТ-сканирование). Неприятной особенностью этого метода является необходимость введения в кровь радиоактивного раствора. Когда в ходе решения задач та или иная область мозга становится активной, радиоактивное вещество поступает вместе с усилившимся кровотоком к соот-
147
ветствующим регионам. Для экспериментов выбираются относительно неустойчивые изотопы, и в этих регионах мозга усиливаются процессы радиоактивного распада. Выделяющиеся в результате положительно заряженные частицы — позитроны — практически сразу же аннигилируют с электронами. При этом образуются два разлетающихся под углом 180° друг к другу фотона. Эти последние и регистрируются датчиками; расположенными вокруг головы испытуемого. Метод обеспечивает довольно высокое пространственное разрешение, порядка 3—4 мм. Однако его временное разрешение мало — в лучшем случае оно составляет примерно одну минуту, что не позволяет отслеживать сколько-нибудь быстрые когнитивные процессы. Тем не менее с помощью ПЭТ-скани-рования были получены фундаментальные результаты, в особенности относящиеся к мозговой локализации различных систем памяти и даже личности (Craik et al., 1999).
Во многих отношениях значительно более совершенным методом картирования является ядерная магниторезонансная томография (МРТ). Этот метод делает возможной очень точную (до I мм) и довольно быструю, по сравнению с ПЭТ, регистрацию. Кроме того, он неинвазивен, то есть не связан с нарушением целостности тканей организма, например, введением в кровь каких-либо субстанций. Его физической основой является эффект излучения радиоволн определенной частоты отдельными атомами, находящимися в переменном магнитном поле, которое создается расположенным вокруг испытуемого магнитом весом более 10 тонн. В экспериментальной психологии данный метод используется в варианте функциональной МРТ (фМРТ), когда определяется количество кислорода в крови (а именно в молекуле гемоглобина)18. Этот показатель интенсивности метаболических процессов коррелирует с активностью нейронов в соответствующих областях мозга. Недостатком фМРТ является все-таки слишком низкая временная разрешающая способность, позволяющая, в лучшем случае, различать события продолжительностью не менее одной секунды19. Тем не менее это, несомненно, самая лучшая на сегодняшний день методика мозгового картирования. Насколько можно судить по стремительно накапливающимся данным, фМРТ часто подтверждает и значительно уточняет результаты ПЭТ-сканирования.
18 Модификация фМРТ — метод DTI (Diffusion Tensor Imaging), позволяющий от
слеживать процессы миелинации аксонов, то есть изменения объема и распределения
белого вещества мозга (см 9.4.2), начинает широко использоваться в нейропсихоло
гии развития.
19 В последнее время появились первые работы, направленные на использование фМРТ
для регистрации изменений магнитного поля, вызванных непосредственно нейронной
активностью. Временное разрешение увеличивается при этом на порядок. В сочетании с
параллельной регистрацией ЭЭГ можно надеяться получить в ближайшем будущем еще
более высокое разрешения — до 1 мс. В отдельных случаях делаются попытки совмеще
ния фМРТ с регистрацией движений глаз испытуемого, что также обеспечивает лучший
148 тайминг событий.
Рис. 2.14. Визуализация данных фМРТ в задаче припоминания географических названий.
На рис. 2.14 показано зарегистрированное с помощью этого метода изменение активности различных участков коры испытуемого, пытающегося вспомнить название столицы Южной Кореи. Особенно сильно выраженный участок активации в префронтальных областях левого полушария может интерпретироваться как типичное проявление интенции на воспроизведение информации из безличной семантической памяти (при попытках припоминания автобиографических сведений активация наблюдается в правых префронтальных структурах — см. 5.3.2). Одновременная активация заднетеменных областей коры свидетельствует о том, что эта задача, по-видимому, решается при помощи фоновых координации, связанных с мысленным просмотром пространственных репрезентаций, или «когнитивных карт» (см. 6.3.1).
Как мы отмечали выше, магнитные поля могут использоваться не только для диагностики, но и для активного изменения динамики физиологических процессов. Для этого применяются мощные магнитные воздействия, которые ведут к кратковременному нарушению работы определенных участков мозга. Сам этот метод получил название трансчерепной магнитной стимуляции, или Τ MC {transcranial magnetic stimulation, TMS). Один из интереснейших результатов, полученных с помощью данного метода, явно противоречит предсказаниям и духу концепции модулярности Фодора (см. 2.3.2). Оказалось, что затылочные (то есть с анатомической точки зрения зрительные) отделы коры слепых испытуемых постепенно меняют свою специализацию и принимают на себя часть функций по переработке тактильной информации. Они не только систематически активируются в случае тактильных за-
149
дач, но их временное «выключение» ведет к возникновению ошибок узнавания воспринимаемых на ощупь объектов, например, при чтении шрифта Брайля.
Одним из самых мощных методов современной когнитивной нейронауки является магнитоэнцефалография (МЭГ). В ней применяется регистрация магнитных полей, сопровождающих активность нейронов. Поскольку эти эффекты примерно в 100 млн. раз слабее фонового магнитного поля Земли, их регистрация чрезвычайно трудоемка и требует использования специальных сверхпроводниковых детекторов (superconducting quantum interference devices — SQUIDs). Это самый быстрый из всех неинвазивных методов, конкурирующий даже с микроэлектродным отведением. МЭГ с успехом используется для уточнения функции отдельных регионов мозга, а также для описания временной развертки активации. Так, с ее помощью было установлено, что зрительные поля V5, участвующие в переработке информации о движении, включаются в работу через 20—30 мс после активации первичных зрительных полей VI (Andersen et al., 1997). К сожалению, МЭГ имеет слабое пространственное разрешение, поэтому обычно ее применяют в сочетании с фМРТ. Для проведения подобных исследований нужно участие междисциплинарного коллектива в составе физиков, психологов, нейрофизиологов и медиков, владеющих навыками работы с дорогостоящей физической аппаратурой, способных интерпретировать получаемые данные и объяснять их друг другу20.
Стоимость необходимой технической инфраструктуры и уникальная квалификация сотрудников — не единственная проблема мозгового картирования. Большинство этих методов основано на регистрации метаболических процессов, лишь сопутствующих собственно нейрофизиологической активности. Характер этой связи не всегда понятен в деталях. Далее, получаемая информация, давая трехмерную модель активированных областей, обычно ничего не говорит о взаимоотношениях между этими областями в процессе решения задачи. В этом смысле известные преимущества имеет классический метод ЭЭГ, так как он дает возможность определять корреляцию (когерентность) колебаний электрических потенциалов в различных областях поверхности коры и, таким образом, судить о типе взаимоотношений этих областей. Наконец, серьезные сомнения начинает вызывать так называемая процедура вычитания, с которой практически всегда связано использование мозгового картирования
20 В настоящее время апробируется так называемая оптическая томография, при которой применяется близкое к инфракрасной зоне спектра световое облучение {Near Infra-Red Spectroscopy, Ν 1RS). Хотя значительная часть фотонов поглощается при этом тканями кожи, черепа и мозга, некоторая часть выходит наружу, что позволяет судить о состоянии активации нейронных структур и степени кровенаполнения. По-видимому, речь идет о создании аналога фМРТ, но более дешевого и удобного в применении. Ведется работа и над простыми акустическими методами мозгового картирования, использующими для оп-150 ределения скорости кровотока эффект Допплера.
в экспериментальных исследованиях. При этом из картины активации мозга в экспериментальном условии вычитается картина активации в контрольном или некотором другом референтном условии.
Так, чтобы узнать, в чем состоит особенность нейрофизиологических механизмов семантической обработки материала по сравнению с перцептивной обработкой, из результирующего «образа активации» в задаче на семантическую категоризацию вычитается «образ активации» в задаче на анализ перцептивных признаков материала. При этом, естественно, все области мозга, которые были примерно одинаково активированы в обеих задачах, выпадают из рассмотрения. Но что если активированные области — это не просто мозаика независимых друг от друга модулей и целое в работе мозга, как подчеркивали гештальтпсихологи, всегда «больше суммы своих частей»? Тогда процедура вычитания может не только не помочь, но даже осложнить интерпретацию полученных данных. В формальном отношении это старая проблема, которая впервые возникла в 19-м веке в связи с дискуссиями, развернувшимися в связи с методом вычитания Дондерса (см. 1.2.1 и 2.2.3). Наметившееся решение применительно к методикам трехмерного мозгового картирования заключается в использовании статистических процедур факторного анализа, выявляющих информацию о взаимодействии (обычно в форме корреляций) процессов активации различных структур мозга.
Перед тем как перейти к рассмотрению нового поколения теоретических моделей когнитивной психологии, необходимо упомянуть еще одну группу методов, использование которых становится обязательным атрибутом все большего числа исследований. Речь идет о регистрации движений глаз, основанной на быстрой обработке видеоизображений. Хотя история анализа движений глаз насчитывает более 100 лет, значительная часть ранних работ была направлена на классификацию типов движений глаз и на описание их биомеханических характеристик. Безусловно релевантными для психологии были лишь исследования чтения и зрительного поиска. Они позволили описать характерный узор очень быстрых саккадических движений и относительно неподвижных фиксаций, а также выявить то обстоятельствог что глазодвигательная активность обычно несколько опережает все формы отчета (включая интроспекцию!) о выполняемой деятельности (см. 3.4.1).
В конце 1960-х годов широкую международную известность получили работы отечественных исследователей, прежде всего биофизика А.Л. Ярбуса (1965). Он продемонстрировал выраженную зависимость траектории движений глаз при рассматривании сложных осмысленных изображений от стоящей перед субъектом задачи. Насколько всеобщим было восхищение результатами Ярбуса, настолько незначительным оказалось желание их повторить. Дело в том, что его методика была основана на использовании резиновой присоски с укрепленным на ней зеркальцем (позднее радиоантенной). Присоска ставилась непосредственно на поверхность (склеру) глаза испытуемого, голова которого жестко фиксировалась в металлической рамке. Часто испытуемый еще 151
должен был в течение эксперимента держать прикушенной специальную соединенную с рамкой и вылитую по форме его зубов пластиковую пластину. Такой эксперимент мог продолжаться не более нескольких минут, обработка же данных занимала недели и месяцы.
Ситуация стала быстро меняться в середине 1990-х годов, когда началось гражданское использование технологии автоматического наведения ракет по видеоизображениям цели и ее непосредственного окружения. При регистрации движений глаз роль отслеживаемой «цели» выполняют зрачки, снимаемые в инфракрасном, остающемся невидимым для испытуемого свете быстрыми (с частотой смены кадра до 500 Гц) и очень маленькими (примерно 5 мм) телекамерами. Одновременно таким же образом регистрируются движения головы. Объединение информации о положении головы и зрачков позволяет чрезвычайно быстро (с задержкой в несколько миллисекунд) определять абсолютное направление взора в окружающем пространстве. Эти новые методы могут быть совершенно бесконтактными (камеры устанавливаются только в окружении, например, монтируются над компьютерным монитором). Они также позволяют испытуемому одновременно с регистрацией в известных пределах двигать головой, взаимодействовать с техническими устройствами и общаться с другими людьми (рис. 2.15).
Значение этих методов выходит за рамки исследований собственно зрительного восприятия, поскольку направление взора служит наиболее надежным и практически мгновенным индикатором положения фокуса внимания, а следовательно, и выполняемых действий (см. 4.1.1). Кроме того, продолжительность зрительных фиксаций и общее время пребывания взора в определенной области окружения позволяют судить о характере и уровне обработки информации (Vehchkovsky, 1999). Существенно, что данные о направлении взора и окуломоторных собы-
инфракрасная видеокамера
компьютер
Рис. 2.15. Бесконтактная методика регистрации движений глаз А — инфракрасное освещение, выделяющее зрачки для компьютерной видеообработки и слежения, Б — возможное расположение аппаратуры (по Joos, Rotting & Vehchkovsky, 2003)
тиях, включающих саккады и моргания, обрабатываются за сотые доли секунды. Это дает возможность менять параметры ситуации прямо по ходу эксперимента, в зависимости от параметров движений глаз (gaze-contingent experiments). Более того, специальные процедуры, близкие коннекционистским моделям, делают возможным по узору саккад и фиксаций идентифицировать намерения человека, что необходимо для адаптивной поддержки операторов сложных технических систем (см. 2.1.2 и 7.4.3). Если мозговое картирование радикально изменило характер работ в области нейропсихологии, регистрации движений глаз, судя по всему, предстоит революционизировать многие практические приложения когнитивных исследований.
2.4.3 Нейробиологические модели познания
В потоке новых данных, порожденных использованием методов трехмерного картирования мозга, стало не всегда просто узнавать аналоги традиционных психологических понятий и те компоненты ранних когнитивных моделей, которые строились на базе традиционной компьютерной метафоры. Даже если пытаться и далее описывать мозг как машину, занимающуюся вычислениями, ясно, что это машина совершенно другого рода, чем все известные нам на сегодняшний день рукотворные технические устройства. Главное отличие состоит, несомненно, в эволюционном и онтогенетическом развитии, а также в обилии элементов — по некоторым данным общее число нейронов головного мозга превышает 100 миллиардов, число же их специализированных соединений, синапсов, оказывается на два-три порядка больше (см. 9.4.2). Все это ведет к массивной параллельности нейрофизиологических процессов, сочетающейся, впрочем, с определенной анатомической дискретностью и функциональной специализацией мозговых структур.
Многие авторы пытались дать описание такой глобальной специа
лизации. Одним из самых известных примеров служит схема А. Р. Лурия
(1975), в которой выделено три основных функциональных блока мозга.
Так называемый энергетический блок (стволовые отделы мозга, древняя
кора и медиобазальные отделы лобной коры) обеспечивает длительное
бодрствование и осуществление форм деятельности, требующих кон
центрации внимания. Второй блок (задние височные и теменно-заты-
лочные отделы коры) обеспечивает получение, переработку и хранение
информации. Это гностический или познавательный блок. Наконец,
третий, исполнительный блок (лобные доли) необходим для программи
рования, регуляции и контроля текущей деятельности. Взгляды Лурия
продолжают сегодня интенсивно развиваться в нейрокогнитивных мо
делях внимания, которые выявляют также различные генетические и
биохимические основания для каждого из этих функциональных блоков
(см. 4.3.3). 153
Надо сказать, что это была далеко не первая и не последняя трехуровневая классификация. Самая первая из них была предложена Джоном Хьюлинг-Джексоном, выдающимся английским неврологом конца 19-го века. Опираясь на эволюционное учение Дарвина, он выделил лобные доли коры как высшую инстанцию поведенческого контроля у человека. Кроме того, проведенный им в ряде работ анализ расстройств речи (афазий) привел его к выводу, что в реализации речевых функций принимают участие не только традиционно рассматриваемые в этом контексте структуры левого полушария (уже хорошо известные к тому времени зоны Брока и Вернике — см. 7.1.1 ), но и механизмы правого полушария, а также субкортикальные центры. Он сформулировал идеи координации активности нескольких разноуровневых механизмов в процессе решения задач, близкие понятию «функциональная система». Эти работы послужили одним из оснований для предпринятой H.A. Бернштейном 50 лет спустя попытки теоретического синтеза накопленных к середине 20-го века поведенческих и нейропсихологических данных о механизмах регуляции движений (см. 1.4.2).
Практически одновременно с Лурия американский нейрофизиолог Пол Маклин (например. McLean, 1973) предложил несколько иную концепцию тройственной организации работы мозга. Наибольший интерес в ней представляет описание среднего уровня, включающего связанную с пространственной памятью и аффективным поведением лим-бическую кору — высшую инстанцию мозга у древних млекопитающих. Лимбическая система, в свою очередь, развивается из субкортикальных базалъных ганглиев, ответственных за контроль поведения у рептилий и птиц. По мнению Маклина, агрессивность территориального поведения отдельных людей, групп и целых государств — наследие этого периода филогенеза. Хотя человек интеллектуально и покинул царство биологических закономерностей, эмоционально он не в состоянии контролировать свой, в его основе все еще «рептильный мозг» {reptilian brain)21.
Все эти авторы — Хьюлинг-Джексон, Бернштейн, Лурия и Маклин, — по сути дела, решали одну и ту же общую задачу, которая называется в геологии стратификацией, то есть выделением в общем массиве породы отдельных слоев, или уровней, относящихся к различным предысторическим эпохам (Velichkovsky & Challis, 1999). Стратификация выполняет в геологии чрезвычайно полезную роль, позволяя сразу переносить на найденный в некотором слое материал общие характеристики соответствующей эпохи, например, кембрия или триасса. Если
21 Речь идет о довольно смелом, критикуемом многими авторами предположении. Оно частично подтверждается современными исследованиями эволюции мозга, свидетельствующими о том, что одна из ответственных за эмоциональные реакции млекопитающих (а тем самым, и человека — см. 9.4.3) структура, так называемая миндалина (амигдала), развивается непосредственно из зачатков коры древних рептилий (Abolotz, Morales & Montiel, 154 2003).
бы нам удалось построить уровнево-эволюционную модель психофизиологических процессов, то она могла бы выполнять по отношению к частным находкам и феноменам когнитивной науки аналогичную эвристическую функцию (см. 1.4.1 и 8.4.3).
Характеризуя актуальное состояние исследований, следует отметить их известную противоречивость, вызванную быстрой сменой характера объяснительных моделей. Волна технических инноваций стремительно меняет в последнее время сам облик когнитивной психологии как научной дисциплины в направлении комплексных когнитивных нейроисследований. Современные модели психологических процессов испытывают особенно сильное влияние «модулярной» нейропсихологии. При этом из-за обилия данных и противоречивости теоретических взглядов зачастую оказывается забытой более общая эволюционная и функциональная перспектива исследований. Конец 20-го века, когда многие когнитивные психологи — порой довольно неожиданно для самих себя — стали нейропсихологами и психофизиологами, оказался временем выдающихся открытий (часть из них будет обсуждаться в последующих главах), но зачастую и псевдооткрытий, в традициях так называемой френологии — популярной в начале 19-го века салонной игры на ощупывание формы черепа с целью определения бугров и впадин, предположительно связанных со степенью развития патриотизма, памяти или, например, литературных способностей.
Так, несколько лет назад одновременно в Северной Америке и Европе появились сообщения двух видных авторов об открытии с помощью ПЭТ-сканирования «центра мышления» — любое умственное усилие действительно вызывало активацию этой узколокализованной области в основании фронтальных долей. При последующем анализе этот «центр» оказался, однако, всего лишь крупным узлом питающих передние отделы коры мозга кровеносных сосудов. По сегодняшний день в профессиональной литературе обсуждается другое недавнее предположение (Tulving, 1998), согласно которому кодирование информации о различных событиях собственной биографии при запоминании (так называемая эпизодическая память — см. 5.3.2) преимущественно осуществляется фронтальными отделами левого полушария, а ее извлечение при припоминании — префронтальными структурами правого. Трудно прежде всего представить эволюционные основания для подобной специализации полушарий, ведь запоминание и припоминание обычно представляют собой моменты единого мнестического действия. Не случайно это предположение оказалось скорректированным в ходе психологических и нейропсихологических исследований памяти (см. 5.3.3).
Одновременно накапливаются новые данные о множественности механизмов и чрезвычайно широких взаимосвязях таких глобальных когнитивных функций, как, например, речь и память. В частности, в случае речи (как это предполагал уже Хьюлинг-Джексон) было установлено, что мозговая локализация основных механизмов не ограничена только левым полушарием коры, но включает также структуры правого
155
полушария и различные субкортикальные механизмы (см. 7.3.3). В результате подобного обилия взаимосвязей изучаемых структур наиболее успешными практически во всех областях когнитивных исследований сегодня оказываются нейросетевые, или коннекционистские модели.
В связи с распространением моделей, основанных на использовании искусственных нейронных сетей, следует заметить, что реальные мозговые механизмы, по-видимому, демонстрируют несколько различных принципов эволюционной организации (Striedter, 2004). Наряду с формами организации, напоминающими относительно автономные «модули» («ядра» или «центры» — они находятся, главным образом, в субкортикальных структурах), значительная часть коры, ее так называемые ассоциативные отделы, демонстрирует более распределенный, сетевой тип организации, когда каждая группа нейронов связана со всеми остальными. Это различение, впрочем, не является очень строгим. Сетевой тип организации демонстрирует и так называемая восходящая ретикулярная активирующая система {Ascending Reticular Activating System, ARAS), локализованная в глубоких субкортикальных структурах ствола, а также среднего и промежуточного мозга. Ее функция состоит в широкой активации коры, без чего состояния бодрствования и внимания оказываются невозможны (см. 4.4.1)22. Модулярные и коннекционистские подходы в когнитивных исследованиях опираются на данные о подобной горизонтальной организации самого мозгового субстрата.
Помимо и сверх того, мозговые структуры сохраняют следы их эволюционного происхождения, которые обуславливают моменты иерархических отношений между ними. Разумеется, эти иерархические, межуровневые отношения выражены не так явно, как в случае структуры бюрократических учреждений (типа какого-нибудь министерства или крупного университета). Часто они оставляют впечатление скорее градуальных переходов (Гольдберг, 2004). Существуют три основных градиента эволюционного развития мозга. Первый и наиболее ранний из них связан с переходом от древнейших, субкортикальных к кортикальным структурам (Grillner et al., 2005). Внутри коры больших полушарий, которая, кстати говоря, имеется в развитом виде только у млекопитающих (Aboitiz, Morales & Montiel, 2003), возник второй выраженный градиент развития — от задних к более новым, передним (лобным, или фронтальным) структурам. Данные эволюционные изменения продолжались вплоть до начала антропогенеза (6—7 млн. лет назад), который иногда даже называют в литературе «эпохой лобных долей» (рис. 2.16). На этой последней фазе эволюции внутри самих передних отделов коры наметился еще один градиент роста, сопровождающийся ускоренным разви-
22 В последние десятилетия было, впрочем, обнаружено, что в действительности эта система состоит из нескольких параллельных подсистем со своими начальными структурами в субкортикальных областях и конечными в коре Более того, отдельные подсисте-156 мы имеют различную биохимическую основу (см в особенности 9 4 3)
Рис. 2.16. Коэффициенты относительного роста участков коры в антропогенезе, демонстрирующие ускоренное развитие ассоциативных, в особенности фронтальных областей
тием фронтополярных областей правого полушария и теменно-височ-но-затылочных областей левого полушария23.
23 Мы никак не затрагиваем здесь проблему ко-эволюции, параллельно разворачивающейся на многих уровнях организации мозга (Deacon, 1996) Иными словами, изменения могут происходить не только в порядке развития высших эволюционных механизмов, но и в ходе модификации низкоуровневых структур Примером служит мозжечок, или цере-бемум, включающий в развитом виде структуры палео-, архе- и неоцеребеллума Активация мозжечка наблюдается как в случае сравнительно простых сенсомоторных тестов на сохранение равновесия или выполнение точностных движений, так и при решении разнообразных когнитивных и коммуникативных задач (Casey, 2005) Общим для всех этих задач является точное пространственно-временное согласование некоторого множества операций (см 7 3 3)
157
Насколько можно судить по имеющимся данным, существование подобных градиентов эволюционного развития мозга не проходит бесследно для взаимоотношения соответствующих познавательных процессов, задавая, так сказать, «вертикальное измерение» их организации, исключительно важное с точки зрения упомянутой выше общей задачи стратификации (см. 3.4.2, 5.3.3 и 8.4.3). В самом деле, примерно такая же динамика изменения неирональнои пластичности различных участков коры наблюдается и в раннем онтогенезе (см. 9.4.2). При этом сначала формируются субкортикальные структуры, затем сенсорные и моторные зоны коры и, с временным сдвигом, ассоциативные области ее теменных и височных долей, после чего постепенно, в течение значительной части жизни формируются структуры филогенетически наиболее новых лобных долей (Huttenlocher, 2002; Thatcher, 1992). Наконец, близкая последовательность вовлечения уровневых механизмов мозга имеет место и при актуальном развертывании — микрогенезе — познавательных процессов, таких как предметное восприятие или понимание речи.
Многие из полученных в последние годы конкретных результатов нейрофизиологического и нейропсихологического анализа будут обсуждаться в последующих главах, посвященных отдельным областям когнитивных исследований. Вместе с тем, чтение данной книги ни в коей мере не может заменить углубленного изучения данных и методов современной когнитивной нейронауки. Мы попытались лишь указать возможные точки соприкосновения, сознательно сделав акцент на анализе относительно молярных психологических феноменов, их механизмов и функциональной роли в деятельности. Преимущественное внимание к молярным механизмам объясняется двумя обстоятельствами. Во-первых, детальное и одновременно целостное описание различных познавательных процессов сегодня все еще едва ли возможно. Во-вторых, накапливается все больше данных о чрезвычайной пластичности мозга (см. 9.4.2). Поэтому сколько-нибудь общие, инвариантные закономерности могут быть выявлены только при рассмотрении более или менее глобальных механизмов. Можно надеяться, что отдельные открытия будут вписываться в намечающуюся глобальную картину и уточнять ее.
Одним из таких выдающихся открытий стало недавнее описание группой итальянских нейрофизиологов во главе с Джиакомо Риццолат-ти в нижней (вентральной) части премоторной коры и в теменных областях коры обезьян так называемых зеркальных нейронов (mirror neurons — см., например, Rizzolatti, 2004). Эти нейроны активируются при выполнении сложных, осмысленных движений, типа доставания пищи или разгрызания ореха. Их нельзя считать просто моторными или «командными» нейронами, так как они активируются уже при одном виде выполнения тех же самых целенаправленных движений, или действий, другими обезьянами или экспериментатором. Функция этих нейронов может состоять прежде всего в обеспечении имитации действий других 158 особей. Такая имитация, несомненно, играет важную роль в социаль-
ной жизни и научении приматов, являясь одной из основ характерной для психологии человека интерсубъектности (см. 9.4.1). Уже Кёлер (КоеЫег, 1921) описал внезапно охватывавшие наблюдавшуюся им колонию шимпанзе кратковременные «моды» на украшение себя яркими полосками ткани или на новый способ добывания термитов. Прелесть кёлеровских описаний, несомненно, состоит именно в том, что в таком «обезьянничании» мы сразу и легко узнаем самих себя.
В связи с данными о локализации зеркальных нейронов в нижних премоторных областях, следует также отметить два дополнительных обстоятельства. Во-первых, эти области граничат с нижними структурами префронтальной коры, которые участвуют у человека в эмоциональной саморегуляции и контроле социального поведения (см. 4.4.2 и 9.4.3). Во-вторых, они отчасти совпадают с областями, гомологичными так называемой зоне Брока, которая ответственна у человека за экспрессивное речевое поведение и грамматику речи (см. 7.1.1 и 7.3.3). Речь является функцией, которая наиболее сильно зависит от социальной имитации, а также от ситуативной настройки процессов понимания на параметры речи и мимики партнера (см. 7.1.3). С помощью фМРТ функции зеркальных нейронов начинают исследоваться и у человека. Фундаментальное значение этих данных для когнитивной науки состоит в том, что они объясняют механизмы развития речи и языка в филогенетической перспективе, демонстрируя их связь не столько с ранними вокализациями (у других приматов эти вокализации связаны с базальными ганглиями и структурами древней, лимбической коры), сколько с жестикуляцией и кооперативными, осуществляемыми совместно с другими особями действиями. Конечно, эта перспектива весьма сильно отличается от сугубо формального анализа языка в работах Хомского и его последователей.
Целый каскад аналогичных открытий подтверждает более ранние теоретические представления отечественных физиологов и нейропсихо-логов о социальной основе высших мозговых процессов (см. 4.1.1 и 7.1.2). Среди пионеров исследования социального мозга следует, наряду с А.Р. Лурия, отметить выдающегося физиолога и философа Алексея Алексеевича Ухтомского (1889—1942), который ввел понятие «доминанта на другого человека». Некоторые новые результаты исследования этого социального по сути дела комплекса поведенческих, психологических и физиологических реакций будет рассмотрена нами в последней главе книги (см. 9.4.2). Работу ведущих исследовательских коллективов, таким образом, начинает определять романтическая задача создания культурно-исторической нейропсихологии развития.
В то же время понятно, что эта общая задача не может быть решена без анализа моторики, сложных форм социального взаимодействия, а также эмоционально-аффективной жизни. При этом все чаще выявляется недостаточность распространенной в когнитивной науке методологии анализа локальных (модулярных) механизмов обработки. На первый план выдвигается бернштейновское понятие «координация» 159
(Velichkovsky, 2005). Кроме того, при всем внимании, уделяемом в последние годы трехмерному картированию мозга, для когнитивной науки до сих пор во многом неизведанным континентом остаются функции нейротрансмиттеров24. В современной нейрокогнитивной литературе в особенности обсуждается роль селективной гибели рецепторов, чувствительных к нейромедиатору ацетилхолину, в нарушениях внимания и в возникновении болезни Алъцгеймера (см. 4.3.3 и 5.4.3), а также влияние выделяемого при положительных эмоциях дофамина на функции самоконтроля и особенности процессов принятия решений (см. 9.4.3). Нарушение баланса дофаминэргической и глутаматэргической систем, возможно, лежит в основе патогенеза такого заболевания, как шизофрения. Исследования физиологических механизмов действия дофамина были удостоены в 2002 году Нобелевской премии.
Для понимания действия нейротрансмиттеров необходимы более молекулярные подходы, развиваемые в так называемой «мокрой» физиологии, биохимии и молекулярной генетике. В связи с недавней расшифровкой генома человека, в частности, стали быстро развиваться работы по когнитивной геномике (см. 4.3.3 и 9.4.2). Так, ген АРОЕ (от Apolipoproteine), участвующий в работе холинэргической системы, оказывает широкое влияние на формирование памяти и пространственного внимания. Близкую роль играют некоторые генетические маркеры иммунной системы человека (Nilsson, 2005). Функции имеющей автобиографический оттенок эпизодической памяти более специфично связаны с генами DRD4 и СОМТ, регулирующими дофаминэргические процессы. Эти же гены, вместе с рядом других, оказывают существенное влияние на формирование высших форм внимательного контроля поведения и познания (Posner, 2004). Работы по когнитивной геномике ставят на более прочную основу анализ психогенетических вопросов развития интеллекта (см. 9.4.2). В этих относительно новых для психологии областях можно искать дополнительные объяснения особенностей аффективно-эмоциональных состояний, стресса или утомления, механизмов возникновения психосоматических и психиатрических нарушений, а также многих, в том числе уровневых аспектов развития, функционирования и распада когнитивных процессов.
Все перечисленные в этом разделе книги области исследования развиваются столь быстро, что очень трудно делать прогнозы о том, как они будут выглядеть через 15—20 лет. Единственное предсказание, которое можно с уверенностью сделать сегодня, состоит в том, что как бы ни
160
24 К нейротрансмитгерам относятся аминокислоты (прежде всего, главные возбуждающие и тормозные медиаторы связей нейронов головного мозга — глутамат и, соответственно, гамма-аминомасляная кислота, ГАМК), моноамины (дофамин, серотонин, адреналин, норадреналин/норэпинефрин), нейропептиды, а также некоторые быстрорастворимые газы и ацетилхолин. По способу их действия нейротрансмиттеры разделяются на два класса — нейромедиапгоры и нейромодуляторы
изменились основные исследовательские подходы в будущем, в истории когнитивной нейронауки останутся имена таких авторов, как Дж. Хью-линг-Джексон, П.К. Анохин, H.A. Бернштейн, А.Р. Лурия, П. Маклин, A.A. Ухтомский и Д. Хэбб, задолго до появления современных методов картирования работы мозга попытавшихся на основе общих эволюционных соображений, продуманного экспериментального анализа и изучения отдельных клинических случаев восстановить картину развития функциональных механизмов познания и регуляции поведения.
161
3
СЕНСОРНО-ПЕРЦЕПТИВНЫЕ ПЮЦЕССЫ
г
Структура главы:
3.1 Пространство и время восприятия
Зрительная пространственная локализация
Восприятие движения и времени
Перцептивные взаимодействия и маскировка
3.2 Взлет и падение «иконы»
Иконическая память
Эхоическая память
Микрогенез как альтернатива
3.3 Распознавание конфигураций
Традиционные психологические подходы
Влияние нейронаук и информатики
Роль предметности и семантический контекст
3.4. Восприятие и действие
Сенсомоторные основы восприятия
(и наоборот)Уровни восприятия
Развитие и специализация восприятия
164
Изучение восприятия началось с описания перцептивных иллюзий и явлений константности, то есть относительной независимости воспринимаемых параметров объектов — положения, ориентации, размера, цвета и т.д. — от физических условий стимуляции. Это позволило в 19-м веке выделить данную область как отличную от сферы интересов оптики и акустики. Гештальтпсихологи Вертхаймер, Кёлер и Коффка описали затем эффекты перцептивной организации, подчеркнув, что восприятие имеет собственные закономерности и не сводится к памяти и мышлению. К началу когнитивной эпохи в области восприятия сосуществовало два основных подхода. Для первого — непрямого или конструктивистского — исходной осталась задача интерпретации ощущений. Поскольку ощущения как проксимальные отображения объектов явно аконстантны, исследователи вынуждены были постулировать процессы их внутренней коррекции с помощью памяти или мышления, например, гельмгольцевских «бессознательных умозаключений». Точку зрения прямого восприятия сформулировал в середине 20-го века ученик Коффки Джеймс Джером Гибсон. Он описывал восприятие как процесс сбора информации о дистальных объектах, осуществляемый с помощью локомоций и предметных действий. Получаемая при этом Информация адекватна объектам и не требует коррекции.
Первые модели переработки информации человеком в когнитивной психологии имели конструктивистский характер. Их неизменным компонентом были блоки «иконической» и «эхоической» памяти, содержание которых выполняло роль зрительных и слуховых ощущений. Не случайно один из авторов, много сделавший для объяснения восприятия, писал в эти годы: «Безусловно, Гельмгольц почувствовал бы себя на знакомой почве, посети он нас после 80-летнего отсутствия» (Epstein, 1977, IX). Когнитивное сообщество вначале игнорировало последователей Гибсона с их лозунгом «Не спрашивай, что внутри твоей головы, а спрашивай, внутри чего твоя голова». Затем ситуация изменилась. Для решения практических задач пришлось перейти к изучению восприятия в естественной среде и в условиях подвижности наблюдателя. Эта среда стала интенсивно изучаться и моделироваться, в результате чего возникла технология виртуальной реальности. Были выявлены группы нейрофизиологических механизмов, в различной степени зависящие от ситуации и от наших представлений о ней. Складывается впечатление, что сторонники альтернативных подходов пытались описать процессы, разворачивающиеся на разных эволюционных уровнях восприятия.
3.1 Пространство и время восприятия
3.1.1 Зрительная пространственная локализация
Среди других перцептивных процессов восприятие пространства выделяется множественностью (избыточностью) своих операций, а также тем, что оно специально настроено на функционирование в нормальных условиях жизнедеятельности: стабильности большинства предметов, независимости их размеров от расстояния до наблюдателя, продолжения существования предмета, частично или полностью вышедшего из поля зрения, и т.д. Легкость, с которой воспринимаемые пространственные отношения определяются искусственными, но экологически правдоподобными стимульными ситуациями, неоднократно давала повод для сравнения механизмов восприятия пространства с изученными этологами врожденными механизмами, запускающими видоспецифи-ческие формы поведения. С этой точки зрения, восприятие пространства могло бы служить примером модулярной системы (Fodor, 1983), если бы не его высокая пластичность и интермодальность, которые явно противоречат некоторым из критериев модулярности (см. 2.3.2 и 3.4.3).
Наиболее известным примером восприятия пространства является бинокулярное восприятие глубины. Джордж Беркли, а затем Герман Гельмгольц дали классическое объяснение этому процессу, основанное на допущении возможности субъективного отображения и интерпретации проксимальной стимуляции. Согласно этой конструктивистской трактовке, восприятие глубины начинается с того, что мы отмечаем различия — диспаратностъ — монокулярных ретинальных изображений, обусловленные несовпадением положений левого и правого глаза в пространстве. Затем на основании этих видимых различий, положений отображений на сетчатке и знаемого расстояния между глазами вычисляется (этап «бессознательных умозаключений») относительная удаленность различных участков сцены.
Важным вкладом в психологию восприятия стали работы американо-венгерского исследователя Белы Юлеза (например, Julesz, 1995), доказавшего возможность бинокулярного восприятия глубины в ситуации, когда это классическое объяснение не работает1. Идея его методики возникла из практики аэрофотосъемки и стереоскопического анализа участков земной поверхности, используемых для определения рельефа местности и при поиске замаскированных объектов. На рис. 3.1 показан пример созданных Юлезом случайно-точечных стереограмм. Для создания стереограмм использовалась матрица размером 100x100, ячейки которой случайно заполнялись с вероятностью 50%. Обе стереограм-мы идентичны за исключением небольшого центрального участка квад-
1 Самые первые демонстрации этого рода были проведены советским исследователем
восприятия Б.Н. Компанейским еще в конце 1930-х годов. 165
Рис. З.1. Пример случайно-точечных стереограмм из работ Юлеза и схематическое пояснение способа их построения.
ратной формы, который несколько смещен в сторону в одной из них. Из-за бесконтурности изображений и совпадения статистических характеристик текстур увидеть этот диспаратный участок при обычном рассматривании стереограмм практически невозможно. Однако если они предъявляются с помощью стереоскопа, независимо левому и правому глазу, мы сразу видим участок квадратной формы, выступающий из окружающего фона2. Если поменять правое и левое изображения, то, в соответствии с заменой знака диспаратности, объект воспринимается как находящийся за поверхностью фона, дальше от наблюдателя. Восприятие глубины, следовательно, оказывается возможным, несмотря на отсутствие объектов или контуров, которые можно было бы увидеть в монокулярных полях зрения.
С традиционной, конструктивистской точки зрения, восприятие объектов или, по крайней мере, контуров в монокулярных полях зрения является предпосылкой бинокулярного восприятия пространства. В случайно-точечных стереограммах порядок событий оказывается прямо противоположным — пространственная локализация служит
166
2 Здесь, правда, возможны индивидуальные различия. Примерно у 7% людей наблюдаются те или иные врожденные дефекты стереопсиса, причем, как и в случае нарушений цветовосприятия, они затрагивают в основном мужскую часть населения.
предпосылкой идентификации объектов. Кроме того, восприятие глубины в подобных стереограммах требует значительно менее выраженных перепадов яркости (меньшего контраста), чем восприятие формы. Поэтому типичными оказываются ситуации, при которых пространственная удаленность объекта оценивается правильно, но его форма еще не может быть определена: он воспринимается как аморфное «нечто».
Каждая поверхность в зависимости от ее материала отражает специфический рисунок распределения света. Поэтому для зрительного выделения объекта в пространстве необходимо наличие зернистости — текстуры — в видимом окружении. Если внутри некоторой области нет обладающих определенной зернистостью рельефов яркости, то она воспринимается как пустое отверстие, не мешающее проникновению за его границы3. Значение текстур для восприятия в особенности подчеркивал в своих работах Джеймс Дж. Гибсон. Результаты Юлеза показывают, что восприятие пространственного положения основано не на интерпретации ощущений, а на автоматических процессах параллельной обработки (кросскорреляции) текстур.
Как можно описать подобные процессы? Для чисто формального описания можно воспользоваться, например, подходом американского психофизика У. Юттала (Uttal, 1975), который разработал автокорреляционную модель обнаружения присутствия точечных конфигураций на фоне динамического шума. Автокорреляционная функция определяется степенью перекрытия копии текстуры с исходным ее вариантом при сдвигах копии относительно вертикальной и горизонтальной осей. При высокой степени перекрытия, вызванной регулярностью конфигурации, на графике автокорреляции появляются пики. Успешность обнаружения конфигураций, согласно данным У. Юттала, хорошо описывается следующим показателем:
F = [ii(AxA)/dj]n (И),
1=1 j=l
где At — амплитуда 1-го пика, А — амплитуда у-го пика, d — евклидово расстояние между двумя пиками, а и — общее число пиков. Для описания процессов параллельной обработки случайно-точечных стереограмм юлезовского типа автокорреляционный процесс может быть заменен
где At — амплитуда 1-го пика, А — амплитуда у-го пика, d — евклидово расстояние между двумя пиками, а и — общее число пиков. Для описания процессов параллельной обработки случайно-точечных стереограмм юлезовского типа автокорреляционный процесс может быть заменен
3 Речь идет в основном о перепадах яркости, а не цвета. Ученица Коффки Сузанна
Либманн (см. Konica, 1935) обнаружила следующий эффект. Если яркость двух примыка
ющих друг к другу поверхностей выравнивается, так что они начинают отличаться между
собой только цветом (спектральным составом отраженного света), то граница этих по
верхностей неожиданно теряет стабильность и определенность формы. Исследования с
применением равнояркостных стимулов выявили ряд разновидностей данного эффекта:
уплощение пространственных рельефов, замедление и даже исчезновение впечатления
движения объектов и т.д. (Livingstone & Hubel, 1987). Причина этих феноменов состоит в
том, что восприятие цвета — относительно поздний продукт перцептивной обработки
(частично связанный с зоной V4 зрительной коры). Пространственная локализация по
верхностей, основанная на выделении текстур и перепадов яркости, является скорее ус
ловием, чем следствием такого восприятия (см. 3.1.3). 167
точно такой же кросскорреляцией текстур в левом и правом монокулярных полях зрения при их взаимных сдвигах относительно горизонтальной оси. Результатом будет обнаружение и определение степени сдвига повторяющегося диспаратного участка.
Для оценки нейрофизиологической реальности таких процессов следует упомянуть еще одну важную линию исследований. В 1970-е годы, в исследованиях восприятия получили распространение теории, основанные на предположении, что зрительная система проводит Фурье-анализ ретинального изображения, то есть выделяет в его составе синусоидальные компоненты разной пространственной частоты и амплитуды. Фурье-анализ изображений основан на использовании теоремы, доказанной в 1822 году французским математиком и физиком Жаном Батистом Фурье. Согласно этой теореме, любая аналитическая функция может быть приблизительно описана как сумма некоторого числа синусоидальных компонентов, отличающихся частотой, амплитудой (контрастом) и фазой. В случае двумерных распределений яркости (к ним может быть отнесено ретинальное изображение) к этим трем параметрам добавляется ориентация соответствующих синусоидальных решеток. Эти идеи, как и представления о корреляционном анализе частот, первоначально возникли в области анализа механизмов слухового восприятия. Несмотря на ряд трудностей (например, таких, как проблема сохранения информации о фазе), в рамках этих моделей удается описать процессы детекции акустических и зрительных стимулов типа синусоидальных и производных от них решеток. Наличие в зрительной системе нейронов, селективно чувствительных к различным пространственным частотам изображения, подтверждается большим числом данных (Brace, Green & Georgeson, 2003).
Эти данные свидетельствуют о том, что кросскорреляционная обработка текстур, лежащая в основе бинокулярного восприятия глубины, по-видимому, осуществляется только в перекрывающихся по пространственной частоте участках спектра. Иными словами, используя для областей фигуры и фона каждой из предъявляемых одновременно стерео-грамм текстуры различной степени зернистости (то есть материал с разной пространственной частотой), можно создать ситуацию, обратную опытам Юлеза — диспаратные объекты сами по себе будут отчетливо видны в каждой из отдельно взятых стереограмм, но при их предъявлении независимо левому и правому глазу впечатление глубины будет полностью отсутствовать. Следовательно, постулируемая классическим, конструктивистским подходом возможность феноменального восприятия объектов или, по крайней мере, контуров в монокулярных полях зрения не является ни необходимым, ни достаточным условием бинокулярного восприятия глубины.
Стереопсис (или бинокулярный параллакс) — лишь один из множества механизмов перцептивной оценки глубины и удаленности. Среди них есть и другие, столь же базовые механизмы, как бинокулярный параллакс, причем они явно присутствуют и у многих животных, не обладающих бинокулярным зрением из-за отсутствия фронтального расположе-168 ния глаз. К таким механизмам относится детекция параллакса движения
Рис. 3.2. Два примера градиентов величины и плотности: А. Уходящая вдаль поверхность; Б. Поверхность, глобальное расстояние от участков которой до наблюдателя не меняется.
(различия угловой скорости объектов в зависимости от их удаленности при движениях самого наблюдателя), перекрытия объектов (при этом фактически используется факт продолжения существования предметов, частично вышедших из поля зрения), воздушной перспективы (низкий контраст и голубоватая окраска далеких объектов), распределения света и тени (здесь для оценки знака рельефа поверхностей используется информация об актуальном или типичном положении источника света), а также градиентов величины и плотности элементов текстуры (см. рис. 3.2). Наконец, к этой же группе базовых биопсихологических механизмов, по-видимому, относятся аккомодация и вергентные движения глаз (см. 3.4.1). Учет вергентных движений существенен для калибровки оценок удаленности, так как в зависимости от степени конвергенции одной и той же диспаратности будут соответствовать различные значения глубины (это последнее утверждение время от времени ставится под сомнение — см. Logvinenko, Epelboim & Steinman, 2001).
Перечисленные выше механизмы восприятия глубины и удаленности имеют различное значение внутри разных «срезов» эгоцентрического окружения наблюдателя. В одной из классификаций (Cutting, 2003) предлагается рассматривать три вложенные друг в друга и довольно приблизительно очерченные сферы: персональное пространство (personal space), пространство действия {action space) и воспринимаемое пространство {vista space). Механизмы перцептивной обработки конвергенции и аккомодации работают практически только внутри персонального
169
пространства (1—2 м), тогда как признаки перекрытия, гибсонианских фадиентов и воздушной перспективы эффективны во всем диапазоне еще воспринимаемого человеком окружения, то есть при идеальных условиях наблюдения (подходящий угол и интенсивность солнечного освещения, соответствующие по размерам объекты и чистый горный воздух) примерно до десяти километров и, если очень повезет, даже несколько больше.
Наряду со всеми этими механизмами имеются признаки глубины и, соответственно, процессы их перцептивной детекции и обработки, носящие выраженный культурно-исторический характер. Все они, без какого-либо исключения, используются для решения задачи передачи и интерпретации глубины в двумерных изображениях. Следует отметить, что различные культурные традиции интерпретации глубины опираются на отдельные аспекты более базовых нейрофизиологических механизмов. Эта ситуация в известной степени аналогична соотношению процессов цветонаименования и физиологических механизмов восприятия цвета, где историческое развитие соответствующей области лексикона постепенно выявляет более фундаментальные механизмы нейрофизиологического кодирования информации о цвете, основанные, например, на контрастировании оппонентных цветов (см. 8.1.2).
Наиболее известным из числа таких «вторичных признаков глубины» является линейная перспектива, использующая работу механизма выделения градиентов величины и плотности. Теория линейной перспективы была разработана и почти канонизирована европейским Возрождением. Тем не менее большие художники никогда не следовали ее предписаниям буквально, учитывая константность величины и формы, то есть относительную независимость воспринимаемых размеров и очертаний предмета от его удаленности и ориентации в пространстве. Кроме того, даже следуя законам линейной перспективы, художники вводили в построение картины несколько систем перспектив, соответствующих различным точкам зрения (этот прием начал применять Джотто, 1266—1337). В традиционной китайской и японской живописи, не знающей линейной перспективы, основными приемами передачи удаленности являются имитация воздушной перспективы (передача удаленных объектов более блеклыми и голубоватыми цветами) и так называемой параллельной перспективы (варьирование положения на вертикальной оси: чем выше расположено изображение объекта на плоскости, тем больше его подразумеваемая удаленность). Размеры изображенных предметов при этом могут не меняться, как и должно было бы быть при 100% константности. В византийских и древнерусских иконах общим случаем является даже обратная перспектива, при которой размеры изображений объектов увеличиваются с предполагаемой удаленностью4.
4 Причины подобной «сверхконстантности» как раз в случае иконописи остаются не вполне понятными (Раушенбах, 1980). Возможно, разгадку обратной перспективы следует искать скорее в особенностях зрительной памяти и воображения, чем собственно восприятия. При возникновении последовательных образов, а также в случае так называемой эйдетической памяти (см. 5.3.1) размеры представляемых объектов увеличиваются при увели-170 чении их предполагаемой удаленности. Такая зависимость называется «законом Эммерта».
Таблица 3.1. Основные признаки глубины и удаленности, эффективные в процессах зрительного восприятия
|
Признаки глубины и удаленности | Бино-/ монокулярн. | Абсолют./ относит. | Качеств./ количеств. |
Бинокулярный параллакс | бино | отн. | кол. |
Вергентные движения глаз (до 3 м) | бино | абс. | кол. |
Аккомодация хрусталика (до 2 м) | моно | абс. | кол. |
Монокулярный параллакс (параллакс движения) | МО НО | отн./абс. (?) | кол. |
Перекрытие поверхностей/текстур | моно | отн. | кач. |
Градиенты величины и плотности (геометрическая перспектива) | моно | отн./абс. (?) | кол. |
Знание размеров и удаленности ориентиров | моно | абс. | кол. |
Высота положения в поле зрения | моно | отн. | кол. |
Воздушная перспектива (размытость контуров и цвет) | моно | отн. | кол. |
Распределение света и тени | моно | отн. | кач./кол. (?) |
Разделение на фигуру и фон | моно | отн. | кач. |
Перечисление основных признаков восприятия глубины и удаленности, используемых при зрительном восприятии пространства, дано в табл. 3.1. Как видно из таблицы, значительное большинство этих признаков может использоваться в монокулярных условиях. При этом вне зоны ближайшего пространственного окружения (пространство действия с включенным в него персональным пространством), где возможно непосредственное сенсомоторное взаимодействие с предметами, зрение выделяет скорее относительную информацию о взаимной удаленности объектов. За пределами этой зоны (все еще воспринимаемое пространство, vista space) абсолютные оценки удаленности объекта помогает выносить опора на память, то есть на знаемые размеры предметов и известную (привычную) удаленность ориентиров. Нако-1 нец, выделяемая стереозрением информация носит как порядковый (например, в случае очень мощного признака перекрытия поверхностей), так и количественный, метрический характер (бинокулярный параллакс).
171
Второй классической проблемой восприятия пространства является стабильность видимого мира. Дело в том, что оценка видимого направления не меняется при движениях глаз (и даже несколько улучшается при их наличии). Под движениями глаз в данном случае имеются в виду саккады — чрезвычайно быстрые, до 800°/с, скачки, переводящие глаза в новое положение для фиксации, то есть относительно неподвижное состояние, во время которого и осуществляется сбор сенсорной информации (см. 3.4.1). В среднем глаза совершают от 3 до 5 саккадических скачков каждую секунду, свыше 160 000 раз в течение каждого дня нашей жизни (мы не принимаем при этих подсчетах во внимание движения глаз во время так называемой REM-фазы сна). Возникающие во время саккад перемещения проекции объектов по сетчатке не воспринимаются нами и не ведут к ошибочным оценкам положения этих объектов в физическом окружении.
Подобная стабильность видимых направлений представляет собой один из первых описанных в литературе феноменов восприятия, известный уже Аристотелю. В 19-м веке были сформулированы два основных объяснения, с небольшими вариациями встречающиеся в нейро-и психофизиологии до сих пор. Эрнст Мах предположил, что коррекция зрительного восприятия осуществляется на базе проприоцептив-ной информации, поступающей от рецепторов глазных мышц. Гельм-гольц выдвинул несколько более сложную гипотезу, согласно которой каждое произвольное движение глаз сопровождается прогнозом изменений зрительной стимуляции. Сравнение этого прогноза, связанного с эфферентной командой (или, в современной терминологии, «эфферентной копии»), с сенсорной ситуацией после осуществления движения («реафферентацией») позволяет судить о том, произошли ли в окружении за время саккадического скачка глаза какие-либо фактические изменения.
Возможность проверки этих предположений связана с обездвижением глаз. С точки зрения теории эфферентного прогноза, но не про-приоцептивной коррекции, в такой ситуации можно ожидать иллюзорных скачков видимого мира при каждой попытке посмотреть в сторону. В последние десятилетия несколько исследователей попытались проверить эти классические гипотезы путем внутривенного введения себе яда кураре. Это вещество селективно блокирует нервно-мышечную передачу импульсов, временно вызывая паралич мышц тела. Система мышц, вращающая глазное яблоко в орбите, отключается при этом в последнюю очередь, поэтому такие опыты можно проводить лишь в клинических условиях, с использованием аппарата искусственного легкого. Полученные результаты свидетельствуют об отсутствии иллюзорного движения и скачков объектов в зависимости от интенции двигать глаза, и, следовательно, они не подтверждают гипотезу об активном прогнозе обратной
афферентации как основе видимой стабильности (Matin, 1986). Одно-172
временно в независимых экспериментах было показано, что проприоцеп-ция от мышц недостаточно точна, а главное, слишком медленна, чтобы ее можно было полноценно использовать для корректировки восприятия при саккадических движениях глаз. Поэтому в целом не подтверждается и альтернативная гипотеза проприоцептивной коррекции.
Не все авторы считают оправданным столь интенсивный интерес к стабильности видимого мира. Для Гибсона и его последователей (а ранее, конечно, и для гештальтпсихологов) — это всего лишь псевдопроблема. Зрительное восприятие, с их точки зрения, направлено на поиск инвариантных характеристик оптического потока. Воспринимаемое направление определяется при этом относительным положением объекта в окружении, которое не меняется при движениях глаз. Несколько иное объяснение предложил в начале 1970-х годов Дональд М. Маккай. По его мнению, в относительно стабильном мире стабильность положения большинства объектов автоматически принимается организмом в качестве «нулевой гипотезы», которая сохраняется до тех пор, пока не будет получено убедительных доказательств обратного5.
Но стабильность видимого мира не удается списать со счета просто так, как нечто само собой разумеющееся. Прежде всего она не сохраняется при нарушении в работе вестибулярных функций и, например, при алкогольном отравлении. Кроме того, с конца 1980-х годов стали широко проводиться эксперименты, в которых предъявление информации зависело от одновременно регистрируемых движений глаз. Эти эксперименты показали, что примерно в течение первых 50—100 мс после начала зрительной фиксации однозначная и устойчивая локализация быстро предъявляемых тест-объектов отсутствует. Далее было установлено, что если во время саккадического скачка осуществляются сдвиги, перестановки и даже подмена объектов, то испытуемые часто этого просто не замечают (о феномене «слепоты к изменению» см. подробнее 3.1.3 и 4.4.1). Данный факт противоречит традиционным теориям стабильности видимого мира, поскольку они предполагают существование детальной «транссаккадической памяти» — либо в форме прогноза вероятных изменений зрительной стимуляции (Гельмгольц и многие последующие авторы), либо в форме образа ситуации, который может требовать (Мах), а может и не требовать (Маккай) дополнительной интермодальной коррекции.
5 Независимость восприятия пространства от наших собственных движений под
черкивал и H.A. Бернштейн: «Когда мы ходим, поднимаемся по лестнице, поворачи
ваемся вокруг себя, мы не только знаем, но и ощушаем со всей наглядностью и непо
средственностью, что перемещаемся мы, в то время как пространство с наполняющи
ми его предметами неподвижно, хотя все рецепторы говорят нам обратное. Если мож
но так выразиться, каждый субъект еще с раннего детства преодолевает для себя эго
центрическую, птоломеевекую систему координат, заменяя ее коперниканской» ( 1947/
1991, с. 82). 173
Эти данные заставляют пересмотреть взаимоотношения восприятия, памяти и сознания. Если ранняя экспериментальная психология абсолютизировала роль сознания, то когнитивная психология первоначально явно преувеличила роль памяти, заменив анализ процессов восприятия на представление о сохранении сенсорной информации в периферических регистрах — иконической и эхоической памяти. Как будет показано в следующем разделе, это представление создает больше проблем, чем решает (см. 3.2.1 и 3.2.2). Возможно, восприятие стабильного окружения вообще не связано с существованием сколько-нибудь детального, удерживаемого в памяти образа. Дело в том, что запоминание и сравнение таких массивов данных потребовало бы от зрительной системы гигантского объема собственно когнитивных ресурсов, которыми зрительная система не располагает. Вместо этого есть очень быстрые, требующие, как правило, менее 100 мс процессы пространственной локализации самих объектов. Эти процессы инициируются вновь и вновь после каждого саккадического движения глаз и, во-видимому, после каждого моргания (Bridgeman, Van der Heijden & Velichkovsky, 1994; Velichkovsky et al., 2002a).
3.1.2 Восприятие движения и времени
Чтобы перейти к обсуждению восприятия движения, необходимо кратко рассмотреть две общие особенности перцептивных процессов: их интермодальность и их опору на целую иерархию выделяемых в окружении пространственных систем отсчета. Несмотря на анатомические различия, разные сенсорные модальности работают в отношении оценки пространственных характеристик как одна функциональная система (см. 1.4.2). Так, варьирование интенсивности билатерально предъявляемых стимулов приводит к аналогичным изменениям направления не только в зрительной, слуховой и осязательной модальностях, но даже в обонятельной и вкусовой (Shipley & Rowlings, 1971). Конечно, при этом сохраняются различия. Например, слуховая локализации обычно быстрее, чем зрительная, но ее точность ниже, в частности, на слух мы не можем определить, находится ли источник звука перед нами или за нашей спиной. Отдельные модальности можно уподобить группам инструментов симфонического оркестра, исполняющих в разном ключе и с вариациями одну и ту же мелодию. Эта избыточность обеспечивает высокую надежность восприятия пространства, служащего опорой как для других перцептивных процессов, так и для решения собственно когнитивных задач.
Сам субъект восприятия также оказывается одним из локализуемых
компонентов окружения. Кожная, мышечная и, в особенности, сустав-
но-мышечная чувствительность традиционно рассматриваются как ос-
174 нова восприятия положения собственного тела и его движений — про-
Рис. 3.3. Примеры динамических градиентов Гибсона.
приоцепции и кинестезии. Речь идет о широкой интеграции ощущений взаимного расположения частей тела («схема тела» — уровень В) и положения тела во внешнем окружении («пространственное поле» — уровень С, по классификации Бернштейна — см. 1.4.3). Имея в виду интермодальность этих процессов, Гибсон писал о «зрительной кинестезии», а Бернштейн о «проприоцепции в широком смысле слова». Гибсон, длительное время проводивший исследования для ВВС США, выделил зрительные источники информации о собственных движениях, описав знаменитые динамические градиенты оптического потока (рис. 3.3). Скорость и целостная геометрия подобных трансформаций позволяют определить характер движений. Например, положение точки, остающейся неподвижной внутри потока оптического расширения {focus of expansion, FoE), специфицирует направление движения наблюдателя6. Пространственное зрение взаимодействует и со значительно более древней вестибулярной системой. В частности, общая ориентация видимых контуров позволяет выделять информацию, соответствующую критическим для работы вестибулярной системы данным о направлении гравитационной вертикали.
6 Использование зрительной информации для контроля собственных локомоций зависит от способа перемещения в пространстве. При движениях с помощью технических средств решающая роль действительно принадлежит динамическим градиентам: изменяй одну только оптическую плотность объектов в периферии поля зрения (например, увеличивая плотность дорожной разметки), можно значительно более надежно заставить водителей тормозить на перекрестках, чем расставляя предупреждающие знаки. При перемещениях, так сказать, «на своих двоих» роль обнаруженных Гибсоном механизмов снижается и ведущим оказывается просто видимое направление на цель.
175
Характерной особенностью восприятия положения и движения является зависимость от пространственных систем отсчета. Роль систем отсчета можно проиллюстрировать следующим примером. Один из основных инструментов в кабине самолета — индикатор бокового наклона, или «авиагоризонт». Долгое время российские и западные авиастроители отдавали предпочтение разным вариантам отображения информации об этой переменной — «виду снаружи» и, соответственно, «виду изнутри» (см. рис. 3.4, А и Б). Этот спор объясняется присутствием различных систем отсчета, связанных с кабиной самолета и с внешним окружением. Зрительно стабильной кажется кабина, тогда как когнитивно, а с учетом вестибулярной афферентации также и сенсорно — земная поверхность. Нельзя ли использовать эти частные подходы для создания более гибкой системы отображения? Решение связано с учетом особенностей работы вестибулярной системы: из-за быстрой адаптации ее рецепторов вестибулярная система реагирует не столько на положение головы в пространстве, сколько на изменение этого положения (Величковский, Зинченко, Лурия, 1973). Поэтому характер отображения можно поставить в зависимость от темпа изменения наклона. При продолжительном полете без выраженных изменений наклона используется «вид изнутри», при резких изменениях — «вид снаружи», который постепенно вновь трансформируется (путем вращения дисплея, как показано на рис. 3.4В) в «вид изнутри» (Wickens, Gordon & Liu, 1998).
176
Рис. 3.4. Три различных варианта отображения информации о боковом наклоне самолета: А. «Вид снаружи»; Б. «Вид изнутри»; В. Комбинированный инструмент, сочетающий оба способа отображения в зависимости от темпа изменения наклона.
Обратимся, наконец, к рассмотрению восприятия движения. Прежде всего оно, безусловно, имеет такой же непосредственный характер, как и пространственная локализация, что связано с особой биологической значимостью тех и других процессов. Хорошо известно, например, что нейроны зрительной системы реагируют главным образом на движение стимула внутри соответствующих рецептивных зон. Следует, однако, очень осторожно использовать эти нейрофизиологические данные с точки зрения объяснения восприятия движения, так как критическую роль в последнем играют процессы детекции изменения положения объекта относительно внешних систем отсчета, а не перемещение стимула по сетчатке само по себе.
Так, при полном устранении зрительного контекста (в темноте или в другом гомогенном окружении) возникает иллюзия автокинетического движения: неподвижная и аккуратно фиксируемая цель начинает казаться движущейся то в одном, то в другом направлении, совершая «экскурсии», амплитуда которых может достигать десятка угловых градусов. Вариантом управляемого автокинеза является так называемое индуцированное движение, детально изученное Карлом Дунке-ром (Dunker, 1929). При этом в гомогенном поле наблюдателю предъявляется неподвижный объект с окружающей его рамкой. Если рамка — единственная видимая система отсчета — начинает двигаться, то наблюдатель воспринимает движение фиксируемого объекта в противоположную сторону. Это восприятие сопровождается отчетливым впечатлением отслеживания иллюзорного движения глазами, головой и даже всем корпусом!
Ситуация возникновения индуцированного движения служит удобной моделью для иллюстрации общих особенностей восприятия. Для получения особенно сильного эффекта индуцированного движения вместо рамки часто используются вертикальные полосы, заполняющие практически все зрительное поле. При этом может наблюдаться дополнительный эффект, свидетельствующий о непосредственной связи видимого движения с особенностями восприятия пространства. Когда испытуемый устает и перестает аккуратно фиксировать полосы или же специально получает инструкцию фиксировать точку, находящуюся перед фоном, может возникать бинокулярная фузия сдвинутых на один период полос. В результате большей конвергенции осей глаз (вергент-ные движения глаз калибрируют оценки удаленности и величины — см. 3.1.1) фон феноменально приближается к наблюдателю, ширина полос сужается и, что существенно, соответственно замедляется скорость индуцированного движения (Velichkovsky & van der Heijden, 1994).
Точно так же и пороги обнаружения реального движения в обычном структурированном окружении оказываются зависящими не от угловой, а от абсолютной скорости. Иными словами, движение воспринимается нами в трехмерном пространстве, с учетом удаленности объектов. Например, при бинокулярных условиях наблюдения пороги обнаружения
177
L
смещения объектов, горизонтально движущихся в противофазе в каждом из монокулярных полей зрения, оказываются выше порогов восприятия такого же движения только одним глазом. Это связано с тем обстоятельством, что в условиях стереоскопического зрения происходит фузия стимулов с меняющейся (из-за разной направленности монокулярных векторов смещения) диспаратностью и воспринимается движение объекта в глубину — по направлению от или к наблюдателю. Несмотря на практически идентичную картину стимуляции самой сетчатки, пороги обнаружения движения меняются, так как разрешающая способность восприятия движения в третьем измерении пространства не так высока, как для движения во фронто-параллельной плоскости7.
Особенно интересным индуцированное движение становится в случае двух и более систем отсчета. Предположим, что наблюдатель фиксирует в гомогенном окружении неподвижный объект, вокруг которого расположена рамка средних размеров и еще одна, окружающая ее внешняя рамка. Пусть теперь обе рамки начинают двигаться, причем в разных направлениях, скажем, внутренняя рамка направо, а внешняя вверх. В каком направлении будет «перемещаться» фиксируемый объект? На основании знакомства с физикой (а именно принципом параллелограмма, введенным в науку Галилеем — см. 6.4.3) можно было бы ожидать, что при этом будет происходить своего рода векторное суммирование, ведущее к возникновению иллюзорного движения объекта в направлении левого нижнего угла поля зрения. Но в восприятии происходит нечто иное. Центральный объект кажется движущимся строго влево. Вместе с этим средняя рамка и движущийся в ней объект как целое смещаются вниз.
Таким образом, при одновременном присутствии множества систем отсчета поведение локальных перцептивных структур определяется ближайшей системой отсчета. Ученик Кёлера и Коффки Вольфганг Метцгер (Metzger, 1941/2001) обобщил эти наблюдения в качестве общего закона организации феноменов сознания, распространив его и на другие области, включая психологию мотивации и межличностных отношений. Следует заметить, что для когнитивной науки характерно использование многочисленных производных этого принципа, с тем основным отличием, что вместо несколько громоздкого словосочетания
7 Эти факты говорят о том, что обработка, непосредственно ведущая к восприятию видимого движения, должна иметь место не ранее первичной зоны VI зрительной коры. В восприятии движения участвуют нейроны зоны V5 (MT/MTS) на границе затылочной и височной долей. Ее поражения или временные отключения (с помощью методики ТМС — см. 2.4.1) приводят к затруднениям в оценках направления и скорости движения. При этом нарушаются и следящие движения глаз (см. 3.4.1 ). Данное объяснение, однако, не является полным — неясными остаются механизмы интермодальных влияний на видимое движение. Поэтому можно предположить, что в восприятии движения участвуют также теменная кора и субкортикальные структуры (четверохолмие и базальные 178 ганглии), где происходит такая интермодальная интеграция.
Рис. 3.5. Эффекты расщепления влияния систем отсчета при восприятии жестов (А) и походки (Б).
«система отсчета» в современной психологии, лингвистике, а также работах по машинному зрению и искусственному интеллекту обычно используется термин «фрейм» (от англ. frame = рамка и frame of reference = система отсчета)8.
В чем причина подобного расщепления влияния одновременно присутствующих в окружении систем отсчета? Ответ заключается в том, что восприятие, по-видимому, и не может быть организовано другим образом. Во-первых, рассмотрение событий в рамках лишь одной, ближайшей системы отсчета позволяет резко ограничить сложность перцептивной обработки. Во-вторых, такое рассмотрение позволяет сохранить специфику локальных движений, что является важным условием их узнавания. Хорошим примером здесь может служить восприятие так называемого биологического движения — прежде всего, специфических характеристик походки, жестов и мимики людей. Представьте себе, что вы провожаете на вокзале знакомого, который стоит у открытой двери тамбура и машет рукой. Когда поезд трогается, ладонь начинает описывать в системе координат, связанной с поверхностью Земли и вашим телом, синусоидальное движение (см. рис. 3.5А). Однако из-за разделения влияния систем отсчета вы будете видеть те же самые движения ладони вверх и вниз относительно рамки двери (то есть ближайшей системы отсчета), тогда как поезд и машущий рукой знакомый в целом движутся в системе координат вокзала и стоящих на перроне провожающих.
' Мы рассмотрим ниже примеры расширенной трактовки этого теоретического конструкта при анализе семантики (см. 3.3.3, 6.3.1 и 7.3.2), представлений окружающей среды (6.3.2), организации так называемых ментальных пространств (7.4.1) и влияния эмоционального контекста на принятие решений (8.4.1).
179
Несколько более сложный случай представляет собой восприятие локомоций. Здесь лучше всего изучено восприятие походки, причем практически все данные получены на основании видеосъемки (в последнее время, разумеется, также компьютерной симуляции) и последующего наблюдения взаимного движения всего лишь нескольких, прикрепленных к основным суставам тела маркеров (рис. 3.5Б). Эта использовавшаяся ранее в биомеханике методика впервые была применена в контексте перцептивных исследований шведским последователем Гибсона Гуннаром Иохансоном (например, Johanson, 1978). При неподвижном положении маркеров их интерпретация и узнавание оказываются полностью невозможными. При движении тела, причем (по разным, к сожалению, не очень точным данным) уже после 100—500 мс экспозиции, испытуемые отчетливо видят движущегося человека, уверенно различая мужчин и женщин. Несмотря на предельную редуцированность информации, испытуемые даже способны узнавать при этом себя и своих знакомых (см. 3.4.1). Походка оказывается, таким образом, очень индивидуальной и легко идентифицируемой формой биологического движения. При разработке систем автоматического видеопоиска, идентификации и отслеживания разыскиваемых людей она даже рассматривается в последнее время в качестве возможной альтернативы узнаванию по геометрии лица.
Чем объяснить, что усложнение стимульной ситуации за счет введения информации о множестве разнонаправленных движений как раз и делает восприятие возможным? Эти движения позволяют выделить несколько иерархически связанных между собой систем отсчета. Прежде всего, такие перцептивные механизмы, как описанный гештальтпсихо-логами закон «общей судьбы» (см. 1.3.1), выявляют в глобальной системе координат тела две подсистемы, а именно туловище и конечности. Каждая из этих подсистем, в свою очередь, становится локальной системой отсчета: в рамках туловища выделяются плечи и бедра, в рамках конечностей — плечевая (бедренная) кость и предплечье (голень). В результате возникает трех- или даже четырехуровневая структура (см. также 3.3.2). В рамках каждой из этих систем отсчета оказывается возможной достаточно точная спецификация характера локальных движений. Так, оказалось, что определяющим признаком для дифференциации походки мужчин и женщин является относительная амплитуда колебаний в плечевом поясе и в области бедер. Как показывают эксперименты с компьютерными анимациями походки, меняя один лишь этот параметр, удается легко управлять восприятием пола фантомных фигур (Mather & Murdoch, 1995).
Мы уже несколько раз упоминали фактор времени, отмечая исключительную быстроту процессов зрительной пространственной локализации. Временной контекст, естественно, весьма важен для возникновения впечатления движения. Так, мы непосредственно видим движение секунд-180 ной стрелки часов, но лишь знаем о движении часовой и минутной стре-
лок. Для непосредственного восприятия движения, по-видимому, существенными оказываются события внутри интервала времени порядка 100 мс. Бельгийский гештальтпсихолог Альбер Мишотт провел в первой половине 20-го века множество простых экспериментов, показав, в частности, что остановки движущегося предмета не замечаются наблюдателем, если они продолжаются менее 100 мс. Самые известные эксперименты Мишотта описывают условия, при которых чисто оптическое сближение и соприкосновение двух зрительных объектов (двух теней на проекционном экране) устойчиво воспринимается как «механический толчок» и «передача импульса». Для восприятия подобной феноменальной причинности необходимо, чтобы не позднее, чем через 100 мс после видимого соприкосновения, произошло бы характерное изменение скорости движения объектов, например, первый объект остановился, а неподвижный до момента соприкосновения второй объект начал двигаться в том же направлении (см. 3.3.3 и 9.4.2)9.
Другим классическим феноменом, исследованием которого даже датируется возникновение гештальтпсихологии (Wertheimer, 1912), является стробоскопическое движение. Оно возникает при предъявлении в пространственно-временном соседстве двух и более объектов. Рассмотрим простейший случай показа всего лишь двух объектов, расположенных на расстоянии нескольких угловых градусов друг от друга. Если последовательное предъявление осуществляется очень быстро, так что асинхронность включения стимулов {AВС = время показа первого стимула, tj + интерстимулъный интервал, ИСИ) остается меньше 40—50 мс, то воспринимаются два одновременно появившихся в поле зрения объекта. При увеличении асинхронности возникает восприятие одного объекта, быстро движущегося от места первого предъявления к месту второго. Иногда объект кажется движущимся за непрозрачным экраном и лишь на мгновение появляется в местах показа стимулов, которые, в свою очередь, воспринимаются как отверстия в экране: этот вариант амодального, не имеющего сенсорной основы восприятия соответствует так называемому ФИ- {феноменальному) движению. При увеличении ABC до 80—120 мс возникает отчетливое восприятие движущегося объекта, который виден во всех промежуточных положениях. Такое движение называется оптимальным, или БЕТА-движением. Если асинхронность превышает 250—300 мс, то движение постепенно исчезает и воспринимается лишь последовательное появление двух объектов на разных позициях.
. ' Пафос классических исследований Мишотта заключался в попытке опровержения
мнения Джона Локка и других эмпирицистов (особенно Юма), согласно которым при
чинно-следственная связь событий не может непосредственно восприниматься, а может
ли11п> домысливаться в результате ассоциативного объединения представлений в сужде
ния (см. 1.1.2). 181
В силу очень простого контроля параметров предъявления объектов, стробоскопическое движение до сих пор остается популярной ситуацией исследования. Эксперименты со стробоскопическим движением показывают, что оно определяется прежде всего дистальными, а не проксимальными параметрами стимуляции. Выше (см 3.1.1) мы отмечали, что информация о третьем измерении пространства выделяется зрительной системой в естественных условиях наблюдения (свободный режим движений глаз, присутствие видимого структурированного окружения) непосредственно и очень быстро. Аналогично обстоит дело и с данным видом воспринимаемого движения: пороги быстрого стробоскопического движения определяются не угловым расстоянием, а близостью стимул ьных объектов в трехмерном пространстве, так что при увеличении расстояния до дисплея или изменении угла, под которым он рассматривается наблюдателем, пороги возникновения движения остаются примерно постоянными, соответствующими константному восприятию метрических отношений пространства (Величковский, 1973)
Эту же закономерность воспринимаемого движения можно проиллюстрировать примером тактильного стробоскопического движения. Если с асинхронностью порядка 100 мс прикасаться к ладоням левой и правой руки (для этого применяются прикрепленные к ним вибраторы), то сидящему с закрытыми глазами наблюдателю внезапно начинает казаться, что что-то или даже кто-то быстро бегает между ладонями. Если теперь несколько развести руки в пространстве, то тогда для сохранения впечатления движений «тактильного крольчонка» приходится пропорционально увеличить величину асинхронности включения, хотя физические и анатомические условия стимуляции при увеличении расстояния между ладонями не меняются. Пороги стробоскопического движения, следовательно, явно демонстрируют некоторую инвариантность скорости перемещения в воспринимаемом трехмерном пространстве, напоминая, тем самым, закономерности процессов «ментального вращения», лежащие в основе узнавания и сравнения различным образом ориентированных в пространстве объектов (см. 5.3.1).
Значительный интерес представляют условия, при которых последовательные события воспринимаются как одновременные. Соответствующие максимальные интервалы времени получили название перцептивного момента. С увеличением точности методик большинство оценок размеров перцептивного момента в разных сенсорных модальностях сдвинулось с величин порядка 100 мс в область 30 мс. Функция разбиения непрерывного потока физической стимуляции на статичные кадры, внутри которых все кажется одновременным, традиционно приписывается интегральным ритмам мозга, измеряемым с помощью таких методик, как ЭЭГ (см. 2.4.2). При этом за последние два десятилетия несколько изменились представления о возможной нейрофизиологической основе этих процессов — с подчеркивания роли альфа-ритма к анализу вероятного участия гамма-ритма. Последний не только имеет более подходящую частоту (а именно порядка 40 Гц), но также регист-182 рируется в субкортикальных структурах, участие которых в регуляции
г
ритмических движений (таламус, мозжечок и базальные ганглии — пал-лидум) и в восприятии временных интервалов (базальные ганглии — стриатум) сегодня представляется бесспорным (Wittmann, 1999).
Представление о том, что в ходе сенсорной обработки сначала выделяется статичная информация, которая затем служит основой для восприятия движения, наталкивается на возражения. В частности, Гибсон подчеркивал в своих работах первичность выделения динамических градиентов стимуляции. Один из наиболее известных его последователей Майкл Турвей (Turvey, 1977) считает, что восприятие движения вообще невозможно в системе, регистрирующей статичные кадры. Такие кадры, или «иконы», предположительно должны быть направлены для сохранения и интерпретации в следующий блок переработки информации, кратковременную память. Но поскольку кратковременная память может осуществлять лишь сжатие масштаба времени последовательности икон (в отношении T:t), то необходимо постулировать дополнительную инстанцию (мышление, гомункулуса и т.д.), которая могла бы «увидеть» в этой преобразованной последовательности характерную динамику событий (см. рис. 3.6А).
Фактически речь идет о том, как из локальных перцептивных моментов строится глобальное перцептивное время. Представление о статичных иконах как основе восприятия соответствует гипотезе дискретного перцептивного времени, согласно которой оно состоит из поставленных «в затылок друг другу» перцептивных моментов (подобно организации астрономического времени, где 2005 год ровно в полночь 31-го декабря сменяется 2006 годом). Эту гипотезу обычно приписывают французскому философу Анри Бергсону. Ей противостоит гипотеза непрерывного перцептивного времени, восходящая к идее потока сознания Уильяма Джеймса. По этой альтернативной гипотезе перцептивный момент подобен движущемуся вместе с физическим временем окну, обеспечивающему симультанный охват некоторого поля событий. Различие этих двух точек зрения можно проиллюстрировать с помощью следующей пространственной аналогии. Гипотеза дискретного времени соответствует ситуации, когда наблюдатель стоит на перроне и последовательно заглядывает в различные купе проходящего мимо поезда. Непрерывное перцептивное время соответствует обратному случаю — наблюдатель сам сидит в одном из купе поезда и видит непрерывно разворачивающуюся перед ним панораму, в том числе и проплывающий мимо перрон со стоящими на нем людьми
В одном из наиболее остроумных экспериментов последних десятилетий английский психолог Алан Олпорт (Allport, 1968) попытался проверить следствия из обеих гипотез. Для этого он использовал анализ направления стробоскопического движения, воспринимаемого в гирлянде последовательно зажигаемых лампочек. Если режим стробирования (то есть включения-выключения) таков, что все лампочки, кроме одной, кажутся горящими одновременно — «попадают в один перцептивный момент», то возникает иллюзорное впечатление движения темного
183
A .
время события (Τ)
момент 1 (- лампочка 8) j
■ момент 2 (- лампочка 7)
момент 3 (- лампочка 6)
Рис. 3.6. Структура перцептивного времени: А Гипотетическая интеграция икон в кратковременной памяти; Б. Обоснование эксперимента Олпорта по проверке двух гипотез перцептивного момента.
184
пятна на светлом фоне. На основании рассмотренных гипотез, как это демонстрирует рис. 3.6Б, можно сделать взаимоисключающие предсказания о направлении движения такого темного пятна Согласно гипотезе дискретного времени, оно должно двигаться в противоположную направлению зажигания лампочек сторону. Гипотеза непрерывного момента, напротив, предсказывает совпадение направлений. Полученные
Олпортом экспериментальные данные свидетельствуют о том, что направление движения темного пятна совпадает с порядком зажигания лампочек, подтверждая, таким образом, гипотезу непрерывного перцептивного времени. Не исключено, впрочем, что дискретная (квантовая) модель перцептивного времени также имеет право на существование, но в диапазоне более высоких временных частот, примерно соответствующих гамма-ритму ЭЭГ.
В объяснениях перехода от субъективной симультанности к восприятию последовательности событий, как и в целом в моделях восприятия времени, до сих пор сохраняется много неясностей. Наряду с описанием различных физиологических «водителей ритма», в литературе имеются предположения об отсутствии какого-либо влияния подобных внутренних часов на восприятие, а также представление о восприятии как процессе, принципиально не знающем времени и разворачивающемся в «вечном настоящем» (см. 3.4.2 и 5.4.2). Величина перцептивного момента при различных способах его измерения связана, как мы увидим в следующем разделе, с характером задачи, а субъективная продолжительность события и действий меняется в зависимости от направленности и напряженности внимания, а также от того, на каком уровне осуществляется обработка. В частности, осмысленные конфигурации кажутся тем наблюдателям, для которых они являются осмысленными, предъявляемыми на более длительное время. Так, если испытуемым на очень короткое время показываются химические формулы, то время показа оценивается как более продолжительное профессиональными химиками. Возможно, что в оценку длительности некоторого события включается и время инициированной им когнитивной обработки.
Как обстоит дело с выявлением продолжительности восприятия здесь и теперь или, по словам французского психолога Поля Фресса, через какое время перцептивное восприятие времени сменяется его когнитивной оценкой! Разные методические подходы к ответу на этот вопрос, как правило, настолько произвольны, что едва ли заслуживают упоминания. Наиболее привлекательный из этих подходов состоит в анализе колебаний восприятия ритмических звуковых сигналов или, скажем, многозначных фигур (рис. 3.7). Предполагается, что продолжительность
Рис. 3.7. Примеры многозначных изображений А Змеи, Б. Трезубец; В Треугольник.
185
186
«воспринимаемого настоящего» соответствует времени непрерывного удержания в сознании одной из возможных интерпретаций. Если судить по точности оценки временных интервалов, а также по частоте изменений восприятия типичных многозначных изображений, то средняя длительность «воспринимаемого настоящего» должна составлять примерно 2—3 секунды. Это время зависит от многих факторов, таких как зрительное утомление и характер движений глаз (см. 3.4.1). При оценке продолжительных отрезков времени, порядка часа и более, в действие вступают другие механизмы, в частности, биопсихологические механизмы суточных (циркадных) ритмов, участвующих в регуляции режима сна и бодрствования.
Вместе с тем, следует еще раз подчеркнуть роль фактора осмысленности решаемых задач при оценке их продолжительности. Существует контрастный эффект влияния этого фактора на субъективную продолжительность актуального переживания и на ретроспективные оценки времени. При непосредственном восприятии отрезки, заполненные личностно значимым делом, кажутся более короткими по сравнению с периодами монотонной работы. Когда же мы оцениваем подобные эпизоды по памяти, то более продолжительными становятся как раз субъективно значимые отрезки автобиографии. Эти наблюдения говорят скорее в пользу трактовки воспринимаемого времени как сложного социокультурного конструкта, связанного с высшими формами памяти и мышления. Не случайно в онтогенезе ориентация во времени развивается сравнительно поздно — в возрасте около 4-х лет, когда появляется рефлексивная способность оценки собственных знаний и знаний других людей как отличных от собственных. Обсуждению этих, так называемых метапознавательных координации посвящены некоторые разделы следующих глав (см. 5.4.3 и 8.1.3).
Эмпирические исследования восприятия времени осложняются тем, что при использовании сознательного отчета о времени проиходя-щих событий могут возникать систематические ошибки, объясняемые фундаментальной способностью нашего сознания «редактировать» как отдаленное, так и непосредственно предшествующее прошлое (см. 4.4.3). Вопрос о воспринимаемом и оцениваемом времени нужно также отделять от двух других вопросов, касающихся временных параметров собственно перцептивной обработки: во-первых, сколько времени нам нужно для восприятия некоторых свойств, предметов и событий (проблема микрогенеза — см. 3.2.3) и, во-вторых, сколько времени занимает последействие восприятия (проблема сенсорной памяти — см. 3.2.1 и 3.2.2). На перцептивные оценки продолжительности и самого факта предъявления объектов драматическим образом влияют предшествующие и в особенности непосредственно следующие события, как это будет видно из анализа эффектов динамической маскировки и метаконт-раста, обсуждаемых в следующем подразделе.
3.1.3 Перцептивные взаимодействия и маскировка
Проведенный выше анализ свидетельствует о тесной взаимосвязи процессов восприятия движения и пространственного положения. Для когнитивных исследований в целом характерен особый интерес к взаимоотношениям различных субмодальностей восприятия, их связям с моторикой и высшими формами познания, примерно так же, как аналогичный вопрос о взаимодействии многочисленных специализированных механизмов мозга начинает доминировать в работах нейрофизиологов и нейропсихологов. Уже в организации одной только зрительной коры сегодня различают, по меньшей мере, 32 специализированные зоны, которые объединены в сложную сеть, включающую более 300 анатомически идентифицируемых связей. Нейроны внутри этих зон отвечают на разные комбинации цвета, движения, ориентации, пространственной частоты, признаков формы и глубины (Tovee, 1996). Как обстоит дело с взаимоотношениями других перцептивных процессов, отличных от только что рассмотренной группы процессов динамической пространственной локализации?
Ощущения света и цвета длительное время описывались философами, физиологами и психологами в качестве первичных фактов зрительного восприятия, более всего соответствующих тому, что можно было бы считать «специфическими энергиями» (или «квалиями» — см. 1.2.1 и 4.4.3) органа зрения. Значительная часть данных по цветовоспри-ятию была получена в условиях лабораторных психофизических опытов на сравнение и оценку цвета экранированных от окружения источников света. Гештальтпсихологи (например, Koehler, 1947) обоснованно критиковали этот традиционный подход за его искусственность. Они считали, в частности, что психофизика изучает лишь апертурный цвет (то есть цвет свечения отверстия, «апертуры»), а не восприятие окраски поверхностей предметов.
С функциональной точки зрения интересно как раз восприятие окраски поверхностей, инвариантное — константное — по отношению к спектральным характеристикам освещения. Пространственная организация сцены играет при таком константном восприятии чрезвычайно важную роль. Американский изобретатель Эдвин Лэнд провел в 1960-е годы эксперименты, продемонстрировавшие зависимость восприятия цвета от пространственного контекста. Он показывал испытуемым коллажи, состоявшие из участков поверхностей разной окраски (типа картин голландского художника-абстракциониста Мондриана или же лоскутных, «бабушкиных» одеял). Эти коллажи освещались проекторами с цветовыми фильтрами в красной, зеленой и синей части спектра. Освещение, например, длинноволновым светом приводило к тому, что, скажем, некоторый зеленый участок отражал в два раза больше света в длинноволновой, красной части спектра, чем в коротковолновой. Тем не менее соответствующая поверхность продолжала воспри-
ниматься зеленой. Константное восприятие цвета окраски, однако, сразу же нарушалось и зеленая окраска начинала казаться красной, если наблюдатель смотрел на этот участок через отверстие в черном экране, закрывавшем окружающие его поверхности.
Во многом опираясь на работы Лэнда, когнитивная нейрофизиология объясняет восприятия цвета как своеобразное сравнение сравнения (Zeki, 1993). Вначале между собой сравниваются отражательные характеристики поверхностей отдельно в каждом из трех различных участков видимого спектра (человек, как и все другие приматы Старого Света, является трихроматом) При монохроматическом освещении каждая поверхность будет иметь различную светлоту в зависимости от ее отражательных характеристик в данном участке спектра. Так, при освещении длинноволновым, красным светом красные поверхности будут отражать больше света и казаться более светлыми, чем зеленые или синие В результате первого сравнения получаются три независимые светлотные карты, которые являются относительными — светлота некоторого участка определяется в них не просто количеством отраженного им света, а логарифмом отношения этого света к среднему количеству света, отраженному окружающими этот участок поверхностями. Предположим теперь, что волновой состав освещения меняется. Соответственно меняется и спектральный состав отраженного каждой поверхностью света. Однако поскольку светлотные карты релятивируют такие изменения, то и характеристики отдельных участков сцены остаются относительно постоянными Сравнение всех трех светлотных карт ведет к выявлению окраски — искомых цветоотражающих характеристик поверхностей предметов10
Относительный характер оценок светлотности особенно очевиден в
случае феномена одновременного яркостного, или светлотного, кон
траста, который заключается в изменении воспринимаемой светлоты
участка поверхности в зависимости от видимой светлоты окружающих
1 участков — серая поверхность кажется более светлой на темном фоне и,
наоборот, более темной на светлом (рис. 3.8А). Хотя одновременный контраст часто объясняется в нейрофизиологии нейрональными взаимодействиями по типу латерального торможения, подчеркивающими границы перепадов яркости и возникающими уже в рецепторных элементах сетчатки, имеющиеся данные говорят о более центральном про-
f исхождении этого феномена Так, А Джилкрист и И. Рок (Gilchrist &
ι Rock, 1981) продемонстрировали зависимость одновременного контра-
| 10 Для константного восприятия цвета (окраски) поверхности необходимо, чтобы
спектральный состав освещения был достаточно широким для активации каждой из трех групп цветовых пигментов человеческого глаза Другими словами, при вариациях спектрального состава освещения в нем еще должны сохраняться компоненты, позволяющие вычислить все три светлотные карты Это требование не выполняется в случае некоторых промышленных источников, излучающих свет в очень узком диапазоне спектра На автостоянке, освещенной таким светом, можно легко потерять свой и «найти» 188 чужой автомобиль
Γ"
Рис. 3.8. Вариации на тему одновременного контраста А Стандартный вариант, Б Иллюзия Уайта, В Влияние светотени на восприятие окраски в предметных сценах (окраска светлых квадратов в середине совпадает с окраской темных на переднем плане — по Adelson, 2000)
ста от феноменальной локализации сравниваемых по светлоте поверхностей, в частности, от близости поверхностей в третьем измерении пространства. К этому же разряду эффектов относится так называемый принцип эквипланарности — одновременный контраст действует только внутри одинаково ориентированных в пространстве поверхностей11.
На рис. 3.8Б серые участки слева кажутся светлее, чем идентичные по окраске серые участки справа. Этот эффект может показаться парадоксальным, ведь серые участки слева в основном окружены светлыми поверхностями, а справа — темными Объяснение состоит именно в использовании принципа эквипланарности — разделении этого плоского изображения на два плана глубины: поскольку серые участки слева воспринимаются как принадлежащие «выступающим вперед» черным полосам, а справа они относятся к «расположенному за черными полосами» белому фону, то соответственно меняется и выбор эффективных систем
1 ' Аналогичные данные недавно впервые были получены и для собственно цвета (Shevell
& Wei, 2000) 189
отсчета. Наконец, рис. 3.8В иллюстрирует влияние воспринимаемого распределения света и тени12. Светлые квадраты в середине этого рисунка по своей окраске совпадают с темными квадратами на переднем плане, но, отчасти, из-за «отбрасываемой цилиндром тени» их восприятие искажается. Таким образом, реальные механизмы восприятия оказываются явно более сложными, чем это предполагалось в классических психологических и нейропсихологических исследованиях цвета. Светлот-ные карты в действительности представляют собой трехмерные ландшафты, учитывающие удаленность, а также взаимную ориентацию поверхностей и предполагаемых источников света в пространстве.
Проведенный анализ говорит о том, что микроструктура процессов восприятия цвета (окраски) включает операции пространственной локализации и определения ориентации поверхностей. Можно попытаться непосредственно прохронометрировать эти формы восприятия, чтобы проверить данный вывод. В исследовании, проведенном совместно с М.С. Капицей (Величковский, Капица, 1980), мы просили испытуемых максимально быстро определять в разных пробах параметры одного из перцептивных измерений предъявляемого на дисплее объекта: пространственное положение (вверху или внизу), направление движения (влево или вправо), светлота (низкая или высокая) и форма (симметричная или асимметричная относительно вертикали). Регистрировалось время реакции — отвечая, испытуемые должны были нажимать на кнопки, — и для различных интервалов времени реакции подсчиты-вался коэффициент успешности различения соответствующего перцептивного признака.
Результаты показаны на рис. 3.9. При их интерпретации следует иметь в виду, что выбор ответа и его чисто моторные компоненты могут требовать не менее 100 мс. Это время нужно вычесть из полученных данных, чтобы получить более точную оценку времени восприятия. Как следует из графиков, особенно быстро испытуемые могли определять пространственное положение и направление движения, причем данные для скорости оценок этих двух измерений практически совпали. Именно так должны были бы выглядеть результаты, если на самом деле существует единая функциональная система, обеспечивающая чрезвычайно быструю (около 100 мс) динамическую локализацию объектов. Восприятие и различение индивидуальности объектов требуют явно большего времени. Так, для оценки видимой светлоты потребовалось время в общей сложности порядка 200 мс. Еще более продолжительным оказалось восприятие особенностей формы объектов, требовавшее не менее 300 мс.
190
12 Системы автоматического разпознавания до сих пор с большим трудом различают тени (пятна) и телесные предметы, так что снабженный электронным «зрением» автомобиль вполне может внезапно остановиться перед тенью, отбрасываемой растущим на обочине деревом.
100
300 Время реакции, мс
500
Рис. 3.9. Успешность различения четырех перцептивных признаков объекта (по: Велич-ковский, Капица, 1980).
Ситуацию только что описанного простого эксперимента по хронометрированию восприятия различных перцептивных характеристик можно использовать для более углубленного анализа взаимоотношений соответствующих процессов. Поскольку во всех пробах испытуемые отвечали нажатием одной из двух кнопок, легко проанализировать, например, насколько полно сознательная задача оценки цветовых (светлот-ных) характеристик позволяет игнорировать другие признаки, такие как форма или движение. Результаты такого анализа свидетельствуют об асимметричности взаимодействий перцептивных процессов (Величков-ский, Капица, 1980). Оценивая цвет объекта, мы можем игнорировать форму, но не положение или движение, так что многие ответы, ошибочные с точки зрения сознательной задачи, оказываются неслучайными в отношении различения этих формально иррелевантных признаков. Точно так же обстоит дело и с восприятием формы — ответы обнаруживают зависимость от процессов динамической пространственной локализации, но остаются случайными в отношении признака светлоты. Остается добавить, что когда задача заключается в различении положения или движения, наблюдается значительная взаимная интерференция, однако влияние цвета и формы полностью отсутствует.
191
Большинство других исследований по классификации признаков объектов также свидетельствуют о том, что цвет и форма — это независимые качества. Этот вывод соответствует данным об относительной независимости их нейронных механизмов, возможности селективных выпадений и необходимости использования внимания для их одновременного восприятия (см. 3.4.2 и 4.2.3). Что касается отношений процессов динамической локализации (восприятие положения и движения) и восприятия перцептивной идентичности предметов (форма и/или цвет), то, по крайней мере при жестких ограничениях на время восприятия, они явно носят асимметричный характер, что соответствует представлению о двух последовательных уровнях восприятия.
Опираясь на эти простые хронометрические эксперименты, можно обратиться к линии исследований восприятия, связанной с анализом феноменов маскировки. В психологии с термином «маскировка» ассоциируются две довольно различные группы феноменов. Гештальтпсихоло-ги положили начало изучению статической маскировки (или камуфляжа). Она чрезвычайно широко распространена в биологическом мире, например, в виде вариантов адаптивной раскраски, делающей неподвижное животное трудноразличимым в естественной среде обитания. Основу маскировки в этом первом значении слова образуют законы перцептивной организации (см. 1.3.1). В когнитивной психологии и в этой главе речь идет об эффектах динамической маскировки, которая возникает при быстром последовательном предъявлении информации13. Типичная процедура состоит в предъявлении в пространственно-временном соседстве двух стимулов — тестового и маскирующего. При несовпадении их локализаций говорят также о метаконтрасте. Эффекты маскировки обычно оказываются сильнее, если маска следует за тестовым стимулом (обратная маскировка), а не предшествует ему (прямая маскировка).
Многочисленные данные демонстрируют два вида зависимости успешности опознания или оценки параметров первого стимула от задержки второго — монотонную и немонотонную, когда максимальный эффект маскировки наблюдается при асинхронностях включения 100—120 мс. Так, в одном из вариантов исследования так называемой «очень короткой зрительной памяти» (см. 3.2.1) испытуемым показывался ряд букв, причем одна из букв маркировалась кольцом или сплошным диском, перекрывавшим критическую позицию. Если меткой был диск, то при одновременном показе с буквами успешность восприятия буквы на критической позиции была минимальной, затем — примерно в течение трети секунды — она улучшалась. Если меткой было кольцо, то при ну-
192
13 Насколько нам известно, первая работа по «динамической маскировке» была опубликована в 1871 году работавшим у Гельмгольца в Гейдельберге стажером из России (впоследствии приват-доцентом физиологии Санкт-Петербургского университета) Н.И. Бакстом (Baxt, 1871).
левой задержке испытуемый просто видел букву в кольце, и успешность воспроизведения была максимальной. При росте асинхронности предъявления (ABC) кольца восприятие буквы ухудшалось и при асинхронности порядка 100 мс наступал момент, когда кольцо как бы «стирало» букву — феноменально оно окружало пустое место. При увеличении задержек до 200—300 мс кольцо переставало оказывать какое-либо влияние на восприятие и воспроизведение вновь улучшалось.
Для объяснения динамической маскировки было предложено два принципа — интеграции и прерывания. Согласно первому принципу, маскировка есть результат объединения тестового стимула и маски в единый перцепт. Такая комбинация затрудняет считывание информации о тестовом стимуле. Согласно принципу прерывания, маскировка возникает из-за прекращения процесса считывания информации о тестовом стимуле, например, в результате вытеснения или стирания его перцептивной репрезентации маской. Современные теории включают оба принципа. Считается, что интеграция действует при небольших интервалах между стимулами. При асинхронностях, превышающих 100 мс, вступает в силу механизм прерывания. Подробный анализ этого вопроса содержится в раннем исследовании Майкла Турвея (Turvey, 1973). Он обнаружил два механизма маскировки — периферический и центральный. Периферическая маскировка бывает как прямой, так и обратной и определяется суммарной энергией маски, то есть подчинена правилу:
Ixt = const, где / — интенсивность, ai— время стимуляции.
Она исчезает при дихоптических условиях — независимом предъявлении тестового стимула и маски левому и правому глазу. Эти свойства позволяют интерпретировать периферическую маскировку как реализацию принципа интеграции. Центральная маскировка зависит не от энергетических характеристик маски, а от асинхронности ее включения. Она является обратной и возможна при дихоптических условиях, но только в случае структурированной маски — гомогенное световое поле оказывается неэффективным. По всей видимости, механизмом центральной маскировки является прерывание.
Легко видеть, что анализ процессов маскировки также приводит к выводу о существовании глобальной двухуровневой архитектуры восприятия: сначала объект воспринимается как относительно недифференцированное, но локализованное в трехмерном пространстве нечто, затем — как предмет с индивидуальными признаками, такими как цвет и форма14 (Величковский, 1973; Enns & Di Lollo, 2000; Hillyard & Anllo-Vento, 1998; Wichkovsky, 1982). Этот вывод подтверждается в результате рассмотрения других релевантных данных, которым посвящены последующие разделы этой главы (см. 3.2.3 и 3.4.2). В частности, процессы локализации и
14 В порядке уточнения отметим, что, согласно нашим данным (см. 3.3.3), на первом
из этих глобальных уровней возможны не только динамическая локализация и различе
ние текстур, но и рудиментарное различение формы — как общих внешних очертаний
объекта. Восприятие формы как внутренней геометрии является прерогативой филогене
тически более молодой системы фокального (предметного) восприятия. 193
идентификации (восприятия индивидуальных характеристик предметов) не только имеют различные нейрофизиологические механизмы, но и обнаруживают разные взаимоотношения с процессами внимания, осознания и памяти. Перед тем как обратиться к обсуждению этих вопросов, нам, однако, придется разобраться с представлениями об икони-ческой и эхоической памяти («периферических сенсорных регистрах»), популярными в ранний период когнитивных исследований.
3.2 Взлет и падение «иконы»
3.2.1 Иконическая память
Обсуждая результаты самых первых тахистоскопических экспериментов, Вильгельм Вундт отмечал, что «продолжительность жизни» зрительного образа может превышать номинальное время экспозиции стимула. По его наблюдениям, эта продолжительность обычно составляет примерно 250 мс. Он признавал также, что за это время возможны сдвиги внимания — идея, напоминающая современное представление о сканировании информации из иконической памяти. Однако Вундт считал такую инерцию зрения связанной с ретинальными послеобразами и был далек от того, чтобы приписывать ей решающее функциональное значение в восприятии и познании. Более того, он рассматривал присутствие послеобразов как прямую помеху, затрудняющую процессы детального восприятия, например, чтение.
В когнитивной психологии понятие об инерционности зрения превратилось в представление о периферическом зрительном регистре — иконической памяти. Это понятие на несколько десятилетий стало одним из центральных при анализе когнитивной организации вообще. Известным исследованиям Джорджа Сперлинга предшествовали теоретические соображения Хэбба (Hebb, 1949), противопоставившего сохранение информации в форме динамического следа стимуляции (длительностью порядка половины секунды) более продолжительной, структурированной форме хранения. В своей докторской диссертации Сперлинг (Sperling, 1960) попытался определить количество информации, воспринимаемой при кратковременном предъявлении15. В качестве материала для воспроизведения испытуемым показывались матрицы из согласных букв (чтобы из них трудно было составить слово).
15 Джордж Сперлинг — физик по образованию — решал в этой работе, выполненной на базе Белловских лабораторий фирмы AT&T, практическую задачу сравнения инерционности зрения оператора с инерционностью катодно-лучевых трубок, которые как раз стали использоваться в начале 1960-х годов в качестве самых первых компьютерных 194 дисплеев.
Время предъявления было равно 50 мс. Успешность полного воспроизведения при этом была равна примерно 5 буквам, то есть соответствовала нижней границе «магического числа» (см. 2.1.1). Эти ограничения могли быть вызваны либо особенностями восприятия — испытуемый не мог разглядеть больше за 50 мс, либо особенностями памяти — испытуемый увидел все или, по крайней мере, многие символы, но очень быстро их забыл.
Для проверки этой второй гипотезы Сперлинг разработал методику частичного отчета. В варианте методики испытуемому быстро предъявляется матрица из трех строчек по 4 элемента в каждой, а после ее исчезновения подается один из трех звуковых сигналов: высокий, низкий или средний. В зависимости от высоты тона он должен воспроизводить только одну из трех строчек матрицы. Поскольку тестирование строк осуществляется в случайном порядке, для определения общего объема воспринятого и запомненного на короткое время материала количество воспроизведенных символов умножается на число строк. Результаты этой процедуры показывают, что сразу после исчезновения матрицы испытуемый помнит значительно больше информации, чем может сообщить. Так, если испытуемый правильно воспроизводит в среднем 3,5 символов тестируемой строки, то умножение на число строк позволяет дать оценку объема иконической памяти, как превышающего 10 символов.
Время сохранения иконического следа можно определить, меняя отсрочку акустической послеинструкции — при увеличении отсрочки объем хранящейся информации начинает быстро уменьшаться. Когда отсрочка достигает 300 мс, вычисленная эффективность запоминания перестает отличаться от результатов экспериментов с полным воспроизведением, то есть снижается до нижнего уровня «магического числа». Поэтому Сперлингом был сделан вывод, что в течение примерно трети секунды после исчезновения зрительного стимула информация о нем продолжает сохраняться в виде быстроугасающего зрительного образа, или (по терминологии Найссера — см. 2.2.2) «иконы». В течение этого короткого времени информация может продолжать «сканироваться» из иконической памяти в более устойчивую, но ограниченную по объему кратковременную память.
Принципиально те же выводы были сделаны годом позже Э. Авербахом и А. Корайллом (Averbach & Coriell, 1961). Эти авторы предложили модифицированный вариант методики, в котором испытуемым симуль-танно показывался ряд символов и критическая позиция маркировалась зрительной послеинструкцией, например, стрелкой, указывающей на определенную позицию. Если отсрочка послеинструкции не превышала 200—300 мс, то вероятность правильного воспроизведения символа на отмеченной позиции была выше, чем вероятность его свободного воспроизведения.
195
Множество других методических процедур, казалось бы, указывало в том же самом направлении. К ним прежде всего относятся методики изучения инерции зрения, такие как методика определения частоты слияния мельканий, а также оценка величины перцептивного момента — максимального временного интервала, внутри которого последовательные перцептивные события воспринимаются как одновременные (см. выше 3.1.2). Например, по данным Дж. Хайлана 1903 года, шесть последовательно показанных на соседних позициях букв обычно кажутся одновременными, когда все они попадают внутрь интервала, продолжительность которого не превышает 80 мс. В когнитивной психологии были проведены многочисленные измерения, давшие в основном оценки от 30 до 120 мс. Подобные результаты можно получить, например, предъявляя с переменным интервалом два «случайных» узора точек, образующих при наложении короткую надпись, которую испытуемые должны были прочитать. Кроме того, понятие иконической памяти использовалось и для объяснения эффектов зрительной маскировки (см. 3.1.3). Так, один из методических приемов состоял в определении критического интервала суммации — максимального временного интервала, внутри которого некоторый пороговый или надпороговый перцептивный эффект определяется суммарной энергией стимула в соответствии с известным нам из обсуждения маскировки мультипликативным правилом:
/ * t = const, где / — интенсивность, a t — время стимуляции16.
Эти феномены, однако, еще не исчерпывают список фактов, которые должна была гомогенизировать гипотеза сенсорного регистра. Ряд исследований был выполнен с помощью классической, предложенной еще Гельмгольцем методики «как верблюду пройти через игольное ушко». В этом случае за вертикальной щелью в непрозрачном экране в горизонтальном направлении движется контурный рисунок, например, изображение верблюда. Если время прохождения рисунка за щелью (или щели перед рисунком) не превышает 250—300 мс, то испытуемые обычно могут узнать, что изображено на рисунке. Этот факт также можно считать указанием на существование некоторой структуры, накапливающей зрительную информацию в течение соответствующего времени.
Таким образом, в основу подхода к большому числу зрительных феноменов была положена очень простая идея, согласно которой начальным этапом процессов переработки информации является двумерная и статичная картина («зрительный сенсорный образ») физической стимуляции, исчезающая («затухающая») за время порядка трети или четверти секунды. В связи с этим возникают вопросы о точ-
16 Существование подобной зависимости внутри интервала около 100 мс в задачах оценки яркости было впервые показано в 19-м веке французскими физиологами Блоком и Шарпантье. Временную суммацию долго считали либо проявлением фотохимических закономерностей, либо следствием ритмической организации физиологических процессов в зрительной коре (прежде всего альфа-ритмом ЭЭГ — см. 2.4.2 и 3.1.2). С появлением предсташшния об иконической памяти именно она стала считаться структурой, в ко-196 торой происходит интеграция зрительной стимуляции.
ной локализации, временных характеристиках и содержании икони-ческой памяти.
По вопросу о локализации иконы мнения разделились. Ряд данных свидетельствовал о том, что иконическая память связана с активностью палочкового аппарата сетчатки. Другие результаты говорят о наличии центральных икон. В одной из работ измерялась критическая частота слияния мельканий решетки из вертикально или горизонтально ориентированных черно-белых полос. Определяемая таким образом инерция зрения уменьшалась вслед за адаптацией к решетке той же самой ориентации и увеличивалась после адаптации к ортогональной решетке, причем эти результаты не зависели от того, предъявлялись ли адаптационная и тестовая решетка одному и тому же глазу (Meyer, Lawson & Cohen, 1975). Учитывая данные из нейрофизиологии, необходимо сделать вывод, что эти эффекты имеют кортикальное происхождение. Иконическая память оказалась состоящей из разноуровневых компонентов.
Трудности возникли и при уточнении собственно временных характеристик иконической памяти. После продолжавшегося 20 лет попыток объединить огромный массив полученных данных стало выясняться, что свести эти данные к некоторому единому показателю в принципе не удается. Так, практически все методики, связанные с оценкой видимой продолжительности стимула, обычно дают существенно меньшие значения времени иконического хранения, чем косвенные процедуры типа спер-линговской методики частичного отчета. Как отметил в обстоятельном обзоре этих исследований англичанин Макс Колтхарт, «информационная инерционность (или иконическая память) не может быть идентифицирована с видимой инерцией, так как они имеют фундаментально различные свойства» (Coltheart, 1980, р. 183).
Можно добавить, что даже с помощью одного и того же методического приема иногда измеряются различные процессы. Например, критический интервал суммации, который считали чуть ли не фотохимической постоянной, меняется от 30 мс в задаче обнаружения зрительного сигнала до примерно 300 мс в задачах идентификации букв и оценки остроты зрения. Неожиданным свойством видимой инерции оказалось то, что при уменьшении яркости стимула она возрастает. Та же тенденция наблюдается и при уменьшении длительности экспозиции. В литературе выдвигалось предположение об адаптивном характере этих эффектов: чем сложнее условия восприятия, тем больше продлевается время жизни иконы, чтобы облегчить работу вышестоящим инстанциям. По-видимому, в этом случае значительно проще было бы говорить не об инерции, а о времени восприятия характеристик объектов, которое увеличивается при недостаточной энергии стимуляции.
Столь же сложен вопрос о характере информации, представленной в иконической памяти. Исследования показали, что успешный частичный отчет возможен на основании целого ряда «физических признаков»: по-
197
ложения, яркости, цвета, размера, общей ориентации символов и т.д. Интересно, что в этот список входят также параметры движения объектов, хотя от чисто инерционной, иконической системы отображения это было бы трудно ожидать. С другой стороны, селекция на основании фонологических или семантических признаков оказывается неэффективной. Так, Сперлинг установил, что если матрица состоит из букв и цифр, то послеинструкция воспроизводить символы одной из этих двух категорий не дает никакого преимущества перед полным отчетом. Это соответствует представлению об иконической памяти как о прекатегориаль-ном (то есть фиксирующем только физические признаки) хранилище. Возможными, однако, остаются и другие объяснения: например, за отсутствие семантической информации могла быть принята ситуация, в которой информация о категориальной принадлежности символов присутствовала в ответах, но, в отличие от физических признаков, «не затухала» (см. 4.1.3).
Общим аргументом против гипотезы иконической памяти служат выявленные в течение 1970-х годов данные о том, что сохранение зрительной информации вполне возможно в течение секунд, минут и месяцев (см. 5.2.1). Предположим, что попытка заменить исследования восприятия изучением иконической памяти была ошибкой и за статическими иконами на самом деле кроются процессы актуального развития, или микрогенеза восприятия17. Пусть далее эти процессы зависят не только от стимульной ситуации, но и от быстрого распределения внимания. Если в результате часть сцены будет обследована более детально, то это совсем не означает, что сцена в целом получает столь же полную обработку. Мы вернемся к альтернативному объяснению данных, на которых основана гипотеза иконической памяти, в конце этого раздела (см. 3.2.3). Отметим только, что, согласно современным данным, зрительная память, удерживающая полученную за время одной фиксации информации, часто работает всего лишь с одним объектом (обычно он является целью следующего саккадического скачка — см. 4.2.3). Кроме того, спецификация этого объекта имеет довольно абстрактный характер (см. 3.3.3 и 4.4.1), что, конечно, не позволяет говорить о какой-либо полной картинке видимой сцены — «иконической репрезентации».
" Термин «микрогенез» был введен в 1930-е годы эмигрировавшим в США немецким психологом Хайнцем Вернером (впоследствии — одним из ведущих специалистов по когнитивному развитию), чтобы отличать актуальное развитие восприятия, мышления и эмоций от процессов их онто- и филогенеза. В предвоенной Германии исследованием микроненеза (или «актуалгенеза») занимались представители так называемой «второй лейпцигской школы» Феликс Крюгер и его ученики. Основные принципы микрогенетического подхода были сформулированы в конце 19-го века русским учеником 198 Вундта H.H. Ланге (см. 3.2.3).
3.2.2 Эхоическая память
В силу ряда причин нельзя одновременно предъявить большое число звуковых сигналов так, чтобы они были в достаточной степени различимы. Это обстоятельство несколько задержало изучение слухового сенсорного регистра, хотя, например, Найссер (Neisser, 1967) был настолько уверен в его существовании, что даже предложил вошедший в литературу термин «эхоическая память». Предполагалось, что эхоическая память — это точная реплика акустических событий, которая продолжает «звучать в нас» после их окончания, позволяя воспроизводить последнюю из только что сказанных нашим собеседником фраз в ответ на вполне справедливый упрек: «Да ты меня совершенно не слушаешь!» Наиболее полной имитацией методики частичного отчета в слуховой модальности является работа Дарвина, Турвея и Краудера (Darwin, Turvey & Crowder, 1972). За одну секунду испытуемым последовательно предъявлялись три тройки букв и цифр. В каждой тройке один стимул предъявлялся на левое ухо, другой — на правое, а третий — на оба сразу. Послеинструкция указывала, с «какого места» воспроизводить информацию. Естественно, в эксперимент вводилось и контрольное условие полного воспроизведения. Результаты, на первый взгляд, также оказались знакомыми: при увеличении задержки послеинструкции наблюдалась типичная «функция затухания», затянувшаяся, правда, в случае эхоической памяти на целых четыре секунды (!). Вместе с тем перепад результатов на этом временном отрезке едва достигал половины единицы материала при абсолютном уровне пять единиц, что, конечно, едва ли достаточно для доказательства существования независимого блока хранения с «почти неограниченным объемом сенсорной информации».
Не прояснили вопроса и другие исследования, проводившиеся, в частности, с помощью предъявления акустически сжатых последовательностей цифр. Эта методика широко использовалась в работах Холдинга и его сотрудников (Holding, 1979). Вопреки большинству других сообщений они вообще не нашли преимущества частичного отчета перед полным, установив дополнительно ряд неожиданных с точки'зрения гипотезы эхоической памяти фактов, таких как наличие выраженного эффекта первичности (хотя «эхо» первых элементов должно было бы «затухать» в первую очередь), а также появление слабого преимущества частичного отчета при увеличении интервалов между стимулами. Последнее изменение условий, очевидно, увеличивает время, в течение которого должен сохраняться эхоический след, тем не менее результаты улучшались. По-видимому, и в этом случае речь идет не столько о накоплении информации, сколько о процессах восприятия и перекодирования акустических событий. Обращает внимание тот факт, что во всех этих работах число символов, якобы хранящихся в эхоической памяти, с трудом достигало нижней границы «магического числа» Дж. Миллера.
199
Множество исследований было посвящено анализу элементарных временных характеристик слуха, аналогичных инерции зрения. Идеалом здесь также была количественная конвергенция результатов. Однако если при детекции повторяющихся участков последовательностей звуков время удержания эхоического следа оценивалось величиной порядка двух и более секунд, то согласно результатам другой методики, основанной на синхронизации начала и конца звукового стимула со вспышкой света, продолжительность эхоической памяти составила около 130 мс. Необъяснимым для гипотезы эхоической памяти образом инерция слуха определялась в последнем случае началом, а не концом предъявления, так что звуковой сигнал длительностью 10 мс имел «инерцию» 110 мс, а длительностью 100 мс — только 20 мс. Этот результат довольно трудно интерпретировать как эффект памяти, скорее как эффект микрогенеза восприятия, начинающегося в момент акустического события и требующего для своего завершения порядка 100 мс.
Серию известных исследований переработки слуховой информации человеком провел Доменик Массаро (Massaro, 1975). Он установил, в частности, что при обратной маскировке опознание звуковых тонов нарушается, если асинхронность предъявления маски становится меньше 250 мс. Этой величиной Массаро и оценивает продолжительность «преперцептивного слухового образа», который представляет собой лишь другое название для эхоической памяти. Он же показал, что кроме «маскировки опознания» существуют другие виды маскировки, например, «маскировка обнаружения», определяемая интервалом, при котором испытуемый затрудняется сказать, был ли вообще предъявлен тестовый стимул. Этот интервал оказывается на порядок меньше. Возможно, приводимая Массаро оценка 250 мс — это время, которое уходит на восприятие и опознание акустического события. Собственно сохранение слуховой перцептивной информации могло бы продолжаться в течение более длительного времени. В самом деле, Ф. Крэйк и М. Кирс-нер (Craik & Kirsner, 1974) показали, что информация о специфических особенностях интонации голоса доступна испытуемым через 8 секунд после предъявления речевого сообщения, а при некоторых условиях ее влияние обнаруживается и через несколько минут.
Несколько иная линия исследований была начата Робертом Крау-дером (Crowder, 1978). Он предпочитает говорить не об эхоической памяти, а о «прекатегориальном акустическом хранилище». Согласно этому автору, о существовании такого хранилища свидетельствуют три эффекта: 1) эффект недавности в позиционных кривых полного воспроизведения (то есть лучшее воспроизведение последних элементов ряда), 2) эффект модальности — более выраженный эффект недавности после слухового предъявления по сравнению со зрительным, 3) эффект аудиторного суффикса. Поскольку эффект недавности в целом чаще связывают с кратковременной памятью, остановимся несколько подробнее на 2QQ последнем из этих эффектов.
В типичном эксперименте испытуемому предъявляются 6—10 акустических стимулов (обычно буквы, цифры или слоги, но иногда также естественные шумы или музыкальные звуки). За этими стимулами последним в ряду следует заранее известный «суффикс» (скажем, слово «нуль»), который нужно просто игнорировать. В контрольном условии вместо суффикса в начале ряда предъявляется префикс (например, тот же «нуль»). Данные говорят о снижении успешности воспроизведения элементов, непосредственно предшествующих суффиксу. Считается, что суффикс интерферирует с информацией, хранящейся в «прекатегори-альном хранилище». Эффект суффикса может быть далее уменьшен при введении явных физических различий между суффиксом и последними элементами ряда, такими как изменение тембра голоса и положения в пространстве. Эти факты выглядят весьма убедительно, но были обнаружены и некоторые осложняющие обстоятельства. Дарвин и Бэддели показали в конце 1970-х годов, что эффект суффикса «не работает», если ряд стимулов состоит из слогов, отличающихся согласными (например, «ба», «га», «да»...), и восстанавливается, когда они отличаются гласными («ги», «га», «ге»...). Этот результат говорит о присутствии фонологического анализа, причем основанного на выделении согласных звуков. Имеются также сообщения, ставящие под сомнение тезис о «прекатего-риальности» эффекта суффикса. Так, например, оказалось, что данный эффект уменьшается почти на 20%, если в качестве суффикса используется синоним последнего слова ряда (Salter & Colley, 1977).
Оценивая накопленные в 1970-е годы экспериментальные данные, Роберт Краудер писал, что «в целом они соответствуют модели эхоичес-кой памяти, но не достаточны для того, чтобы заставить принять эту модель» (Crowder, 1978, р. 367). С этим выводом трудно согласиться. Одно то, что оценки продолжительности эхоического хранения иногда различаются между собой на два порядка, доказывает, что эта частная попытка гомогенизации психологических феноменов в рамках компьютерной метафоры окончилась неудачей. Не случайно, что к началу 21-го века понятие «эхоическая память» практически перестало упоминаться в руководствах по когнитивной психологии. Сами феномены, разумеется, остались. Их изучение продолжается в рамках двух основных направлений.
Первое направление развивает представления, близкие идеям геш-тальтпсихологии. Хотя законы перцептивной организации были первоначально описаны главным образом на зрительном материале, исследования восприятия звуковых тонов выявили аналогичные зависимости. Их автор — А. Бригман (Bregman, 1990) описывает полученные результаты в терминах классических законов сходства, близости, простоты, хорошего продолжения, вхождения без остатка и общей судьбы (см. 1.3.1). Один из ведущих специалистов в области внимания Даниел Канеман считает, что суффикс меняет перцептивную организацию акустического ряда, ухудшая условия восприятия релевантных элементов. Причина такого ухудшения заключается в том, что включенный в общую группу иррелевантный элемент отвлекает на себя часть внимания и обработка 201
остальных элементов оказывается менее эффективной. В доказательство своей точки зрения Канеман продемонстрировал существование эффекта суффикса в зрительной модальности (см. 4.2.2).
Второе направление связано с анализом собственно феноменов памяти. Центральным при этом становится анализ кратковременной, или, в современной терминологии, рабочей памяти. Рабочая память содержит целый ряд служебных компонентов, в том числе относительно пассивное фонологическое хранилище (см. подробно 5.2.3). Это последнее фиксирует продукты перцептивного анализа речи и оказывается более продолжительным (до нескольких секунд), чем гипотетический слуховой сенсорный регистр, или эхоическая память. По-видимому, существование подобного фонологического хранилища, специализированного на поддержке процессов речевой обработки, и позволяет нам в ответ на справедливый упрек «Да ты меня просто не слушаешь!» практически всегда достаточно успешно воспроизвести последнее из того, что сказал наш собеседник.
3.2.3 Микрогенез как альтернатива
Чтобы подойти к объяснению фактов, на которых основано предположение о существовании иконической памяти, полезно обратиться к работам ученика Вундта и одного из основателей экспериментальной психологии в России, профессора Одесского университета Николая Николаевича Ланге (1858—1921). В 1892 году им была опубликована работа «Закон перцепции». Исходя из своих наблюдений с тахистоскопи-ческим показом изображений предметов, он описывает восприятие как процесс микрогенетического развития: «Процесс всякого восприятия состоит в чрезвычайно быстрой смене целого ряда моментов или ступеней, причем каждая предыдущая ступень представляет психическое состояние менее конкретного, более общего характера, а каждая следующая — более частного и дифференцированного» (Ланге, 1893, с. 3). Восприятие трактуется здесь как развернутый во времени процесс, а не моментальный, постепенно растворяющийся в воздухе снимок.
Можно ли операционализировать эту интерпретацию, сделав ее экспериментально проверяемой? Один из таких подходов состоит в анализе зависимости «сенсорной инерции» от времени, прошедшего с момента предъявления стимула (stimulus onset asynchrony, SOA — асинхронность включения стимулов, ABC) и с момента его выключения (interstimulus interval, /57 — интерстимульный интервал, ИСИ). Микрогенез начинается в момент предъявления информации и поэтому должен быть связан с параметром асинхронности включения. Напротив, в случае эффектов сенсорной памяти решающее значение должен иметь интерстимульный интервал, так как инерция зрения (или слуха) просто увеличивает эффективную 202 продолжительность стимула после его физического окончания.
Имеющиеся данные дают однозначный ответ — как слуховые (см. выше 3.2.2), так и зрительные сенсорные эффекты определяются временем, прошедшим с момента включения стимула. В частности, канадским психологом Винцентом Ди Лолло (Di Lollo & Wilson, 1978) было показано, что возможность перцептивной интеграции зрительных конфигураций зависит от параметра ABC, a не от интерстимульного интервала. Он последовательно предъявлял своим испытуемым две матрицы 5x5, которые при физическом наложении образовывали полную матрицу с одной пустой ячейкой (рис. 3.10). Задача заключалась в обнаружении этой ячейки при различных комбинациях длительности предъявления и величины интерстимульного интервала. Когда время экспозиции первого изображения превышало 100—120 мс, то даже при интервале 10 мс не происходила суммация изображений — испытуемые не могли указать пустую ячейку. Если бы «иконическая память» на самом деле была памятью, то есть в известном смысле «следом стимуляции», ее продолжительности с избытком должно было бы хватить для заполнения столь короткого интервала. Напротив, естественно предположить, что в первые 100 мс после предъявления объект просто еще не воспринят как некоторое устойчивое и оформленное целое и всякая поступающая информация легко интегрируется с ним.
первая матрица
вторая матрица
отсутствующая ячейка
комбинация
Рис. 3.10. Псевдослучайные матрицы, используемые для изучения зрительной интеграции: при наложении они образуют заполненную матрицу с одной пропущенной ячейкой. 203
Рассмотрим второй тезис Ланге, согласно которому актуальное развитие восприятия обнаруживает несколько «моментов или ступеней» в направлении от общих к более дифференцированным «психическим состояниям». К началу когнитивной революции взгляды Ланге и последующие работы лейпцигской школы гештальтпсихологии были успешно забыты. Но в 1970-е годы было выдвинуто несколько похожих предположений. В частности, нами была обоснована теория микрогенеза, согласно которой восприятие предмета начинается с его динамической локализации в трехмерном окружении, после чего происходит спецификация его общих очертаний и, наконец, инвариантное восприятие тонких внутренних деталей (Величковский, 1973; 1982а; Velichkovsky, 1982). Базовый цикл микрогенеза восприятия может занимать до 300 мс и требует, особенно в отношении анализа индивидуальных характеристик и деталей предметов, участия внимания (то есть осуществляется в режиме так называемого «фокального зрения» — см. 3.3.2 и 3.4.2).
С этой точки зрения, через треть секунды после предъявления зрительный образ предмета обычно лишь впервые формируется, а отнюдь не прекращает свое существование. Отмечавшиеся многими авторами систематические расхождения в различных оценках длительности иконы (см. 3.1.2) могли бы тогда объясняться тем, что методики изучения видимой инерции основаны на относительно простых задачах обнаружения и локализации, требующих для своего завершения около 100 мс, тогда как выявляемая с помощью методики частичного отчета информационная инерция предполагает возможность идентификации формы объектов, то есть занимает в общем случае порядка 300 мс18. Так называемое «сканирование информации из иконы» осуществляется по ходу формирования зрительного образа и принципиально приурочено к тому или иному его этапу (например, 100 или 300 мс) в зависимости от характера требуемого от испытуемого ответа.
Столь же естественно объясняется в рамках микрогенетических представлений и маскировка. Она возникает из-за ошибочной спецификации маскирующего стимула вслед за правильной локализацией тестового. Иными словами, речь идет о подмене объекта: предъявление тестового объекта быстро (в течение примерно 100 мс) локализуется как некоторое требующее нашего внимания событие, но когда мы переходим затем к детальной спецификации его индивидуальных характеристик, таких как цвет и форма, то находим в соответствующей области окружения уже другой объект, который и воспринимается нами вместо первого (Enns & Di Lollo, 2000). Это объяснение, предполагающее повторное обращение к объекту на более высоком уровне обработки, по-
18 Известные исключения лишь подтверждают это правило: в случае идентификации формы видимая инерционность, определяемая по величине критического интервала сум-мации или с помощью упоминавшейся выше методики «как верблюду пройти через иголь-204 ное ушко», возрастает до 300 мс (например, Kahneman & Norman, 1964).
зволяет понять целый ряд особенностей маскировки, например, почему даже в условиях жесткой маскировки, когда испытуемые утверждают, что совершенно не видят тестовый объект, они, тем не менее, способны различать (в ситуации вынужденного выбора) те пробы, в которых он был предъявлен, от тех, где он не предъявлялся (Pollack, 1972)19.
В рамках этих представлений удается объяснить результаты экспериментов по частичному отчету, не прибегая к понятию «иконическая память» (Величковский, 1977). Дело в том, что в когнитивной психологии не рассматривалось скрытое допущение о равенстве времени восприятия материала матрицы и восприятия послеинструкции в методике частичного отчета. В большинстве таких экспериментов необходимо было воспринимать и воспроизводить довольно сложную фигуративную информацию, тогда как инструкция содержала простую пространственную информацию. Восприятие послеинструкции, следовательно, могло значительно опережать восприятие релевантных для решения задачи аспектов матрицы. Учитывая хронометрические данные по быстрым оценкам местоположения и формы объектов (см. 3.1.3), можно ожидать, что такое опережение будет достигать 200 мс. За это время испытуемый может сконцентрировать свое внимание, эффективно настроившись на восприятие формы объектов в указанной части матрицы, но не в других ее частях. Последнее делает процедуру умножения результатов в методике частичного отчета неправомерной.
Можно предположить, что если кодировать положение критических элементов матрицы с помощью фигуративных послеинструкции (то есть стимулов, отличающихся формой, а не пространственным положением), то всякие указания на иконическую память должны исчезнуть, точнее, «функция затухания иконы» должна сдвинуться в область положительных задержек «послеинструкции». Это подтвердили эксперименты, проведенные нами некоторое время назад совместно с М.С. Капицей (см. Величковский, 19826)20. Как видно из результатов этих экспериментов,
19 Первоначально маскировку объясняли как своеобразные гонки между двумя сти
мулами, причем восприниматься должен тот стимул, который первым достигает блока
«сознательной репрезентации». С этой точки зрения, однако, совершенно непонятно,
почему обратная маскировка обычно выражена более сильно, чем прямая, иными сло
вами, почему «в гонках» побеждает стимул, предъявляемый последним. Предложенная
двухуровневая модель объясняет это задержкой в подключении внимательного анализа,
направленного на спецификацию индивидуальных характеристик объектов. Данная мо
дель является частным случаем уровневых объяснений восприятия, более подробно рас
смотренных нами ниже (см. 3.4.2 и 8.4.3).
20 В экспериментах применялась методика частичного опознания со зрительной пос-
леинструкцией, похожая на методику экспериментов Авербаха и Корайлла (см. 3.2.1).
Кстати, практически полное совпадение результатов этих авторов и Сперлинга (исполь
зовавшего не зрительную, а акустическую послеинструкцию) представляет собой про
блему для гипотезы иконической памяти, так как объединение информации из икони-
ческой и эхоической памяти допускается в блочных моделях лишь на уровне кратковре
менного хранилища. Напротив, с нашей точки зрения, процессы быстрой пространствен
ной локализации принципиально имеют интермодальный характер. 205
-500 -300 -100 0 100 300 500
Асинхронность предъявления послеинструкции, мс
О пространственная инструкция Δ фигуративная инструкция
Рис. 3.11. Результаты экспериментов по частичному опознанию зрительных форм в зависимости от характера инструкции, асинхронности ее предъявления и состояния тем-новой адаптации зрения (по: Величковский, 19826).
206
представленных на рис. 3.11, использование в качестве кода признака формы, а не пространственного положения приводит к тому, что для улучшения восприятия элементов предъявлять инструкцию действительно приходится до показа самой матрицы.
Из представленных на этом рисунке графиков также видно, каким образом на успешность опознания влияет предварительная темновая адаптация зрения, способствующая появлению выраженных последовательных образов стимульных объектов. Темновая адаптация улучшает результаты, давая возможность «считывать» информацию с послеобраза, но она никак не меняет вид выявляемых зависимостей, в частности, тот факт, что кривые для пространственных и фигуративных инструкций сдвинуты относительно друг друга примерно на 200 мс. Это говорит об относительной независимости микрогенеза и механизмов возникновения последовательных образов, а также о том, что сперлинговский эффект частичного отчета зависит прежде всего от параметров микрогенеза восприятия, а не от последействия сенсорной стимуляции, резко возрастающего в условиях темновой адаптации.
Обсуждая общенаучные основания исследования процессов актуального развития восприятия, нельзя не отметить их несомненную романтическую основу: микрогенетические представления естественно
соотносятся с данными о развитии восприятия в фило- и онтогенезе, а также с результатами неиропсихологических и нейрофизиологических исследований (см. 1.4.1 и 3.4.2). Этот факт в полной мере подчеркивал еще H.H. Ланге: «Подобно тому как эмбриологическое развитие человека повторяет в несколько месяцев те ступени, которые некогда проходило общее развитие рода, так и индивидуальное восприятие повторяет в несколько десятых секунды те ступени, какие в течение миллионов лет развивались в общей эволюции животных» (Ланге, 1893, с. 3).
Гетерохронность (разновременность) различных аспектов микроге-неза зрительного восприятия подтверждается нейрофизиологическими данными, свидетельствующими о существовании быстрых и медленных каналов сенсорной переработки. Они отличаются рядом анатомических особенностей (отсюда одно из их названий: магноцеллюлярные, M — крупноклеточные и парвоцвллюлярныв, Ρ —- мелкоклеточные). В функциональном отношении эти механизмы также весьма различны. Каналы первого типа быстро отвечают на «размытую» информацию, наличие больших пятен, движение и появление объектов в широком поле зрения. Механизмы второго типа работают сравнительно медленно, реагируя на локальные перепады яркости, тонкие линии, другие мелкие детали (Tovée, 1996).
На вопрос о том, достаточно ли этого разделения для описания микрогенеза, следует ответить отрицательно. Во-первых, не совсем ясны взаимоотношения между этими группами каналов. Обычно предполагается, что фазические каналы тормозят активность тонических21. В одном из обзоров процессов маскировки Бруно Брейтмейер (Breitmeyer, 1980), однако, приходит к выводу, что такое торможение является взаимным. Иконические репрезентации этот автор идентифицирует с положительными последовательными образами, причем, по его мнению, в процессах восприятия (в частности, при чтении) такие «иконы» могут лишь мешать восприятию деталей, а следовательно, должны активно
21 Взаимодействие фазических и тонических каналов служит основой распространен
ного объяснения обратной маскировки и метаконтраста. Предполагается, что фазичес-
кий ответ на маскировочный стимул тормозит более поздний тонический ответ на предъяв
ление тестового стимула (коррелятом этого ответа может быть описание деталей). Для
данного объяснения существенно, чтобы маскировочный стимул предъявлялся с соот
ветствующей задержкой. В последнее время обнаружены условия, при которых это объяс
нение не работает. Например, полная маскировка (метаконтраст) возникает и в том слу
чае, когда маскировочный стимул предъявляется одновременно с тестовым и просто про
должает оставаться в поле зрения после того, как тест-объект примерно через 100 мс ис
чезает (Enns & Di Lollo, 2000). Этот вариант маскировки легко предсказывается описан
ной выше (см. 3.1.3) двухуровневой моделью восприятия: 1) вначале происходит регист
рация и локализация тестового и маскирующего стимулов как некоторого недифферен
цированного события; 2) с задержкой порядка 100 мс начинаются процессы детальной
спецификации этого события, которые ведут к восприятию индивидуальных характерис
тик одного лишь маскировочного стимула. 207
подавляться22. По-видимому, зрение действительно занимается «иконоборчеством» — вывод, который предвидел уже Вундт. К тому же, разделение двух групп каналов связано, главным образом, с анализом сенсорной переработки в сетчатке и в первичных, затылочных отделах коры. Как мы увидим в дальнейшем (см. 3.4.2), восприятие вовлекает и другие структуры мозга, включающие различные субкортикальные области, а также ассоциативные зоны теменных и височных долей.
3.3 Распознавание конфигураций
3.3.1 Традиционные психологические подходы
Важнейшей функцией восприятия является распознавание зрительных и акустических конфигураций, ведущее, в частности, к узнаванию предметов и их категоризации, то есть отнесению к той или иной семантической категории. Проблема механизмов распознавания, или «распознавания образов», является одной из центральных для целого комплекса когнитивных наук: психологии, нейрофизиологии, искусственного интеллекта и нейроинформатики. В когнитивной психологии ей прямо или косвенно посвящены десятки монографий и сотни статей. В дальнейшем мы будем многократно возвращаться к ее рассмотрению из перспективы исследований памяти и организации семантической информации (см., например, 5.1.1 и 6.1.2). Данный раздел посвящен сенсорно-перцептивным механизмам распознавания.
Элементарной предпосылкой того, что некоторый объект вообще будет опознан, является его выделение в качестве фигуры из окружающего фона. Кроме того, при распознавании акцент лежит на индивидуальных признаках, таких как цвет поверхности и форма. Пространственно-ситуативные признаки (положение в пространстве, ориентация, движение, освещенность) выполняют при распознавании скорее технические функции — чаще всего их параметры лишь учитываются нами для того, чтобы дать инвариантную (константную) оценку индивидуальным признакам. Таким образом, можно сказать, что распознавание связано с относительно поздними стадиями восприятия, как бы «надстраивающимися» над процессами динамической пространственной локализации (см. 3.1.3).
22 Инерционность восприятия увеличивается при утомлении, когда ослаблены центральные процессы контроля. Это проявляется в увеличении продолжительности последовательных образов, усилении маскировки и снижении критической частоты слияния 208 мелькании (Леонова, 1984)
В последние годы были проведены систематические исследования законов перцептивной организации, направленные на выяснение природы влияющих на выделение фигуры из фона факторов и их взаимоотношений. При этом оказалось, что динамическая локализация в пространстве служит наиболее фундаментальной основой для такого выделения. Если разные законы перцептивной организации (см. 1.3.1) конфликтуют между собой, «навязывая» разные варианты группировки видимых компонентов сцены, то победителем обычно оказывается фактор близости, причем близости в трехмерном пространстве, а не на сетчатке. Закономерное движение стимулов в трехмерном пространстве также оказывается сильнейшим фактором перцептивной организации. Если пространственно-динамические факторы нейтральны (например, когда в статичной конфигурации расстояния между элементами равны между собой), то второй по силе группой факторов оказывается глобальное сходство, определяемое такими признаками, как окраска, общая ориентация (для элементов, имеющих выраженную ориентацию) или размеры (зернистость). Только тогда, когда все эти факторы нейтрализованы, группировка начинает учитывать особенности и сходство собственно формы элементов.
и сложности различению формы (Б) образующих эти текстуры элементов. 209
Очевидное объяснение этих зависимостей состоит в том, что восприятие формы предполагает анализ уже выделенных из фона объектов, тогда как группировка основана на глобальной оценке сходства без предварительного восприятия формы образующих текстуру элементов. Эти два процесса не просто различны, но часто противоположны по чувствительности к отдельным признакам объектов. Так, хотя буквы «L» и «Т» явно отличаются по форме, образованные из них текстуры лишь с трудом отличаются друг от друга (см. рис. 3.12 справа). Напротив, небольшие вариации в наклоне «Т» практически не замечаются нами при узнавании, однако они служат хорошей основой для дифференциации соответствующих текстур (рис. 3.12 слева).
Особенно важную роль в распознавании играют именно процессы спецификации и распознавания формы. Как особая, требующая специального изучения проблема восприятие формы длительное время не осознавалась представителями «импрессионистической» (Эрнст Мах) ассоциативной психологии. Гештальтпсихологи считали восприятие формы первичным фактом восприятия, подчеркивая его «вещный», или предметный, характер. Если тезис о первичности восприятия формы вызывает сегодня — на основании представленных выше данных о микрогенезе — обоснованные сомнения, то предметность действительно представляется весьма важной характеристикой этого класса перцептивных процессов, к обсуждению которой мы еше вернемся в конце этого раздела (см. 3.3.3).
В психологических подходах последних десятилетий центральное место занимают формальные теории описания структуры перцептивных конфигураций. Речь идет о синтаксическом подходе: сначала выделяются отдельные элементы (признаки), из которых по определенным правилам (грамматикам) строится перцептивное описание конфигурации. Фактически в основу этого подхода положена более ранняя идея Дональда М. Маккая (МасКау, 1950), согласно которой перцептивная сложность (информативность) конфигурации определяется числом операций, осуществляемых перцептивной системой для ее спецификации (см. 2.1.3). Но характер этих элементов и операций над ними по-прежнему остается не вполне ясен23. Одна из наиболее интересных теорий такого рода развивается голландским психологом Э. Ле-венбергом и его коллегами (Leeuwenberg, 1978). Модель постулирует повторения, зеркальные отображения и другие избыточные операции с разными элементами конфигураций, иногда осуществляемые в итеративном (повторном) режиме, то есть в ходе нескольких последовательных обращений к продуктам процесса кодирования.
Оценка сложности различных перцептивных интерпретаций используется для объяснения множества эффектов. Так, можно задать вопрос, почему на рис. 3.1 ЗА мы всегда видим два пересекающихся квадрата, хотя теоретически возможны и альтернативные варианты, частично указанные в нижнем ряду. Ответ связан с относительной простотой процесса конструирования квадрата, для которого нужно повторное использование лишь двух элементов — отрезка фиксированной
21 Джулиан Хохберг следующим образом характеризует эти исследования1 «На физиологическом и психофизическом уровнях идет лихорадочный поиск элементов сенсорного анализа (которые учитель Гельмгольца Иоханнес Мюллер назвал "специфическими энергиями органов чувств") и есть упоминания ментальных структур, к которым эти элементы должны относиться... Но если Титченер когда-то заявил, что небольшой (по сегодняшним масштабам) финансовой поддержки и пары лет работы было бы достаточно, чтобы поставить все точки над / и черточки на t его варианта ассоцианистской теории, ..мне что-то не приходилось слышать таких оптимистичных заявлений в последнее вре-210 мя» (Hochberg, 1979, ρ 138).
Потенциальные интерпретации
Прозрачность
низкая высокая
Рис. 3.13. Примеры влияния фигуративной сложности на восприятие: А. Однозначность восприятия потенциально многозначной конфигурации; Б. Эффект глубины в плоском изображении; В. Феноменальная прозрачность.
длины и угла 90°. При других интерпретациях число элементов и разнообразие операций с ними возрастает. Точно так же на рис. 3.1 ЗБ нами воспринимается, казалось бы, очень сложная трехмерная конструкция, а не плоский, нанесенный на поверхность узор. В действительности, с учетом высокой избыточности компонентов (они показаны справа), трехмерная интерпретация оказывается более простой, чем двумерная, требующая спецификации множества отличающихся по ряду параметров элементов. Наконец, на рис. 3.13В слева мы видим плоский двумерный паттерн, тогда как справа похожая с точки зрения физических при-
211
знаков конфигурация распадается на две, причем та из них, которая лежит «сверху», к тому же оказывается феноменально прозрачной, позволяющей видеть детали, лежащие «внизу». Мы предоставляем читателю возможность объяснить этот феномен по аналогии с объяснениями, данными выше24. Несколько иной подход будет рассмотрен нами в конце данной главы (см. 3.4.1).
В когнитивной психологии существует несколько групп моделей, или теорий распознавания. Только что рассмотренные формальные теории восприятия формы служат хорошим введением в эту проблематику. Дело в том, что наиболее распространенными в настоящее время являются теории признаков и структурные теории распознавания. Фактически они дополняют друг друга: признаки понимаются как исходные элементы, а структурные теории — как правила их объединения. Возникающие «описания» сравниваются с хранящимися в памяти репрезентациями (эталонами), и в случае совпадения происходит ассоциативная активация соответствующих узлов или областей семантической памяти. Хотя мы часто ориентируемся на отдельные признаки, особенно при поиске хорошо знакомых объектов, узнавание может происходить и на основании их более целостных комбинаций, как это подчеркивали гештальтпсихологи.
В силу их чрезвычайной значимости детальной классификации были подвергнуты речевые признаки, различающие отдельные буквы и, при акустическом предъявлении, фонемы (см. подробнее 7.1.1). Один из основных признаков, различающих фонемы, называется местом артикуляции, то есть местом перекрытия гортани при произнесении звука: подъемом задней части языка к нёбу, прикосновением языка к губам или соединением губ. Оказалось, что когда в психоакустических экспериментах на одно ухо подается звонкая согласная с так называемым передним местом артикуляции [Ь] и одновременно на другое — глухая согласная со средним положением артикуляции [t], то ошибки часто комбинируют эти признаки — [р] и [d] слышатся чаще, чем [q] и [к], возможно, потому, что глухость (звонкость) сочетаются здесь с передним (либо, наоборот, более задним) положением места артикуляции. Однако такого рода аргументация наталкивается на трудности. Прежде всего, физические признаки фонем не остаются постоянными и меняются в зависимости от контекста. Далее, восприятие речи вполне возможно в
24 Данный подход можно легко распространить на слуховое восприятия. Один из результатов изучения избирательного восприятия речи («проблема вечеринки» — см. 2.2.1) состоит в том, что понимание релевантного речевого сообщения на фоне шума определяется возможностью его дифференциального описания в терминах локализации, громкости, тональности и тембра голоса собеседника. Если при восприятии музыки предъявляются короткие и сильные сигналы, замещающие участки мелодии, то последняя воспринимается непрерывной с тем большей вероятностью, чем меньше сходство ее ритмического рисунка с ритмом последовательности шумов. Иными словами, различие перцептивных описаний шумовых сигналов и мелодии делает шум акустически «прозрачным» 212 (Bregman, 1990).
условиях, исключающих использование традиционных фонематических признаков (например, Remez, Rubin, Pisoni & Carrell, 1981).
Стивен Лупкер (Lupker, 1979) проверил гипотезу, согласно которой восприятие букв при чтении основано на выделении признаков. Ни одна из признаковых моделей при этом не подтвердилась. Напротив, данные хорошо описывались моделью микрогенетического типа — восприятие локальных особенностей букв начинало играть некоторую роль в их различении лишь после восприятия обобщенных очертаний. Эксперименты с маскировкой слов также показали, что она оказывается особенно сильной, если в качестве маски используются буквы, а не их фрагменты. Это говорит о том, что репрезентация букв может быть наиболее дробным слоем анализа. Существенную роль в распознавании букв играет контекст — распознавание резко улучшается, если этот контекст представляет собой осмысленное слово или, по крайней мере, произносимое псевдослово (см. ниже классический эффект превосходства слова — 7.2.1). Эта закономерность играет особенно большую роль в распознавании рукописного текста, когда один и тот же графический знак уверенно воспринимается как разные буквы (например, «А» или «Н») в зависимости от контекста.
Вторую группу теорий распознавания образуют так называемые теории шаблонов. Они предполагают наличие в памяти целостных репрезентаций, с которыми сравниваются столь же целостные перцептивные описания предметов и событий. Идея целостного сравнения подтверждается многочисленными результатами, свидетельствующими об ускорении опознания в случае общего перцептивного сходства тестового и эталонного объектов, а также данными Р. Шепарда и его коллег (например, Shepard & Podgorny, 1978) по мысленному вращению и другим пространственным трансформациям зрительных образов объектов в процессах узнавания (см. подробно 5.3.1 и 6.3.1).
Споры вызывает, впрочем, вопрос о степени абстрактности подобных целостных репрезентаций. Первоначально преобладало мнение, что их детальность, или конкретность, зависит от времени, прошедшего с момента восприятия. Считалось, что при очень коротких интервалах сравниваются детальные репрезентации, удерживаемые в иконической и эхоической памяти, так что распознавание зависит здесь от более или менее точного пространственного (зрение) и временного (слух) наложения конфигураций. Рассмотренные нами выше данные (см. 3.2.1 и 3.2.2), а также эксперименты на так называемую транссаккадическую память (Irwin, 1996) показывают, что уже через сотые доли секунды после исчезновения изображения или смены точки фиксации в рабочей памяти сохраняется лишь относительно абстрактное описание одного-двух воспринятых объектов.
Несмотря на эту сравнительно обедненную постперцептивную информацию, наша память, несомненно, умудряется строить детальные и разнообразные долговременные репрезентации осмысленных предметных сцен. Эти репрезентации, например, оказываются достаточными для „. „
успешного узнавания тысяч видовых слайдов через недели после их однократного показа (Standing, 1973). Важным условием при этом являются целостность и предметная правдоподобность — полностью абстрактные изображения и предметные сцены, поставленные «на голову» или расчлененные на несколько переставленных кусков, не обнаруживают и доли успешности узнавания экологически естественного материала. Интересно, что узнавание предметных сцен оказывается весьма успешным при повороте изображений относительно вертикали, не нарушающем законы гравитации (Величковский, 19826). Это свидетельствует о целостности процессов сравнения, которые явно не сводятся к поэлементному совмещению тестовой сцены и репрезентаций памяти (см. 5.2.1). В конце этого раздела мы рассмотрим новые работы, выявляющие особенности восприятия интактных предметных сцен, которые, по-видимому, объясняют также и их последующее успешное узнавание (см. 3.3 3).
К группе теорий, допускающих возможность целостного сравнения, примыкают теории прототипов, согласно которым при ознакомлении с элементами некоторого множества испытуемый постепенно выделяет одну или более центральных тенденций — прототипов. По отношению к ним и решается вопрос о принадлежности конкретного объекта к данному множеству. С существованием границ между классами объектов, тяготеющим к разным прототипам, связываются обычно эффекты категориального восприятия — два незначительно различающихся в отношении физических признаков объекта, которые попадают в разные классы (категории), кажутся более разными, чем объективно более различающиеся объекты, попадающие в одну и ту же категорию. Соответственно, во втором случае можно ожидать более быстрое узнавание различных объектов как одинаковых. Такие эффекты обнаружены при восприятии фонем, назывании оттенков цвета, идентификации сложных зрительных форм и т.д. (см. 7.1.1). Формирование прототипов не сводится к абстрагированию признаков, так как можно подобрать множество объектов, не обладающих признаками будущего прототипа — в отношении различительных признаков прототип будет находиться «между» конкретными образцами.
Относительно слабо изученными остаются механизмы узнавания событий и сложных трансформаций биологических объектов. Более или менее правдоподобные объяснения разработаны здесь лишь для частных случаев, например, упоминавшейся выше походки (см. 3.1.2). Особенно большое внимание уделялось исследованию узнавания наиболее важного «стимула» в нашем окружении — человеческого лица и его эмоциональных выражений. Эти результаты выявляют асимметрическую зависимость: знакомость (например, в случае фотографий известных политических деятелей) улучшает узнавание эмоционального выражения, но варьирование выражения не оказывает какого-либо однознач-214 ного влияния на узнавание лиц.
Рис. 3.14. Иллюзия Тэтчер." можно сначала сравнить оба изображения при данной ориентации, а затем в нормальном и снова в перевернутом положении
Изучение признаков, обеспечивающих узнавание лиц, привело и в этой области к разделению целостных (конфигурационных, связанных со взаимным положением) и локальных признаков, определяемых спецификой деталей. В отличие от восприятия обычных предметов и объектов в нашем окружении (и в отличие от процессов чтения в культурах с алфавитной письменностью — см. 7.2.1), узнавание лица в большей степени определяется именно целостными характеристиками, так что даже если в действительности речь идет об изменении некоторого локального признака, испытуемые воспринимают его глобально. Например, изменение диаметра зрачка обычно не воспринимается как таковое, а интерпретируется глобально, скажем, как увеличение привлекательности. Целостное узнавание возможно только при нормальной пространственной ориентации, как это демонстрирует иллюзия Тэтчер (по имени главы британского правительства, сократившей в свое время финансирование научных исследований). Хотя мы легко можем установить, что изображения на рис. 3.14 не совпадают между собой в деталях, мы даже отдаленно не можем себе представить, в какой степени на самом деле различаются между собой выражения этих лиц.
Зависимость восприятия «внутренней геометрии» лица от его ориентации в пространстве ведет к тому, что при необычной ориентации мы, в известном смысле, становимся функционально слепыми к целостным фигуративным признакам. Эта зависимость имеет общий характер, но в случае лиц она выражена особенно сильно. Особый статус восприятия лиц доказывается существованием прозопагнозии — нейропсихологичес-кого синдрома, который связан с селективным выпадением узнавания преимущественно именно этого класса объектов. Интересно, что воз- 215
можны варианты этого синдрома, когда пациенты не могут зрительно узнавать даже своих близких родственников и знакомых, но, тем не менее, вполне успешно определяют «по выражению лица» эмоциональное состояние. Как показывают данные клинических наблюдений и мозгового картирования, эти формы восприятия, по-видимому, преимущественно связаны с нижневисочными отделами правого полушария.
В нижневисочных отделах коры тоже локализуются процессы, существенные для узнавания, а также, что интересно, даже для простой детекции (Grill-Spector, 2004) других категорий сложных зрительных стимулов (см 3 3 3 и 3 4 2) Продолжительные споры относительно того, до какой степени могут быть специализированы процессы восприятия формы объектов и как это связано с межполушарными различиями, привели в последнее время к возникновению представления о своеобразной полуспециализации полушарий. Правополушарные механизмы вентрального потока переработки зритетьной информации обеспечивают целостное восприятие лиц, а также участвуют в обработке формы и узнавании повседневных предметов Однако они не вовлечены сколько-нибудь существенно в процессы восприятия формы букв (в культурах алфавитной письменности) Левополушарные механизмы, напротив, работают скорее с отдельными признаками объектов Они обеспечивают процессы побуквенного чтения и частично участвуют в узнавании повседневных предметов, но не в узнавании лиц Это предварительное объяснение подтверждается, в частности, анализом основных синдромов дислексии — нарушения чтения при локальных поражениях мозга (см 7 2 2)
3.3.2 Влияние нейронаук и информатики
Многие из числа известных современных теорий распознавания опираются, как мы только что видели, на данные и модели, заимствованные из становящейся все более обширной области нейронаук — нейрофизиологии, нейропсихологии и нейроинформатики. Начало переориентации психологических описаний восприятия на физиологическую терминологию и нейросетевые объяснительные модели было положено открытием нейронов-детекторов признаков стимуляции. Особую известность получила основанная на данных микроэлектродного отведения активности отдельных нейронов модель Нобелевских лауреатов 1981 года Д. Хьюбела и Т. Визела. Согласно этой модели, на разных уровнях зрительной системы последовательно выделяются пятна, линии, углы, а затем и более сложные комбинации элементов контура («вплоть до детектора моей бабушки», как иронически заметила однажды американская исследовательница восприятия Науми Уайсстейн)
Эти данные, полученные при изучении зрительной системы кура-
ризированных кошек, были использованы в дальнейшем для моделиро-
216 вания различных аспектов зрительного восприятия. Если нейроны вы-
деляют соединения контуров, то почему разные соединения, например типов «Y», «X», «L» или «Т», выделяются с различной частотой? Математическое моделирование описаний трехмерных сцен показало, что такие соединения могут выполнять разные функции, связанные с отнесением участков, ограниченных контурами, к одним и тем же или к разным предметам Так, особенно часто выделяемое соединение типа «Y» с высокой степенью вероятности представляет собой вершину (впадину) единого объекта с тремя гранями. Напротив, соединение «Т» скорее свидетельствует о перекрытии одного предмета другим, причем верхняя «перекладина» принадлежит перекрывающему предмету, а центральная «ось» разделяет две поверхности перекрываемого предмета. Как в таком случае быть с участками объектов, не имеющими контуров, но, тем не менее, явно демонстрирующими «телесность», подобно изображенному на рис. 3.15А торсу? Возможно, что в этом случае используется некоторое сочетание детекции пространственных частот и ориентации Участки гладких поверхностей moi ут моделироваться путем выделения овальных теней и бликов различной величины и ориентации в пространстве (рис. 3.15Б).
На развитие формальных моделей распознавания в последние годы оказывают особенно сильное влияние идеи, возникшие в рамках работ
217
218
по машинному зрению, компьютерной графике и нейроинформатике. Пожалуй, наиболее известной в психологии и за ее пределами до сих пор остается возникшая свыше двух десятилетий назад в этом контексте вычислительная модель зрительного восприятия Дэвида Марра (Магг, 1982). Эта модель постулирует три этапа переработки зрительной информации. На первом этапе вычисляется грубое, но полное описание изменений яркости в локальных участках изображения (в вариантах модели используется также информация о движении и бинокулярной диспарат-ности). Описание строится в терминах алфавита типов изменения яркости: КРАЙ, ТЕНИ-КРАЙ, ЛИНИЯ, ПЯТНО и т.д., дополненных параметрами ПОЛОЖЕНИЕ, ОРИЕНТАЦИЯ, КОНТРАСТ, РАЗМЕР и РАЗМЫТОСТЬ. Марр назвал такое описание первичным наброском, поскольку оно выделяет контур и подчеркивает слабые изменения яркости, подобно тому как это мог бы сделать художник, делая набросок картины. По отношению к первичному наброску последовательно применяются операции группировки и различения, результатом чего является выделение фигуры (объектов) из фона.
Описание формы выделенных из фона объектов осуществляется лишь на более поздних этапах восприятия. Эти этапы были пояснены в работах Марра значительно менее подробно, чем первичная сенсорная обработка. Первоначально строится так называемая «двух-с-половиной-мер-ная» (2'/2D) репрезентация предметов. Речь идет о том, что предметы отчасти приобретают телесность, третье измерение, но при этом восприятие остается ограниченным определенным углом зрения, под которым мы их наблюдаем. Собственно трехмерная (3D) репрезентация предметов, не зависящая от специфической точки зрения, строится в последнюю очередь и связана с эффективной «упаковкой» информации в памяти. Характер такой упаковки позволяет понять предложенная Марром и Ни-шихарой гипотеза обобщенных цилиндров. Согласно этой гипотезе, универсальными элементами «ментального конструктора» служат обобщенные цилиндры — цилиндрические элементы разных пропорций, размеров и ориентации. Спецификация формы предметов примерно соответствует микрогенетическому принципу перехода рт глобальных к локальным системам отсчета. Примером служит репрезентация формы человеческого тела, показанная на рис. 3.16. Незначительная модификация параметров составляющих тело цилиндров позволяет описать общие очертания других похожих биологических существ и их движений (см. 3.1.2).
К этой же группе моделей примыкает теория американского психолога Ирвина Бидермана (Biederman, 1987), предположившего, что зрительная система располагает целым алфавитом таких базовых элементов, которые он называет геонами. Наряду с цилиндрами, этот алфавит включает еще несколько других простых форм, таких как конусы и параллелепипеды. Различные предметы могут составляться из разных элементов. Психофизиологическая реальность подобных элементов не вполне очевидна. Эксперименты с использованием так называемого прайминга (см. 5.1.3), при которых гипотетические элементы предмета предъявлялись в некотором иррелевантном контексте непосредственно перед опытами на его прямое опознание, не выявили в общем случае ожидавшегося ускорения опознания. Поэтому вопрос о возможности некоторой
человек
кисть
Рис. 3.16. Описание сложного объекта с помощью иерархии «обобщенных цилиндров» (по: Магг, 1982).
универсальной, основанной на геометрии декомпозиции предметов остается открытым. Скорее всего такая декомпозиция может быть только результатом развернутого во времени обучения, позволяющего постепенно выявить компоненты предмета, которые обладают наибольшей автономной вариабильностью и, таким образом, заслуживают статуса «частей».
С помощью компьютерной графики и других, например акустических и тактильных, средств предъявления новой информации и обратной связи о собственных движениях, у наблюдателя можно создать живую иллюзию взаимодействия с динамическим предметным окружением — виртуальную реальность {virtual reality, VR)25. Кроме таких полностью искусственных моделей среды и объектов на практике (в частности, в устройствах отображения информации) широко используется промежуточная форма представления среды, расширенная реальность {augmented reality, AR). В этом случае восприятие реального окружения совмещается с элементами искусственного окружения, созданного средствами компьютерной графики, что дает возможность воспринимать скрытые характеристики объектов, такие как внутреннее устройство автомобильного двигателя, положение анатомических структур во время эндоскопической операции, детальный рельеф местности в тумане и т.д. (см. 9.2.3).
25 Значительный прогресс наблюдается сегодня в создании тактильных (гаптических) компонентов виртуальной реальности. С их помощью сапер может за сотни метров от эпицентра событий почувствовать сопротивление проржавевшего металла обезвреживаемой роботом мины, хирург — пластичность обрабатываемых на расстоянии тканей и т.д.
219
Последней разновидностью является так называемая расширенная виртуальность (augmented virtuality, AV), которая представляет собой искусственное окружение для реальных объектов и, например, используется для проведения VR-видеоконференций с обсуждением и проверкой реальных технических изделий (Величковский, 2003).
Все эти сенсорные технологии разрабатываются при участии психологов. Они начинают оказывать заметное влияние и на сами психологические исследования, прежде всего психологию восприятия. В частности, системы виртуальной реальности используются для создания условий экспериментов, которые, с одной стороны, экологически валидны, а с другой, позволяют контролировать независимые переменные (как, например, в исследованиях восприятия опасных ситуаций и реагирования на них при поездках по виртуальному городу — см. 3.4.2). Наряду с этим вкладом в методологию эксперимента, компьютерная графика может служить источником аналогий для теоретических представлений о восприятии. При создании виртуального окружения сначала строится схематическая (или «проволочная») модель среды, которая затем «облачается» участками различных текстур. Можно предположить, что восприятие решает обратную задачу, а именно задачу перехода от информационно богатого внешнего окружения к обедненной схематической модели среды. Понятно, что на ранних этапах микрогенеза важную рель должны играть не только контуры, но и в особенности текстуры.
Именно при обработке текстур, выделении границ объектов и контуров обнаруживается особая компетентность разрабатываемых в ней-роинформатике коннекционистских моделей (см. 2.3.3). На рис. 3.17 показаны примеры того, как самоорганизующаяся нейронная сеть справляется с соответствующими тестовыми заданиями. В первом случае (А) сеть различает участки достаточно похожих текстур. Во втором (Б) — выделяет и подчеркивает контурные компоненты сложного изображения. Методы параллельной обработки используются также при распознавании пластических трансформаций биологических объектов, таких как движения губ при речи и мимика эмоций. Значительный практический интерес представляет собой и обратная задача — продуцирование правдоподобной мимики и эмоционального выражения лица виртуальных персонажей (аватаров). Соответствующие технологии необходимы для создания антропоморфных интерфейсов, например, систем «видимой речи», позволяющих глухим людям пользоваться для общения обычным телефоном с соответствующей компьютерной приставкой (см. 7.4.3 и 9.4.2).
Методы нейроинформатики могут использоваться и в значительно более глобальном плане — для так называемого эволюционного моделирования механизмов восприятия. Для этого первоначально совершенно гомогенная нейронная сеть (то есть сеть с одинаковыми весовыми коэффициентами синаптических связей) начинает подвергаться много-220 кратному (десятки тысяч раз) воздействию разнообразных, возникаю-
Рис. 3.17. Примеры сенсорно-перцептивных задач, успешно решаемых нейронными сетями А. Дифференциация текстур; Б. Выделение контуров в составе сложного изображения
щих в различных участках «поля зрения» сети объектов. Успешность работы сети определяется ее способностью распознавать эти объекты. Такого рода идеализированные компьютерные эксперименты обычно демонстрируют любопытный эффект постепенной «модуляризации сети»: нейронная сеть начинает распадаться на две автономные подсистемы, одна из которых занимается преимущественно выделением параметров местоположения объектов, а другая — анализом их фигуративных характеристик, критических для собственно распознавания (Calabretta & Parisi, 2005).
Вырисовывающееся различение соответствует изложенным выше фактам об уровневой организации восприятия и прямо напоминает два гипотетических механизма построения движений, а именно уровни пространственного поля С и предметного действия D, описанные в 1947 году H.A. Бернштейном (см. 1.4.2). В современной нейропсихологии предположение о существовании в восприятии приматов и человека двух, филогенетически различных зрительных систем одним из пер-
221
вых высказал, в 1968 году, шотландский исследователь Колуин Тривар-зен (Trevarthen, 1968). Специализацией более древней системы, или так называемого «амбьентного зрения» (от фр. ambiance = окружение), по его мнению, является динамическая пространственная локализация. Вторая система, или «фокальное зрение», занимается идентификацией объектов. На основании экспериментов с перерезкой мозолистого тела (корпус коллозум), связывающего между собой полушария большого мозга, Триварзен и Сперри пришли к выводу, что первая система расположена преимущественно в субкортикальных структурах, тогда как вторая система находится в коре и поэтому зависит от сохранности межполушарных связей (Trevarthen & Sperry, 1973).
В последующем нейропсихологический поиск субстрата этих двух форм зрительной обработки надолго сместился в кору (отчасти потому, что процессы в коре проще наблюдать, чем в субкортикальных структурах). В этом контексте различают дорзальный (ведущий в заднетеменные зоны коры) и вентральный (нижние височные зоны) «потоки» зрительной информации, хотя постепенно накапливается все больше данных, подтверждающих мнение Бернштейна и Триварзена, что филогенетически более древний дорзальный поток {амбьентное зрение, или уровень С) включает и субкортикальные компоненты. Различие механизмов локализации и идентификации было установлено в последнее время также в слуховом восприятии (см. 4.1.2). Аналогичные взаимодействия выявляются и при выполнении мануальных движений: при схватывании предмета сначала задается общее направление и расстояние (локализация), и лишь затем осуществляется приспособление пальцев к его форме и размерам (идентификация). Мы более подробно остановимся на дискуссиях об уровневой организации восприятия в последнем разделе этой главы (см. 3.4.2) после рассмотрения взаимоотношений восприятия и семантики.
3.3.3 Роль предметности и семантический контекст
Недостаток большинства нейрофизиологических моделей распознавания состоит в том, что они односторонне подчеркивают геометрические признаки конфигурации, игнорируя предметный контекст. Предметность восприятия представляет собой не просто абстрактный философский или, например, идеологический принцип26, а фактор, оказываю-
26 По известному замечанию Курта Коффки, мы воспринимаем «предметы, а не промежутки между ними». Согласно Брентано и последующим феноменологическим направлениям философии и психологии, предметность и интенциональность (в смысле «интенцио-нальной направленности психических актов на предметы») лежат в основе феноменов сознания. В марксистской философии предметность восприятия («чувственного отражения») 222 выводилась из предметного характера внешней практической деятельности (см. 9.3.1).
щий влияние на результаты конкретных исследований. Эксперименты с классификаций и идентификацией различных сенсорно-перцептивных признаков показывают, что нам значительно проще определять разные признаки одного и того же предмета (цвет, размер и форму), чем один и тот же признак (например цвет) такого же числа разных предметов (см. 4.1.3). Особенно поучительным является эффект превосходства объекта, обнаруженный Науми Уайсстейн и Чарльзом Харрисом (Weisstein & Harris, 1974).
Эти авторы провели эксперименты, в которых испытуемые сначала должны были в тахистоскопических пробах с последующей маскировкой различать один из четырех возможных отрезков, типа показанных на рис. 3.18А, при их изолированном предъявлении. После того как в первой части эксперимента индивидуально определялось время экспозиции, позволяющее правильно узнавать отрезки в 75% случаев, эксперимент несколько усложнялся. Вместе с каждым отрезком и на то же самое время предъявлялся фигуративный контекст, представлявший собой два квадрата, которые были смещены таким образом, что каждый из тестовых отрезков связывал между собой их различные вершины (рис. 3.18Б). Во всех пробах второй части эксперимента этот контекст был идентичным — подобное избыточное дополнение, казалось бы, не должно было улучшать различение предъявляемых линий. Более того, присутствие дополнительной информации в условиях тахистоскопичес-кого эксперимента означает дополнительную нагрузку, поэтому во второй части эксперимента можно было ожидать некоторого снижения
223 уровня успешности узнаваний тестовых отрезков по сравнению с условиями его первой части. Результаты показали, однако, что успешность ответов во второй части эксперимента возрастает, достигая 90%. Иными словами, отрезки линий воспринимаются быстрее и точнее внутри конфигураций, вызывающих впечатление предметности — присутствия различных объемных («телесных») объектов, чем при изолированном предъявлении. Если бы восприятие следовало порядку активации гипотетических детекторов признаков — от линий к углам и лишь затем к более сложным, образующим предметы конфигурациям, результаты должны были бы получиться обратными. Возможное возражение состоит в том, что квадраты могут выполнять роль удобных ориентиров, присутствие которых облегчает определение положения и ориентации тестовых линий. Поэтому в одном из контрольных экспериментов тестовые линии показывались на фоне фрагментов координатной сетки (рис. 3.18В). В этом случае вероятность правильного узнавания снижалась до 70%. Эффекты контекста не менее выражены и в слуховом восприятии. Хорошо известно, прежде всего, что признаки фонем — наименьших смыслоразличительных единиц потока речи — меняются в зависимости от акустического контекста (см. 7.1.1). Интерес представляет влияние семантики речи на восприятие фонем. Так, в классических экспериментах Р. Уоррена (Warren, 1970) фонема /s/ в составе некоторого слова иногда просто заменялась шумовым сигналом. В нормальном речевом сообщении испытуемые этого не замечали, продолжая отчетливо слышать /s/. Более того, такие отсутствующие физически, но субъективно слышимые фонемы могут при их «повторении» даже приводить к адаптационным психофизиологическим эффектам, сдвигая пороги восприятия звуков со сходными признаками27. Вместе с тем, не следует переоценивать эффекты ожидания в восприятии. В частности, нужно принять во внимание, что белый шум, использовавшийся в экспериментах Уоррена, по своим характеристикам особенно похож на фонему /s/. Если шумовыми сигналами той же средней громкости заменяются другие фонемы, то это относительно легко замечается испытуемыми. Что можно сказать о взаимоотношении восприятия фигуративных и семантических характеристик объектов? Анализируя влияние семантики на наше восприятие, Фодор и Пылишин (Fodor & Pylyshin, 1988) связывают его с переходом от «восприятия» к «восприятию как» («perception us»), " Соответствующий зрительный эффект состоит в следующем. Адаптация к пространственной частоте синусоидальных решеток (известно, что в детекции такого рода стимулов участвуют специализированные нейроны — см. 3.1.1) зависит не только от физической стимуляции определенной части поля зрения, но и от перцептивной организации в целом. Если часть заполненного адаптационной решеткой поля зрения перекрывается, то адаптация в этой локальной части окружения определяется тем, воспринимаем ли мы перекрытие как фигуру (то есть как предмет, выступающий перед непрерывным, образо-224 ванным решеткой фоном) или же как отверстие в решетке. иллюстрируя это теоретическое различение следующим примером. Потерпевший караблекрушение моряк может смотреть на некоторую звезду и, безусловно, видеть ее очень отчетливо, наряду с другими звездами, но может видеть ее и совсем иначе, например, «как Полярную звезду», позволяющую ему найти направление к берегу. Аналогично, по проницательному замечанию А.Н. Леонтьева, после высадки астронавтов на поверхность Луны изменилось само наше восприятие этого небесного тела. Экспериментально семантику восприятия впервые исследовал М.П. Никитин, работавший в лаборатории В.М. Бехтерева. В статье «К вопросу об образовании зрительных ощущений», опубликованной в 1905 году, он описал эксперименты по узнаванию изображений предметов, предъявлявшихся с индивидуально подобранной околопороговой длительностью экспозиции (она составила от 0,8 до 3 мс). После каждого предъявления испытуемый зарисовывал то, что видел, и давал словесный отчет. В целом результаты подтвердили закон перцепции Лан-ге, но с одним существенным добавлением. Оно состояло в том, что всякая новая идея о предмете «запускает» микрогенез восприятия сначала. «Некоторые лица, — пишет М.П. Никитин, — так описывают этот момент: "Помню, что некоторое время ясно осознавал общие очертания некоторых линий, но, как только блеснула идея о предмете, сразу забыл их"» (1905, с. 118). Та же закономерность проявилась и в динамике зарисовок: сразу после возникновения идеи, даже если она была правильной, увеличивалось количество ошибочно изображенных деталей! Испытуемый говорил «птица» и рисовал птицу другого вида, чем та, которая была на карточке. Насколько нам известно, подобные эффекты никогда не перепроверялись в последующие десятилетия и лишь совсем недавно — через 100 лет — стали предметом анализа в контексте исследований так называемого послевнимания (см. 4.2.3). В когнитивной психологии долго доминировало представление, что осмысленность восприятия носит постперцептивный характер. «Прека-тегориальными» считаются иконическая и эхоическая память. Уже в первых экспериментах Дж. Сперлинга испытуемым предъявлялись матрицы, включавшие буквы и цифры. Инструкция отбирать символы одной из этих двух категорий не приводила к преимуществу частичного отчета. Позднее Дж. Сперлинг и сотрудники (Sperling et al., 1971) провели эксперименты по определению максимальной скорости распознавания. Испытуемым показывались матрицы из букв, в которых нужно было найти и идентифицировать спрятанную цифру. Задача решалась при фантастических условиях предъявления, когда в каждой матрице было от 9 до 16 букв и матрицы сменялись каждые 40—50 мс. Поскольку категоризация, по мнению авторов, может иметь место лишь после строго последовательного сканирования информации из иконической памяти в «буфер опознания» (подструктуру кратковременной памяти), ими был сделан вывод о том, что распознавание одного символа может осуществляться за время порядка 10 мс (80—120 символов в секунду). 225 С точки зрения сегодняшних представлений о временных характеристиках восприятия, к этому выводу следует отнестись с некоторым скептицизмом. Среди прочего, он не учитывает возможность очень эффективной семантической категоризации хорошо знакомой перцептивной информации. Так, например, в работах по зрительному поиску было неоднократно показано что искать букву (цифру) среди цифр (букв), оказывается легче, чем искать букву (цифру) в контексте других букв (цифр). Любопытно, что эти эффекты, по-видимому, не сводятся к выделению одних только сенсорных различительных признаков материала: в литературе сообщается о результатах, согласно которым искать «букву "О"» среди цифр проще, чем искать «цифру "О"» (то есть буквально тот же самый объект с точки зрения сенсорных признаков!) среди цифр (Jonides & Gleitman, 1972). Многочисленные перепроверки, проведенные за прошедшие со времени первой публикации 30 с лишним лет, в большинстве случаев подтверждали этот поразительный результат. Данные говорят не о вторичных, а о непосредственных эффектах значения в восприятии. Например, когда на очень короткое время (скажем, 30 мс) нам предъявляются знакомые или незнакомые символы, то длительность предъявления первых кажется больше. Этот результат сохраняется даже тогда, когда вводится обратная маскировка и испытуемый не может сказать, что было показано в каждом конкретном случае. Перцептивное распознавание оказывается до определенной степени процессом уточнения не только фигуративных, но и семантических характеристик объектов. Если начальным этапом в первом случае является динамическая локализация в окружающем пространстве, то во втором — появление абстрактного представления о существовании объекта. Нами совместно с М.С. Капицей и У. Кемпфом (Величков-ский, 1982а; Velichkovsky, 1982) проведены эксперименты по зрительной маскировке, показавшие, что на промежуточных этапах микрогенеза (100—200 мс) особую роль играют общие очертания объектов28. На основе выделения общих очертаний, в частности, могут строиться быстрые положительные ответы в задачах сравнения конфигураций. По-видимому, этим промежуточным этапам микрогенеза соответствуют и критические моменты уточнения принадлежности объекта к той или иной общей семантической категории. Некоторые другие данные также говорят о том, что перцептивные процессы могут быть, по крайней мере, столь же тесно связаны с абстрактной семантической информацией, как и речевые. Согласно ре- 28 Недавно (март 2004) нами совместно с Т.Г. Визель и Е.Г. Гришиной было проведено обследование пациентки О.Б. Ядерная магнитнорезонансная томо1рафия выявила у нее двустороннее поражение затылочно-височных областей коры (вентральный поток — см. 3.4.2), что объясняло прозопагнозию и дислексию. Одновременно О.Б. была способна узнавать (отчасти угадывать) отдельные предметы и буквы по их форме, но только на основе общих очертаний. Восприятие внутренней геометрии предметов было нарушено (см. 226 также Botez, 1975). зультатам M. Поттер (например, Potter & Faulconer, 1975), при показе изображения молотка испытуемый гораздо быстрее называет более общую семантическую категорию «инструмент», чем при показе слова «молоток». Об этом же свидетельствуют результаты работы И. Хофф-манна (1987). Испытуемым давалось либо возможное название категории, либо возможное название объекта, изображение которого предъявлялось с переменной задержкой вслед за этим для скоростной бинарной классификации. При этом оказалось, что в положительных пробах ответ давался быстрее, если испытуемому вначале указывалась семантическая категория некоторой средней степени общности (о таких категориях промежуточного, или «базового», уровня абстрактности и их роли в когнитивном развитии — см. 6.2.2). Например, если на картинке была изображена роза, то ответ «да» давался быстрее при преднастройке «цветок», чем при преднастройке «роза». Преднастройка на «растение» не вела к такому относительному ускорению ответов. В связи с этими данными возникают два принципиальных вопроса. Первый состоит в том, каким образом осуществляется выделение семантических признаков в восприятии. Суть второго вопроса в том, какие следствия такое выделение имеет для процессов обработки собственно фигуративных признаков. В связи с первым вопросом мы уже отмечали, что речь идет о микрогенетическом процессе, причем опирающемся скорее на глобальные, чем на локальные характеристики объектов и сцен. Если учесть, что детальное предметное восприятие представляет собой относительно медленный процесс, требующий (как правило, после первоначальной пространственной локализации) участия фокального внимания, то «общий смысл», очевидно, может выделяться одновременно или даже раньше, чем большинство геометрических признаков. Имеется целый ряд работ, показывающих это с помощью методики, в которой испытуемым в высоком темпе последовательно предъявлялось значительное число осмысленных изображений (Potter, Staub & O'Connor, 2004)29, Выявляемое при этом время обработки (80—200 мс) соответствует промежуточным фазам микрогенеза восприятия. Иными словами, эти промежуточные фазы микрогенеза как бы отвечают на вопрос «На что это похоже?». В последнее время появились самые первые модели обработки сложных реалистических изображений, показывающие, как, в принципе, может происходить столь быстрое выделение их общего семантического содержания (Oliva & Torralba, 2001). Оказывается, для этого достаточно использования нескольких относительно простых фильтров, работаю- г9 В современной психологической литературе для обозначения подобного методи щих без обратной связи. Отсутствием обратных связей может объясняться высокая скорость обработки, а также то, что она оказывается возможной даже в условиях отвлечения внимания (см. 4.1.3). Работая с частотным спектром изображений, не зависящим от точной пространственной локализации и идентичности отдельных объектов, эти фильтры позволяют оценивать зрительные сцены сразу по нескольким глобальным измерениям «протосемантики сцен»: «естественный—искусственный», «угловатый—гладкий», «открытый—закрытый» и т.д. Конкретные изображения успешно кластеризуются в координатах подобного семантического пространства как примеры «морского берега», «городской сцены», «горного пейзажа» или, скажем, «интерьера дома»30. Здесь важно еще раз подчеркнуть, что общее значение сцены может быть выделено до детального восприятия отдельных наполняющих ее предметов. Такая возможность быстрой семантической классификации осмысленных сцен, по-видимому, и обуславливает особую успешность их восприятия и запоминания (см. 5.2.1 ). Дело в том, что быстрые и полностью однонаправленные, то есть осуществляемые в режиме bottom-up, процессы глобальной семантической классификации позволяют в рамках известной семантической категории (схемы, или фрейма — см. 6.3.1) осуществлять направленную проверку идентичности вероятного предметного заполнения сцены. Они оптимизируют движения внимания при зрительном поиске, обеспечивают нужное шкалирование гранулярности внимания, позволяют предвосхитить вероятные особенности очертаний предметов и их пространственной локализации. Вместе с другими эффектами контекста, в частности, наряду с так называемыми прай-минг-эффектами (см. 5.1.3), семантическая категоризация позволяет ситуативно модифицировать параметры априорной «заметности» тех или иных фрагментов сцены, существенно дополняя таким образом в предметной осмысленной среде действие классических факторов перцептивной организации (Torralba, 2005). Второй поставленный нами выше вопрос имеет, прежде всего, философскую подоплеку: если конечный «перцепт» — это продукт наших знаний, ожиданий, умозаключений, то что же в нем от объективной действительности? По мнению некоторых авторов, тяготеющих к философии диалектического материализма и/или к прямому реализму (его придерживаются последователи Гибсона — см. 9.3.1), семантика присутствует в объективном мире как один из его фундаментальных аспектов. По терминологии А.Н. Леонтьева, это его «пятое измерение», наряду с тремя пространственными и одним временным. При такой постановке вопроса семантика не должна с необходимостью рассматриваться как искажающий восприятие фактор. Кроме того, в когнитивных исследо- 30 Более традиционные работы по невербальной семантике (основанные на процедурах классификации и сравнения) выявляют в зависимости от исходного набора картинок несколько иные базовые измерения, в особенности измерение «активности», являющееся одним из трех измерений осгудовского семантического дифференциала (см 2.2 1 и 228 61.2). ваниях последних лет стало общепризнанным представление о существовании не только статического, связанного со структурой семантических категорий декларативного знания, но и процедурного знания, которое имеет действенный характер и, включаясь в процессы познавательной активности, делает сенсорно-перцептивную обработку и проверку гипотез более эффективной (см. 5.3.2 и 7.2.2). Наиболее известной попыткой интеграции схематического знания и процессов восприятия является теория перцептивного цикла Улрика Найссера (1981), по его собственному признанию, навеянная общением с Гибсоном. Эта теория, по сути дела, сводится к изображенному на рис. 3.19 круговому взаимодействию окружения, знания («схем») и перцептивной активности. В новейшей истории психологии роль этой теории состояла в объединении конструктивистских представлений о восприятии, как когнитивной интерпретации стимула, со взглядами сторонников Гибсона, согласно которым стимульная ситуация достаточна для того, чтобы полностью определять восприятие. Но сегодня эта теория представляется слишком общей (ср., например, попытку ее дальнейшего развития учеником Найссера Барсалу в 6.4.2). Она не дает объяснения ни специфическим уровневым механизмам, вовлеченным во взаимодействие со средой, ни характеру обратного влияния схем и других когнитивных факторов на наше восприятие. ν Направляет
ческого приема применяется буквосочетание RSVP (от англ. rapid serial visual presentation,
то есть «быстрое последовательное зрительное предъявление»). Эту английскую аббре
виатуру легко запомнить, если учесть, что она идентична стандартному международному
сокращению, означающему просьбу ответить — responde s'il vous plait. 227
229
Рис. 3.20. «Жена или теща?»: А. Однозначно «жена»; Б. Однозначно «теша»; В. Неоднозначное изображение.
230
В какой степени наше ожидание увидеть что-либо влияет на содержание восприятия? Вообще говоря, такое влияние неоспоримо и зафиксировано в авторитетных источниках: «In the night, imagining some fear, how easy is a bush supposed a bear» («А в темноте, страшилищами бредя, мы куст принять готовы за медведя» — У. Шекспир, «Сон в летнюю ночь», перевод Лозинского). Тем не менее эксперименты выявляют более сложную картину. Эпстейн и Рок (Epstein & Rock, 1960) попытались однажды продемонстрировать роль ожиданий, используя варианты классического (введенного в психологический оборот Борингом) изображения «Жена или теща?» (рис. 3.20). Они изготовили два похожих изображения, одно из которых всегда воспринималось как изображение молодой женщины (Ж), а второе — старой (Т). Вначале испытуемым предъявлялись для распознавания однозначные изображения, причем в фиксированном порядке Ж-Т-Ж-Т и т.д. После примерно 15 таких повторений за изображением «Т» неожиданно следовал показ классической фигуры. Поскольку испытуемые ожидали теперь увидеть молодую женщину, можно было бы предположить, что это ожидание сдвинет баланс восприятия в сторону «жены». Результаты показали, что первой реакцией, как правило, был ответ «Теща!». Следовательно, даже в очень специальной ситуации амбивалентного восприятия существуют факто-
Рис. 3.21. Осмысленный зрительный контекст сокращает количество сенсорной информации, необходимой для узнавания объекта. Глаз при изолированном предъявлении (А), в контексте частей лица (Б), в контексте лица (В) и в контексте человеческого тела (Г).
ры, легко преодолевающие возможное влияние таких переменных, как ожидание31.
Обратимся еще раз к приведенной только что цитате Шекспира. Не случайно речь идет о восприятии в ночных условиях, когда нарушено фокальное зрение, ответственное за восприятие деталей и идентификацию предметов (об этом говорит и характерный для сумерек или тумана амбьентный режим движений глаз, при котором возрастает амплитуда саккад, а длительность фиксаций уменьшается, причем несмотря на резкое увеличение перцептивной нагрузки — см. 3.4.2). Устранение возможности для фокального анализа увеличивает влияние внутренней, «эндогенной» составляющей — но, главным образом, в отношении дополнения отсутствующей физически детальной информации. Следующий пример иллюстрирует этот принцип дополнительности сенсорной информации и семантического знания. На рис. 3.21А обилие деталей позволяет легко узнать глаз. По мере добавления осмысленного контекста (рис. 3.21 Б и В) для этого оказывается необходимым все меньше деталей, пока всякое графическое «упоминание» глаза вообще не становится излишним (рис. 3.21Г). Количество сенсорных данных,
31 Таким фактором в данном случае может быть последействие (прайминг — см. 5.1.3) непосредственно предшествующей обработки, связанной с восприятием «теши» (или «жены»), причем последействие не только восприятия идентичности фигуры, но, например, восприятия ее размеров или ориентации, которые также различают обе интерпретации (Величковский, 1986а). Этот вопрос, безусловно, заслуживает дальнейшего экспериментального анализа.
231
необходимое для узнавания какого-либо объекта, уменьшается при увеличении семантических сведений32.
«Общий смысл» ситуации влияет на решение многих других перцептивных задач, если они имеют выраженную «эндогенную» (причем не только когнитивную, но и эмоциональную — см. 9.4.3) составляющую, как это происходит в случае целенаправленного зрительного поиска и обнаружения. Так, Ирвин Бидерман и его сотрудники (Biederman, Glass & Stacy, 1973) показали в начале 1970-х годов, что нахождение целевого предмета в сложной предметной сцене резко затрудняется при нарушении ее общей простанственно-смысловой организации, даже если локальное окружение, положение и ориентация самого предмета при этом остаются неизменными (см. также 5.1.1 и 7.2.1).
Особенно выраженным влияние семантики оказывается в случае исследований так называемой «слепоты к изменению» {change blindness). Эти исследования (они будут подробнее рассмотрены в следующей главе — см. 4.4.1) выявили нашу нечувствительность к изменениям предметов и других визуальных особенностей наблюдаемой сцены, когда эти изменения совпадают по времени с глобальными прерываниями восприятия — как искусственными (отключение изображения на 50— 200 мс), так и естественными (саккады и моргания). В результате мы можем долго внимательно смотреть на предъявляющуюся вновь и вновь фотографию, допустим, набережной Сены, не замечая, что с каждым показом Собор Парижской Богоматери оказывается то в левой, то в правой части изображения.
Подобные данные, однако, большей частью получены в условиях, когда критические изменения были иррелевантны с точки зрения опыта деятельности наблюдателей. Кроме того, разные варианты изображений (и даже реальных событий — см. 4.4.1) не меняли общего смысла ситуации. В самое последнее время выполнено несколько работ, в которых анализировалась способность испытуемых видеть семантически релевантные изменения и подмены предметов в ситуациях игры в шахматы, наблюдения за футбольным матчем и поездкой на автомобиле по городу. Хотя эти изменения, как и раньше, вводились в моменты глобального прерывания восприятия, успешность их обнаружения увеличивалась в 3—4 раза, приближаясь к 100% (Velichkovsky et al., 2002a).
Интерпретация этих данных возможна прежде всего в рамках теоретических представлений, которые подчеркивают межуровневые взаи-
32 В истории живописи всегда использовалась эта особенность восприятия, позволяющая обходиться без точной прорисовки деталей. Начиная с работ импрессионистов, передача общего впечатления (фр. impression), основанная на игнорировании деталей, стала одним из основных художественных приемов. Аналогично, в современных фильмах, когда надо показать, скажем, множество охваченных паникой людей на палубе тонущего океанского лайнера, вместо актеров-статистов используются виртуальные персонажи, в об-232 лике которых отсутствуют многие важные при других обстоятельствах части лица и тела.
модействия процессов актуального восприятия физических характеристик объектов и структур схематического, концептуального знания о мире (см. 6.3.1 и 6.4.2). Подобные взаимодействия, очевидно, имеют двусторонний характер — в отношении порядка вовлечения уровневых механизмов они могут протекать как по направлению «снизу вверх», так и по направлению «сверху вниз», причем зачастую это может происходить в одно и то же время, так что перцептивная интерпретация оказывается результатом параллельно-последовательной конвергенции, основанной на учете ограничений и возможностей нескольких различных уровней организации. Исследования последних лет свидетельствуют о том, что одним из важнейших признаков, позволяющих дифференцировать уровневые механизмы восприятия, является их избирательное взаимодействие с сенсомоторными процессами.
3.4. Восприятие и действие
3.4.1 Сенсомоторные основы восприятия (и наоборот)
Хотя уже в исходном варианте компьютерной метафоры познавательные процессы трактовались как активное преобразование информации, сенсорным системам оставлялась роль пассивного интерфейса — своего рода проекционного экрана, сохраняющего в течение долей секунды картинку физического воздействия. Благодаря теоретическим работам Гибсона и Найссера, а также первым масштабным исследованиям целенаправленной глазодвигательной активности, проведенным в 1960-е годы советским биофизиком А.Л. Ярбусом (см. 2.4.2), фокус действенной трактовки сдвинулся в область восприятия. Этот сдвиг был вызван и техническими проблемами, возникшими в когнитивной роботике. Доминирующим направлением здесь постепенно стало создание систем активного зрения, связанных с постоянным выбором фрагментов окружения для более углубленной обработки. Как оказалось, обработка по принципу «широко и глубоко» требует слишком большого количества вычислительных ресурсов и протекает недопустимо медленно (см. 9.2.3).
Обследование окружения и выбор объектов для детальной обработки осуществляется с помощью движений головы и тела, на которые накладывается тонкий узор движений глаз. Классификация видов движений глаз дана в таблице 3.2. Наиболее известной их разновидностью являются неоднократно упоминавшиеся выше саккады — чрезвычайно быстрые скачки баллистического типа, меняющие положение глаз в орбите и позволяющие выделять фрагменты сцены для последующей фиксации. Если фиксируемый объект движется, то глаза начинают отслеживать его в режиме динамической фиксации с помощью гладких, следящих движений. Если при этом меняется еще и расстояние между объектом и 233
Таблица 3.2. Разновидности движений глаз человека и приматов (по: Joos, Rutting & Veiichkovsky, 2003)
234
Название | Стимул | Результат | Скорость |
Поисковые (частично произвольные) движения | |||
Саккады | Изменения в периферии поля зрения или намерение | Обследование окружения, ориентировка на новые пели, зрительный поиск | Скорость до 800°/с, сред, частота 3—4 Гц, амплитуда до 60° |
Вергентные движения | Бинокулярная диспаратность или намерение | Бинокулярная фиксация объектов переменной удаленности от наблюдателя | Скорость до 10°/с |
Стабилизирующие (непроизвольные) движения | |||
Следящие движения (smooth pursuit) | Медленно движущийся объект | Отслеживание движений объекта | Скорость до 80°/с, затем сменяется саккадой |
Вестибулярный нистагм | Движения головы | Удержание линии взора в пространстве во время собственных движений | Подобно движениям головы, возвратный скачок до 500°/с |
Оптокинетический нистагм | Движение заполняющих поле зрения объектов | Удержание относительно неподвижного изображения объектов на сетчатке | Медленная фаза до 80°/с, возвратный скачок до 5007с |
Микродвижения (непроизвольные движения во время фиксации) | |||
Дрейф | Тонические моторные и вестибулярные факторы | «Плавание» глаза во время фиксации, дезадаптация рецепторов | Скорость до 1-2УС, амплитуда до 15' |
M и кросаккады | Часто — вызванный дрейфом «уход» глаза с цели | Часто — восстановление фовеальной фиксации. Дезадаптация рецепторов | Скорость до 30°/с, амплитуда до 15' |
Тремор | Неконтролируемая неточность работы мотонейронов | Дестабилизация изображения на сетчатке и дезадаптация рецепторов | Частота до 100 Гц, амплитуда < Г |
наблюдателем, то в небольшом диапазоне удаленностей (примерно до 3 м) к отслеживанию подключаются так называемые вергентные движения, более известные как конвергенция и дивергенция. Когда наблюдатель сам перемещается в пространстве, относительная неподвижность проекции окружения на сетчатку поддерживается с помощью нистагма: пилообразных движений, медленная фаза которых компенсирует собственное движение, а быстрая — возвращает глаза в исходное положение. Для полноты картины отметим, что наши глаза во время фиксации не остаются неподвижными, а совершают мельчайшие микродвижения нистагмоидного типа, параметры которых также описаны в таблице.
Как движения глаз «встроены» в другие виды активности? Рассмотрим это на примере неожиданного сильного события, скажем, падения предмета со стола или априорно достаточно невероятного попадания самолета в одно из соседних высотных зданий. Сначала такие внезапные события затормаживают текущую активность (об этих ранних компонентах ориентировочной реакции — см. 4.4.1 и 9.4.3) и запускают перераспределение тонуса мышц, которое приводит к движению корпуса и головы — синергии поворота в сторону события. В ходе этого движения генерируется одна или несколько длинных саккад, направленных в критическую область, и только потом разворачивается фокальная обработка, ведущая к идентификации события. Фокальная обработка характеризуется сравнительно продолжительными фиксациями и саккадами небольшой амплитуды. Если связанные с событием объекты продолжают перемещаться в пространстве, фокальная обработка поддерживается следящими и вергентными (для близких расстояний) движениями глаз. Если случившееся событие носит локальный характер, типа упавшей со стола книги, то здесь окуломоторика тесно кооперирует с движениями рук, как это происходит при большинстве трудовых действий и операций. Коррелятом высокоамплитудных саккад является глобальное перемещение руки в пространстве. Зрительной фокальной обработке соответствуют движения кисти и пальцев, приспособленные к особенностям формы предметов.
В этих фазах развертывания ориентировочно-исследовательской
активности легко узнать проявление работы уровней построения движе
ний H.A. Бернштейна, хотя сам он не занимался ни движениями глаз, ни
восприятием (см. 1.4.2). Речь идет о четырех описанных им уровнях —
• от А (простейшие защитные и ориентировочные реакции) до D (пред
метное действие). Не случайно нейрофизиологические механизмы уп
равления движениями глаз обнаруживают выраженную иерархическую
организацию, включающую как субкортикальные (основание мозга,
средний мозг, базальные ганглии), так и кортикальные (теменные и
фронтальные) структуры. В самое последнее время был достигнут изве
стный прогресс в диагностике уровня текущей глазодвигательной ак
тивности. Эти работы демонстрируют связь движений глаз с характером
перцептивной и когнитивной обработки (см. 3.4.2 и 7.4.3). 235
О 140 230 420 S6Û 700 840 960 1,120
Длительность фиксации, мс
0 140 280 420 560 700 840 980
Длительность фиксации, мс
1,120
Рис. 3.22. Типичное распределение длительности фиксаций (А) и соответствующих амплитуд саккадических движений глаз (Б).
236
Для иллюстрации возможного подхода рассмотрим отношение длительности зрительных фиксаций и амплитуды саккадических движений глаз (Velichkovsky, 2002). Рис. 3.22А показывает типичное распределение длительностей фиксаций водителей, проезжающих путь средней сложности в городской среде. Эти фиксации включают в подобном динамическом окружении также элементы отслеживания движущихся целей, поэтому они обычно более продолжительны (распределение как бы «растянуто» вправо), чем при рассматривании статичных картин или чтении. На рис. 3.22Б показано отношение между длительностью фиксаций и амплитудами саккад. Легко видеть существование трех различных сегментов длительности фиксаций. Первый из них (< 90 мс) относительно неинтересен: здесь несколько больших саккад просто не долетают до цели, поэтому глаза останавливаются на мгновение и потом совершают незначительное коррекционное движение.
Фиксации из второго сегмента (от 100 до примерно 300 мс) связаны с саккадами, которые довольно велики (> 4°) — больше, чем размеры радиуса парафовеальной области. Это означает, что такие саккады не могут направляться сколь-нибудь детальной, или «фокальной», репрезентацией объектов. Поэтому эти фиксации можно рассматривать как проявление низкоуровневого пространственного, или «амбьентного», модуса зрительного восприятия (аналогичного уровню С, или уровню «пространственного поля» Бернштейна). Напротив, продолжительные фиксации (более 300 мс) обычно предваряются и завершаются сравнительно небольшими саккадами. Эти саккады перемещают глаза внутри парафовеальной области, что облегчает детальное восприятие и поддержание непрерывного внимания. Этот модус обследования сцены может поэтому интерпретироваться как связанный с фокальной обработкой, по крайней мере, того типа, которая нужна для идентификации предметов и событий (уровень предметного восприятия D). Аналогичные сегменты выделяются и при рассматривании сложных статичных изображений,
Рис. 3.23. Варианты фигур, восприятие которых, возможно, определяется характером реально или потенциально осуществляемых по отношению к ним движений.
но при этом (из-за отсутствия «растягивающих» интервалы между сак-кадами следящих движений) границы сегментов сдвинуты в область меньших длительностей фиксаций.
Один из традиционных вопросов в исследованиях восприятия состоит в том, в какой степени оно включает сенсомоторные компоненты и, возможно, определяется ими. Накопленные на этот счет данные довольно противоречивы. С одной стороны, имеется множество косвенных свидетельств влияния движения глаз и локомоции на восприятие. Об этом говорит, например, регистрация движений глаз при восприятии многозначных изображений (см. рис. 3.7,6.3и9.3). Обычно различным вариантам перцептивных интерпретаций в этом случае соответствуют несколько иначе расположенные узоры фиксаций, причем изменение характера движений глаз предшествует смене восприятия (Pomplun, Ritter & Velichkovsky, 1996). Хотя речь идет всего лишь о корреляционных зависимостях, можно предположить, что с помощью частично находящихся под произвольным контролем движений глаз мы научаемся управлять восприятием таких изображений.
Вероятным фактором здесь является внутренняя, идеомоторная активность, позволяющая нам предвосхищать реальные действия и движения. Хорошим примером служат так называемые «фигуры Коп-ферманн», показанные на рис. 3.23. В последовательности этих фигур возрастает вероятность восприятия объемной призмы, а не плоского изображения. Возможная причина состоит в том, что реальная призма может быть увидена как «А» только из определенной позиции полностью обездвиженным наблюдателем. Поэтому предпочтение отдается двумерной интерпретации. В случае варианта «Б» становится возможным двигаться относительно вертикали, и только вариант «В» снимает всякие ограничения на движения наблюдателя33.
Последний пример возможного влияния идеомоторики на восприятие связан с восприятием походки в варианте исследования биологического движения (см. 3.1.2). Как показывают некоторые исследования, в подобных динамических конфигурациях мы почему-то легче узнаем себя, чем наших близких знакомых (Beardsworth & Buckner, 1978). Этот
33 Это объяснение, очевидно, применимо и к другим аналогичным объектам, рассмот
ренным нами выше (см. 3.3.1 и 9.3.2). 237
Рис. 3.24. Схематическое изображение, иллюстрирующее условия экспериментов с симметричными и параллельными движениями ладоней (по: Mechner, 2003).
результат трудно понять, если исходить из предположения о сугубо сенсорной (афферентной) основе узнавания, ведь мы практически никогда не видим себя со стороны. Он, однако, становится ожидаемым, если допустить, что узнавание включает скрытое «проигрывание» наблюдаемых движений.
Нельзя сказать однако, что движения односторонне определяют характер восприятия. Имеются данные, демонстрирующие прямо обратную зависимость. Франц Мехнер из Института психологических исследований общества Макса Планка (Mechner, 2003) проанализировал недавно феномен более простого выполнения движений, симметричных относительно оси тела. Так, если синхронно выполнять параллельные движения пальцами или ладонью со все большей скоростью (рис. 3.24А), то довольно скоро движения сбиваются и превращаются в симметричные (рис. 3.24Б). Если начать с симметричного движения, то спонтанного перехода к параллельному движению не происходит. Можно объяснить это симметричностью моторного оснащения тела — иннервация гомологичных мышечных групп проще, чем иннервация мышц, расположенных на противоположных сторонах ладони. Чтобы проверить это традиционное моторное объяснение, автор просил своих испытуемых повернуть одну из ладоней кверху и выполнять то же задание (3.24В). В этом случае одновременная активация гомологичных мышц ведет к параллельному движению и можно было бы ожидать, что именно оно будет теперь лучше выполняться при высоких скоростях. Но предпочтительным по-прежнему оставалось визуально симметричное движение, хотя оно и было связано теперь с совершенно другой и, казалось бы, более сложной иннервацией34.
Интересны нейропсихологические данные о возможности поддержки и частичной реабилитации нарушенных моторных функций с помощью замены афферентации. Так, существенной компонентой локомоций является их ритмическая организация во времени. Соответствующие «во-
34 Можно предположить поэтому, что такие мануальные движения на самом деле планируются не в координатах тела (уровень В), а в координатах внешнего, эгоцентрически
238 воспринимаемого пространства (уровень С, по Бернштейну).
L
дители ритма», возможно, локализованы или зависят от структур базаль-ных ганглиев. Бернштейн (1947) пытался помочь пациентам с сухоткой спинного мозга (tabes dorsalis), подменяя ритмическую временную организацию недоступной им в полном объеме проприоцептивной информации ритмической организацией видимого окружения в пространстве. Согласно его сообщениям, некоторые их этих пациентов могут испытывать серьезные трудности при движении по ровной, оптически гомогенной поверхности, но относительно легко поднимаются по лестнице (!) — именно потому, как полагает Бернштейн, что в последнем случае оптическая информация, структурированная видом ступенек, становится эффективным источником «зрительной кинестезии» (см. 3.1.2). Ритмическая структура видимого окружения, по-видимому, как-то «переносится» на последовательность двигательных актов.
Эти идеи не получили в свое время должного развития, но очень похожие феномены были описаны недавно для пациентов с болезнью Пар-кинсона. В связи с этим для улучшения ходьбы пациентов предлагается использовать монтирующиеся на очковой оправе устройства расширенной реальности (augmented reality — см. 3.3.2), позволяющие оптически совмещать образ окружения с координатной сеткой или соответствующими пространственно организованными стимулами (Riess, 1998).
В последнее время появились работы, направленные на компенсацию нарушений локомоций за счет привлечения механизмов социальной имитации. Японский исследователь Кори Мияке (Miyaké, личное сообщение, октябрь 2003) в поведенческих опытах установил, что два идущих рядом человека обычно начинают постепенно согласовывать ритм своих движений (см. также более раннюю публикацию этой группы исследователей — Miyaké, Miyagawa & Tamura, 2001). Чтобы использовать этот эффект для коррекции нарушений, Мияке разработал программную систему (виртуального робота — см. 9.2.3) под названием «Walkmate» — «идущий приятель». Система анализирует ритм и другие особенности походки пациента и вычисляет оптимальную стратегию ее трансформации в относительно стабильную и симметричную (в смысле движений левой и правой ноги) динамическую структуру. Эти промежуточные ритмические «решения» предъявляются затем пациенту в форме акустических сигналов через наушники. Первые сообщения говорят о выраженном стабилизирующем походку эффекте использования подобного электронного спарринг-партнера, в частности, у пациентов с болезнью Пар-кинсона. Конечно, и эти результаты еще должны получить независимую оценку с точки зрения надежности наблюдаемых эффектов.
Возвращаясь к общему вопросу о связи восприятия и моторики, мы хотели бы теперь рассмотреть некоторые новые данные, свидетельствующие о возможности совершенно неожиданного ответа на этот вопрос. Речь идет о группе экспериментов, в которых впервые была предпринята попытка сравнить параметры восприятия объектов, как они отражаются в нашем сознании, с тем, как они реконструируются по косвенным поведенческим признакам выполняемых нами двигательных актов (Milner & Goodale, 1995). Так, в целом ряде исследований последних лет
239
240
изучались особенности движений схватывания элементов конфигураций типа упоминавшейся выше фигуры Мюллера-Лайера (см. 2.3.2). При рассматривании этой фигуры (и других конфигураций, вызывающих так называемые оптико-геометрические иллюзии) возникает отчетливое восприятие различия физически равных элементов. Можно было бы ожидать, что это иллюзорное восприятие будет определять и особенности сенсомоторной активности. Видеорегистрация схватывания центральных отрезков фигуры Мюллера-Лайера показала, однако, что расстояние между пальцами приближающейся к фигуре кисти не зависит от иллюзорной оценки и оказывается одинаковым. В одно и то же время наше зрительное восприятие информирует сознание о различии отрезков, а моторику — об их идентичности!
Аналогичная диссоциация была обнаружена в работах американского психолога Дэниса Проффитта и его коллег (например, Creem & Proffitt, 1999). Проффитт исследовал субъективные оценки крутизны склона холмов (в изобилии встречающихся на юге штата Вирджиния, где он работает). Обычно, пытаясь «на глаз» определить угол наклона поверхности холма, мы переоцениваем его как минимум в 1,5—2 раза. Эта тенденция дополнительно усиливается, когда оценки делаются в состоянии выраженного утомления, например, сразу после многокилометрового забега. Проффитт показал, что можно получить значительно более адекватные оценки, причем совершенно не зависящие от субъективного состояния, если попросить испытуемых «на глаз» (но без зрительного контроля самих движений) установить рукой или ногой подвижную платформу в положение, примерно равное по наклону поверхности холма.
Наиболее неожиданный результат этих замечательных своей простотой экспериментов состоял в том, что адекватность и стабильность сенсомоторных оценок сохранялась лишь до тех пор, пока испытуемые непосредственно смотрели на холм. Достаточно было попросить их-повернуться к холму спиной или на 5—10 секунд закрыть глаза, как и эти оценки начинали приобретать привычные утрированные формы. Таким образом, «восприятие для действия», по-видимому, не имеет собственной памяти и в случае прерываний вынуждено опираться на данные имеющего доступ к памяти «восприятия для познания». Параметры восприятия, выявляемые при выполнении действий, тем самым, скорее соответствуют представлениям Гибсона и его последователей о прямом, не опосредованном знаниями и мышлением характере перцептивного отражения, тогда как более созерцательное «восприятие для познания» — с его зависимостью от фокального внимания, памяти и субъективных состояний сознания — лучше интерпретируется в рамках представлений о перцептивном образе как внутреннем когнитивном конструкте (см. 9.3.3).
3.4.2 Уровни восприятия
В этой главе нами уже упоминалось множество разновидностей сенсорно-перцептивных процессов, начиная с различных модальностей и субмодальностей. Некоторые из использовавшихся различений имели характер частично коррелирующих между собой дихотомических классификаций большей или меньшей степени общности. По сегодняшний день в этих данных остается много неясных деталей, причем даже в знаниях об анатомической организации, казалось бы, вдоль и поперек изученной зрительной системы человека. Одним из наиболее удачных, на наш взгляд, является различение амбьентной и фокальной обработки (см. 3.4.1). Это различение близко другим попыткам выделения двух уровней восприятия, таким как этапы локализации и идентификации, и несколько более специфично, чем классическое описание предвнима-тельной и внимательной фаз обработки, например, в «Когнитивной психологии» Найссера (см. 2.2.2). Оно может быть использовано для описания не только зрительного, но и как минимум слухового восприятия (Scott, 2005).
Остановимся на этих понятиях и стоящих за ними процессах подробнее. Под «амбьентной обработкой» понимаются процессы глобальной ориентации в пространстве и локализации объектов. По-видимому, такой характер имеет вся субкортикальная зрительная обработка, так как ограниченное количество нейронов не позволяет решать более сложную задачу идентификации объектов. Эти данные подтверждают предположение Бернштейна о том, что примитивные формы восприятия пространственного окружения связаны с субкортикальными структурами, в частности, базааьными ганглиями (стриатумом). Но перцептивная переработка пространственной информации существенна и для коры, где в этом отношении главным «специалистом» являются заднетеменные структуры (или так называемый «дорзальный поток» — см. 3.4.1 ). Эти же структуры вместе с премоторными отделами коры участвуют в реализации того, что было названо выше восприятием для действия35.
Как мы только что видели, у восприятия, непосредственно включенного в действие, возможно, нет памяти в привычном смысле слова — оно функционирует в режиме «здесь и теперь»36. Иными словами, хотя
35 Кроме того, накапливаются данные, что именно эти теменные структуры преиму
щественно являются целью так называемых магноцеллулярных (см. 3.2.3) каналов, по
зволяющих сравнительно быстро передавать зрительную сенсорную информацию о круп
ных движущихся объектах (Le et al., 2002)
36 Упоминание памяти «в традиционном смысле слова» обусловлено тем, что в послед
ние годы обнаружено значительное число эффектов так называемой имплицитной памя
ти, проявляющейся косвенно, по изменению параметров перцептивных и сенсомотор-
ных процессов. Отличие традиционной, эксплицитной памяти и имплицитного запоми
нания будет подробно рассмотрено нами в одной из следующих глав (см. 5.1.3). Процес
сы имплицитного запоминания лежат в основе многих форм перцептивного научения, в „ ..
частности, связанного с адаптацией к сенсорным искажениям (см. 3.4.3). Имплицитное
эти перцептивные процессы требуют определенного времени для их реализации и точного тайминга, функционально они осуществляются как бы в «постоянном настоящем». Восприятие стабильного пространственного окружения также не связано с существованием сколько-нибудь детального, удерживаемого в памяти образа объектов (см. 3.1.1). Вместо этого есть очень быстрый, требующий менее 100 мс процесс локализации самих объектов. Такое отсутствие опоры на память можно объяснить двояко. С функциональной точки зрения «внешний мир — лучшая модель самого себя» (см. 9.3.2). С точки зрения нейроанатоми-ческих связей, перцептивная обработка в дорзальном потоке осуществляется в структурах, удаленных от механизмов, обеспечивающих эксплицитное запоминание, то есть от височных долей и расположенного непосредственно под ними гиппокампа (см. 5.3.2).
Иначе обстоит дело с процессами фокальной, внимательной обработки, ведущими к детальному восприятию и идентификации предметов. Эти процессы вовлекают в основном регионы височных долей, расположенные ниже и несколько спереди от теменных долей коры. Этот «вентральный поток» переработки информации, с одной стороны, контактирует с гиппокампом и его окружением, а с другой — со структурами, обеспечивающими восприятие и порождение речи (см. 7.1.1). Перцептивная обработка опирается здесь не только на сенсорную информацию, но и на семантическую память и одновременно сама служит основой для формирования фиксируемых в памяти репрезентаций отдельных ситуаций и эпизодов. Таким образом, вентральный поток оказывается идеальным субстратом для того, что было названо выше «восприятие для познания». Основные признаки двух зрительных систем приведены в табл. 3.3. Аналогичное разделение, как отмечалось, может быть проведено сегодня также по отношению к подсистемам слухового восприятия.
О связях височных долей с когнитивными механизмами говорят нарушения, возникающие при их поражениях, среди которых, наряду с апперцептивной агнозией (агнозия на форму или объектная агнозия — нарушение узнавания предметов), встречаются также ассоциативная агнозия (неспособность семантически категоризовать предмет, форма которого, судя по зарисовкам, воспринимается), оптическая афазия (неспособность назвать предмет при сохранности практического знания о его применении) и категориально-специфическая агнозия. В последнем случае речь
запоминание характерно также для аффективной информации (см. 5.3.2). Исследования восприятия боли свидетельствуют о том, что и в этом случае оценки интенсивности ощущений не опираются на процессы суммирования во времени. Хирургическая операция, продолжавшаяся лишь 6 минут, может, быть оценена как более болезненная, чем операция, занявшая 66 минут, если некоторое одиночное пиковое состояние боли в первом случае оказалось выше, чем каждый из нескольких пиковых состояний и в целом более 242 высокий болевой фон во втором (Kahneman et al., 1993).
Таблица 3.3. Две зрительные системы — перечень контрастирующих признаков (по: \felichkovskyetal., 2005)
Зрительная система | Фокальная | Амбьентная |
Структуры коры | Вентральный поток | Дорзальный поток |
Функция | Что | Где/Как |
Включенность в движение | Меньше | Больше |
Осознание/Память | Больше | Меньше или отсутствует |
Временные свойства | Медленая | Быстрая |
Чувствительность к освещению | Высокая | Низкая |
Пространственное разрешение | Высокое | Низкое |
идет о нарушениях узнавания объектов, входящих в определенную семантическую категорию — инструментов, животных или хорошо знакомых лиц. Подобные нарушения возникают при повреждении разных участков нижневисочных отделов коры.
Следует отметить, что некоторые из этих, связанных с поражениями височных долей, нарушений предметного восприятия частично компенсируются в ходе осуществляемых с ними действий. Наблюдения за пациентами с агнозией на форму показывают, что иногда они могут демонстрировать рудиментарное восприятие формы в ходе практических манипуляций с предметами. Так, при инструкции взять предмет, форму которого пациентка не в состоянии определить, она, тем не менее, может иногда правильно адаптировать пальцы подводимой к предмету руки (Milner & Goodale, 1995). Такое различение формы (или, скорее, общих очертаний), однако, оказывается ограниченным, не позволяющим учитывать внутреннюю геометрию предмета (Dijkerman, Milner & Carey, 1998). Этот вопрос продолжает в настоящее время дискутироваться, так как теменные области, безусловно, в основном специализированы на обследовании пространственного окружения и локализации объектов. В особенности структуры, расположенные в их верхних медианных зонах (близких к продольной борозде, разделяющей левое и правое полушарие), демонстрируют поданным функционального картирования мозга повышенную активацию при широком, «амбьентном» обследовании окружения. Селективное — фокальное — внимание к дета-. лям, цвету и форме предметов вызывает подавление такой активации (Raichle, 1998).
243
Анализ случаев агнозии на форму показывает, что нарушения высших форм восприятия оставляют относительно сохранными более элементарные процессы пространственного восприятия. Интересно, что обратное скорее неверно — поражения затылочных долей часто ведут к массивным нарушениям восприятия формы и узнавания. Эти нарушения известны в нейропсихологической литературе как симулътаноагно- ' зия и синдром Балинта11. В всех этих случаях пациенты не могут интегрировать отдельные детали в целостный образ и неспособны увидеть более одного объекта в относительно простой их комбинации (по принципу «либо серп, либо молот» при восприятии старого советского герба, включавшего изображения серпа и молота). Типичны, впрочем, как раз попытки угадать по отдельным деталям целое — пациент видит круглые дуги рукояток ножниц и заявляет, что видит очки. Видимый мир как бы распадается на отдельные детали. А.Р. Лурия оставил классическое описание этих нарушений в эссе о «человеке с раздробленным миром», а один из наиболее ярких его последователей, американский нейропсихолог Оливер Закс описал в своих работах «человека, спутавшего свою жену со шляпой» (проблемы этого пациента, правда, осложнялись также выраженной прозопагнозией, то есть нарушенным узнаванием лиц — см. 3.3.1) .
Приведенные данные говорят об уровневых взаимоотношениях между механизмами восприятия пространственного положения (уровень С) и восприятия предметов (уровень D). Подобные взаимоотношения наблюдаются при восприятии событий, когда развертывание познавательной активности осуществляется в режиме «снизу вверх». В этих случаях говорят также об использовании непроизвольного внимания (см. 4.4.1). Но вовлечение механизмов восприятия в работу часто происходит в противоположном направлении, так сказать «сверху вниз» (или в порядке «обратной иерархии», reverse hierarchy — Hochstein & Ahissar, 2002). Это типично для задач активного поиска, связанных, как принято говорить в психологии, с использованием произвольного внимания (см. 4.4.2). В чисто временном аспекте работа с информацией об индивидуальном предмете (скажем, «будильник?») может предшествовать тогда процессам пространственной локализации («на ночном столике»). Пространственный поиск может легко управляться и абстрактной семантической информацией более высокого уровня Ε (например, при поиске «посуды»), а даже иметь ситуативно-творческий характер, включающий элементы мышления (уровень F — см. 8.4.3). Так, пытаясь найти «то, что можно положить под проектор», можно значительно облегчить себе задачу, если
37 У полностью здоровых людей резкое сужение размеров функционального поля зрения, или феномен туннельного зрения, наблюдается при высокой степени эмоционального стресса. Возможно, туннельное зрение объясняется связью дорзальной системы коры (и, следовательно, амбьентного восприятия) с базальными ганглиями, участвующими в 244 регуляции эмоций и стресса и крайне чувствительными к ним (см. 9.4.3).
догадаться, что любая достаточно толстая и раскрытая соответствующим образом книга легко послужит такой подставкой.
Различение уровней восприятия имеет большое практическое значение и за пределами нейропсихологии. Поскольку в условиях слабой освещенности избирательно затрудняется идентификация предметов и событий, тогда как широкое амбьентное восприятие, связанное с ориентацией в пространстве и управлением собственными движениями, может оставаться относительно сохранным, у водителей возникает опасная иллюзия отсутствия каких-либо существенных изменений способности управлять автомобилем в сумерках и скорость движения обычно не снижается. Если при этом внезапно возникает задана идентификации — тени, припаркованной машины или пешехода, водитель может не справиться с ее решением. Число аварий со смертельным исходом в сумерках примерно в 4 раза больше, чем при дневном освещении. Характерно, что в этих условиях примерно 25% водителей, только что сбивших пешехода, утверждают, что вообще никого на дороге не видели38. Разделение двух уровней (или модусов) зрительной переработки информации справедливо рассматривается в прикладной психологии как «скрытый фактор-убийца», ответственный за высокий процент серьезных аварий в ночное время (Leibowitz, 1996).
В самое последнее время появились новые возможности лабораторного исследования восприятия и поведенческих ответов на внезапную опасность. Этот вопрос имеет давнюю историю. На заре научной психологии Уильям Джеймс иллюстрировал восприятие опасности случаем внезапной встречи с медведем в лесу. Примерно в том же плане, но уже экспериментально один из основателей современной когнитивной нейропсихологии Дональд Хэбб исследовал реагирование высших приматов на змею. Конечно, в современном урбанизированном мире эти примеры носят скорее воображаемый характер. Большинство угрожающих нам опасностей имеют техногенное происхождение, и среди них выделяются те, которые возникают при автомобильном движении. Достаточно сказать, что только на дорогах России ежегодно гибнет население среднего по величине города, а США потеряли в автодорожных катастрофах больше людей, чем во всех войнах своей истории.
Для того чтобы экспериментально изучать поведение человека в ситуации опасности, нужно найти некоторый компромисс между воображением и реальностью. Таким компромиссом является упоминавшаяся выше технология виртуальной реальности. В одном из экспериментов мы
38 Надо сказать, что имеются два других фактора, вносящих вклад в эту статистику.
Прежде всего это утомление и сонливость, максимальные в предутренние часы (время,
называемое в голландском языке «собачей вахтой»). Еще одна причина связана с мета-
когнитивными процессами (см. 8.1.1). Пешеход на ночной дороге обычно лучше адаптиро
ван к темноте, чем водитель, полноценной зрительной адаптации которого препятствует
подсветка приборов и яркая зона освещенности перед машиной. Тем не менее пешеходы,
по-видимому, полагают, что если они отчетливо видят движущийся автомобиль, то, по
крайней мере, столь же отчетливо их должен видеть и водитель. 245
246
Рис. 3.25. Две потенциально опасные ситуации в экспериментах с поездками по виртуальному городу А Перекресток со светофором, Б Пешеход на краю дороги (по" Velichkovsky et al, 2002b).
создали в нашей лаборатории условия, при которых можно было длительное время «ездить» при дневном освещении по довольно реалистическому виртуальному городу, время от времени попадая в различные непростые ситуации. Рис. 3.25 показывает два потенциально опасных эпизода — приближение к перекрестку со светофором (А) и пешехода, стоящего на краю дороги (Б). Каждая из подобных потенциальных опасностей могла внезапно превратиться в непосредственную угрозу, когда у самого перекрестка зеленый свет менялся на красный или же пешеход начинал быстро переходить дорогу. Кроме таких опасных событий, зрительное окружение испытуемых постоянно изменялось: в зависимости от скорости (то есть от нажатия ногой на соответствующую педаль) усиливалось или замедлялось оптическое «разбегание» видимой панорамы, по дорогам ездили другие автомобили (иногда по той же полосе," но на приличном расстоянии), а другие пешеходы двигались по пешеходным дорожкам независимо от дорожной ситуации.
Вся эта «жизнь» находилась под контролем нескольких связанных между собой компьютеров. Более того, миниатюрные телекамеры с высокой скоростью и точностью непрерывно регистрировали движения головы и глаз водителя. Нас интересовало, как водитель и его глаза реагируют на оба класса опасных событий. Следующий вопрос состоял в том, насколько стабильными эти реакции остаются во времени. В самом деле, после классических работ психофизиолога E.H. Соколова (подробно изучившего ориентировочный рефлекс, возникающий в ответ на неожиданное изменение ситуации — см. 4.4.1) хорошо известно, что многие реакции организма, связанные с ориентировкой в окружении, могут постепенно ослабевать и даже практически полностью угасать.
Чтобы ответить на эти вопросы, мы попросили 12 опытных водителей в течение 5 последовательных недель «ездить» по одному и тому же виртуальному маршруту. «Статические» компоненты окружения при этом оставались неизменными, все динамические события были более или менее случайными. Каждая такая поездка продолжалась примерно
-4-3-2-1 0
2 3 4 5
-4-3-2-1012345
40 мин. Рис. 3.26 показывает динамику продолжительности зрительных фиксаций непосредственно до (4 фиксации), в момент (эта фиксация обозначена «0») и сразу после критического события во всех тех случаях, когда водители успешно тормозили или объезжали (эпизоды с пешеходом) опасность. Три горизонтальные линии соответствуют референтным (baseline) порогам 5, 50 и 95% средних продолжительностей фиксаций на различных участках поездок, не содержавших опасные эпизоды. Легко видеть, что оба класса критических событий вызывают мощную и единообразную реакцию удлинения фиксации, причем эта реакция совершенно не угасает со временем. Относительно продолжительные фиксации после события (от +1 до +3) коррелируют с произвольными движениями, в данном случае нажатием на педаль торможения. Особенно интересны те чрезвычайно редкие случаи (< 1%), когда водители не успевают отреагировать на острую опасность, пересекая перекресток на красный свет (N = 12; рис. 3.27А) или проезжая сквозь идущего пешехода (N = 9; рис. 3.27Б). Эти ошибки не могут быть объяснены недостатком времени на принятие решения, так как скорость обычно была даже несколько ниже нормативных (и достаточных) 50 км/час. Нельзя их объяснить и различиями оптических условий — на самом деле, совершая ошибки, водители часто прямо смотрели на светофор или на пешехода. Поскольку число таких наблюдений было столь незначительным, традиционный статистический анализ был невозможен. Однако его вполне заменяет прямое сравнение с референтными пороговыми значениями: продолжительность фиксаций в момент опасности явно превышает порог 95%, особенно для более драматического эпизода с пешеходом. Единственное реальное отличие по сравнению с данными, когда водители правильно реагировали на опасность, состоит в том, что при ошибочных ответах критическому событию предшествуют две-три короткие фиксации, продолжительность которых оказывается на уровне или ниже порога 5%.
247
-4-3-2-10 1 2 3 4 5
-4-3-2-1012345
248
Рис. 3.27. Продолжительность фиксаций до, в момент и после возникновения опасного события в случаях совершения ошибки:'А. Проезд перекрестка на красный свет; Б. Наезд на пешехода (по: Velichkovsky et al., 2002b).
Почему эти непосредственно предшествующие опасному событию фиксации ассоциируются с ошибками? Для ответа на этот вопрос нужно вернуться к рассмотренным выше данным о возможной связи между длительностью фиксации и уровнем обработки (см. 3.4.1). Фиксации, непосредственно предшествующие ошибкам, имеют длительность порядка 200 мс и, следовательно, принадлежат сегменту ам-бьентного восприятия. В случае адекватных реакций фиксации перед критическим событием с их средней длительностью около 400 мс свидетельствуют о фокальном, или внимательном, анализе ситуации. Причина ошибок состоит, видимо, именно в переключении с фокальной на преимущественно амбьентную обработку. Такие переключения, могут кратковременно наблюдаться и при рассматривании картин Рембрандта, но в условиях дорожного движения они дополнительно провоцируются постоянными изменениями видимого окружения — появлением новых объектов, изменением их взаимного положения и т.д. Водители не успевают своевременно идентифицировать опасность, поскольку критические события случаются во время перцептивной обработки, задачей которой является нечто другое, прежде всего общая пространственная ориентация. Эти новые данные позволяют надеяться на возможность ранней диагностики эпизодов с высокой вероятностью ошибки и на ее использование для адаптивной технической поддержки водителя (см. 7.4.3).
3.4.3 Развитие и специализация восприятия
Исследования раннего онтогенеза восприятия относятся к числу наиболее увлекательных глав экспериментальной психологии, нейрофизиологии и философии. Длительное время именно философские позиции определяли характер ведущихся по этой проблеме дискуссий. Эмпирицисты, прежде всего Джордж Беркли, выдвинули тезис о полной неорганизованности ранних сенсорных впечатлений младенца, которые упорядочиваются только в ходе их ассоциации с моторными ощущениями. Эта точка зрения особенно сильно повлияла на психологию. В 19-м веке ее разделяли Гельмгольц и Джеймс, который писал, что окружающий мир представляет собой для новорожденного «blooming boozing confusion» (читатели, знающие английский язык, могут попытаться перевести это замечательное определение сами). Жан Пиаже — крупнейший специалист прошедшего столетия в области психологии развития — также по сути дела солидаризировался с данной точкой зрения. Он, в частности, высказал предположение, что до опыта двигательных манипуляций с предметами у младенца нет их восприятия как некоторых объективных, независимых от него сущностей.
Во всех этих пунктах противоположной (и первоначально столь же малодоказательной) точки зрения придерживались представители направлений, тяготеющих к кантианскому рационализму (гештальтпсихо-логия) и к прямому реализму (экологический подход Гибсона). Философским основанием для отрицания роли эмпирического, в частности двигательного, опыта в процессах восприятия были взгляды Канта на априорный, то есть существующий до всякого опыта характер наиболее общих категорий нашего рассудка, таких как пространство и время (см. 1.1.3). Когнитивные исследования восприятия впервые позволили проверить справедливость этих взглядов на природу ранних перцептивных достижений.
При проведении подобных исследований приходится целиком опираться на косвенные, поведенческие и физиологические индикаторы восприятия. Большое значение имеют также сравнительные, в том числе и нейрофизиологические эксперименты на животных. Все эти источники говорят о том, что сенсорные возможности новорожденного сильно редуцированы — очень низка острота слуха и зрения, нет восприятия цвета, нет и достаточной бинокулярной координации, которая развивается в течение первых 6 недель жизни39. Наконец, предельно ограниченными длительное время остаются сенсомоторные возможности,
39 Тем не менее, по-видимому, возможна очень ранняя, в первые недели после рожде
ния, имитация сенсомоторного поведения другого типа высовывания языка в ответ на
многочисленные показы языка взрослым. Считается, что в основе этой имитации может
лежать активность зеркальных нейронов, расположенных в нижних отделах премоторной
коры (см. 2.4.3). Эти результаты, как и вообще все результаты, полученные в исследова
ниях с младенцами, требуют тщательной перепроверки. 249
так что, например, устойчивое схватывание предмета наблюдается начиная примерно с 4 месяцев. Вместе с тем, экспериментальные данные отнюдь не подтверждают тезис о полной неорганизованности самых первых восприятий. Напротив, вырисовывающаяся картина свидетельствует о поразительной перцептивной компетентности младенца уже в первые дни и недели жизни, особенно в отношении интермодального восприятия пространственного положения объектов.
В одном из экспериментов Джером Брунер и Барбара Козловска показывали младенцам в возрасте 3 недель на различном расстоянии яркие цветные предметы, которые отличались размером. Хотя в этом возрасте устойчивое схватывание объекта еще невозможно, исследователи обнаружили повышенную моторную активность в плечевом поясе при предъявлении именно тех предметов, размеры и удаленность которых позволяли бы их схватить тремя месяцами позже. В другой известной работе был проведен анализ того, как младенцы этого же возраста реагируют на совпадающую и на противоречивую интермодальную информацию о пространственном положении. Если при приближении лица матери младенец слышал ее голос в совершенно другом направлении, это приводило к изменению обычно положительной эмоциональной реакции, о чем можно было судить по учащению ритма сердцебиений.
Ученик Гибсона Томас Бауэр (1981) провел эксперименты, в которых попытался прямо проверить предположение Пиаже о первоначальном солипсизме восприятия младенца. В этой работе ребенку в возрасте до 4 месяцев показывалась яркая игрушка. После того как становилось ясно, что игрушка замечена и вызвала интерес, она на глазах у малыша помещалась за стоящий перед ним непрозрачный экран. Исходный феномен, описанный Пиаже, состоит в том, что при этом младенец теряет интерес к игрушке и не предпринимает попыток ее достать. Это наблюдение, конечно, может говорить о том, что предмет, исчезающий из поля зрения младенца, перестает для него существовать. Возможными остаются, однако, и другие объяснения, например, что поведение ребенка обусловлено слабостью его сенсомоторных возможностей, а не отсутствием знания о постоянстве существования предмета. Поэтому Бауэр продолжил эксперимент. Через короткий интервал после исчезновения игрушки (интервал был коротким, чтобы не тестировать память вместо восприятия) экран поднимался и ребенок мог видеть либо игрушку, либо пустое место. Если бы ребенок не знал о продолжении существования предмета вне его восприятия, появление игрушки должно было бы вызвать у него реакцию удивления. Если же предметы субъективно существуют независимо от актуального восприятия, то удивление должно было бы вызвать отсутствие игрушки за экраном. Именно этот последний результат и был получен в эксперименте40.
40 В качестве показателей удивления в этих и аналогичных экспериментах использовались психофизиологические признаки ориентировочной реакции, которая будет рассмот-250 рена в следующей главе (см. 4.4.1).
финиш старт
старт
Рис. 3.28. Траектории движений глаз младенца при рассматривании лица: А. Первые 2—3 недели жизни; Б. От 4 недель и старше.
Таким образом, многое в восприятии представляется врожденным, причем в плане самых общих категорий, таких как интермодальное пространство и постоянство существования предметов. Чувствительность к нюансам в пространственной области сочетается со слабостью в восприятии формы. В самом деле, регистрация движений глаз показывает, что в первые недели жизни младенец фиксирует лишь наиболее заметные элементы внешних очертаний предметов и лиц (рис. 3.28). Поэтому предмет, положенный на другой предмет, несколько больших размеров перестает им восприниматься41. Даже когда к концу первого месяца жизни младенец начинает фиксировать внутренние детали обращенного к нему лица, его интерес привлекают прежде всего глаза — независимо от того, сколько глаз находится на лице и как они распределены по его поверхности. Это заставляет сделать вывод, что описанная в предыдущих разделах этой главы дорзальная система восприятия (уровень С, без его моторных компонентов) в большей степени готова к функцио-
41 Близкие наблюдения многократно описаны в нейропсихологической литературе и в исследованиях поведения приматов с удаленной зрительной корой. Поэтому не исключено, что речь идет о субкортикальных эффектах. Интересно, что фактически они реализуют правило, согласно которому «в одном месте пространства в данный момент времени может находиться только один предмет». Дальнейшее уточнение этого правила к концу первого — началу второго года жизни связано в разных культурах с использованием игрушек «матрешечного типа», когда из одного предмета внезапно появляется другой (Бауэр, 1981).
251
252
нированию к моменту рождения, чем вентральная система (уровень D), которая дозревает и, возможно, отчасти формируется в течение первого полугодия жизни (см. 9.4.2).
Еще один аргумент против моторных теорий развития восприятия связан с наблюдениями за развитием детей с серьезными врожденными аномалиями опорно-двигательного аппарата. При условии полноценной социальной поддержки, их перцептивное и интеллектуальное развитие не обнаруживает никаких выраженных отклонений от нор,мы. По-видимому, невозможность осуществлять собственные движения может быть компенсирована выполнением совместных действий с другими людьми. При такой широкой трактовке можно сохранить представление о том, что перцептивное развитие происходит в русле осуществляемой активности, которая «проявляет» и усиливает существующие задатки, но, правда, тем самым иногда ограничивает их спектр. В главе, посвященной речи (см. 7.1.1), будут рассмотрены данные о восприятии и произнесении фонем. Эти данные свидетельствуют о том, что специфическое языковое окружение ведет к исчезновению первоначально присутствовавшего различения некоторых речевых звуков. Так, столь важные для европейцев различия фонем /р/ и /л/ не являются смыслоразличительными в японском языке. Поэтому взрослые носители этого языка не способны к их дифференциации ни при произнесении, ни при узнавании.
Первые недели и месяцы жизни являются критическим периодом в развитии восприятия, когда формируются его основные нейрофизиологические механизмы. Однако пластичность восприятия сохраняется на годы и десятилетия, о чем свидетельствуют эксперименты на адаптацию к сенсорным искажениям. Обычно в этих экспериментах, начало которым положил в конце 19-го века один из американских учеников Вунд-та Джордж Стрэттон, испытуемые должны были в течение более или менее длительного времени носить специальные очки, или призмы, меняющие отображение видимого окружения на сетчатку. Даже наиболее радикальные из таких искажений, переворачивающие ретинальное изображение на 180°, как правило, сопровождаются восстановлением двигательных координации и практически нормального восприятия через несколько недель после начала ношения призм.
Адаптация к сенсорным искажениям, по-видимому, осуществляется прежде всего в рамках той заднетеменно-премоторной подсистемы восприятия, которая была названа выше «восприятием для действия». Разнообразные исследования этого рода, в том числе с животными, демонстрируют важную роль сенсомоторной активности в возникновении наблюдаемых адаптивных изменений (Held & Hein, 1963). Однако в отличие от опытов с животными, где собственная моторная активность в сочетании с вызывающими ее сенсорными изменениями оказывается необходимым условием адаптации, эксперименты с людьми выявили
еще один возможный подход, ведущий к коррекции сенсорных искажений даже при собственной моторной пассивности испытуемого. Для этого испытуемый, похоже, может использовать речь, управляя своими перемещениями в пространстве при помощи другого человека. В соответствии с данными о раннем онтогенезе мы можем предположить, что не только моторные акты сами по себе, но и в особенности жтенцио-нальные, в том числе речевые действия (см. 7.1.2), выполнение которых может быть поддержано другими лицами, существенны для становления и перестройки перцептивных механизмов42.
Интерес представляют и другие результаты, полученные в исследованиях адаптации к оптическим искажениям. К ним относится, в частности, определенная последовательность наблюдаемых коррекций. Эти «стадии» особенно заметны при значительных искажениях типа инверсии ретинального изображения. Как правило, самые первые признаки положительных изменений возникают при локомоциях и выполнении действий с предметами. Затем постепенно «подтягиваются» особенности феноменального восприятия. При этом учитывается и семантическая информация — свечка, видимая сначала в перевернутом положении, вдруг воспринимается правильно, если ее поджигают и пламя начинает указывать направление «вверх»; точно так же «переворачивается«· чашка, в которую начинают наливать воду, и т.п. (O'Reagan & Noë, 2001). В течение длительного времени после, казалось бы, наступившей адаптации внимательный интроспективный анализ ведет к выводу об инвертированное™ восприятия. Внезапные рецидивы искажений также вполне возможны на этих поздних стадиях адаптации, причем часто они связаны с восприятием фрагментов символьной информации, таких как названия газет, вывески и номера автомобилей. Когда в конце концов искажающие восприятие оптические устройства снимаются, видимое окружение снова начинает казаться дезориентированным, но реадаптация происходит значительно быстрее.
Эти наблюдения привели к ряду работ, направленных на выявление особенностей памяти и научения, лежащих в основе адаптации к сенсорным искажениям. В этих экспериментах испытуемые должны были время от времени снимать искажающие линзы. Продолжительность интервалов с линзами и без оных варьировалась, а прогресс адаптации измерялся с помощью объективных тестов. Основной результат состоял в демонстрации относительной иррелевантности общего времени эксперимента и практического отсутствия забывания — адаптация происходила только при непосредственном сенсомоторном и перцептивном взаимодействии с окружением и при наличии линз, причем каждое новое их надевание продолжало ход адаптации примерно в прерванной ранее точке. Периодически заменяя пару линз, можно было даже добиться двух разнонаправленных адаптации при сохранении третьего, нормального
42. Понятие речевых действий (речевых актов — англ. speech acts) является одним из
центральных для современных философских исследований в области лингвистики и праг
матики Оно будет рассмотрено нами подробнее в главе, посвященной речи и ее механиз
мам (см 7.1.2). В следующей главе мы также остановимся на возможной роли речевых
действий в процессах оперативного контроля выполняемых действий (см. 4.4.2). 253
254
модуса восприятия в одно и то же (макро)время (Welch et al., 1993). Эти данные напоминают результаты, полученные при изучении формирования навыков чтения инвертированного текста (см. 5.1.3) и при анализе узнавания больших массивов сложных зрительных сцен (см. 5.2.1). Они подтверждают предположение о том, что в основе адаптационных эффектов лежат механизмы, отличающиеся от тех, которые известны из традиционных исследований памяти и обучения. Эти различия будут подробно рассмотрены в следующих главах.
Как ни любопытны в целом данные об адаптации к сенсорным искажениям, не менее драматические изменения происходят в процессах нормального развития. Речь идет о формировании и шлифовке, иногда в течение десятилетий, перцептивных компонентов наших знаний и умений. Так, все мы обычно являемся экспертами в области восприятия и узнавания лиц, причем особое умение целостного схватывания выражения лица (его индикатором служит иллюзия Тэтчер — см. 3.3.1) оказывается сравнительно поздним достижением, проявляющимся лишь к началу подросткового возраста. Точно так же значительные изменения претерпевают процессы, включенные в чтение. На поздних этапах развития этого навыка зрительная обработка и обслуживающие ее движения глаз могут обеспечить узнавание слов и даже выделение общего смыслового содержания фразы без детального анализа отдельных букв и их последовательности (см. 7.2.1).
Еще одним ярким примером перцептивного обучения являются скорость и удивительная надежность идентификации опасных ситуаций автомобилистами. Даже в намеренно усложненных условиях одного из описанных выше исследований (см. 3.4.2) опытные водители вовремя замечали свыше 99% опасных событий. Эти и другие, более специальные примеры (распознавание шахматных позиций гроссмейстерами или фотографий тундры геологами) говорят о том, что перцептивное обучение приводит к чрезвычайно быстрому автоматическому выделение осмысленных, целостных признаков и их изменений (см. 4.3.2 и 8.3.3).
Начав с анализа восприятия новорожденных, естественно кончить упоминанием изменений восприятия в старческом возрасте. Исследования показали, что на этом возрастном сегменте наблюдается неожиданный рост корреляции интеллекта, памяти и внимания с простейшими показателями работы сенсорных систем, такими как острота зрения и слуховая чувствительность (Baltes & Lindenberger, 1997). Поскольку эта зависимость является корреляционной, ее объяснение пока остается загадкой. Возможно, она объясняется уменьшением количества ресурсов внимания — этот общий фактор начинает лимитировать успешность решения как перцептивных, так и когнитивных задач (см. 4.2.1). Другое объяснение состоит в том, что ослабленные зрение и слух превращают простейший акт восприятия в сложную когнитивную задачу. Возможно
также, что внешний мир должен во все большей степени использоваться как источник поддержки ослабленным когнитивным механизмам. В частности, ухудшение произвольной памяти может вести ко все более выраженной опоре на воспринимаемое предметное и социальное окружение, выполняющее функцию своеобразной «внешней памяти» (см. 5.4.1 и 9.3.3).
255
4
СОЗНАНИЕ И КОНТРОЛЬ ДЕЙСТВИЯ
τ
Структура главы:
4.1 Селективность восприятия и структурные модели
Определение понятий и ранние модели
Где расположен фильтр?
Зрительное селективное внимание
4.2 «Творческий синтез» как альтернатива
Позитивная трактовка внимания
Внимание как умственное усилие
и ресурсные моделиПроблема интеграции признаков
4.3 Автоматические и контролируемые процессы
Внимание как внутренний контроль
Критерии выделения автоматизмов
Двухуровневые модели, их критика
и альтернативы
4.4. Сознание и внимание в структуре деятельности
Непроизвольное (экзогенное) внимание
Произвольное внимание и контроль действия
Нейрофилософия и нейропсихология сознания
258
Трудно найти понятия, сыгравшие в истории психологии столь важную, но одновременно и столь противоречивую роль, как сознание и внимание. Они находились в центре интересов ранней экспериментальной психологии. «Каждый знает, что такое внимание», — писал У. Джеймс в главе «Внимание» своих «Научных основ психологии». «Характерной особенностью нашей душевной жизни, — продолжает он, — является тот факт, что... только часть полного итога наших впечатлений входит в наш так называемый сознательный опыт, который можно уподобить "ручейку", протекающему по широкому лугу цветов...» (Джеймс, 1902, с. 180). На рубеже 19—20-го веков были выполнены исследования, свидетельствовавшие, в частности, о роли внимания в усилении сенсорных впечатлений. Один из инициаторов этих работ Э.Б. Титченер называл концепцию внимания «жизненным нервом всей системы психологических понятий», добавляя, что по отношению к вниманию нас и будет судить «высший трибунал психологической науки».
Антименталистская волна начала 20-го века резко изменила это отношение. Гештальтпсихологи (вслед за Эдгаром Рубином) подчеркнули, что восприятие предметов и событий определяется прежде всего объективной структурой поля, а не ментальной активностью субъекта. Бихевиористы отвергли сознание и внимание как главные понятия старой, ориентированной на интроспекцию психологии. Итоги подвел в 1962 году Джордж Миллер: «Мы отказались от этих слов несколько десятилетий назад, поскольку ошибочно надеялись, что сможем разработать несколько более точных понятий, которые бы позволили строго количественно и объективно описывать соответствующие психологические процессы» (Miller, 1962, р. 25). Он также делает вывод, что «селективность сознания и ограниченность объема внимания — это разные способы обсуждения одного и того же» (там же, р. 49). С тех пор оба термина стали играть в психологии почти такую же центральную роль, как во времена Вундта и Джеймса. Проблематичным по-прежнему остается тот факт, что, не получив однозначных определений, они используются в десятках ситуаций как объяснительные понятия. Прогресс экспериментальных исследований и все более полный учет нейрофизиологических данных позволили в последние годы демистифицировать сознание и внимание, продемонстрировав разнообразие их форм и многоуровневость лежащих в их основе процессов.
4.1 Селективность восприятия и структурные модели
4.1.1 Определение понятий и ранние модели
За прошедшие с начала когнитивной переориентации исследований десятилетия в психологии и в неиронауках было предложено удивительно большое число различных описаний внимания. В разных контекстах оно описывалось как фильтр, воронка, ворота, процессы выбора, умственное усилие, ресурсы, ориентировка, процессы контроля в кратковременной памяти, конъюнктивное связывание признаков объекта, луч света (луч прожектора), объектив с переменным фокусным расстоянием, состояние «бдительности», процессы подготовки движения, усиление или подавление нейронной активности, ретуширование образа и т.д. Как если бы картина не была уже достаточно размытой и противоречивой, внимание по сегодняшний день часто приравнивается сознанию (ср. приведенную выше цитату из Джорджа Миллера).
Хотя наша задача состоит прежде всего в аналитическом обзоре современных исследований, любое обсуждение быстро становится затруднительным, если центральное понятие, в данном случае «внимание», имеет свыше 15 разных интерпретаций. Удивительная неизбирательность характерна, в частности, для многочисленных учебных руководств по психологии внимания. Это заставляет с самого начала ввести рабочие определения, которые, с одной стороны, не противоречат общепринятому использованию термина в языке («каждый знает, что такое внимание»), а с другой — опираются на достигнутые научные результаты. Последние свидетельствуют о существовании, наряду с относительно модулярными (парачлельными, или горизонтальными) способностями, вертикального измерения познавательных процессов, а именно целого ряда иерархически организованных эволюционных механизмов, связанных с различными областями мозга (см. 3.4.2, 5.3.4 и 8.4.3).
С этой точки зрения, до сих пор нет альтернативы предложению H.A. Бернштейна (1947) считать сознание содержанием работы ведущего в данный момент уровня (см. 4.4.3 и 8.4.3). В категориях сознания, в частности, формулируются цели наших произвольных действий и оцениваются их результаты. Только в контексте оперативного достижения целей, то есть в контексте выполнения действий, имеет смысл говорить о внимании. Но внимание связано со всем набором контрольных операций, включающим в общем случае и несколько «этажей» фоновых, или подсобных, уровней с их специализированными механизмами. Именно поэтому для феноменов внимания столь типичны межуровне-вые взаимодействия. Когда сознательная цель одна, а делать мы начинаем нечто совсем другое, то виним в этом рассеянность, то есть недостаток внимания (хотя «виновата» может быть и мотивация). Таким образом, внимание — это координационная структура процессов оперативного достижения цели (Величковский, 19826). Если искать среди 259
понятий научной психологии родственные термины, то ближайшим аналогом внимания является не сознание, а мотивация, выполняющая по отношению к деятельности (то есть стратегически, а не оперативно) ту же стимулирующую и контролирующую роль, которую внимание выполняет по отношению к действию1.
При таком понимании различие сознания и внимания становится очевидным. Возникнув в контексте прикладных работ по «человеческому фактору», когнитивная психология до сих пор явно преувеличивает вездесущность задач. В повседневной жизни сознание может отражать различные состояния человека, совсем не обязательно постоянно «озадаченного» достижением каких-либо целей2. Далее, категории цели и задачи шире понятия произвольных (принятых или самостоятельно поставленных) целей/задач. Поэтому предполагаемая связь внимания с сознанием явным образом нарушается в ситуациях непроизвольного внимания, когда развертывание активности начинает контролироваться внешними факторами. Примером такого внешнего контроля могут быть действия, выполняемые под внешним социальным контролем или же возникающие в результате неожиданных событий. Так, мы с задержкой осознаем, что успели вполне целенаправленно взобраться на дерево, под которым бегает медведь (один из любимых примеров Уильяма Джеймса), или как раз резко затормозили в ответ на внезапное появление собаки на проезжей части дороги (см. 7.4.1).
Внимание не синонимично сознанию, и при контроле произвольных действий, в частности, оно может значительно опережать осознание ситуации в случае хорошо отлаженных, координированных форм активности. Так, например, при чтении зрительное внимание, как это видно из регистрации движений глаз, значительно забегает вперед по отношению к субъективно читаемому месту (см. 7.2.3).
На наш взгляд, существенное значение имеет еще один, социально-психологический или даже «социобиокультурный» аргумент. Сознание неделимо, но внимание вполне может быть распределено между
1 Для обозначения функциональной структуры, обеспечивающей мотивацию ситуа
тивного действия, Куртом Левином был предложен термин «квазипотребность». Этот тер
мин и есть лучшая характеристика внимания, которой, с точки зрения современных тре
бований к теориям в когнитивной науке, не хватало бы только детального перечня ней
рофизиологических механизмов, с помощью которых соответствующая квазипотребность
может быть «реализована».
2 Всякое осознание и вообще бодрствование связаны хотя бы с минимальным мони
торингом внешней и внутренней среды (см. 4.4.1). Как мы отмечали, исследования по
мозговому картированию предполагают регистрацию нейрофизиологической активнос
ти в условиях выполнения задачи и при покое. Чтобы определить структуры, ответствен
ные за решение задачи, из первой картины вычитается вторая (см. 2.4.2). В последнее
время возникли обоснованные сомнения в том, что при внешней неподвижности и фор
мальном отсутствии задачи можно говорить о нейропсихологическом покое. Интроспек
тивная активность в форме потока привычных мыслей особенно интерферирует с рабо-
260 тои фронтополярных структур мозга.
несколькими людьми. Развитие речи, произвольного контроля и рефлексивного мышления зависит, как впервые проницательно отметил Л.С. Выготский, от социализации внимания и возникновения в процессах коммуникации особых состояний, которые в современной психологической литературе называются совместным вниманием — joint attention (Tomasello, 2000; Velichkovsky, 1995). На самом деле, это означает, что другой человек с его специфическими умениями, знаниями и прочими «ресурсами» включается в координационные структуры действий ребенка (или взрослого, участвующего в выполнении совместной активности).
Эти общие соображения подтверждаются последними нейрофизиологическими исследованиями. Дело в том, что высшие мозговые механизмы внимания локализованы, согласно современным представлениям, в передних отделах поясной извилины, в непосредственной близости от медианных структур префронтальной коры (см. 4.3.3). Как и полагается контрольно-координационной инстанции, передние отделы поясной извилины оказались очень чувствительны к отклонениям в протекании действия, особенно к допускаемым испытуемым ошибкам3. Замечательным является то обстоятельство, что таким же образом эти структуры реагируют и на ошибки... другого человека, выполнявшего то же самое действие вместе или просто рядом с испытуемым (van Schie et al., 2004). Идея совместного внимания, возникшая в контексте психологии развития, оказывается, таким образом, чрезвычайно полезной для понимания принципов работы социального мозга. Кроме того, примечательна сама локализация этих механизмов. Передняя поясная извилина, как отмечалось, примыкает к орбитофронтальным и вентроме-дианным отделам префронтальной коры, участвующим в процессах саморегуляции и мотивационного обеспечения деятельности (см. 4.4.2 и 9.4.3). Эта близость подтверждает наше предположение о филогенетическом родстве внимания и мотивации.
Обратимся, однако, к последовательному рассмотрению новой и новейшей истории вопроса. Первым признаком возвращения проблемы внимания, а затем и сознания в экспериментальную психологию стала работа английского психолога Дональда Бродбента «Восприятие и коммуникация» (Broadbent, 1958). В этой книге он сравнивает функционирование внимания с работой электромеханического устройства — фильтра, осуществляющего отбор информации и предохраняющего, таким образом, канал передачи информации с ограниченной пропускной способностью от перегрузки (см. 2.1.3). Используя результаты сво- · их экспериментов по группировке материала при воспроизведении на
3 Впервые предположение о существовании специальных мозговых механизмов де
текции ошибок было экспериментально обосновано в исследованиях известного русско
го нейрофизиолога Н.П. Бехтеревой, которая ввела понятие «детектор ошибки». 261
семантический анализ
фильтр
основе сенсорных характеристик, а также данные К. Черри, показавшего, что избирательная настройка на восприятие одного из нескольких одновременно присутствующих речевых сообщений облегчается, если между ними есть физические различия, Бродбент выдвинул идею ранней селекции. В предложенной им модели информация для когнитивной обработки и подготовки ответа отбирается на основе простых сенсорных признаков фильтром, работающим по принципу «все или ничего» (см. рис. 4.1А). Вопрос о том, где расположен фильтр, надолго стал центральной темой исследований внимания в когнитивной психологии.
Альтернативные взгляды были связаны с подчеркиванием роли семантики в управлении процессами отбора информации. Основания для такого развития были связаны с результатами ряда работ. Англо-канадский автор Невилл Морей в условиях дихотического эксперимента просил своих испытуемых отслеживать и тут же повторять вслух те слова, которые предъявлялись по релевантному каналу (например, на правое ухо)4. Хотя испытуемый мог не замечать, что некоторое слово повторяется по иррелевантному (игнорируемому) каналу до 35 раз, он обычно сразу же замечал, если произносится его имя. В дальнейшем Морей противопоставил теории ранней селекции — селекции стимула — представление о более поздней, основанной на учете семантики селекции ответа (см. 4.1.2).
262
4 Ранние исследования внимания были преимущественно посвящены анализу слухового внимания, что было связано с практической задачей улучшения радиокоммуникации. В типичной для этих исследований методике дихотического предъявления информация независимо подавалась через наушники на левое и на правое ухо. Подобная «двух-канальность» слуха повлияла на выбор технической терминологии при описании внимания (Kahneman, 1973). При переходе к изучению зрительного внимания использование представления о каналах и фильтрах стало более затруднительным.
Для теоретических дискуссий 1960—70-х годов особое значение имели, несомненно, эксперименты ученицы Бродбента Энн Трисман, в которых она также установила, что селекция может осуществляться не только на основе сенсорных признаков, но и по семантическим характеристикам. Если, например, испытуемому в задаче селективного слушания предъявляется для повторения некоторый известный и семантически связанный текст, то переключение продолжения текста на другой канал может в первый момент не замечаться испытуемым, продолжающим «вторить» текст уже по иррелевантному каналу. Поскольку выделение значения возможно лишь на относительно поздних этапах обработки, эти результаты открывали возможность ревизии модели Бродбента в двух отношениях. Во-первых, можно было предположить, что степень фильтрации подвержена градуальному контролю (рис. 4.1 Б). Во-вторых, можно было радикально изменить эту модель, предположив, что вся поступающая информация параллельно обрабатывается и опознается, после чего выделенная информация сохраняется в памяти, а ирреле-вантная очень быстро забывается (рис. 4.1В).
Первая, компромиссная модификация модели ранней селекции была предложена Трисман. В ней сохранялась мысль о различиях в обработке выделяемых вниманием и игнорируемых стимулов уже на самых ранних этапах, предшествующих сознательной идентификации. В терминах теории обнаружения сигнала (см. 2.1.2) это должно было бы вести к уменьшению чувствительности (d') по отношению к игнорируемой информации и увеличению по отношению к сообщениям по релевантному каналу. Кроме того, изменение направления внимания должно было сопровождаться сдвигом положения критерия выбора ответа (β). Предполагалось, что семантические факторы меняют состояние активации гипотетических центральных «словарных единиц» памяти, которое оказывает обратное влияние на селективные свойства фильтра, ужесточая или ослабляя критерии пропуска сигналов по отдельным каналам. В этой модели, следовательно, фильтр никогда не блокирует полностью сенсорную информацию, а лишь ослабляет или усиливает ее.
В своей последующей книге «Принятие решения и стресс» Д. Брод-бент (Broadbent, 1971) полностью согласился с данной коррекцией модели фильтра. В новом варианте его теории ограничение потока перерабатываемой информации может происходить на двух различных уровнях. Периферический фильтр осуществляет градуальную — в большей или меньшей степени — селекцию по стимульным характеристикам. Кроме того, вводится представление о центральном фильтре, который производит выбор между различными активированными участками памяти. Работа этого центрального фильтра приводит к эффектам отбора по категориальным, семантическим признакам, которые и играют ведущую роль в организации ответных реакций.
263
ι ι
Двум описанным вариантам модели фильтра противопоставляют модели поздней селекции. Одна из первых моделей такого рода была предложена в конце 1960-х годов Дональдом Норманом, который в свою очередь использовал и развил более ранние идеи своих калифорнийских коллег Энтони и Дианы Дойч. Как и Трисман, все эти авторы исходят из существования центральных структур памяти, активация которых служит механизмом опознания. Селекция, приводящая к переходу от параллельной к последовательной обработке, считается поздним процессом, осуществляемым после того, как все знакомые стимулы были опознаны, то есть успели в той или иной степени проконтактиро-вать со структурами памяти. Суммарная активация этих единиц памяти определяется, по мнению Нормана, также одним, центральным потоком информации. Этот генерируемый центрально поток связан с антиципируемыми характеристиками значимости и актуальности данного сообщения. Именно он приводит к специфическим проявлениям внимания, которые в данной модели сдвигают критерии (β) активации структур памяти, но не меняют показатели их чувствительности (сГ). В каждый момент времени единица памяти с максимальным уровнем активации доминирует над восприятием, сознанием и памятью.
На первый взгляд, гипотеза о возможности семантической обработки и опознания всей поступающей информации кажется, по меньшей мере, странной. Однако близкие представления защищаются сегодня целым рядом авторов. Более того, представления о параллельной активации структур семантической памяти стали особенно популярны в последнее десятилетие — большинство современных коннекционист-ских моделей восприятия и опознания постулирует нечто подобное (см. 2.3.3). При этом иногда крайне трудно провести классификацию моделей на два или три рассматриваемых класса теорий фильтрации. Так, по мнению видного голландского психолога Александра ван дер Хайдена (например, van der Heijden, 2004), селекция в целом имеет поздний, посткатегориальный характер, но в силу существования обратных связей, ведущих к ранним нейрофизиологическим этапам восприятия, приводит, кроме всего прочего, и к усилению сенсорных впечатлений. При таком разнообразии мнений полезнее всего обратиться к углубленному анализу существующих экспериментальных данных.
4.1.2 Где расположен фильтр?
В пользу ранней селекции говорят факты относительной легкости отбора информации по физическим, сенсорным признакам. С помощью моделей поздней селекции, в лучшем случае, можно было бы предсказать равную эффективность селекции по физическим и семантическим признакам. Примером конкретных эмпирических результатов могут 264
служить данные, полученные с помощью методики частичного отчета Сперлинга. Эта методика подробно обсуждалась нами выше в связи с анализом представлений о существовании очень короткой сенсорной (иконической и эхоической) памяти (см. 3.2.1 и 3.2.2). Особое место среди сенсорно-перцептивных признаков, используемых для успешной селекции, занимает пространственное положение, хотя эффективными могут быть и другие признаки, например тембр голоса или, в зрительной модальности, цвет (причем, в первую очередь, не столько собственно хроматические, сколько светлотные особенности цвета — см. 3.1.3).
Точно так же, как представление о «сенсорных регистрах» в целом, споры вызывает тезис о предкатегориальности отбора информации в методике частичного отчета. Один из контраргументов (он был выдвинут канадским психологом П. Мериклом) состоит в следующем. Когда послеинструкция в методике частичного отчета упоминает пространственное положение, то стимулы для воспроизведения сразу оказываются компактно сгруппированными. Если упоминается семантическая категория, то стимулы для воспроизведения нужно еще найти и сгруппировать, так как они пространственно перемешаны с иррелевантной информацией. Если подобные соображения учитываются при планировании эксперимента, то действительно удается показать, что эффективный отбор фрагментов предъявленной на короткое время информации возможен и на основании семантических критериев, например категории букв. Такой отбор, однако, обычно не достигает эффективности селекции по сенсорным признакам и поэтому вполне совместим с компромиссной моделью градуальной сенсорной селекции (рис. 4.1 Б). Фактором, способствующим селективному восприятию и воспроизведению на основе пространственной послеинструкции, является более быстрая обработка информации о локализации, чем об идентичности символов (см. 3.2.3). С учетом всех этих обстоятельств, данные экспериментов по методике частичного отчета не позволяют однозначно отвергнуть модель поздней селекции.
Самым сильным аргументом в пользу гипотезы раннего положения фильтра являются некоторые нейрофизиологические данные, свидетельствующие о том, что селективное внимание усиливает слуховые вызванные потенциалы мозга уже через 40—60 мс после предъявления сенсорной информации (см. рис. 4.2). Аналогичные факты получены и при исследовании зрения, где модулирующее обработку влияние пространственного внимания начинает сказываться через 80—90 мс (Hillyard & Anllo-Vento, 1998). Столь ранние проявления внимания могли бы говорить о том, что кортикальная обработка сенсорной информации с самого начала модулируется вниманием. Этот результат, однако, релятивизируется в последних работах, где самые быстрые эффекты внимания зафиксированы лишь на уровне областей V3 и V4, причем установлена особая роль пространственной селекции, примерно на 100 мс опережающей эффекты отбора по другим сенсорно-перцептивным 265
в фокусе внимания ERP's
вне фокуса внимания
О 100 200 300
мсек.
Рис. 4.2. Типичная картина изменений слуховых вызванных потенциалов мозга (ERP's -event related potentials) при настройке на пространственное положение стимула.
266
признакам (Hillyard, Russo & Martines, 2004). Без учета фактора латентного времени, эффекты селективного внимания действительно обнаружены сегодня в самых разных структурах мозга, практически на всех уровнях нейрофизиологической обработки, включая VI и субкортикальные структуры латерального коленчатого тела (Kastner, 2004). Таким образом, нейрофизиологические данные оставляют открытым вопрос о возможности переменной селекции и допускают селекцию на нескольких уровнях переработки информации.
В пользу раннего положения фильтра приводятся результаты ряда психологических исследований селективного внимания с одновременным отслеживанием критических событий по иррелевантному каналу. Н. Морей и Т. О'Брайен (например, Moray, 1970) дихотически предъявляли испытуемым буквы и цифры. Испытуемые должны были стараться синхронно повторять то, что поступало, например, по правому «каналу». Одновременно они должны были также нажимать на ключ всякий раз, когда справа или слева звучала буква. Анализ данных с помощью теории обнаружения сигнала показал, что селективное внимание меняет не только критерий (β), но и чувствительность (<Г) обнаружения. Этот результат соответствует предсказаниям модифицированной модели ранней селекции, предложенной Трисман.
Однако впоследствии Морей изменил свою точку зрения, превратившись в критика ранней селекции. Дело в том, что если в дихотичес-ких условиях испытуемые должны просто отмечать (без синхронного повторения и навязываемой им настройки на определенный сенсорный канал) появление одного из критических сигналов, то эта задача решается вполне успешно — до тех пор пока два критических сигнала не возникают одновременно слева и справа. В этом случае испытуемые заме-
чают только один из них. Этот эффект нельзя объяснить усилием, затрачиваемым на идентификацию, поскольку точно такое же влияние имеют и ошибки «ложных тревог». Поэтому Морей объясняет его интерференцией, связанной с выбором ответа. Важным следствием такого объяснения является новая интерпретация результатов классических экспериментов по дихотическому слушанию, проводившихся с использованием синхронного повторения. Это повторение (или «вторение») означает, что испытуемый должен постоянно принимать решения, связанные с выбором ответа, что и приводит к подавлению восприятия информации по другому, иррелевантному каналу. Пикантность ситуации состоит в том, что эффект выбора ответа — это пример поздней селекции, но он может объяснить результаты, послужившие основой для моделей ранней селекции.
Интересно, что в зрительном восприятии есть довольно полный аналог эффекта выбора ответа, обнаруженного Мореем. Этот феномен, называемый эффектом «моргания внимания», возникает при быстром последовательном предъявлении зрительной информации (обычно буквенно-цифровой, но иногда и изображений объектов) на одном и том же месте дисплея. Испытуемые должны регистрировать появление любого из двух целевых стимулов, включенных в последовательность дистракторов. Если вслед за первым целевым стимулом (Т1), который обычно легко идентифицируется, внутри временного интервала асин-хронностей включения порядка 200—600 мс следует второй (Т2), то вероятность его идентификации резко снижается. Данный интервал является слишком большим, чтобы можно было объяснить этот эффект сенсорно-перцептивной интерференцией типа периферической зрительной маскировки (см. 3.1.3). Кроме того, Т2 вполне может быть идентифицирован, если испытуемому просто предлагается игнорировать Т1. Регистрация вызванных потенциалов мозга показывает далее, что Т2 инициирует практически нормальный электрофизиологический ответ, включая поздние компоненты вызванного потенциала в области свыше 250 мс (компонент РЗ может быть, впрочем, несколько отсрочен). Все это заставляет считать «моргание внимания» проявлением процессов поздней, постперцептивной селекции, связанной с выбором ответа по отношению к Т15.
Против ранней селекции часто приводятся данные о возможности полного распределения внимания. Так, согласно результатам наблюдений, пианисты высшей квалификации могут, не делая ошибок, играть с
5 Надо сказать, что ситуация быстрого последовательного предъявления символов на
одном и том же месте (RSVP — rapid serial visual presentation) не очень типична для функ
ционирования зрения в нормальных условиях и сопровождается разнообразными маски
ровочными эффектами. Некоторые из них (например маскировка, вызываемая стимула
ми с выраженным аффективным содержанием — свастика, череп и т.д.) имеют преиму
щественно постперцептивный характер. 267
листа незнакомое им произведение и одновременно повторять вслух зачитываемый им текст. Распределение внимания объясняется в моделях ранней селекции предположением о быстром переключении фильтра с одного канала на другой и о сохранении слабой «струи» информации по иррелевантному каналу (модель переменной селекции). Скорость переключения оценивается в дихотических условиях с помощью предъявления фрагментов сообщения попеременно на левое и правое ухо. РеЗкое ухудшение понимания наступает, когда размеры таких фрагментов становятся меньше 300 мс. Этот результат, правда, можно объяснить не ди-хотическим режимом предъявления, а нарушением целостности сообщения и маскировкой. Следует отметить также, что факты успешного распределения внимания относятся к разделению между модальностями, тогда как понятие фильтра обычно используется по отношению к процессам внутри одной слуховой модальности6.
Еще одна группа фактов, используемая как аргумент против модели ранней селекции, связана с возможностью семантической обработки информации, поступающей по игнорированному каналу. Некоторые эксперименты с дихотическим слушанием показали, что наличие ассоциативной связи между словами, предъявляемыми по иррелевантному каналу и повторяемыми в тот же момент по релевантному, влияет на скорость повторения. В ряде исследований (например, в работе финских авторов, И.ф. Вригта с сотрудниками — von Wright, Anderson & Stenman, 1975) было установлено, что слова, которые сочетались ранее с ударами электрического тока, а также слова одной с ними семантической категории вызывают повышенную кожно-гальваническую реакцию, когда они предъявляются по иррелевантному каналу и, судя по всему, не осознаются испытуемыми. Надежность этих данных, однако, была сразу же поставлена под сомнение по методическим соображениям, но перепроверка, похоже, подтвердила правомерность основных выводов.
Складывается впечатление, что эффекты глубокой обработки при наличии внимания и в его отсутствие качественно не равнозначны. Например, Д.Дж. Маккай (MacKay, 1973) предъявлял испытуемым в дихотических условиях по релевантному каналу предложения, неопределенные либо в отношении отдельных лексических единиц (типа русских слов «коса» и «ключ»), либо в отношении глубинной синтаксической структуры (типа предложения «Мужу изменять нельзя»). Оказалось, что
6 При возникновении конфликтов между модальностями они обычно решаются в пользу зрения. Доминирование зрения видно из исследований, в которых использовалась способность некоторых людей к чревовещанию. При этом видимая, хотя и иллюзорная локализация источника звука оказывала существенное влияние на характер его обработки. Как можно судить по вызванным потенциалам и по времени реакции, слуховая обработка примерно на 40 мс быстрее зрительной. Это означает, что при разговоре на дистанции 1,5—2 м мы, с точки зрения сенсорной обработки, несколько раньше «слышим» речь нашего собеседника, чем «видим» движения его губ. Тем не менее и здесь на-268 блюдаются мошные зрительные эффекты, влияющие на восприятие фонем (см. 7.1.1).
слова, предъявлявшиеся на другое ухо, влияют на понимание многозначных слов, но не снимают синтаксическую неопределенность. В ряде других работ латентность повторения слов по релевантному каналу уменьшалась под влиянием семантического контекста независимо от того, предъявлялся ли он по тому же или по иррелевантному каналу. Однако увеличение объема контекста при переходе от отдельных существительных к целым предложениям не имело никакого дополнительного эффекта в случае иррелевантного канала, хотя и вело к дальнейшему ускорению повторения при предъявлении по релевантному каналу. Эти различия лексико-семантических и синтаксических эффектов обычно неосознаваемой иррелевантной информации никак не следуют из традиционных структурных моделей фильтрации, требуя их дополнения.
Вопрос о возможности семантической обработки иррелевантной информации был проанализирован с использованием нейрофизиологических показателей (Bentin, Kutas & Hillyard, 1995). Испытуемым дихо-тически предъявлялись две последовательности слов, одну из которых они должны были вслух повторять. Между некоторыми словами существовала выраженная семантическая связь. Авторы попытались выяснить, насколько эти связи влияют, во-первых, на поздние, чувствительные к семантике компоненты вызванных потенциалов (а именно пик N4) и, во-вторых, на узнавание слов в тесте на память. Оказалось, что семантические ассоциации влияют на вызванные потенциалы и узнавание только тогда, когда слово подвергалось внимательной обработке. Можно было бы сделать вывод, что без обращения внимания семантическая обработка невозможна, и, тем самым, вернуться к модели ранней селекции. Но этот вывод был бы преждевременным. Наряду с прямым (или эксплицитным) тестом памяти, авторы использовали также непрямой (имплицитный — см. 5.1.3), в качестве которого была взята задача лексического решения1. Скорость лексического решения («слово» — «неслово») увеличивалась, если тестовое слово предъявлялось ранее в дихо-тических условиях. Такое ускорение имело место даже тогда, когда слово предъявлялось по иррелевантному каналу и не воспринималось испытуемым.
Методика синхронного повторения ведет, в силу постоянной селекции ответа (как, в частности, показал Невилл Морей), к серьезной центральной интерференции с обработкой иррелевантной информации. Тем значимее являются полученные данные о существовании имплицитных эффектов семантической активации. Эти эффекты примерно соответствуют тому, что можно было бы ожидать от процессов переменной селекции. Таким образом, в сочетании с физиологическими данными прове-
7 В этой задаче испытуемый должен быстро ответить, является ли показанный набор
букв словом или нет. Задача рассматривается как простейший тест на семантическую па
мять и широко используется при анализе неосознаваемых, автоматических влияний на
восприятие и понимание (см. 4.3.2). 269
денный анализ скорее подтверждает компромиссную модель Трисман. Если, конечно, вообще придерживаться представления о фильтре.
Дело в том, что иногда модели фильтра оказываются явно неадекватными. Так, целый ряд парадоксальных с точки зрения представления о фильтрации феноменов обнаружила в условиях дихотического предъявления информации Диана Дойч (Deutsch & Roll, 1976; Deutsch, 2004). Простейший из них состоит в том, что при дихотическом предъявлении со сдвигом на один звук чередующихся высоких и низких тонов испытуемые (правши) обычно слышат слева низкие звуки, а справа — высокие (рис. 4.3). Иными словами, воспринимаются изменения высоты тона и локализации. Это наблюдение противоречит представлению о фильтре, переключающем слуховое восприятие с одного уха на другое или остающемся настроенным лишь на один из этих каналов. В самом деле, фильтр, переключающийся в такт со стимулами, должен был бы менять только воспринимаемую локализацию звуков. Если бы фильтр был жестко настроен на один из каналов, менялась бы высота, но не локализация!
Как объяснить этот неожиданный эффект? Объяснение состоит в хорошо известном, подтверждаемом также нейрофизиологическими исследованиями слуха разделении перцептивной обработки на две, частично автономные группы механизмов — процессы пространственной локализации и идентификации (они были отнесены нами выше к разным уровням когнитивной организации и контроля поведения, С и D — см. 3.4.2). Эти две группы механизмов опираются на различные сенсорные признаки акустических событий: локализация в пространстве (вопрос «где?») определяется местоположением более высокочастотного сигна-
левое правое
левое правое
270
Рис. 4.3. Иллюзорные эффекты, возникающие при дихотическом предъявлении звуковых тонов (по: Deutsch, 2004): А. Последовательность физических стимулов, Гц; Б. Феноменальное восприятие.
ла, тогда как восприятие идентичности (вопрос «что?») — характером сигнала, который первым достигает доминантного, левого полушария (и, следовательно, предъявляется на правое ухо). Нам представляется, что этот пример чрезвычайно полезен в качестве иллюстрации того, насколько осторожно нужно обращаться с вниманием как с объяснительным понятием, если не рисковать вновь превратить его в своего рода психологический «флогистон». Внимание не заменяет сформировавшиеся в ходе эволюции и индивидуального развития нейрофизиологические механизмы, а лишь координирует их работу.
4.1.3 Зрительное селективное внимание
Рис. 4.4. Автопортрет «изнутри» — зарисовка зрительного поля, сделанная Эрнстом Махом (1885/1907). 271
Феноменально (как говорили гештальтпсихологи, наивно и некритически), открывая глаза, мы всякий раз видим безграничное, наполненное светом и цветом предметное окружение. Интроспективно (то есть при известной критической установке) мы осознаем, что это впечатление иллюзорно. Наше поле зрения очевидным образом ограничено, а сетчатка глаза неоднородна. Ее центральная, наиболее насыщенная рецепторами часть, фовеа, имеет размер порядка 2°, что чуть больше углового размера ногтя большого пальца вытянутой руки. Эрнст Мах («Анализ ощущений», 1885/1907) попытался передать эти ограничения с помощью знаменитого рисунка зрительного поля (рис. 4.4). Но при длитель-
ном наблюдении и попытках зарисовки объектов удержать глаза на одной точке невозможно. Чтобы исключить движения глаз, Гельмгольц ввел методику очень быстрого, порядка нескольких миллисекунд, освещения сцены. Это привело к дополнительному сужению восприятия — детальное зрение было возможно лишь в узкой центральной области, окруженной все более размытой периферией. Важным открытием было то, что эта область могла произвольно сдвигаться по отношению к анатомической фовеа: перед предъявлением можно было подготовиться к детальному восприятию и лучше увидеть объекты в стороне от точки фиксации, но за счет ухудшения восприятия на других местах.
С тех пор использование метафоры ясного центра и размытой периферии стало одинаково типичным для нескольких поколений исследователей зрительного внимания, от Вундта и Фрейда до современных авторов. Интересно, что понятие фильтра практически не используется в этих исследованиях8. Чаще всего зрительное внимание сравнивается с лучом фонаря, иногда снабженного объективом с переменным фокусным расстоянием: если пятно света оказывается шире, то детали видны менее ясно, если уже, то более четко — они как бы находятся тогда «в фокусе» феноменального сознания. Мы рассмотрим эксперименты, вытекающие из подобной трактовки внимания, несколько позднее, остановившись вначале на работах, продолжающих, на материале зрения, выяснение отношений ранней и поздней селекции.
По сегодняшний день важным приемом определения объема и характера воспринимаемой зрительной информации является кратковременное предъявление. Классический вопрос, возникающий в связи с подобными, тахистоскопическими экспериментами состоит в том, что же на самом деле увидел (идентифицировал) испытуемый и что смог потом сообщить. Для уменьшения роли собственно ответа Сперлинг предложил методику частичного отчета, результаты применения которой подробно обсуждались нами выше, в связи с понятием иконической памяти (см. 3.2.1 и 4.1.2). Связанное с этим понятием представление о возможности идентификации «всех или почти всех» элементов предъявляемых на доли секунды многоэлементных матриц вызывает серьезные сомнения. Согласно данным современных экспериментов по восприятию и кратковременному удержанию зрительных конфигураций, типа наборов буквенно-цифровых матриц или бессмысленных форм, мы способны воспринять меньше информации (от 1 до 4 элементов) и на более короткое время, чем думал Сперлинг. Возможно, впрочем, что эта
8 В обширной технической и нейрофизиологической литературе, посвященной зрению и его моделированию, используются понятия «фильтр» и «ворота», так что на первый взгляд может показаться, что аналогия с исследованиями слуха может быть более полной. Но эти термины имеют иное значение, связанное с цифровой обработкой изоб-272 ражений, например, выделением спектра их пространственных частот (см. 3.1.1).
информация перерабатывается глубже, например, вплоть до выделения различной категориальной принадлежности букв и цифр (см. 3.3.3).
Споры о доступности семантической информации, как основы для процессов селекции, продолжаются и в других областях изучения зрительного восприятия. Довольно противоречивыми оказываются данные о зрительном восприятии вербального материала. В экспериментах по зрительной маскировке А. Олпорт (Allport, 1977) определял асинхрон-ность включения маскирующего стимула, позволяющую воспроизводить два или, скажем, четыре коротких слова. Темп обработки — число слов, воспроизводимых при данной асинхронности, — оказался зависящим не от количества букв или слогов, а от общей частотности соответствующих слов в языке. Это означает, что отбор материала для осознания и воспроизведения может осуществляться уже после «контакта» с семантической памятью (точнее, внутренним лексиконом — см. 7.2.2). Этим и аналогичным результатам, полученным при маскировке слов (см. 4.3.3), противостоят данные по семантическим эффектам при чтении. В частности, одна из популярных сегодня методик анализа чтения состоит в регистрации движений глаз и подмене некоторого слова еще в процессе «полета» глаза в его направлении. Оказалось, что только зрительное и фонологическое, но не семантическое сходство нового слова с подмененным сокращают при прочих равных условиях длительность фиксации. Таким образом, по-видимому, в периферическом зрении, то есть без непосредственной фиксации, обработка слова не достигает уровня семантического анализа (Rayner & Sereno, 1994).
Не менее противоречивые результаты получены и с использованием невербального материала. Здесь особое положение занимает сложный, естественный материал типа видовых слайдов и фотографий лиц (см. подробнее 4.3.3 и 5.2.1). Так, Р. Келлог (Kellog, 1980) в тщательно спланированных экспериментах получил данные о том, что испытуемые способны при неожиданном тестировании узнавать фотографии лиц, показывавшихся им во время выполнения в уме сложных арифметических вычислений. По мнению автора, отсутствие внимания не препятствует долговременному запоминанию сложного, предметно организованного зрительного материала. Аналогичные результаты получены и в ряде последующих исследований с видовыми слайдами предметных сцен и ландшафтов, так что сегодня вывод об успешной и чрезвычайно быстрой обработке сложных осмысленных изображений в условиях неполного внимания не вызывает особых сомнений. Более того, отвлечение внимания может даже способствовать имплицитной обработке, особенно в случае эмоциогенных стимулов
Другие данные, однако, свидетельствуют о том, что уже восприятие особенностей формы объектов оказывается нарушенным при отвлечении внимания. Соответствующий феномен получил название слепоты невнимания. Ариен Мэк и Ирвин Рок (Mack & Rock, 1998) обобщили результаты большого числа экспериментов, где специально создавались условия, при которых испытуемые смотрели на фигуру, но не обращали на нее внимание (рис. 4.5). Следствием отвлечения внимания было практически полное отсутствие запоминания, а по мнению авторов, и 273
Рис. 4.5. Типичные объекты из экспериментов на «слепоту невнимания» работа с одной из двух отличающихся цветом фигур ведет к тому, что последующее узнавание другой фигуры оказывается невозможным
274
восприятия особенностей формы В непосредственно следовавших тестах на узнавание испытуемые сообщали, что видят эти фигуры в первый раз. Данный результат в целом подтверждает жесткий вариант модели ранней селекции. Поэтому были предприняты попытки перепроверить результаты исследований слепоты невнимания Трисман некоторое время назад повторила эти опыты и полагает, что обнаружила в непрямых тестах на запоминание небольшие эффекты имплицитного запоминания (см 5.1.1), свидетельствующие о том, что обработка общих особенностей формы игнорировавшихся абстрактных конфигураций все-таки имела место Иными словами, невнимание, как и в дихотических экспериментах, резко ослабляет, но не прерывает полностью процессы, ведущие к идентификации.
Подводя итоги обсуждению вопроса об уровне селекции, можно сказать, что ответ зависит от характера задачи и, конечно же, от воспринимаемого материала. Эффекты поздней, семантической селекции возможны лишь тогда, когда сам материал допускает осмысленную интерпретацию. Иными словами, эти эффекты скорее можно ожидать в случае слов и предметных сцен, чем в случае абстрактных форм и спер-линговских буквенно-цифровых матриц. Присутствие поздней селекции подтверждается анализом вызванных потенциалов и данными микроэлектродного отведения активности нейронов нижней височной борозды (вероятный субстрат зрительной обработки, ответственной за детальное восприятие формы и идентификацию предметов — см. 3.4.2). Активация этих нейронов в ответ на предъявление осмысленной информации в несколько ослабленной степени сохраняется даже при полной анестезии. При таких условиях ни о сознании, ни о внимании — в традиционной, основанной на интроспекции трактовке этих понятий — не может быть и речи. Мы вернемся к обсуждению вопроса о глубине автоматической обработки информации при непроизвольном внимании в последнем разделе главы (см. 4.4.1).
Если сравнивать внимание с лучом фонаря или проектора, то что можно сказать о движении этого пятна света? Перемещается ли оно от точки А к точке В зрительного поля градуально, так что в процессе движения происходит последовательное улучшение обработки информации в промежуточной зоне, либо скачком, как это сделал бы глаз? Далее, движется ли оно в двумерном отображении окружения, подобном ретинальному изображению, или же, скорее, в воспринимаемой трехмерной модели пространства? Наконец, имеет ли зрительное внимание фиксированную или переменную зону охвата, с соответствующим изменением возможности обработки (оптического разрешения) деталей? Каждый из этих вопросов вызвал к жизни десятки исследований, в которых с помощью различных методических ухищрений было показано, что перемещение фокуса зрительного внимания, безусловно, должно интерпретироваться как движение в трехмерном пространстве (Hoffman, 1999)9.
В ряде специальных, в том числе нейрофизиологических работ было также показано, что сдвиги фокальной зоны зрительного внимания тесно связаны с программированием движении глаз в соответствующую часть зрительного окружения Как впервые продемонстрировал Гельм-гольц в упоминавшихся опытах (и как каждому известно из повседневных наблюдений), в условиях продолжительной зрительной фиксации объекта или группы объектов мы можем внимательно отслеживать события, находящиеся несколько в стороне от направления нашего взора При свободном зрительном обследовании окружения связь внимания и движений глаз, однако, становится более прочной. В частности, мы не можем обратить внимание на один обьект и одновременно совершить произвольный саккадический скачок к другому — попытка сделать нечто подобное ведет к выраженному ухудшению выполнения, по крайней мере, одной из этих задач. К аналогичным выводам приводит анализ нейропсихологических синдромов поражения теменных и премоторных зон коры (таких как синдром Балинта и оптическая атаксия — см. 3.4.2), которые одновременно нарушают саккадические движения глаз, целевые движения рук и способность пациента обратить внимание на целевой объект в его окружении
Обобщив эти факты, итальянский нейропсихолог Дж. Риццолатти и его коллеги (например. Rizzolatti & Craighero. 1998) выдвинули премо-торную теорию зрительного внимания, в которой зрительное внимание и программирование целенаправленных движений рук и глаз рассматриваются как один и то же процесс. Эта теория вызывает два уточняющих замечания Во-первых, зрительное внимание не исчерпывается только его пространственными компонентами, включая настройку на форму предметов и на их семантику, по отношению к которым премоторная
9 К сожалению, несмотря на множество экспериментов, данные о способе движения
фокуса зрительного внимания — градуально или скачком — до сих пор неоднозначны
Возможно, это связано с качественной неоднородностью задач на внимание, лишь отно
сительно небольшая часть которых имеет действительно строго пространственный ха
рактер 275
интерпретация становится затруднительной (см. 7.4.3). Во-вторых, связь пространственного внимания с движениями глаз кажется более непосредственной и систематичной, чем с движениями рук. Экспериментальные данные подтверждают, что сдвиги внимания действительно могут опережать саккады. Например, при промежуточной фиксации в процессе чтения мы способны значительно лучше замечать внезапные изменения букв в направлении следующего скачка (см. 7.2.3). Если задача предельно проста — при появлении объекта надо быстро перевести взгляд на него с фиксационной точки, то мы считаем, что уже совершили скачок и даже более отчетливо видим целевой предмет за 150—200 мс до того, как глаза действительно начинают двигаться к цели. В случае более сложных, например коммуникативных, задач движения глаз, впрочем, могут начинать опережать наше осознание их местоположения (см. 9.1.3).
Рассмотрим кратко самую последнюю версию оптической метафоры, возникшую в 1980-е годы. Внимание трактуется в этом случае как объектив с переменным фокусным расстоянием, или трансфокатор (zoom lense). Эксперименты подтверждают нашу способность легко настраиваться на восприятие как грубых, так и мелких деталей, но с известными оговорками. Хотя размеры зоны селективного внимания оказались подвижными, более естественным, в соответствии с мнением гештальтпсихологов (см. 1.3.1) и с исследованиями микрогенеза восприятия (см. 3.2.3), было движение от глобального к локальному. Сталкиваясь с новой ситуацией или с новым объектом, мы, как правило, сначала смотрим «широким полем» и лишь затем концентрируем наше внимание на деталях. Отметим одновременно, что эта закономерность меняется под влиянием острых эмоциональных нагрузок и стресса, когда поле зрительного внимания сужается вплоть до возникновения так называемого туннельного зрения, препятствующего восприятию информации в периферии зрения (см. 2.1.2 и 9.4.3). Возможно, здесь исследования баланса глобальной и локальной обработки начинают быть интересны с точки зрения природы межуровневых переходов, связывающих механизмы амбьентного и фокального восприятия, а также более высокие уровни символических координации.
Начало изучению проблемы соотношения глобальной и локальной
зрительной обработки в когнитивной психологии положили экспери
менты ученика Нормана Дэвида Навона (Navon, 1977). Он предъявлял
испытуемым большие буквы, состоявшие из маленьких букв (рис. 4.6).
Некоторые из этих составных стимулов были «однородными» — глобаль
ная форма и локальные элементы представляли собой одну и ту же бук
ву, например «Е». Другие были «неоднородными» — глобальная и ло
кальные буквы были разными (скажем, «Е» и «S»). Испытуемые должны
были как можно быстрее идентифицировать глобальную или локальную
букву. Оказалось, что при настройке на глобальную форму она иденти
фицируется быстро и без всякой интерференции со стороны совпадаю
щее ших или несовпадающих букв локального уровня. При настройке на
FFFF
F
F
FFFF
F
F
F
F
TTTT
Τ
Τ
TTTT
Τ
Τ
Τ
Τ
Рис. 4.6. Однородные и неоднородные супербуквы из экспериментов Навона.
идентификацию деталей картина была иной. Во-первых, ответы были более медленными. Во-вторых, в случае неоднородных стимулов ответы дополнительно замедлялись и становились менее точными. Очевидно, настраиваясь на детальную обработку, мы не всегда можем игнорировать глобальную информацию. Интересно, что когда в контрольных опытах была предъявлена одна маленькая буква, то ее идентификация осуществлялась столь же быстро и точно, как и идентификация большой.
В целом эти классические данные не очень удобны для концепции внимания как некоторого «ментального органа», аналогичного объективу с переменным фокусным расстоянием. Если объектив расфокусирован, то мы видим лишь глобальные очертания и интерференция со стороны локальных элементов должна отсутствовать, что и наблюдается в эксперименте. Но если фокус внимания сконцентрирован на одном из локальных элементов, то почему «прорываются» глобальные влияния? Если это происходит потому, что мы обычно начинаем с глобальной настройки, то почему изолированная маленькая буква обрабатывается так же быстро как и большая? Куда исчезает при этом центральная операция изменения фокусного расстояния — zooming! Очевидно, что как только мы покидаем область пространственного восприятия и начинаем рассматривать процессы идентификации объектов, основанные на представлении о перемещениях более или менее сфокусированного пучка света, пространственные метафоры теряют свой объяснительный потенциал. Более того, фокус зрительного внимания, по-видимому, способен расщепляться, если, например, возникает необходимость одновременного отслеживания движения двух или большего (как правило, до четырех — Cavanagh, 2004) числа объектов в пространстве.
В самое последнее время были получены результаты, которые лучше высвечивают отношения глобальной и локальной обработки, тестируемые с помощью супербукв Навона. Так, нейропсихологические исследования выявили возможную дифференциальную роль задних отделов левого и правого полушарий. При этом левое полушарие оказалось скорее регулятором настройки на детали, а правое — на глобальные очертания (Derryberry & Reed, 1998). Чрезвычайно интересным оказалось влияние эмоций: отрицательные эмоции, в отличие от положительных, усиливали установку на восприятие деталей (см. 9.4.3). Одним из ярких направлений социальной психологии становятся эксперименты, в кото-
277
рых испытуемые должны «мысленно проиграть», часто за кого-нибудь другого, формы поведения, связанные с приближением или, напротив, избеганием (Foerster et al., 2005 in press). Баланс глобальной и локальной обработки меняется при этом в глобальном или, соответственно, локальном направлении'9. Этот баланс оказался подверженным влиянию не только стресса или эмоций, но, например, и кофеина, даже в том его количестве, которое содержится в чашке кофе. Пластичность настройки внимания, однако, нарушается при патологии. Исследования выявили двойную диссоциацию: пациенты с синдромом Дауна (и, согласно некоторым сообщениям, с аутизмом) демонстрируют ригидную установку на глобальную обработку, а пациенты с синдромом Уильямса и навязчиво-компульсивным синдромом — на локальную (Yovel, Reveile & Mineka, 2005). В этом последнем случае пациенты хронически «не видят леса из-за деревьев».
Важной дискуссией в исследованиях зрительного внимания последних лет является обсуждение возможного различия внимания, включенного в процессы амбьентного зрения, и внимания к предметам. В таком повороте событий нет ничего удивительного. Разделение соответствующих уровней имеет фундаментальный характер (см. 3.4.2 и 8.3.3), и координационные структуры самых различных действий должны строиться с учетом не только пространственной локализации, но также фигуративной идентичности и семантики объектов. Многочисленные данные свидетельствуют о выраженной роли предметной организации в типичных задачах на внимание. Так, в задачах на избирательное внимание к признакам было показано, что мы быстрее называем три сенсорных признака одного объекта (цвет, величину, ориентацию), чем один и тот же признак (скажем, цвет) трех объектов. Этот результат говорит против настройки некоего фильтра на определенный сенсорный канал, но все еще объясним в рамках внимания к занимаемому предметом месту. Дело в том, что при фиксированной временной координате предмет не может занимать несколько различных положений в пространстве, а в одном и том же месте не могут находиться разные предметы".
10 Фиксируемые при этом сдвиги не ограничиваются только сферой восприятия, но, похоже, распространяются и на собственно мыслительную активность, меняя характер ассоциаций, которые становятся в контексте положительных эмоций и поведенческих тенденций приближения более широкими, включающими относительно низкочастотные варианты ответов. Здесь, несомненно, проявляются малоизученные закономерности творческой деятельности (см. 9.4.3).
" Если, конечно, один предмет не спрятан внутри другого, как это систематически происходит в случае самой знаменитой (после автомата Калашникова) русской игрушки Как показал в своих исследованиях перцептивно-познавательного развития Томас Бауэр ( 1981 ), учет этого «если» относится к числу наиболее важных интеллектуальных достижений первых полутора лет жизни ребенка (см. 3.4.3). Способность построения «матрешеч-ных репрезентаций», несомненно, связана с развитием РЕКУРСИИ, представляющей 278 собой одну из фундаментальных метапроцедур нашего мышления (см. 1.3 3 и 8 1.3).
A
Рис. 4.7. Зрительный поиск среди конфигураций, напоминающих телесные предметы (А), оказывается проще, чем среди похожих абстрактных конфигурации (Б).
Приведенный на рис. 4.7 пример двух наборов объектов, в которых нужно найти один отличающийся, уже не может быть объясним просто движением фокуса внимания в пространстве и требует введения представлений, аналогичных представлению о превосходстве объекта в процессах восприятия (см. 3.3.3). Авторы одной из работ (Lavie & Driver, 1996) попытались развести эти две возможные формы внимания и просили испытуемых оценивать сходство двух признаков, принадлежащих одному и тому же объекту или двум разным объектам. При этом они меняли пространственное расстояние между оцениваемыми признаками как внутри объекта, так и между объектами. В соответствии с гипотезой объектного внимания задача решалась лучше, если признаки принадлежали одному объекту. Пространственное расстояние не играло никакой роли. Если, однако, испытуемые получали инструкцию обращать внимание на признаки и игнорировать фигуративный контекст, то превосходство объекта исчезало, а влияние расстояния появлялось, как и должно быть при чисто пространственных перемещениях луча «ментального прожектора».
В последнем разделе этой главы (см. 4.4.1) мы подробно рассмотрим другие, в том числе и нейропсихологические данные, позволяющие трактовать эффекты внимания в терминах взаимодействия нескольких уровней обработки. В качестве предварительного итога можно сделать следующий вывод: вместо того чтобы быть фиксированным структурным элементом, внимание в современных исследованиях обнаруживает черты хамелеона, принимающего все новые обличья в зависимости от тонких особенностей решаемой задачи. Затянувшийся процесс проверки сравнительных достоинств моделей ранней и поздней селекции привел к тому, что в начале 1980-х годов появились структурные модели, «оборудованные» целым «каскадом» фильтров. Широкое распространение
279
получили теории, вообще отрицающие представление о фильтрации. Некоторые из них рассматривают возможность уровневой организации внимания. К обсуждению эволюции этих альтернативных теорий и связанных с ними экспериментальных доказательств мы сейчас и переходим.
4.2 «Творческий синтез» как альтернатива
4.2.1 Позитивная трактовка внимания
Этому разделу нужно предпослать краткое разъяснение. Рассмотренные в начале предыдущего раздела структурные модели, оперирующие понятием фильтра, можно, с известной долей условности, назвать моделями негативной трактовки внимания. Они возникли в сугубо техническом контексте применения теории обнаружения сигнала (см. 2.1.2). Основной функцией фильтра, особенно в моделях ранней селекции, является улучшение отношения сигнала к шуму, ведущее к повышению чувствительности, или d'. Это достигается за счет селективного подавления («отфильтровывания») шума и пропуска сигнала в гипотетический «канал с ограниченной пропускной способностью». Вплоть до того как развернулась экспериментальная дискуссия о раннем или позднем расположении фильтра, ничего более увлекательного о судьбе самого выделенного сигнала сказать было нельзя.
Основной альтернативой подобным структурным моделям стали значительно более общие психологические теории, которые первое время находились на периферии этой области исследований. Примером могут служить теории Улрика Найссера (Neisser, 1967) и Джулиана Хох-берга (Hochberg, 1970). Внимание понимается этими авторами как активное предвосхищение результатов восприятия, ведущее к синтезу сенсорных данных на основе внутренних схем. Напомним, что уже в «Когнитивной психологии» Найссер выделил два уровня познавательных процессов: грубые, быстрые и параллельные процессы предвнима-тельной обработки были противопоставлены детальным, медленным и последовательным процессам фокального внимания. Подчеркивание активного синтеза в качестве содержания фокальной обработки чрезвычайно близко пониманию творческого синтеза как основы апперцепции в работах Вильгельма Вундта (см. 1.2.2)12.
12 Приходится вновь и вновь удивляться тому, каким образом основатель научной психологии смог затронуть такое огромное количество тем, продолжающих вызывать споры и сегодня. Так, справедливости ради следует напомнить, что разработка проблемы «бессознательного» в психологии была начата совсем не психоанализом. Уже в 1862 году лекции В. Вундта включали раздел под соответствующим названием. Фрейду исполнилось 280 тогда шесть лет.
В отличие от авторов структурных моделей внимания, Найссер подчеркивает циклический, разворачивающийся во времени характер познавательной активности. По его мнению, бессмысленно пытаться локализовать «воронку» ближе к стимулу или ближе к ответу, так как в перцептивном цикле стимулы неразрывно связаны с ответами. Найссер также отмечает позитивный характер фокального внимания. Он предлагает следующую аналогию: срывая яблоко с ветки, мы никак не подавляем и не тормозим оставшиеся яблоки, мы просто ничего с ними не делаем. Точно так же не подавляется и иррелевантная информация — она просто не испытывает преимуществ дополнительной активной переработки. Для иллюстрации этого тезиса Найссером совместно с Р. Бек-лином (см. Найссер, 1981) были проведены ставшие классическими исследования.
Речь идет о методике так называемого селективного смотрения, в которой на одном экране совмещаются видеозаписи двух различных последовательностей событий, например, двух спортивных игр. Испытуемые должны следить за одной из игр, регистрируя нажатием на ключ релевантные события, например, переход мяча с одной стороны поля на другую. Результаты показали, что даже при высоком темпе релевантных событий (до 40 в минуту) присутствие на том же экране интерферирующего фильма практически не снижало успешности работы по сравнению с контрольными условиями. Высокая эффективность избирательного внимания сохраняется при общем визуальном сходстве двух игр и не связана с необходимостью следить глазами за релевантной игрой. По мнению Найссера, эти данные представляют собой веский аргумент против концепции фильтра, так как любая структурная единица системы переработки информации должна либо наследоваться, либо формироваться прижизненно для решения определенной задачи. В данном эксперименте испытуемые сталкиваются с совершенно уникальной задачей — никто никогда не наблюдал две цепочки событий в одно и то же время в одном месте. Только теория внимания как схематического предвосхищения развития событий, направленного на выделение динамических признаков типа тех, которые отличают одну спортивную игру от другой, позволяет понять эти результаты.
Еще один, довольно неожиданной результат этих экспериментов состоял в отсутствии восприятия происходивших на самом виду, в центре поля зрения испытуемых дополнительных иррелевантных событий, таких как спокойное прохождение по спортивной площадке... женщины с зонтиком (а в позднейших модификациях этой экспериментальной ситуации даже человека, переодетого гориллой). Речь идет об одной из самых первых демонстраций слепоты к изменениям, подробно рассмотренной нами в конце данной главы (см. 3.3.3 и 4.4.1).
281
282
Не ставя под сомнение гениальную простоту и оригинальность методики селективного смотрения, следует отметить, что эта ситуация все же не является абсолютно уникальной. Две последовательности событий можно одновременно наблюдать и при совсем других условиях, а именно в военной авиации, где с 1970-х годов прошлого века используются так называемые head-up дисплеи — технология вынесения наиболее важных индикаторов с расположенной внизу (head-down) приборной цане-ли непосредственно на лобовое стекло кабины самолета. Аргументы в пользу такого представления информации настолько очевидны, что возможность широкого гражданского использования head-up дисплеев рассматривается сейчас многими автомобильными компаниями. Прежде всего, эти дисплеи экономят время на движениях глаз и головы к приборам и обратно к виду из кабины. Далее, предполагается, что они позволяют лучше распределять внимание между показаниями приборов и воспринимаемой ситуацией вне самолета, ведь теперь вся эта информация одновременно находится внутри одного пространственного «конуса» отчетливого зрения.
Результаты Найссера и Беклина имеют непосредственное отношение к этому предположению. Их значение состоит в том, что они поставили под сомнение не только модели фильтра, но и чисто пространственные представления о зрительном внимании как луче прожектора. Последние данные о возникающих при использовании head-up дисплеев ошибках пилотов подтверждают результаты этих психологических экспериментов, Оказалось, что предъявляемая в центральном поле зрения информация способна настолько полно поглощать внимание, что пилот перестает видеть происходящие прямо перед ним события, особенно если они носят несколько неожиданный характер. Примером может служить показанная на рис. 4.8 ситуация посадки истребителя (сама посадка, впрочем, была виртуальной и совершалась на современном тренажере), в которой 2 из 12 профессиональных летчиков вообще не увидели выруливающий на ту же полосу пассажирский самолет (см. аналогичные примеры в 4.4.1). Из 10 оставшихся 8 заметили самолет слишком поздно. Авторы исследования сообщают, что один из совершивших ошибку пилотов, ознакомившись с видеозаписью, решил досрочно уйти на пенсию! Очевидно, при конструировании устройств отображения инженерная мысль слишком увлеклась поддержкой фокального внимания в ущерб амбьентным формам обработки. Между тем для пилота часто самой сложной операцией является не попадание в цель, а посадка самолета, особенно если посадка осуществляется в осложненных условиях, например, на палубу авианосца.
Рассмотрим кратко вторую теорию этого же общего типа, предложенную Дж. Хохбергом (например, Hochberg, 1970; 1998). На протяжении многих лет он развивает представления, которые лишь в нескольких пунктах расходятся с только что изложенной точкой зрения Найссера. Восприятие для него является подтверждением меняющегося набора предвосхищений сенсорной стимуляции. На хранение в память при этом переводится информация, подтвердившая наши ожидания. Сти-
Рис. 4.8. Совмещение двух динамических последовательностей событий при использовании head-up дисплея.
мулы, которые не подтвердили ожидания, почти сразу же забываются, если только они не обладают какими-либо особенно заметными свойствами. Поскольку в задачах на селективное внимание мы пытаемся предвосхитить характеристики сообщения, поступающего по релевантному каналу, иррелевантная информация, как правило, не соответствует нашим ожиданиям и, следовательно, не запоминается. Функция ожиданий полностью соответствует роли активного синтеза в теории Найссера.
Главное различие двух теорий состоит в понимании соотношения детального — внимательного — перцептивного анализа и предвнима-ния. Найссер, как отмечалось выше, во многом следует взглядам Вундта (см. также 1.2.2 и 2.2.2). По мнению Хохберга, напротив, без какого-либо участия сознания возможны генерирование и проверка очень тонких и специальных перцептивных предвосхищений. Вообще в теории Хохберга сознание выступает в качестве пассивной инстанции: осознание некоторого материала определяется лишь тем обстоятельством, переводится ли он на хранение в память. Данная теоретическая интерпретация позволяет если и не объяснить, то, по крайней мере, подойти к объяснению протекающих без участия сознания сложных форм перцептивных и сенсомоторных координации, так называемых автоматизмов (см. .4.3.2). Вместе с тем, она противоречит отмечавшемуся уже Клапа-редом факту преимущественного осознания содержаний, расходящихся с нашими ожиданиями и установками (см. 1.2.3).
283
Во многих отношениях позиция Хохберга близка точке зрения Фрейда. Как известно, сознание выполняет в его трехуровневой модели психики (включающей, кстати, также «предсознание») относительно пассивную роль. В своем раннем «Проекте научной психологии» Фрейд (Freud, 1895/1981) обсуждает распределение внимания в форме свободной психической энергии на объекты восприятия и мысли, противопоставляя ему связанную (контролируемую) энергию, которая тратится на то, чтобы не пропустить определенное содержание в сознание13. ВГэтом разделении неподконтрольной и контролируемой энергии можно увидеть прообраз современных двухуровневых моделей, выделяющих процессы автоматической и контролируемой обработки (см. 4.3.3). При желании в работах Фрейда можно также обнаружить признаки позитивной трактовки внимания — внимание ведет к активному развитию, а не к торможению идей (хотя оно и связано в основном со сферой бессознательного). Наконец, некоторым современным теориям внимания, к обсуждению которых мы как раз переходим, соответствуют представления об ограниченности общего количества энергетических ресурсов и относительном энергетическом балансе различных подструктур психики.
На этом примере можно видеть, как просто при подобной общности понятий находить многочисленные аналогии между различными теоретическими конструкциями. Как мы увидим в дальнейшем, данные экспериментальных исследований, напротив, часто не согласуются с позитивной трактовкой внимания, свидетельствуя о том, что избирательный и произвольный характер наших действий обеспечивается, прежде всего, с помощью торможения альтернативных активностей. Так, например, анализ методики селективного смотрения Найссера выявил в последнее время некоторые особенности, которые говорят о торможении восприятия игнорируемой последовательности событий (см. 4.4.2). Исследование нейрофизиологических эффектов также скорее подтверждает негативную трактовку, хотя и не обязательно в варианте классической теории фильтра. Согласно этим данным, внимание к объекту не обязательно меняет характеристики ответов нейронов в центральной области их рецептивных полей, но обычно уменьшает размеры последних, что объективно ведет к подавлению процессов переработки периферической информации (Tovee, 1996).
При всей их многозначности и относительно слабой эмпирической обоснованности взгляды сторонников позитивной трактовки оказали заметное влияние на «второе поколение» теорий внимания в когнитивной психологии. Их суть в ряде случаев трудно выразить в виде блок-схем, а подчас они прямо противопоставляются структурным моделям. Для этого «энергетического подхода» характерно подчеркивание огра-
13 Для обозначения этих двух форм энергии в английских переводах произведений Фрейда используются псевдогреческие термины «катексис» и «гиперкатексис». Удивительным образом эти слова отсутствуют в текстах немецких оригиналов. В качестве общего термина для обозначения психической энергии Фрейдом, как известно, использо-284 валось понятие «либидо»
ниченности 'общего объема внимания, находящегося в распоряжении индивида. Эти новые тенденции, казалось бы, уже не связаны непосредственно с компьютерной метафорой. Вместе с тем сама гипотеза фиксированного «пула ресурсов» соответствует известным ограничениям вычислительных возможностей любого, даже очень мощного компьютера. Близкие положения энергетических теорий внимания Вундта и Фрейда, разумеется, имели другое происхождение. На них, как и на многих современников, произвело глубокое впечатление открытие Ю. Майером и Г.ф. Гельмгольцем закона сохранения энергии.
4.2.2 Внимание как умственное усилие и ресурсные модели
Когнитивные исследования традиционно направлены на изучение структуры процессов переработки информации. Представления об активации, энергетических затратах и ресурсах организма, напротив, типичны для психофизиологии и прикладных исследований функциональных состояний — стресса и утомления. В когнитивной психологии первой и до сих пор наиболее известной концепцией, объединяющей оба подхода, стала теория внимания, разработанная Даниелом Канеманом14. Внимание интерпретируется в ней как внутреннее усилие, связанное с решением задачи. Наши усилия ограничиваются количеством (пулом) энергетических ресурсов. Общее количество ресурсов в каждый момент времени является постоянной величиной, но оно может меняться в незначительных пределах под влиянием состояний и раздражителей, сдвигающих уровень физиологической активации (рис. 4.9). Центральным когнитивным звеном модели является механизм, распределяющий ресурсы на выполнение отдельных действий (деятельностей). Принятие решений этим механизмом определяется как постоянными предпочтениями, так и ситуативными обстоятельствами.
Канеман подчеркивает связь внимания с решением задач. Хотя мы субъективно осознаем наши усилия, их величина определяется не столько желаниями и сознательными интенциями, сколько объективной сложностью задачи, о чем свидетельствует следующий простой тест:
«Во-первых, попытайтесь умножить в уме 83 на 27. Закончив решение этой задачи, представьте себе, что вам должны дать четыре цифры и что сохранение вашей жизни зависит от того, сможете ли вы удержать их в памяти в течение десяти секунд. Эти цифры семь, два, пять и девять. Закончив и эту
14 Его книга с описанием этой теории (Kahneman, 1973) была переведена и издана на
русском языке спустя 30 с лишним лет. За это время спектр научных интересов Канемана
сдвинулся в область процессов принятия решений и их зависимости от эмоциональных
(«гедонистических») переменных (см 8.4.1). 285
распределение ресурсов внимания
поведение Рис. 4.9. Модель внимания как внутреннего усилия (по: Kahneman, 1973).
задачу, вы, возможно, согласитесь, что даже ради сохранения собственной жизни нельзя работать с таким же напряжением, удерживая четыре цифры, как перемножая два двузначных числа» (Kahneman, 1973, р. 14).
По мере роста сложности задачи происходит некоторое повышение уровня активации, а также увеличивается количество ресурсов внимания, выделяемых на решение задачи. Но количество выделяемых ресурсов (= внимания) постепенно отстает от растущей сложности задачи, поэтому процессы решения начинают давать сбои, что выражается в появлении ошибок. При всех условиях часть ресурсов обязательно остается в резерве для обеспечения решения каких-либо неожиданных задач15.
286
ь Подобное описание можег привести к ошибочному выводу, чго повышение уровня физиологической активации, увеличивая количество ресурсов, ведет к монотонному улучшению выполнения действия. На самом деле, соотношение активации и успешности немонотонно. Чрезмерная активация ведет к проблемам в распределении внимания, в частности, к упоминавшимся эффектам туннельного зрения Похожая закономерность известна и из исследований мотивации, где соответствующее отклонение от монотонности носит название закона Йеркса-Додсона. Близость феноменов внимания и мотивации неоднократно отмечалась нами выше (см. 4 1.1).
Важной особенностью работ Канемана является демонстрация связи стратегий распределения внимания с законами перцептивной организации (см. 1.3.1). Как отмечают Д. Канеман и А. Хеник, «пренебрежительное отношение к гештальтистским понятиям в современной психологии обычно оправдывается на том основании, что они имеют скорее описательный характер. Но, поскольку гештальтпсихологи были великими мастерами очевидного, игнорирование их наблюдений иногда сочетается с созданием теорий, которые лучше объясняют мелкие и сомнительные эффекты, чем крупные и очевидные» (Kahneman & Henik, 1976, p. 319). В простых экспериментах, которые сделали бы честь и гештальтпсихологам, эти авторы показали, что воспроизведение предъявляемой на короткое время зрительной информации определяется не столько остротой зрения и маскировкой, сколько перцептивной организацией материала и стратегиями распределения внимания. Перцептивное поле подвергается группировке, и на образовавшиеся группы символов последовательно выделяется все меньшая доля общих ресурсов. Распределение ресурсов внутри каждой группы оказывается примерно равномерным.
В проведенных Канеманом и Хеником исследованиях определенная перцептивная организация навязывалась испытуемым либо цветовым кодированием, либо пространственной группировкой стимулов, примером чего служат ряды цифр в табл. 4.1 слева (цифры обозначают здесь номера позиций, в эксперименте они выбирались случайно). Как показывают данные, частично приведенные в той же таблице, перцептивная группировка ведет к появлению характерного профиля изменения вероятности правильных ответов и их корреляции по позициям. При этом прежде всего наблюдается относительная однородность успешности воспроизведения внутри групп и резкие перепады успешности между группами с выраженной тенденцией ее уменьшения от первой группы к следующей. Кроме того, хорошо виден негативный эффект включения в перцептивную группу иррелевантного элемента («зрительного суффикса»), что, по-видимому, связано с отвлечением части выделенных данной группе ресурсов на его обработку. Эффект суффикса, кстати, доказывает, что механизм, распределяющий ресурсы, сам по себе предвнимате-лен — он «не знает» идентичности элементов внутри группы и каждый элемент, независимо от его релевантности, получает определенную долю ресурсов.
Эффекты перцептивной организации особенно важны в задачах зрительного поиска, которые будут подробно рассмотрены-в конце этого раздела. Обычно присутствие иррелевантных объектов — дистракторов — затрудняет нахождение целевого объекта. Легко показать, однако, что добавление дистракторов может значительно облегчить зрительный поиск, если в результате они образуют визуально компактные группы, позволяющие игнорировать их как целое (Banks, Bodinger & Ilüge, 1974). В контексте предложенного Найссером различения предвнимательных и фокальных процессов перцептивная организация относится к одной из
287
Таблица 4.1. Успешность воспроизведения цифр по позициям в зависимости от пространственной группировки и присутствия иррелевантной буквы, или зрительного суффикса «к» (по: Kahneman & Henik, 1976).
Примеры группировки | Вероятность правильных ответов по позициям (%) | Средние корреляции успешности воспроизведения по позициям (%)* * | ||||||||
| 1 | 2 | 3 | 4 | 5 | 6 | 3-4 | 4-5 | 2-4 | 4-6 |
1234 56 | 93 | 83 | 86 | 86 | 29 | 39 | (75) | -25 | (52) | 04 |
123 456 | 94 | 89 | 88 | 48 | 43 | 45 | -27 | (27) | -28 | (25) |
1234 56k | 97 | 90 | 91 | 94 | 14 | 12 | (50) | -27 | (31) | -36 |
123 456k | 96 | 95 | 92 | 36 | 27 | 17 | -16 | (18) | -20 | (16) |
* Корреляции для пар позиций, принадлежащих к одной перцептивной группе, даны в скобках.
288
функций предвнимания (другой функцией может быть отслеживание внезапных изменений привычного течения событий — см. 4.4.1). Действительно, выделение фигуры из фона определяется такими характеристиками стимуляции, которые могут не совпадать с выделяемыми при внимательном рассматривании. Например, для группировки нескольких объектов существенна высокая степень сходства ориентации контуров, тогда как взаимное расположение деталей практически не играет роли. Напротив, при фокальном анализе мы часто не замечаем незначительных различий в ориентации, но зато различия в форме объектов имеют для нас первостепенное значение (см. 3.3.1).
Вернемся, однако, к представлению об ограниченном пуле ресурсов как основе феноменов внимания. Степень изменения «ресурсоемкое™» некоторой задачи по ходу ее решения можно, по мнению Кане-мана, определять, измеряя время простой двигательной реакции на неожиданный сигнал другой модальности. Представим себе очень простую задачу сравнения физической идентичности двух последовательно показываемых букв. Если на разных фазах выполнения этой задачи иногда давать неожиданный звуковой сигнал, требующий немедленного ответа, то возникает характерная картина. При совпадении акустической пробы с первой буквой или при ее попадании в интервал между буквами, когда предположительно происходили процессы «кодирования» информации, увеличение времени реакции было небольшим — порядка 250 мс. Оно резко возрастало — до 600 мс, когда звуковой сигнал предъявлялся чуть ранее или одновременно со второй буквой, совпадая, таким образом, с процессами принятия решения в основной за-
даче. Эти и аналогичные данные считаются подтверждением того, что два структурно независимых процесса могут интерферировать. Такая интерференция носит энергетический характер и обусловлена повышенными требованиями двух задач к ресурсам (= вниманию) из одного и того же ограниченного резервуара16.
Попытка последовательного объяснения эффектов селективного и распределенного внимания в рамках представления об ограниченных ресурсах внимания была предпринята Д. Норманом и Д. Боброу (Norman & Bobrow, 1975). Если Канеман (Kahneman, 1973) еще разводит структурную интерференцию и интерференцию, вызванную суммарными требованиями двух задач к ограниченному количеству ресурсов, то эти авторы вообще отказываются от рассмотрения каких-либо структурных механизмов. По их мнению, любое ухудшение в решении некоторой задачи обусловлено влиянием двух типов ограничений познавательных возможностей человека: «ограничений по ресурсам» и «ограничений по данным» (то есть недостатком информации, необходимой для решения). Определив для каждой задачи положение границы между ограничениями первого и второго типа, можно — в теории — предсказать результаты совместного решения таких задач. Хотя данный подход позволяет описать в терминах ресурсов и ограничений значительное количество ранее полученных результатов, у многих исследователей возникли сомнения в его продуктивности, так как нет никакой уверенности в существовании единой для разных задач шкалы усилий, а тем более единого резервуара ресурсов внимания.
Складывается впечатление, что это направление, по крайней мере в его актуальном состоянии, оказалось тупиковым. Чем больше приводилось теоретических графиков, описывающих распределение ресурсов между задачами, тем меньше было эмпирических данных, доказывающих справедливость этих взглядов, а главное, хоть как-то проясняющих природу самих ресурсов. Так, известный инженерный психолог Кристофер Уикенс выдвинул в 1980-е годы предположение о существовании 6 видов специализированных ресурсов (см. новую версию этого подхода в работе Wickens, Gordon & Liu, 1999). Другие авторы говорят с уверенностью только о двух — вербальных и невербальных, предполагая к тому же, что эти ресурсы избирательно связаны с работой, соответственно, левого и правого полушария мозга. В последнее время также стала рассматриваться возможность уровневой организации ресурсов —
16 Канадский исследователь Колин Маклеод впоследствии опроверг эту интерпрета
цию. Он обратил внимание на то, что в подобных экспериментах ответы в основной (зри
тельной) задаче и во вторичной (акустической) пробе предполагали нажатие на кнопки,
то-есть требовали осуществления очень похожих движений. Поэтому он минимально мо
дифицировал эксперимент, прося испытуемых при возникновении акустического сигна
ла просто говорить «бип». В этом случая интерференция с этапом принятия решения в
основной задаче исчезала, а вместе с ней и доказательство существования центрального
пула ресурсов. 289
наряду с ресурсами относительно низкоуровневых, модально-специфических механизмов постулируется существование центрального пула ресурсов, связанного с работой префронтальных механизмов коры. Эти представления все больше начинают напоминать соответствующие структурные модели памяти и оперативной обработки информации, которые мы рассмотрим позднее (см. 4.4.2 и 5.2.3).
Эмпирической основой для выводов о существовании общих для двух задач ресурсов обработки служат данные об их интерференции при совместном выполнении по сравнению с контрольными условиями выполнения каждой из этих задач в отдельности. При этом, конечно, крайне трудно разделить структурные и энергетические компоненты. Пример структурной интерференции можно найти в экспериментах канадского психолога Ли Брукса (Brooks, 1968). Он просил испытуемых представить себе букву, показанную на рис. 4.10А. Затем им предлагалось мысленно двигаться по краю буквы в указанном стрелкой направлении, отмечая каждый раз направление поворота. В трех группах испытуемых отчет о направлении поворотов должен был даваться тремя различными способами: указанием одной из двух букв в специально подготовленном бланке (рис. 4.10Б), нажатием левой или правой ногой на педали и, наконец, просто произнесением вслух «да» и «нет» при повороте налево или направо. В другой серии испытуемые должны были удерживать в сознании хорошо знакомую фразу типа «Лучше синица в руке, чем журавль в небе» и, переходя от слова к слову, определять по отношению к каждому из них, является ли оно существительным. По ходу мысленного движения отчет должен был даваться теми же тремя способами. Результаты показали, что интерференция имела селективный характер: если визуализация резко затрудняла отчет в форме зрительного поиска, то сканирование предложения отрицательно интерферировало с вербальными ответами.
Y | N |
Y | N |
Y | N |
Y | N |
Y | N |
Y | N |
Y | N |
Y | N |
Y | N |
Y | N |
Y Y | Ν Ν |
290
Рис. 4.10. Исследование интерференции визуализации и формы отчета: А — фигура Брукса (звездочкой отмечено начало движения); Б — отчет в форме поиска и подчеркивания наклоненной буквы F («да») или N («нет»).
В настоящее время исследования интерференции нескольких задач используются главным образом при поиске структурных компонентов рабочей памяти, заменившей в некоторых современных моделях переработки информации человеком блок кратковременной памяти (см. 2.1.3 и 5.2.1). Эти исследования выявили ряд особенностей интерференционных процессов, неожиданных с точки зрения представления о ресурсах. Так, оказалось, что задача визуализации Брукса может сильнее интерферировать с задачей акустического слежения за движущимся объектом, чем с задачей визуального обнаружения изменений цвета экрана. Причиной более выраженной интермодальной интерференции является существование общих пространственно-действенных компонентов в координационной структуре двух первых задач. Центральный пул ресурсов внимания рассматривается иногда как принадлежность так называемого центрального исполнителя — иерархически наиболее высокой инстанции модели рабочей памяти. Однако гомогенность структуры и функций центрального исполнителя в настоящее время также серьезно оспаривается (см. 5.2.3).
Продолжающиеся теоретические споры ничего не меняют в том факте, что сами исследования интерференции имеют чрезвычайно важное практическое значение. Анализ интерференции при одновременном (multitasking) или быстром последовательном (task switching) выполнении двух и более задач лежит в основе проектирования многих рабочих мест (см. 4.4.2). Особенно важен анализ процессов интерференции при создании дисплеев и систем адаптивной поддержки оператора (см. 7.4.4). Так, после начала гражданского использования спутниковых средств ориентации в пространстве (GPS — global positioning system) появилась возможность создания навигационных систем для автотранспорта. При этом первоначально водителю показывалась на дисплее карта местности с обозначением его собственного положения и локализации цели. Из-за того, что ориентация этой карты зачастую не совпадала с актуальным направлением движения машины, водитель должен был время от времени осуществлять операцию мысленного вращения карты в пространстве (см. 5.3.1). Эта операция оказалась совершенно несовместимой с основной деятельностью — управлением автомобилем и зрительным контролем окружения. Поэтому в современных навигационных системах для уменьшения подобной нежелательной интерференции используется голос в сочетании с предъявлением упрощенных, эгоцентрически локализуемых зрительных указателей.
4.2.3 Проблема интеграции признаков
В итоге цикла исследований зрительного поиска упоминавшаяся нами выше ученица Бродбента Энн Трисман разработала в 1980-е годы радикально отличающуюся от найссеровской концепцию предвнимательной и фокальной фаз обработки. По Найссеру, предвнимание ведет к выделению очень грубой, но все-таки связной репрезентации объектов, которая сопровождается чем-то вроде неотчетливого осознания («перцеп-
291
ция» в понимании Вундта и еще раньше Лейбница). Согласно трактовке Трисман, предвнимание совершенно не похоже на то, что нам известно из интроспективных наблюдений — отдельные сенсорные признаки физических объектов находятся здесь в «свободно плавающем» состоянии. Функция фокального внимания состоит, по ее мнению, в конъюнктивной интеграции этих признаков и воссоздании объектов. На основе этих представлений были выдвинуты гипотезы об особенностях процессов зрительного поиска и перцептивной организации (напомним, что выделение фигуры из фона считается типичной функцией предвнимания).
Перед тем как обратиться к этим гипотезам, рассмотрим основные понятия, используемые для описания поиска. Задачи поиска предполагают нахождение целевого объекта среди дистракторов. О характере поиска судят по зависимости времени реакции от числа дистракторов. Если их количество не влияет на время поиска, то говорят о параллельном поиске. Он характерен для предвнимательной обработки (целевой объект сам «бросается в глаза»). Если время поиска растет с числом дистракторов, то говорят о последовательном поиске. В этом случае важно сравнить функции времени реакции для положительных (целевой объект присутствует в дисплее — ответ «да») и отрицательных (целевой объект отсутствует — ответ «нет») проб. Параллельность этих функций свидетельствует о последовательном исчерпывающем поиске. Иными словами, можно предположить, что в положительных пробах, как и в отрицательных, просматриваются все находящиеся в дисплее объекты, то есть поиск продолжается даже после того, как целевой объект обнаружен. Статус этой стратегии не вполне ясен, но часто ее также считают признаком предвнимательной обработки. Наконец, если обе функции не параллельны, причем наклон функций отрицательных ответов примерно в два раза больше, чем положительных, то говорят о последовательном самооканчивающемся поиске. Здесь, очевидно, в положительных пробах в среднем просматривается в два раза меньше объектов, чем в отрицательных, а значит, нахождение цели сразу ведет к прерыванию поиска и ответу. Эта стратегия свидетельствует о внимательной обработке каждого объекта17.
Теперь можно перечислить основные предсказания теории интеграции признаков Трисман:
если искомый объект отличается одним признаком, то его поиск
может происходить без участия внимания — параллельно;если объект отличается конъюнкцией двух или более признаков,
его поиск предполагает последовательный внимательный просмотр
объектов;
17 Нужно сказать, что основой подобного анализа служит метод аддитивных факторов Сола Стернберга (см. 2.2.3). В дальнейшем мы подробно проанализируем исследования 292 процессов поиска в памяти, базирующиеся на той же логике (см. 5.1.2).
различение текстур и выделение фигуры из фона возможны на
основе отдельных признаков, но не их конъюнкции;при отвлечении внимания «свободное плавание» признаков раз
ных объектов будет приводить к иллюзорным конъюнкциям (типа зеленой
розы с красными листьями, хотя в случае знакомых предметов память
может корректировать комбинации признаков).
Эти предположения были подтверждены в ряде экспериментов с буквенно-цифровыми стимулами, текстурами и условными изображениями лиц. Типичный результат иллюстрирует рис. 4.11. Мы легко находим отличающийся от остальных объект на основании признака цвета или, в конкретном примере (А), ориентации, однако поиск на основании конъюнкции этих же признаков (Б) превращается в медленный процесс последовательного перебора. Качественные особенности результатов таких экспериментов — последовательный самооканчивающийся поиск для конъюнкций и параллельный поиск в случае отдельных признаков — сохраняются при уменьшении размеров участка дисплея, на котором предъявляются объекты. Следовательно, в основе интеграции лежат не движения глаз (их число и амплитуда сокращаются при уменьшении угловых размеров зоны поиска), а скорее движения «мысленного взора». Было показано также, что выявленные закономерности сохраняются при изменении степени сходства релевантных и фоновых объектов. Так, например, найти латинскую букву R в контексте Q и Ρ оказалось гораздо сложнее, чем найти ее среди букв В, хотя R более похожа на В, чем на Q или на Ρ в отдельности. Трисман объясняет это тем, что R
Рис. 4.11. Основной результат, положенный в основу теории интеграции признаков: А. Нахождение объекта по одному-единственному признаку («горизонтальный объект») осуществляется быстро и не зависит от числа дистракторов; Б. В случае конъюнкции признаков («черный вертикальный объект») время поиска замедляется и начинает зави-сить от дистракторов.
293
является конъюнкцией признаков Q и Р. В специальных экспериментах с использованием разноцветных букв были получены и ожидавшиеся иллюзорные конъюнкции.
Воспринимаемая нами феноменально картина предметного окружения, с точки зрения теории интеграции признаков, возникает либо в результате синтезирующей активности внимания, либо восстанавливав ется в знакомых условиях из памяти. Когда ситуация незнакома и внимание отвлечено, речь может идти только о случайных сочетаниях отдельных сенсорных элементов. Дальнейшая судьба этого наиболее радикального из существующих вариантов концепции творческого синтеза, видимо, зависит от того, насколько общими являются результаты, полученные в условиях, которые максимально способствовали возникновению именно таких иллюзорных эффектов18. Перед тем как обратиться к анализу этой теории, следует отметить, что проблема интеграции признаков интенсивно обсуждается и в нейрофизиологических работах, где для ее решения иногда предлагаются совсем другие механизмы.
В науках о мозге интерес к «связыванию» (binding) признаков также возник в 1980-е годы, когда стало окончательно ясно, что разные сенсорные признаки обрабатываются в различных участках затылочных долей коры (см. 3.1.3). При наличии в поле зрения нескольких объектов с разным набором признаков это ставит проблему установления принадлежности признака и объекта. Возможное решение этой проблемы, предложенное немецкими нейрофизиологами К. фон дер Мальсбургом и Вольфом Зингером, заключается в синхронизации работы нейронов, обрабатывающих в различных частях зрительной коры признаки одного и того же объекта (например, Singer, 1999). Иными словами, нейроны, регистрирующие признаки одного объекта, должны разряжаться в фазу, другого объекта — с определенным сдвигом по фазе и т.д. Исследования с микроэлектродным отведением активности нейронов зрительной коры животных показали, что предъявление объектов приводит к появлению на фоне спонтанной ритмической активности с частотой 1 —30 Гц кратковременных «веретен», синхронизированных разрядов в области 35—70 Гц (то есть примерно в диапазоне гамма-ритма ЭЭГ). Эти высокочастотные веретена и могли бы кодировать принадлежность набора одновременно обрабатываемых в разных участках коры признаков определенному объекту.
Против этой красивой гипотезы свидетельствует несколько фактов. Во-первых, веретена синхронизированной активности, охватывающей обширные участки зрительной коры, не всегда вовлекают как раз те нейроны, которые наиболее явно кодируют признаки. Во-вторых, веретена
18 Ошибки иллюзорных конъюнкций особенно часто наблюдаются у пациентов с поражениями теменных отделов мозга, в особенности при синдроме Балинта (см. 3 4 2 и 4 1.3). Поскольку при этом синдроме осознанно воспринимается лишь один из нескольких присутствующих в поле зрения предметов, смешение признаков нескольких из них свидетельствует об имплицитной обработке, по крайней мере, части невоспринимаемых 294 предметов.
возникают только в ответ на движущиеся объекты и поэтому вероятнее всего связаны с отслеживанием движения объектов, а не с более общей задачей интеграции признаков (Tovee, 1996). Последовательность событий, следовательно, скорее может выглядеть следующим образом. Информация о предметном окружении подвергается мощной оптической фильтрации уже на входе в зрительную систему, так что лишь фовеаль-ная (2°) и в меньшей степени парафовеальная (8°) стимуляция, чаще всего соответствующая всего лишь одному объекту, должна быть немедленно обработана. Эта обработка элементарных признаков осуществляется в затылочных отделах коры чрезвычайно быстро (10—20 мс), после чего информация передается в дорзальный поток (задняя теменная кора) для локализации и в вентральный поток (нижняя и средняя височная кора) для возможной идентификации объектов (см. 3.4.2). Последняя задача может требовать связывания признаков посредством селективного внимания, поддержанного информацией из памяти («красное яблоко» и «зеленые листья»).
Теория интеграции признаков Трисман, при всей необычности лежащих в ее основе допущений, удивительно хорошо выдержала 20-летнюю экспериментальную проверку. Едва ли не главным затруднением для нее оказались подчас очень плоские функции зависимости времени поиска от общего числа дистракторов. Иногда их наклон составляет только 10—20 мс на дистрактор, что формально означало бы проверку до 100 объектов в секунду при поиске определяемых конъюнкцией признаков целевого объекта. Эту проблему решает модель ведомого поиска (Guided search), разработанная гарвардским психологом Джереми Вольфе (например, Wolfe, 2003). По его мнению, подтверждаемому анализом движений глаз испытуемых, просмотр элементов дисплея не является вполне случайным, а направляется (ведется) некоторым знанием о характеристиках целевого объекта. Это позволяет сокращать перебор. Например, если нам нужно найти конъюнкцию двух признаков — красный вертикальный прямоугольник среди красных и черных, вертикальных и горизонтальных прямоугольников, то мы можем заранее, в режиме «сверху вниз» настроиться на красные объекты и искать главным образом среди них. С учетом возможности такой стратегии пред настройки, оцениваемая скорость поиска вновь приближается к реалистическим 30—50 мс на объект19.
В том, что касается понимания предвнимательной и внимательной фазы, взгляды Вольфе лишь незначительно отличаются от представле-
19 «Ведомый» не означает в данном случае «управляемый» или «находящийся под про
извольным контролем», так как за исключением упомянутых ограничений на перебор
сам поиск осуществляется вполне случайным, анархическим образом. Наблюдаемое со
кращение перебора объектов в зрительном поиске в каком-то смысле напоминает сокра
щение зоны обследования при поиске крысой пути в лабиринте в классических экспери
ментах Толмена и Креча (см. 1.3.3). Общим в этих двух примерах является массивное уча
стие уровня пространственного поля С (заднетеменные отделы коры) 295
ний Трисман. В обоих случаях считается, что различные признаки объектов параллельно репрезентированы в большом количестве (кортикальных) пространственных карт. Если задача поиска задает только один такой признак, то его репрезентация активируется и соответствующая пространственная карта сразу же выделяется из числа остальных: целевой объект (вернее, сначала его положение) как бы «бросается в глаза», иными словами, сразу видится как фигура на фоне. Акт внимания состоит в быстром объединении информации о признаках, приписанных данному месту во всем множестве карт. Если целевой объект задан конъюнкцией признаков, то здесь одновременно активируется несколько пространственных карт. По мнению Трисман, задача решается тогда внимательным перебором с последовательной проверкой признаков каждого объекта, вплоть до нахождения целевого. В модели Вольфе предполагается, что при активации нескольких карт они накладываются друг на друга и поиск ведется среди тех «имплицитных объектов», местоположение которых маркировано максимальной активацией. Ведомый таким образом последовательный поиск позволяет обнаружить целевой объект, определить в явном виде его признаки и на этой основе идентифицировать.
При столь критической роли «базовых признаков» в организации поиска большое значение имеет вопрос о их природе и о том, как именно они используются в процессах селекции. Этому вопросу было посвящено значительное число исследований, проведенных как с задачами зрительного поиска, так и в ситуациях возникновения перцептивной организации в текстурах. В настоящее время в литературе насчитывается около дюжины подобных базовых признаков (Wolfe & Horowitz, 2005). К ним, в частности, относятся признаки, выделяющие целевой объект в силу различия светлоты, ориентации, величины, непрерывности контура, кривизны контура, положения в третьем измерении пространства. Чрезвычайно эффективны также разнообразные признаки относительного движения, например, гештальтпсихологический признак «общей судьбы» (см. 1.3.1). Не совсем понятно, правда, можно ли говорить во всех этих случаях просто о признаках.
Так, для параллельной обработки часто используются относительно грубые признаки текстур, которые нельзя путать с признаками формы объектов (см. подробнее 3.3.1). Вместе с тем они не совпадают и с элементарными сенсорными признаками, выделяемыми первичными отделами зрительной коры. По сравнению с первичной сенсорной обработкой в таких отделах, как VI, речь идет о более продвинутой стадии репрезентации пространства и даже в какой-то степени объектов в нем. Об этом говорят данные о возникновении при зрительном поиске эффектов, аналогичных эффекту превосходства объекта (см. 3.3.3, 4.1.3 и 5.3.2). Эти эффекты свидетельствуют об учете трехмерности телесных объектов и их
ориентации по отношению к возможным источникам освещения. О дос-296
Рис. 4.12.
таточно высокой компетентности предвнимательного зрения в оценке положения объектов в трехмерном окружении говорят, например, эксперименты американского психофизиолога, специалиста по зрительному восприятию Кена Накаямы и его коллег (Не & Nakayama, 1992). В некоторых из них использовались фигуры типа представленных на рис. 4.12А. Здесь проще найти фигуру L в левой, чем в правой части рисунка. Дело в том, в конфигурации, показанной справа, L воспринимается лишь как видимый фрагмент более обширной, но частично перекрытой поверхности. Впечатление разной глубины дополнительно усиливалось в этих экспериментах стереоскопическим предъявлением объектов (реконструкция восприятия показана на рис. 4.12Б). Таким образом, анализ данных о зрительном поиске в сложных сценах вызывает сомнение в примитивности «базовых признаков» и даже в том, что речь должна идти о признаках, а не о предметной сегментации сцены (см. 4.4.1). Подобные сомнения отражают общий недостаток теорий, возникших в контексте позитивной трактовки внимания — они явно недооценивают сложность процессов, разворачивающихся в режиме предвнимательной обработки.
Одним из интересных направлений, возникших по сути дела уже в 21-м веке, является изучение так называемого послевнимания. Предвни-мание, как мы видели, связано с чем-то вроде многократно упоминавшегося нами амбьентного зрения — относительно низкоуровневого восприятия трехмерной сцены с недифференцированными («имплицитными» — Вольфе) или рассыпанными на составные признаки (Трис-ман) объектами. Обращение внимания на объект ведет к интеграции (Трисман) или экспликации (Вольфе) признаков и идентификации объекта. При этом объект описывается значительно более детально, чем
297
это было бы возможно лишь при конъюнктивном связывании «базовых признаков». Совершенно очевидно, что эффекты селективного внимания к некоторому объекту ведут — в форме обратных связей, «сверху вниз»— к изменению обработки в первичных сенсорных зонах коры (см. Nyberg, 2002, а также 3.4.2 и 4.1.2). Но что происходит с репрезентацией объекта, когда фокальная обработка заканчивается и мы переходим к детальному анализу другого объекта либо осуществляется глобальная смена задачи?
Вольфе и его коллеги (Wolfe, Kiempen & Dahlen, 2000; Horowitz, 2005) попытались разобраться в этом вопросе, используя методику повторного поиска. В стандартных задачах на зрительный поиск цели и дистракто-ры меняются в каждой пробе. В задаче повторного поиска испытуемому многократно, иногда по 300 и более раз, показывается один и тот же дисплей (он мог включать в разных сериях от 5 до 20 изображений различных предметов). Перед каждой пробой испытуемому называется предмет, который может быть показан с вероятностью 50%. Задача состоит в проверке присутствия этого предмета. Казалось бы, в этих условиях должно возникать быстрое научение и задача могла бы решаться за все меньшее время. Однако никакого улучшения поиска не происходит. Даже тогда, когда лишь очень небольшое число хорошо знакомых объектов явно видны в поле зрения, некоторая «воронка» препятствует доступу к более чем одному объекту20. Поэтому при необходимости подтвердить присутствие одного из этих объектов разворачивается последовательный внимательный поиск, как если бы обследовался совершенно незнакомый дисплей. Зрительный поиск, как считают Джереми Вольфе и Тодд Хоровиц, разворачивается в «вечном настоящем времени» (eternalpresent tense). Уход внимания с объекта просто возвращает его в предвнимательное состояние, иными словами, «послевнима-ние» = «предвнимание».
Эти исследования расширяют список ситуаций, в которых взаимодействие с предметной ситуацией не ведет к ее лучшему запоминанию. Первым из таких примеров были особенности так называемого «восприятия для действия», рассмотренные в предыдущей главе (см. 3.4.1). В следующей главе (см. 5.4.1) будут приведены дальнейшие примеры, включающие классический эффект незаконченного действия, обнаруженный в самом конце 1920-х годов ученицей Левина Блюмой Вуль-фовной Зейгарник (1900—1988). «Эффект Зейгарник» заключается в том, что имеющая отношение к действию информация сохраняется лишь до тех пор, пока действие не окончено. Эти работы обычно рассматриваются как исследования влияния мотивации на память, но мы уже неоднократно отмечали особенно тесную связь феноменов внимания и мотивации (см. 4.1.1 и 9.4.3). В этом смысле можно в самом предварительном
2(1 Упоминая «воронку», Вольфе как бы возвращает дискуссию о ранней и поздней селекции к ее началу. Нам кажется, что для выявления эффектов перцептивного научения нужно проводить опыты с осмысленными предметными сценами, а не со случайными коллажами объектов. В этих условиях можно было бы скорее ожидать возникновения пред-внимательной семантической обработки и постепенной оптимизации поиска, свидетель-298 ствующей об имплицитном запоминании (см. также 3.3.3 и 5.4.2).
плане рассматривать последние результаты Вольфе и его коллег как проявление эффекта законченного действия: когда действие поиска целевого объекта заканчивается, релевантная информация забывается и поэтому при повторном поиске все приходится начинать сначала (см. 5.4.1)21.
Давно назревший поворот в дискуссии о механизмах зрительного поиска наметился в связи с результатами новых экспериментов группы Накаямы (Wang, Kristjansson & Nakayama, 2005). Целевые объекты задавались здесь конъюнкцией разнообразных признаков — цвета, светлоты, размера, формы и «топологии» (наличие внутреннего отверстия). В каждой пробе, однако, такое сочетание могло быть своим — искать нужно было лишь объект с некоторым уникальным сочетанием признаков. При этих условиях, в частности, невозможна предварительная, «сверху вниз» активация «нужных» стимульных измерений. Иными словами, как теория интеграции признаков, так и теория ведомого поиска предсказывают медленный последовательный поиск, зависящий от числа дистрак-торов. Тем не менее поиск во многих случаях оказался практически параллельным. Авторы исследования склонны искать объяснение не в тех или иных способностях внимания, а в специфике процессов перцептивной организации, разбивающих сцену на группы объектов, с которыми мы потом последовательно и работаем (см. 1.3.1 и 4.2.2). Чем единообразнее организация сцены в целом, тем ближе параметры поиска приближаются к предельному случаю параллельного обнаружения цели или отсутствия таковой (в отрицательных пробах).
4.3 Автоматические и контролируемые процессы
4.3.1 Внимание как внутренний контроль
Позитивная трактовка внимания, потеснившая представление о фильтрации, подчеркивает, что внимание к объекту существенным образом меняет его репрезентацию, например, ведет к интеграции признаков и узнаванию. Процессы вне фокальной зоны внимания (а равно вне сознания, так как внимание и сознание здесь синонимичны) характеризуются при таком подходе очень поверхностно — они «не испытывают преимуществ активной обработки». Что изменится, если попытаться
21 Мы упоминаем здесь лишь сам глобальный принцип модуляции восприятия, оперативного запоминания и забывания в зависимости от расчлененности деятельности на относительно дробные сегменты, или действия. При более детальном анализе можно ожидать сохранения фрагментарных следов использовавшейся для выполнения законченного действия информации в виде эффектов имплицитной памяти, или прайминга (см. 5.1.3 и 5.4.1). Такие эффекты, оптимизирующие зрительный поиск в серии последовательных проб, действительно были обнаружены в последнее время (Peterson et al., 2001). 299
рассмотреть функции внимания в контексте выполнения некоторого действия? Тогда известный пример Найссера с яблоком, которое мы «просто срываем, ничего не делая с остальными», потребует значительно более обстоятельного анализа. Мы выбираем самое красное яблоко из числа тех, до которых еще можем дотянуться; игнорируем соседнее зеленое^ ведем руку к определенной области пространства, при необходимости корректируя траекторию движения; заботимся о сохранении равновесия; сдерживаем усилие, чтобы не сломать ветку, и т.д. Даже относительно простое целенаправленное движение имеет, следовательно, наряду с осознаваемой целью, множество фоновых координации из нижележащих уровней, вплоть до наиболее древних в классификации Бернштейна уровней синергии и полеокинетических координации (см. 1.4.3).
Во второй половине 1980-х годов два исследователя, работавших тогда в Центре междисциплинарных исследований университета Биле-фельда, Алан Олпорт и Одмар Нойманн, одновременно предложили рассматривать внимание как селекцию и контроль действия. По мнению Олпорта, проблема контроля действия делает необходимым существование фундаментального механизма, который бы позволял релевантной информации контролировать наше поведение и отключал бы доступ к иррелевантной информации, мешая ей оказывать интерферирующее влияние. Нойманн видит во внимании целый «ансамбль механизмов», позволяющих мозгу справляться с задачей выбора и контроля выполнения действия. Известные эффекты селективного внимания обусловлены, по его мнению, необходимостью отбрасывания иррелевантной информации в целях поддержания целостности и согласованности компонентов («когерентности») действия — точно так же, как на железнодорожном транспорте самым надежным способом предотвращения столкновения поездов является закрытие стрелки определенного пути на все время прохождения поезда22.
Не является ли столь резкий разворот в сторону «негативной трактовки внимания» возвращением к идее фильтра? На этот вопрос можно дать несколько ответов. Во-первых, нет ничего плохого в возвращении к проблеме, реальность которой подтверждается экспериментальным материалом. Во-вторых, в отличие от гипотезы фильтра, представление о селективности контроля действия делает акцент скорее на центральных механизмах, а не на ранней сенсорной обработке. В самом деле, многие из обсуждаемых в этом разделе данных скорее соответствуют иде-
22 Примерно так обычно объясняются эффекты задержки обработки и маскировки информации, известные как психологический рефрактерный период (задержка реакции на второй из двух быстро следующих друг за другом сигналов — см. 2.1.3) и моргание внимания (см. 4.1.2). Характерно, что изменение характера действия в этих ситуациях способно устранить часть интерференционных эффектов. Это происходит, например, если задача обнаружения буквы в эффекте моргания внимания сменяется задачей чтения слова или становится возможной любая другая форма интеграции информации во времени (стиму-300 лы представляют собой варианты одного и того же предмета — Valdes-Sosa et al., 2004).
ям поздней селекции. В-третьих, подчеркивание роли действия открывает ряд новых направлений анализа, например, с точки зрения изучения микроструктуры действия и входящих в его состав фоновых координации (ср. только что приведенный пример с найссеровским яблоком). Мы рассмотрим сначала данные о роли активного торможения ирреле-вантной информации, а затем перейдем к центральной для данного раздела проблеме формирования и специфики когнитивных автоматизмов. В когнитивной психологии, как и в реальной жизни, контроль есть проверка соответствия процесса некоторой цели (эталону) и осуществление мер по восстановлению соответствия, если оно оказывается нарушенным. В потенциальном списке таких мер на видном месте находятся разнообразные операции запрета, торможения и подавления, направленные против мешающих достижению цели воздействий. Как мы увидим ниже, способом коммуникации филогенетически новых, фронтальных структур коры с другими отделами мозга часто является именно торможение (см. 4.3.2). Наличие подобного торможения может быть продемонстрировано и в традиционных исследованиях внимания, где оно получило название негативного прайминга (см. также 5.1.3). Один из примеров негативного прайминга — сложные последовательные эффекты, возникающие в классическом феномене Струпа, названном так по имени открывшего его в 1930-е годы американского психолога.
Этот феномен был обнаружен в задаче называния цвета букв некоторого слова. Само слово может быть нейтральным (например, наименования цифр) либо представлять собой название цвета. Если цвет краски и значение слова, являющееся названием цвета, не совпадают (например, слово «синий» написано красными буквами), то время вербальной реакции по сравнению с контрольным условием называния цвета нейтральных слов увеличивается (эффект интерференции). Если цвет краски и значение слова соответствуют друг другу, время реакции уменьшается (эффект конгруэнтности). Анализ феномена Струпа показывает, что хотя испытуемый пытается сосредоточиться на оценке цвета букв, значение слова непроизвольно воспринимается им и взаимодействует с ответом. Более того, это взаимодействие наблюдается даже тогда, когда значение слова не прямо, а лишь ассоциативно связано с названием какого-либо цвета (как в случае слов «небо» или «трава»). Замечательной особенностью феномена Струпа является то, что он может выступать в десятках обличий: когда испытуемый должен сказать, сколько символов ему показано, а сами эти символы цифры; когда он должен сказать, высоким или низким голосом произносится слово «низкий» или «высокий»; когда он должен назвать изображение объекта, на котором написано его название или название другого объекта, причем последний может принадлежать, а может и не принадлежать той же самой семантической категории, и т.п. Эта ситуация представляет собой настоящий «микрокосм» процессов селективной интерференции.
В данном контексте для нас важны указания на то, что, стараясь назвать цвет краски букв, испытуемый активно подавляет интерферирую-
щую информацию о семантике слова. Для этого нужно обратиться к анализу последовательной обработки информации, например, когда в одной пробе она мешала решению задачи, а в следующей, напротив, становилась релевантной. Такие эффекты действительно были обнаружены: если интерферирующее название цвета (например, слово «красный» зеленого цвета) становилось в следующей пробе цветом слова {красное слово «синий»), то возникала дополнительная по сравнению с контрольными условиями задержка называния цвета букв («красные»), составлявшая в среднем около 50 мс. Этот феномен (впервые обнаруженный в дипломной работе В.Н. Каптелинина, выполненной под нашим руководством в 1978 году) получил название негативного прайминга. Он свидетельствует о существовании активного торможения иррелевантной информации, противореча чисто позитивной трактовке внимания Найссером и другими авторами. Варианты негативного прайминга обнаружены сегодня и в некоторых других ситуациях (Tipper & Driver, 1988), причем эти эффекты могут возникать в зависимости от решаемой задачи на разных уровнях обработки: семантическом (как в только что приведенном примере феномена Струпа), восприятия формы и пространственного положения объектов.
В области восприятия и обследования пространства (уровень пространственного поля С, или амбьентное восприятие — см. 3.4.2) вариантом негативного прайминга является так называемое «торможение возврата» {inhibition of return). Его суть состоит в том, что сразу после посещения глазом некоторой точки пространства вероятность возврата в эту же точку оказывается очень низкой. Более того, попытки повторно вернуться в эту область сопровождаются увеличением времени, уходящего на подготовку саккадического скачка (Findlay & Gilchrist, 2004). Очевидная роль подобного механизма состоит в возможно более полном и эффективном обследовании сцены. На рис. 4.13 показана характерная запись движений глаз в задаче поиска различия между левой и правой половинами дисплея (Velichkovsky, Challis & Pomplun, 1995). Прежде всего, как и предполагалось многими авторами (см. 4.2.2 и 4.2.3), отчетливо заметно структурирующее влияние процессов перцептивной организации — поиск осуществляется между группами, которые обычно включают от двух до четырех объектов. Можно видеть далее, насколько эффективно, в частности без повторов, осуществляется сканирование. Важно отметить, однако, что как только искомое различие начинает подозреваться испытуемым, процесс решения задачи поиска сразу же переходит на более высокий уровень и «торможение возврата» исчезает, так что глаза многократно последовательно фиксируют одни и те же критические области23.
23 При этом также резко возрастает продолжительность зрительных фиксаций, с примерно 200 мс на стадии поиска до 500 и более мс на стадии проверки гипотезы и принятия решения. Таким образом, с учетом наших данных о связи продолжительности фиксации с уровнем обработки, приведенных в предыдущей главе (см. 3.4.2), торможение возврата является феноменом, характерным, главным образом, для амбьентной обработки (уро-302 вень С, «пространственное поле» Бернштейна).
Рис. 4.13. Типичная картина движений глаз в задаче поиска различия между левой и правой половиной дисплея (по: Velichkovsky, Challis & Pomplun, 1995).
Если внимание понимается как контрольный механизм действия, то его эффекты должны определяться обучением и тренировкой, причем в силу автоматизации действий основные события должны разворачиваться именно вне сферы осознания. Мы только что видели на примере эффекта Струпа, как очень прочный, а следовательно, в значительной степени автоматизированный навык чтения интерферирует с менее привычной задачей называния цвета букв. Точно так же простое заучивание наизусть текста, который предъявляется потом по иррелевантному каналу, резко затрудняет повторение релевантного сообщения в стандартных дихотических условиях. Одним из примеров того, как меняются возможности распределения внимания с практикой, служит ранняя работа английского психолога Джеффри Андервуда (Underwood, 1974). Среди испытуемых был его учитель Невилл Морей — автор и участник десятков исследований дихотического слушания. Повторяя буквы, предъявлявшиеся по релевантному каналу, необходимо было независимо от канала отмечать появление любых цифр. По сравнению с обычными испытуемыми Морей лучше замечал цифры по релевантному каналу — 88 против 77% обнаружений. Но по-настоящему драматических масштабов различия достигали при детекции цифр в иррелевантном канале: если Морей замечал 67% всех цифр, то остальные испытуемые — только 8%.
303
L
Следовательно, формирование когнитивных навыков особенно сильно повышает успешность работы в условиях отвлечения внимания. Эти результаты позволяют надеяться на преодоление многих, казалось бы, фиксированных ограничений познавательных процессов при пра* вильно построенных обучении и тренировке. В этом контексте можно было бы даже говорить о позитивной трактовке... невнимания. Как отмечает в одной из своих последующих работ Найссер, «наши ограничения, когда они не отражают упрямые факты среды, являются всего лишь примерами того, что мы пока не научились делать» (Neisser, 1980, р. 28).
Фактические результаты исследований самого Найссера и его учеников свидетельствуют о широких возможностях автоматизации сложных познавательных процессов. Речь идет о многолетнем цикле исследований письма под диктовку и одновременного чтения. Было показано, например, что после продолжавшейся несколько месяцев тренировки испытуемые могут одновременно безошибочно записывать названия соответствующих читаемым словам категорий и с пониманием читать научный текст типа статьи в энциклопедии. Хотя и с большим трудом, две испытуемые (в прошлом секретарши) научились даже читать текст и одновременно писать простые предложения, понимая смысл той и другой информации. О понимании предложений, в частности, можно было судить по успешному различению «старых» и «новых» предложений, а также по характерным ошибкам семантического смешения на стадии тестирования. Интересно, что в таких условиях у испытуемых часто отсутствовало чувство знакомости, поэтому субъективно разделение «старых» и «новых» предложений делалось почти наугад. Это типично также для опознания сложных изображений24.
Целый ряд сведений о возможностях такого разделения в результате продолжительной практики приводит А. Олпорт (Allport, 1980). Кроме собственных результатов, свидетельствующих о том, что пианисты способны без какой-либо интерференции «вторить» одному из двух ди-хотических сообщений и одновременно играть с листа незнакомое музыкальное произведение, он обсуждает аналогичные данные, полученные в экспериментах с японскими специалистами вычисления на счетах. В результате нескольких лет упорной тренировки последние оказались способны проводить вычисления в уме быстрее, чем с помощью счетов. На скорость вычислений не влияла беседа на общие темы или монотонное повторение вслух трехзначного числа, но решение простейшей арифметической задачи сразу же вело к сбоям и ошибкам. Это наблюдение демонстрирует главную трудность одновременного выполнения двух действий, связанную с разделением компонентов их микроструктуры. Очевидно, два человека могут легко организовать свою работу таким образом, что один из них будет писать под диктов-
24 Видный голландский инженерный психолог Андреас Зандерс (Sanders, 1998) попытался недавно воспроизвести эти результаты Найссера и его коллег, но безуспешно. Зандерс склонен объяснять эту неудачу общим падением нравов и исчезновением действи-304 тельно хороших секретарш.
ку, а другой читать. Но происходит это не из-за удвоения ресурсов внимания, а потому, что перед ними не встает проблема постоянного разделения операций двух очень похожих действий.
Для восстановления исторической справедливости следует отметить, что первая теория, связывающая внимание с контролем действия, была разработана еще в 1950-е годы Петром Яковлевичем Гальпериным (1902—1988). Исходным пунктом для его анализа было наблюдение, что внимание, не имея собственного продукта, улучшает выполнение других процессов25. Считая, как и многие советские психологи того периода (см. 1.4.3), что психологические процессы являются интериоризиро-ванными формами внешней деятельности, Гальперин выделил в составе внешних действий функцию контроля как не имеющую собственного продукта, но критически важную для успешного выполнения любого действия. Внимание трактуется им как функция внутреннего контроля за выполнением умственных, то есть интериоризированных и сокращенных действий. В этом подходе, наряду с анализом стадий или этапов ин-териоризации внешней активности, особенно интересно подчеркивание роли речи как средства управления собственным поведением и необходимого компонента произвольного внимания. Мы увидим ниже, что эта точка зрения подтверждается новыми исследованиями произвольного контроля (см. 4.4.2).
4.3.2 Критерии выделения автоматизмов
Если эффекты внимания определяются обучением и тренировкой, то в силу автоматизации действий их координация перестает определяться одним только сознательным контролем. Серьезная методологическая проблема состоит в том, что, вводя различение сознательных и автоматизированных процессов, мы вступаем на зыбкую почву домыслов и предположений, где десятилетиями доминировали различные течения психоанализа. Несомненным достижением когнитивной психологии является нахождение операциональных критериев разведения этих процессов. Один из подходов уже рассматривался нами в предыдущем разделе при анализе задач зрительного поиска (см. 4.2.3). В этой ситуации есть веские основания считать, что параллельный поиск свидетельствует об автоматической обработке, тогда как последовательный самооканчивающийся — об участии фокального внимания и сознания. Этот
25 Это общее, вновь и вновь повторяющееся в психологических учебниках утвержде
ние справедливо далеко не всегда. Например, в случае сложных, хорошо автоматизиро
ванных навыков внимание к ним может нарушать их выполнение (см. 5.4.2). Совершен
но аналогично обращение внимания на содержание сложных, включающих множество
имплицитных компонентов понятий (таких как понятие «время» — см. 6.1.1 ) может вне
запно начать мешать их пониманию. 305
подход будет неоднократно встречаться нам в дальнейшем (см. 4.3.3 и 5.1.2), но, к сожалению, он применим только к задачам поиска. Более общим является подход, связанный с работами американского нейро--психолога Майкла Познера26.
Эти работы относятся к 1970-м годам, но в значительной степени сохраняют свою актуальность до настоящего времени. Реферируя в те годы факты, свидетельствующие о сложности таких в значительной степени автоматизированных процессов, как чтение или пространственная локализация объектов, Познер отмечал, что они подтверждают мысль И.М. Сеченова о рефлекторной основе психических процессов. По мнению Познера, ошибочно связывать все эти процессы с произвольным сознательным управлением. Анализ функций и структуры сознания пока остается слишком сложной задачей, так как ее решение предполагает изучение особой управляющей инстанции — гомункулуса, который является чем-то вроде «призрака, гонящегося за когнитивной психологией» (Posner, 1978, р. 151). На данном этапе развития научной психологии можно поставить вопрос только лишь об операциональном разделении автоматизмов (то есть процессов рефлекторного типа) и процессов, находящихся под контролем сознания.
Познер и его сотрудник Снайдер (Posner & Snyder, 1975) выделили три группы критериев, разделяющих автоматические (рефлекторные) и сознательные (рефлексивные) процессы. Как они считают, автоматические процессы характеризуются активацией, возникающей, во-первых, без сознательного намерения, во-вторых, без сопутствующего осознания и, в-третьих, параллельно (без интерференции) с активацией других подсистем. Напротив, сознательно управляемые процессы интенциональны, дают толчок к сознательным переживаниям и затрудняют альтернативным процессам доступ к ограниченному объему ресурсов внимания.
Эти соображения позволили впервые в истории психологии предложить методический прием разведения сознательных и автоматических процессов. Он получил название методики «проигрыша—выигрыша» (она же методика Познера—Снайдера). Поскольку автоматическая обработка осуществляется полностью сформированными подсистемами, которые могут функционировать параллельно, то предварительная настройка одной из этих подсистем приведет к ускорению обработки адекватной для нее информации, но не будет сопровождаться замедлением обработки, если в действительности предъявляется совсем другая, неожиданная информация. Следовательно, автоматизированные подсис-
26 Познер начал свою научную карьеру как инженерный психолог, под руководством
Пола Фиттса. С течением времени он стал одним из наиболее видных представителей
когнитивной психологии, а затем и когнитивной нейронауки. Спектр его современных
интересов начинает включать также вопросы психологии развития и когнитивной гено-
306 мики (см. 4.3.3).
темы работают по правилу «выигрыш, но не проигрыш». Сознательная обработка сопровождается «выигрышем» при показе ожидаемых стимулов, но в случае неожиданной информации, к обработке которой мы не подготовились, будут возникать затруднения. Иными словами, для сознательной обработки характерны «как выигрыш, так и проигрыш». Этот «проигрыш» в системе сознательного управления должен возникать в результате вызванного ожиданиями произвольного перераспределения ресурсов: не исключая полностью возможности работы других подсистем, такое перераспределение делает обработку информации в них более медленной и поверхностной.
Чтобы сделать логику этих рассуждений более понятной, лучше всего обратиться к конкретному примеру. В одном из экспериментов Познера и его коллег слева или справа от испытуемого предъявлялся сигнал, который мог быть либо зрительным, либо акустическим. В разных сериях измерялось время реакции определения положения или модальности сигнала. Перед каждой пробой испытуемый получал предын-струкцию, в которой сообщалось, какой сигнал будет предъявлен. В 80% случаев эта информация была верной, в 20% — ложной. В контрольных условиях вместо предынструкции предъявлялся случайный набор букв. Оказалось, что в задаче пространственной локализации («слева» или «справа» независимо от модальности) верная предынструкция (80% случаев) приводила к «выигрышу» — ускорению ответов по сравнению с контролем, но ложная преднастройка (20% случаев) не сопровождалась «проигрышем»: время реакции оставалось таким же, как и в контрольном условии. В задаче определения модальности («вижу» или «слышу» независимо от локализации) был обнаружен как «выигрыш», так и «проигрыш». Это означает, что интермодальная пространственная локализация — автоматический процесс, который разворачивается независимо от интенций субъекта (см. 3.1.1). Определение сенсорной модальности, которое часто считается чуть ли не первичным психическим актом, напротив, интенционально осуществляется при участии сознания и конкурирует с другими процессами.
Этот же методический прием был использован и в ряде более сложных ситуаций. В задаче сравнения двух букв Познер и Снайдер (Posner & Snyder, 1975) систематически меняли задержку между предынструк-цией (она также была верной или ложной, соответственно в 80 и 20% случаев) и сравниваемыми символами. Как показывают результаты, представленные на рис. 4. НА, обработка включает здесь как «выигрыш», так и «проигрыш», причем первый нарастает во времени значительно быстрее. Подобная асимметричность микрогенеза свидетельствует о том, что опознание включает очень быстрые автоматические компоненты (примерно 250 мс), за которыми следуют процессы более медленной сознательной обработки.
307
-60 -
О 100 300 500 300 500 700
Асинхронность предъяштения преднастроечной информации, мс
Рис. 4.14. Эффекты проигрыша и выигрыша в задачах узнавания букв (А) и лексического решения (Б).
В известной работе, проведенной с помощью данного метода, Дж. Нили (Neely, 1977) продемонстрировал влияние семантической предна-стройки на время реакции в задаче лексического выбора, когда испытуемый должен определить, является ли предъявленная ему последовательность букв словом — например, «дятел» или «теляд» (см. 4.1.2). Показу тестовой последовательности предшествовало предъявление с различной асинхронностью слова, которое обычно (80% случаев) было названием соответствующей категории («птица»), но иногда (20%) могло обозначать совсем другую категорию (например, «мебель»). Как видно из рис. 4.14Б, и здесь также присутствует фаза быстрой, 250—350 мс, автоматической обработки, в течение которой ложная предынструкция неэффективна. Затем эффекты семантической активации начинают дополняться тормозящим влиянием контекста, возникающим, как полагает автор, в результате произвольного сдвига внимания в ошибочно указанную область семантической памяти. Эта интерпретация подтверждается данными, полученными при произвольном кодировании предынструкции (например, «птица» всегда означала «мебель»). Если при этом тестовое слово неожиданно оказывалось из первой, привычной категории («ворона»), то до задержек примерно 400 мс все равно наблюдалось ускорение реакций, которое затем сменялось торможением, очевидно, обусловленным сознательным учетом введенного ранее произвольного соответствия (центральная кривая на рис. 4.14Б).
308
Подход Познера и Снайдера возник в период расцвета энергетических моделей (см. 4.2.2) и, казалось бы, подтверждает существование центрального резервуара ресурсов. Возникновение «проигрыша» при этом связывается с перераспределением ресурсов внимания. Но если это так, то развитие процессов торможения должно иметь генерализованный характер, замедляя обработку любой иррелевантной информации — ведь резервуар един для разных задач. Это предположение поставили под сомнение последующие работы, проведенные с помощью той же методики. Например, в одном из экспериментов (McLean & Shulman, 1978) испытуемые должны были в основной задаче (она повторяла задачу Познера и Снайдера) после соответствующей предынструкции сравнивать буквы. Иногда им неожиданно предъявлялся звуковой сигнал, на который нужно было дать быстрый двигательный ответ. Хотя с увеличением времени, прошедшего с момента показа предынструкции, «проигрыш» в основной задаче возрастает (ср. рис. 4.14А), интерференция двух разных задач падает — латентное время простой двигательной реакции на ирре-левантный сигнал уменьшается. Таким образом, в основе «проигрыша» лежат достаточно специфичные изменения, которые нельзя описать просто как результат перераспределения центрального пула ресурсов. Очевидно, что внимание в этих экспериментах — это не луч прожектора, указывающий потоку ресурсов сенсорный канал или место в семантической памяти, а процесс формирования нового ответа (действия). По мере его завершения появляется возможность перейти к решению других задач (см. 5.4.2).
В последние годы в арсенале когнитивной психологии появился еще один интересный методический прием операционального разведения сознательных и автоматических процессов. Речь идет о предложенной канадским психологом Лэрри Джакоби (например, Jacoby, 1998) методике диссоциации процессов. До сих пор эта методика использовалась в основном в исследованиях памяти и восприятия, поэтому мы лишь кратко упомянем о ней в данном разделе (см. ниже описание так называемого эффекта псевдознаменитости — 4.3.3), отложив более детальный анализ до следующей главы (см. 5.1.3). Хотя подход Джакоби основан на несколько иных предположениях и совершенно не использует данные о времени реакции, результаты, полученные с его помощью, хорошо вписываются в общую картину, как минимум, двухуровневой организации когнитивного управления поведением, где привычные автоматизированные тенденции — с переменным успехом — сдерживаются и направляются в русло сознательной задачи процессами произвольного контроля.
4.3.3 Двухуровневые модели, их критика и альтернативы
Одну из первых и до сих пор самую известную попытку обобщения исследований внимания, восприятия и памяти с позиций различения автоматических и контролируемых процессов предприняли Р. Шиффрин и 309
ч
У. Шнайдер (Schneider & Shiffrin, 1977; Shiffrin & Schneider, 1977). В отличие от большинства других блочных моделей познавательных процессов 1970-х годов, в их модели нет жесткого различения кратковременной и долговременной памяти: первая описывается как временно активированный фрагмент второй. Сохраняя актуально значимую информацию, кратковременная память выполняет функции рабочего ре- ■ гистра (см. 5.2.3) для принятия решений, мышления и любых других «процессов управления», на которые способна система. Рациональным зерном этой модели является также признание роли обучения, обеспечивающего постепенный перевод контролируемых процессов в автоматизированную форму обработки. Для обозначения автоматических и контролируемых процессов обработки эти авторы используют термины автоматическое обнаружение и контролируемый поиск.
Автоматическое обнаружение представляет собой восприятие стимулов посредством рутинных программ обработки, хранящихся в долговременной памяти. Они позволяют контролировать потоки информации, направлять внимание и генерировать ответы, причем, благодаря высокой степени заученности, все это не требует сознательных усилий и траты ресурсов кратковременной памяти. Контролируемым поиском называется любая более или менее новая последовательность преобразований информации. Такие последовательности не хранятся в готовом виде. Они могут быть изменены и приспособлены к новым обстоятельствам, но за эту гибкость приходится расплачиваться тратой ресурсов кратковременной памяти и сознательными усилиями. Контролируемый поиск обычно осознается и может меняться вербальной инструкцией. Даже в том случае, когда контролируемый поиск в кратковременной памяти осуществляется слишком быстро для «прохождения в сознание», он остается под произвольным контролем, поскольку инициируется и завершается субъектом. Автоматическое обнаружение, напротив, сопротивляется изменениям — когда оно запущено в действие, его трудно игнорировать или остановить.
Экспериментальные исследования этих авторов проводились с помощью методики, объединявшей задачи зрительного поиска и поиска в памяти (см. 5.1.2). Испытуемому последовательно с относительно высокой скоростью предъявлялись матрицы, содержавшие от двух до четырех буквенно-цифровых символов. Он должен был определить, есть ли среди них хотя бы один символ из показанного ему ранее и удерживаемого в памяти положительного множества, объемом от одного до четырех символов. Критическим различием было использование в качестве целевых и иррелевантных стимулов (дистракторов) символов из разных или же из обеих категорий. Эти два условия назывались «постоянное соответствие» (consistent mapping) и «переменное соответствие» (varied mapping). Во избежание ошибочных интерпретаций, в табл. 4.2 приведено несколько примеров каждого из этих условий, различавших отдельные серии экспериментов. Так, при выборе условия постоянного
Таблица 4.2. Примеры основных условий экспериментов Шиффрина и Шнайдера
| Постоянное соответствие |
|
Символы в памяти | Символы на дисплее | Ответы |
HBKD | 43В7 | ДА |
HBKD | 9253 | НЕТ |
5273 | J5DC | ДА |
5273 | BJGH | НЕТ |
Переменное соответствие | ||
Символы в памяти | Символы на дисплее | Ответы |
Н4ВЗ | 5CGB | ДА |
Н4ВЗ | 2J7C | НЕТ |
56F2 | G5BJ | ДА |
56F2 | 8D 1 С | НЕТ |
соответствия на протяжении всей серии проб, включавшей сотни предъявлений, целевыми стимулами всегда были буквы, а дистрактора-ми — цифры.
Типичные результаты одного из вариантов этих экспериментов показаны на рис 4.15. При предъявлении в качестве целевых стимулов и дистракторов символов из разных категорий и сохранении этого соответствия на все время серии проб объем положительного множества (нагрузка на память) и число символов в каждом дисплее оказывают незначительное влияние на время поиска — обработка осуществляется в режиме автоматического обнаружения. Напротив, эти факторы оказывают выраженное влияние в условии переменного соответствия, когда отнесение символов разных категорий к целевым стимулам и дистрак-торам постоянно менялось. Здесь наблюдается последовательный самооканчивающийся поиск: наклон отрицательных кривых примерно в два раза больше, чем наклон положительных. Это свидетельствует об использовании контролируемого поиска. Объяснение эффективности работы в условии постоянного соответствия состоит в том, что процедуры различения этих простейших категорий заранее фиксированы в долговременной памяти. После продолжительной тренировки (свыше 2000 проб) аналогичные результаты могут быть получены для некоторых еще более условных категорий, например, для букв первой и второй половины алфавита27.
27 Как показала последующая проверка, этот очень специальный навык или, быть может, какой-то простой прием (см. ниже) решения задачи в условиях постоянного соответствия сохранялся потом у участников эксперимента в течение, по крайней мере, 9 лет.
311
внутри категории
между категориями
символ в матрице 2 символа 4 символа
4 12 4 12
Объем положительного множества
внутри категории У/ между категориями
Рис. 4.15. Эксперименты Шиффрина и Шнайдера: А — последовательность событий' (1) предъявление положительного множества, (2) точка фиксации, (3) матрицы с дистрак-торами, (4) матрица, содержащая положительный стимул, (5) матрицы с дистракторами; Б — типичные результаты.
312
Что произошло в оценке данной модели и в этой области исследований за прошедшие четверть века? Модель Шиффрина и Шнайдера продолжает называться в литературе «самой общей и универсальной», так как она позволила довольно точно описать результаты хронометрических экспериментов в таких разделенных до тех пор областях, как
зрительный поиск и поиск в памяти. К сожалению, использование в этом исследовании крайне обедненного материала затрудняет перенос выводов на более сложные случаи. Более того, возникают сомнения в том, что эти хрестоматийные эксперименты были правильно спланированы. Так, в условии постоянного соответствия и использования букв в качестве целевых стимулов (ср. две первые строчки табл. 4.2) для правильного ответа достаточно было просто определять присутствие на дисплее любой буквы — сканирование памяти и сравнение символов на дисплее с элементами положительного множества было излишним.
Мы остановимся сначала на нескольких наиболее ярких примерах развития собственно эмпирических исследований контролируемых и автоматических процессов, а затем, в самом конце раздела, проанализируем современный теоретический статус двухуровневых моделей внимания и контроля, к числу которых и относится модель Шиффрина и Шнайдера — со всеми ее последующими модификациями (например, Gupta & Schneider, 1991; Sanders, 1998).
Одно из исследований было проведено Д. и М. Бродбентами (Broadbent & Broadbent, 1980). Не вспоминая более о гипотетических фильтрах внимания, эти авторы различают «пассивную» и «активную» обработку. Для пассивной обработки характерно автоматическое снижение порогов по отношению к часто встречающемся комбинациям признаков объектов. В случае активной обработки субъект создает гипотезы, которые проверяются на ограниченном подмножестве данных. Используя данные На-вона (см. 4.1.3) о том, что пассивная обработка может представлять собой глобальный, а активная — локальный анализ свойств стимуляции, эти авторы исследовали влияние факторов эмоциональной значимости, включенности в контекст предложения и общей частотности на восприятие слов, подвергнутых двум различным процедурам оптической фильтрации. В первом случае устранялись тонкие детали (как при дефокусировке), но сохранялись глобальные очертания. Во втором из слова вырезались фрагменты букв, так что при сохранении большинства деталей общий вид слова явно нарушался. Оказалось, что на узнавание слов с сохраненными глобальными очертаниями оказывает влияние лишь частотность их возникновения в языке, тогда как во втором случае эффективными были факторы контекста предложения и коннотативного (связанного с эмоциональной оценкой) значения. Последние факторы, следовательно, влияют на более поздний этап активной обработки28.
О том, насколько сложные формы восприятия могут происходить без сознательной регистрации, говорят исследования влияния семантического контекста на скорость лексического решения. Известно, что
28 Результаты этих авторов вместе с отдельными данными о восприятии и поведении в ситуации опасности (см. 3.4.2) говорят против психоаналитической концепции первичности аффективных компонентов восприятия, разделявшейся на протяжении десятилетий представителями многих направлений психологии (влючая так называемые Новый взгляд и Новый новый взгляд). Мы рассмотрим ведущиеся сегодня споры о механизмах обработки аффективной информации в последней главе книги (см. 9.4.2).
313
предъявление перед тестовым словом ассоциативно связанного с ним слова ускоряет время реакции. В широко известных (и часто оспариваемых!) экспериментах Э. Марсел (например, Marcel, 1980) обнаружил, что такое ускорение сохраняется даже в том случае, когда преднадстро-ечное слово подвергается настолько жесткой обратной маскировке, что испытуемый не может сказать, было ли ему показано что-либо кроме маски. Имеются данные, что эти эффекты характеризуются «выигрышем», но не «проигрышем», что дополнительно подтверждает их автоматический характер. Согласно более ранним результатам Д. Уикенса (Wîckens, 1972), при короткой экспозиции тестового слова, недостаточной для идентификации, испытуемые все же способны оценивать возможное значение слова с помощью методики семантического дифференциала Осгуда, особенно по отношению к Шкале активности (см. 2.2.1). Близкие эффекты получены при изучении восприятия и называния изображений знакомых предметов (McCauley et al., 1980). Предварительный показ картинки, семантически связанной с предметом, ускорял его восприятие и называние, даже если сама картинка подвергалась маскировке и длительность ее экспозиции составляла всего лишь '/3 от индивидуально подобранного порога узнавания.
Чтобы не ограничиваться восприятием, приведем пример так называемого эффекта псевдознаменитости, демонстрирующего влияние автоматизмов на память. В экспериментах Л. Джакоби и его коллег (см. Jacoby, 1998) испытуемые должны были вслух прочитать список имен совершенно, как им в явном виде говорилось, малоизвестных людей. Эта простая задача решалась в двух условиях — полного внимания и отвлеченного внимания (когда нужно было еще отслеживать появление определенных чисел). Во второй половине эксперимента испытуемым предъявлялся другой список, в котором они должны были подчеркнуть имена всех упомянутых там знаменитостей. Некоторые имена действительно были очень известны, другие — нет. Среди неизвестных имен встречались и имена из первого списка. Оказалось, что если испытуемые зачисляют в категорию знаменитостей неизвестных лиц, то обычно из числа уже предъявлявшихся им в первом списке имен. Эта тенденция заметно усиливалась, если во время работы с первым списком внимание испытуемых отвлекалось. Подобный результат вполне нетривиален. Если бы отвлечение внимания просто ухудшало обработку имен первого списка, то их интерферирующее влияние должно было ослабевать. Если бы испытуемые могли сознательно вспомнить, что слово уже предъявлялось в первом списке, то они не стали бы его подчеркивать, поскольку первый список по определению состоял из малоизвестных имен. Следовательно, включение имен из первого списка в число знаменитостей объяснимо только автоматическими влияниями на память. Эти влияния усиливаются, когда отвлечение внимания ослабляет контроль29.
29 Любопытно, что эффект псевдознаменитости был обнаружен даже в том случае, когда первый список зачитывался пациентам, находившимся под общим наркозом! Этот поразительный факт, по-видимому, объясняется тем обстоятельством, что в состоянии наркоза все еще может быть активирован вентральный поток переработки информации, дела-314 ющий возможными эффекты имплицитного запоминания (прайминга — см. 5.1.3).
Теоретические споры, связанные с данной двухуровневой моделью, так или иначе вращаются вокруг возможно излишне жесткой дихотомии автоматических и контролируемых процессов. Поэтому в модификации модели Шиффрина и Шнайдера начала 1990-х годов (Gupta & Schneider, 1991) подробно рассматриваются переходы от первоначально контролируемой обработки, для которой характерно существование ряда изолированных операций, таких как поиск в памяти и сканирование дисплея, к постепенной модуляризации обработки по принципу «короткого замыкания» информации на входе с ответами на выходе. Однако даже подобные описания градуальной автоматизации не устраивают критиков, которые хотели бы видеть значительно большую гибкость во взаимоотношениях этих процессов. Эта гибкость проявляется, с одной стороны, в сохранении некоторого контроля над автоматизмами, а с другой — в неоспоримом влиянии автоматических процессов на наше осознание ситуации и произвольные действия.
Доказательством того, что автоматические процессы в экспериментах Шиффрина и Шнайдера не вполне «бесконтрольны», могут служить результаты самих этих авторов и последующих работ данного типа. Как правило, автоматическое обнаружение никогда не сопровождается строго параллельным поиском: время реакции растет с увеличением числа дистракторов, причем иногда наблюдается расхождение функций положительных и отрицательных ответов. Классические примеры автоматической обработки, такие как навыки чтения, обнаруживают зависимость от наших интенций и внимания — одно и то же слово будет прочитано нами различным образом, если мы считаем его словом немецкого или английского языка (см. 7.2.1). Аналогично величина эффекта Струпа несколько уменьшается, когда мы стараемся не читать название цвета. Действительно, лишь незначительная часть процессов переработки информации человеком может рассматриваться как «когнитивно непроницаемые» (см. 2.3.2 и 4.4.1), строго модулярные процессы.
Многочисленные факты демонстрируют возможность влияния автоматических процессов на осознание ситуации и произвольные действия. Мы имеем в виду не столько общую возможность редукционистского объяснения воли и сознания как эпифеноменов активности мозга (см. 4.4.3), сколько конкретные экспериментальные эффекты. Один из них известен с 1960-х годов как феномен Ферера-Рааба. Этот феномен был обнаружен в исследованиях маскировки и метаконтраста (см. 3.1.3), когда испытуемых просили как можно быстрее реагировать нажатием на кнопку при восприятии любого события на экране. При полной обратной маскировке предъявлявшегося первым объекта испытуемые видят только последующую маскировочную конфигурацию и уверены, что произвольно отвечают именно на нее. Анализ времени реакции показывает, однако, что фактически ответ инициируется первым, субъективно невос-принятым стимулом. Так, если первый объект предъявляется на 50 мс,
315
после чего с интервалом 50 мс показывается маскировочный объект, то время реакции по отношению к этому второму стимулу, на который, как считает испытуемый, он и реагирует, может составлять лишь 100 мс, что почти в два раза меньше самых быстрых произвольных ответов человека на зрительные стимулы.
Рассмотрим этот простой феномен подробнее, чтобы показать другой недостаток двухуровневых моделей. Объяснение феномена Ферера-Рааба предполагает комбинацию нескольких уровней обработки, первый из которых регистрирует появление объекта и инициирует моторный ответ. Этот уровень, однако, не способен идентифицировать объект, для чего необходима более детальная обработка, осуществляемая средствами следующего уровня. Если предположить, что первым из этих уровней является дорзальная (заднетеменная) система локализации, а вторым — вентральная (нижневисочная) система идентификации объектов (см. 3.3.3), то остается открытым вопрос о механизмах, ответственных за постановку самой задачи и общий контроль выполнения этого произвольного действия. Центральная роль в целеполагании принадлежит, согласно современным представлениям, префронтальным структурам коры (см. 4.4.2). Это заставляет добавить в схему третий уровень, «сверху». Кроме того, не совсем ясно, ответственна ли низкоуровневая система локализации также и за само обнаружение сигнала, либо нужно вводить еще и систему первичной активации (подобную системе Alerting в последних работах Майкла Познера — см. ниже).
Следовательно, традиционная дихотомия сознательной и бессознательной обработки, используемая в двухуровневых моделях, явно недостаточна для описания взаимодействий, сопровождающих решение задач в многоуровневой архитектуре30. Координационная структура действия «глубже» собственно сознательного контроля, поскольку охватывает также взаимодействия между фоновыми уровнями процессов оперативного достижения промежуточных целей (см. 4.1.1). Например, когда мы срываем с дерева пресловутое найссеровское яблоко, то низкоуровневые фоновые операции сохранения равновесия (уровень А) должны в основном координироваться с фоновой же операцией протягивания руки (уровень С), а не с более высокими уровнями, выполняющими в этом действии ведущую роль и поэтому определяющими содержание сознания. Взаимодействия между фоновыми уровнями в общем случае недоступны осознанию (если только сами эти операции, скажем, из-за внезапной потери равновесия, не становятся самостоятельным действием — см. 1.4.3), но это не меняет их сути как проявлений внимания, критически важных для успеха действия в целом.
30 Н.А Бернштейн описывал автоматизацию как выведение из-под сознательного контроля и распределение координации по соответствующим фоновым уровням· «Процесс переключения технических компонент движения в низовые, фоновые уровни есть то, что 316 называется обычно автоматизацией движений» (1947, с 43)
В настоящее время практически все авторы, работающие в рамках нейрокогнитивной парадигмы (см. 9.1.3), склонны рассматривать внимание как многоуровневый механизм или группу механизмов. Наиболее интенсивная и интересная программа изучения организации мозговых процессов, лежащих в основе разнообразных, направленных на решение задач активностей организма, реализуется Майклом Познером и его коллегами (Posner, 2004). Познер описывает такую организацию в терминах работы трех систем внимания, а именно:
/. Возбуждения-бдительности (Alerting),
Ориентровки {Orienting)
Экзекутивного контроля {Executive Control).
Наряду с использованием данных хронометрических задач и мозгового картирования, эти работы начинают все более опираться также на нейрогуморальные и нейрогенетические исследования (см. 2.4.3 и 9.4.3). Кроме того, исследуется отногенез и основные клинические синдромы нарушения внимания. Последние исследования, в частности, направлены на анализ возможной генетической обусловленности таких непосредственно влияющих на внимание заболеваний, как ADHD (синдром дефицита внимания и гиперактивности — предположительно связанной с системой Alerting), болезнь Альцгеймера (по-видимому, преимущественно нарушения ориентировки), а также аутизм и шизофрения (система экзекутивного контроля).
Характеристики трех систем внимания, как они описываются на момент написания данной книги, приведены в табл. 4.3. Некоторые данные об онтогенезе структур, лежащих в основе функционирования этих систем внимания, будут приведены в соответствующем разделе последней главы (см. 9.4.2).
Представление о трех системах внимания у Познера (и аналогичные схемы, встречающиеся в последнее время в работах ряда других авторов) несколько напоминают описание трех основных функциональных блоков мозга, как они понимались в поздних работах Лурия (энергетический, гностический и исполнительный, или экзекутивный, — см. 2.4.3). Надо сказать, что две первые системы из схемы Познера реализуют преимущественно автоматические операции. Для третьей системы, напротив, характерно использование произвольного режима работы. На протяжении последних лет Познер связывал ее функции с оперативной памятью, преодолением конфликтов и исполнительным (экзекутивным) контролем. Он также неизменно отмечал заслугу Лурия в самом открытии этой переднемозговой системы внимания, выполняющей, среди прочего, важнейшую функцию контроля социального поведения. Вопрос состоит в том, достаточно ли этих трех систем для обслуживания периодически обсуждаемых в нашей книге уровней функциональной организации познания? Их эволюционный Grand Design явно включает более трех уровней (см. 8.4.3).
317
Таблица 4.3. Характеристика трех систем внимания по Познеру (Posner, 2004).
Система | Основные | Основной | Представи- | Основной |
| структуры мозга | нейромодулятор | тели | локус |
|
|
| в геноме | воздействия |
Возбуждение | Ствол мозга | Норэпинефрин | Неизвестны | Система (2): |
| (Locus coeruleus), | (норадреналин) |
| «Ориенти- |
| правые теменные |
|
| ровка» |
| зоны коры |
|
|
|
Ориентировка | Средний мозг, | ACh | АРОЕ | Первичные |
| верхнетеменные | (ацетилхолин) | CHRNA4 | сенсорные |
| и височно- |
| CHRNA7? | зоны (напр., |
| теменные отделы |
|
| VI и AI) |
| коры, фронталь- |
|
|
|
| ные глазодвига- |
|
|
|
| тельные поля |
|
|
|
Контроль | Передняя пояс- | Дофамин | DRD4 | Весь мозг |
| ная извилина, |
| СОМТ |
|
| медианная и |
| DBH |
|
| вентролатераль- |
| МАОА |
|
| ная префронталь- |
|
|
|
| ная кора, базаль- |
|
|
|
| ные ганглии |
|
|
|
Например, ориентировка понимается Познером как пространственный поиск и селекция стимульных областей для более глубокой обработки. При таком понимании она относится к уровню пространственного поля С. Можно предположить, конечно, что та же самая система амбь-ентного внимания обслуживает и более высокий уровень D, «перетекая» из эгоцентрического «макропространства» окружения в «микропространство» координат предмета. В любом случае ясно, что в табл. 4.3 не хватает упоминания нижневисочных структур, или вентрального потока обработки зрительной информации, реализующего основные функции фокального внимания. Может ли пространственное внимание «подняться еще выше» и обеспечить обработку символической информации, например, поиск понятия в семантической памяти или слова во внутреннем лексиконе? По мнению Познера (личное сообщение, октябрь 2004), семантические связи обслуживаются не второй, а третьей системой. Об этом может говорить тот факт, что уже при простом припоминании слова или имени часто возникают конфликты выбора, подобные классическому эффекту «на кончике языка» (см. 2.2.2 и 7.1.3)31. С другой стороны,
31 Согласно современным представлениям (например, Botvinick, Cohen & Carter, 2004), детекция конфликтов разного рода составляет основную функцию передней поясной извилины (anterior cingulate cortex). Эта структура относится Познером к нейронной сети механизмов экзекутивного контроля.
вполне возможно, что система экзекутивного контроля Познера неоднородна и должна быть разделена на две подсистемы, обеспечивающие контроль переработки безличностного знания и, соответственно, личностно-релевантных ситуаций (см. 5.3.3 и 9.4.3). На эти и аналогичные вопросы ответ могут дать только дальнейшие исследования1'.
Долгое время функции сознания и центральных когнитивных механизмов представлялись совершенно недоступными для научного анализа. Так, по мнению основателя модулярного подхода Фодора (Fodor, 1983), научный анализ возможен лишь по отношению к модулярным системам перцептивной обработки информации, но не по отношению к центральным (высокоуровневым) механизмам познания и сознания (см. 2.3.2). За 100 лет до Фодора близкие взгляды высказывались основателем научной психологии Вильгельмом Вундтом (см. 1.2.2), который искренне считал, что экспериментальный метод применим лишь к относительно элементарным перцептивным и сенсомоторным процессам. Роль ранних нейропсихологических наблюдений состояла в демонстрации связи нарушений сознания с нарушениями нейрофизиологических механизмов (Бернштейн, 2003). Мы рассмотрим в следующем, последнем разделе этой главы современные данные, позволившие систематизировать представления о контроле действия, а также в значительной степени демистифицировать функции сознания, путем выделения в их составе отдельных компонентов и доказательства связи этих компонентов с мозговым субстратом.
4.4 Сознание и внимание в структуре деятельности
4.4.1 Непроизвольное (экзогенное) внимание
В организации материала этого раздела нам опять сможет помочь воображаемое найссеровское (или, быть может, ньютоновское?) яблоко. Согласно классическому различению двух видов внимания, наши действия могут быть произвольными (эндогенными) — «схожу в сад, сорву яблоко, подарю близкому человеку», но могут быть и непроизвольными (экзо-
32 Одно из возможных направлений связано с более детальным анализом интерферен
ции решения нескольких задач. Так, если нам нужно отслеживать одновременно и разно
направленно движущиеся в поле зрения объекты (multiple-object tracking, MOT), то эта за
дача успешно решается по отношению к 3—4 целям (Cavanagh, 2004). Но когда при этом
нужно еше отмечать изменения цвета или внутренней геометрии объектов, возможности
их отслеживания резко снижаются, обычно до одного объекта (Saiki, 2002). Это могло бы
говорить о едином пуле ресурсов обработки в случае задач локализации и идентифика
ции. С другой стороны, успешность отслеживания объектов не зависит, согласно некото
рым сообщениям (Horowitz & Place, 2005), от одновременно выполняемой задачи подав
ления иррелевантной информации. 319
генными), навязанными внешней ситуацией, например, видом спелого яблока на ветке перед окном. Гештальтпсихологи в особенности подчеркивали своеобразный требовательный характер вещей (нем. Aufforderungscharakter der Dinge, а также очень похожий англоязычный неологизм affordances в экологическом подходе Гибсона — см. 9.3.1). Чтобы пояснить значение этого термина, Макс Вертхаймер предлагал представить, что вы находитесь дома и по какой-то причине не хотите подходить к телефону. Если вдруг раздается звонок телефона, то можно почувствовать требовательную силу звонка, которой приходится буквально сопротивляться, чтобы не взять трубку. На первой странице «Принципов гештальтпсихологии» Курт Коффка (Koffka, 1935) приводит перечень аналогичных примеров: «Вода кричит "Выпей меня!", яблоко кричит "Съешь меня!"» и т.д.
Обычно в текущем поведении эндогенные факторы скорее доминируют над экзогенными, однако этот баланс может автоматически сдвигаться в пользу последних под влиянием сильных, значимых, а также новых, неожиданных или необычных раздражителей. Непроизвольное внимание как область исследований непосредственно примыкает поэтому к работам по изучению знаменитого павловского рефлекса «Что такое?», известного в научной литературе под названием «ориентировочная реакция». Она представляет собой комплекс поведенческих и физиологических изменений в ответ на внезапное изменение привычного течения событий. При этом наблюдаются торможение поведения и общая ориентировка на предполагаемый раздражитель (поворот головы, зрительная фиксация, прислушивание). Это состояние готовности к восприятию и оценке ситуации поддерживается физиологическими реакциями, в число которых входят десинхронизация альфа-ритма ЭЭГ, увеличение кровоснабжения мозга, уменьшение электрического сопротивления кожи, задержка дыхания и т.д. (Наатанен, 1997)33. Наиболее сильная реакция возникает на одиночный отклоняющийся раздражитель. Если он многократно повторяется, то ориентировочная реакция постепенно угасает.
Известный русский психофизиолог Евгений Николаевич Соколов объяснил возникновение ориентировочной реакции отклонением параметров раздражителя (интенсивности, цвета, продолжительности, ритмической структуры) от его нейронной модели (Соколов, 1958). Такая «нейронная модель стимула» выполняет роль обучаемого, или самонастраивающегося, фильтра на входе в восходящую активирующую ретикулярную формацию (см. 2.4.3). По мере повторения стимуляции модель
33 Считается, что комплекс психофизиологических изменений, характерный для ориентировочной реакции, обеспечивается одной из базовых систем эмоциональной регуляции поведения, в основном связанной с такими отрицательными эмоциями, как тревога и страх (Gray, 1987). Можно также предположить участие мотивационной системы поис-320 ка и предвосхищения подкрепления (система SEEKING — см. 9.4.3).
уточняется и все более эффективно блокирует доступ к ретикулярной формации, что ведет к угасанию ориентировочной реакции. Стимул, параметры которого отличаются от записанных в нейронной модели, не может быть отфильтрован, ретикулярная формация активируется, и возникает ориентировочная реакция, тем более выраженная, чем больше степень отклонения.
Экспериментальные данные свидетельствуют об исключительном многообразии изменений, вызывающих ориентировочную реакцию. Среди них оказались не только сенсорные, но и семантические изменения, например, когда при последовательном предъявлении букв в алфавитном порядке одна из них вдруг оказывалась явно не на месте. Возникающие в связи с этим вопросы живо напоминают дискуссию о ранней или поздней локализации фильтра в исследованиях внимания (см. 4.1.2). Существует также отличное от общепринятого, но вполне правдоподобное мнение, согласно которому ориентировочная реакция возникает в основном в ответ на субъективно значимую информацию и при этом не угасает (Bernstein, 1979). В самом деле, ориентировочная реакция сохраняется на повторные предъявления собственного имени, на слова, подкрепленные ударами электрического тока, и, скажем, на многократное возникновение одних и тех же, но потенциально опасных транспортных ситуаций (см. 3.3.2). Новизна, согласно этой точке зрения, имеет самостоятельную биологическую значимость. Когда в ходе повторных предъявлений типичных психофизических раздражителей их новизна исчезает, а никакого другого особого значения у стимула не обнаруживается, то естественным образом угасает и ориентировочная реакция.
Не вдаваясь в теоретические споры о природе ориентировочной реакции, мы подробнее остановимся на современных исследованиях, которые демонстрируют роль вызывающих непроизвольное внимание факторов новизны, неожиданности и необычности, на разных уровнях когнитивной организации поведения. Основная функция непроизвольного внимания состоит в мониторинге изменений окружения {«процессы бдительности» — англ. vigilance или познеровское alerting — см. 4.3.3). Первый их этих примеров имеет отношение к наиболее быстрой зрительной реакции организма человека, называемой эффектом дистрак-тора. Вероятным субстратом этого эффекта является средний мозг (верхние бугры четверохолмия) — древнейшая структура, участвующая в переработке зрительной информации и регуляции движений глаз.
Если во время свободного обследования окружения или любого изображения, допустим, через 70 мс после начала одной из фиксаций в поле зрения в стороне от фиксируемой точки на короткое время внезапно возникает контрастное пятно («дистрактор»), то наши глаза реагируют на это событие несколько неожиданным образом. Вместо того, чтобы прервать текущую фиксацию и переориентироваться на внезапный раздражитель для его обследования, глаза просто замирают в актуальном
321
положении, так что средняя продолжительность фиксаций, во время которых предъявляется дистрактор, увеличивается по сравнению с контрольными условиями («без дистрактора») как минимум на 15—20%. Увеличение продолжительности фиксации означает задержку следующего саккадического скачка. Можно попытаться определить временные характеристики этого эффекта более точно, сравнив функции вероятностей возникновения саккады в зависимости от времени, прошедшего после начала фиксаций с дистрактором и без дистрактора. Результаты этих сравнений неизменно показывают, что эффект дистрактора максимально сказывается на поведении глаз уже через 90—100 мс после его появления (Pannasch et al., 2001)34.
Эффект дистрактора обычно считается в нейрофизиологической литературе оптомоторным рефлексом, замыкающимся на уровне среднего мозга. Это предположение было в последнее время поставлено под сомнение экспериментами, доказывающими, что речь идет о простейшей форме ориентировочной реакции. Эти эксперименты показали, что для возникновения подобного эффекта дистрактор вполне может быть слуховым или тактильным, а не зрительным. Далее, оказалось, что этот эффект обнаруживает постепенное угасание (привыкание) при повторных предъявлениях и восстанавливается, как только изменяются параметры дистрактора. Эта адаптивность весьма любопытна, так как ее трудно было бы ожидать от столь раннего уровня обработки. Поэтому значение имеют новые электрофизиологические данные, доказывающие, что речь идет именно о субкортикальных процессах: самые быстрые компоненты кортикальных вызванных потенциалов в ответ на дистрактор регистрируются уже после того, как возникают описанные изменения в поведении глаз (Marx, Pannasch & Velichkovsky, 2003).
С мониторингом отклонений от привычного течения событий или от ожидаемого вида объектов связывают и ряд других эффектов, возникающих на значительно более высоком уровне, безусловно, вовлекающем кортикальные процессы. В исследованиях зрительного поиска хорошо известен феномен асимметрии поиска. Так, мы быстрее находим перевернутую вверх ногами цифру в нормально ориентированных цифрах по сравнению с нормально ориентированной цифрой среди перевернутых. Необычное действительно «бросается в глаза»: в случае дистрак-торов это отвлекает, в случае целевых объектов помогает задаче поиска35.
34 Надо сказать, что такие времена реакции совершенно нетипичны для человека.
Простейшая двигательная реакция на зрительный раздражитель требует не менее 180 мс,
акустический сигнал — примерно на 40 мс меньше Поведенческие ответы порядка 100
мс характерны скорее для значительно более простых организмов, например, насекомых,
к которым относится мировой чемпион по скорости реакции богомол. Тормозящий мо
торику эффект неожиданного зрительного изменения используется многими видами ба
бочек, которые, демонстрируя в ситуации опасности пестрый узор крыльев, успевают
психологически обездвижить преследователя и улететь (Schienoff, 1985).
35 Кроме того, практически всегда значительно легче найти «то, что есть», чем «то,
чего нет». Например, нам легче обнаружить букву «Q» по отличающему ее хвостику среди
322 множества «О», чем, наоборот, найти «О» среди «Q».
Рис. 4.16. Асимметричный поиск, зависящий от знакомости дистракторов и целевых букв
Интересно, что предвнимательная обработка опирается здесь на цифры, а не на элементарные признаки (см. 4.2.3). Влияние обучения можно проиллюстрировать с помощью следующего примера. Для русскоязычных читателей и без того более сложный поиск двух отличающихся по ориентации букв латинского алфавита на рис. 4.16Б по сравнению с 4.16А будет дополнительно осложнен высокой степенью знакомости и «нормальной ориентацией» элемента «И». Аналогичные эффекты могут возникать и при использовании сложного невербального материала, например, фотографий лиц или изображений животных.
Одним из самых увлекательных разделов современной экспериментальной психологии является уже упоминавшийся феномен слепоты к изменению (см. 3.3.3). На самом деле, речь идет о гетерогенной группе феноменов, известных под этим общим названием. На рис. 4.17 показан один из методический приемов (методика фликера), применяемый для создания слепоты к изменению. Здесь иногда можно чрезвычайно долго смотреть на две сменяющие друг друга картинки и не замечать их различия. Несмотря на интенсивные исследования, начавшиеся примерно в середине 1990-х годов, единое теоретическое объяснение этих феноменов до сих пор отсутствует (Simons & Rensink, 2005). Выраженная нечувствительность к изменениям объектов и сцен, которые, казалось бы, должны вызывать всплеск непроизвольного внимания, наблюдается в следующих условиях:
1 ) изменения происходят на фоне других, обычно более глобальных изменений, таких как включение и выключение изображения, саккадические скачки, моргания, движение объектов или синхронизированное с искомыми изменениями появление посторонних раздражителей — дистракторов;
2) изменения происходят в сценах, включающих более 3—4 объектов, поскольку эта величина (а не «магическое число» Миллера — см.
323
Рис. 4.17. Методика фликера, широко используемая в исследованиях слепоты к изменению
324
2.1.3) лимитирует объем зрительных компонентов рабочей памяти (см. 5.2.3);
изменения происходят одновременно с выполнением задачи,
требующей высокой концентрации внимания и/или участия высоких
уровней обработки, прежде всего процессов коммуникации с другими
людьми;изменения иррелевантны по отношению к содержанию выпол
няемой задачи;некоторые из примеров «слепоты к изменению» используют при
ем постепенного введения изменений — если они происходят достаточ
но градуально, то не замечаются нами, в особенности когда одновремен
но реализуется и, по меньшей мере, одно из предыдущих условий
Просмотр этого списка показывает, что слепота к некоторому изменению часто возникает в условиях, когда мы либо не можем, либо, в известном смысле, не хотим обратить на него внимание. В условиях 1) и 2) это сделать крайне трудно, так как каждое глобальное зрительное событие (даже столь естественное, как саккадический скачок или моргание — см 3.1.1) заново запускает процессы «амбьентной», пространственной ориентировки, не совместимые с одновременной внимательной идентификацией локальных событий. Методика фликера, очевидно, использует именно эти механизмы. В условиях 3) и 4) мы решаем другие задачи и, следовательно, игнорируем или подавляем ирре-левантную информацию. К этой группе относятся яркие примеры невнимания, описанные в развитие классической работы Найссера и Беклина по селективному смотрению (см. 4.2.1). Например, когда в таких экспериментах во время показа спортивных игр — отслеживаемой и иррелевантной — экран пересекала дама с зонтиком (или в одном из вариантов экспериментатор, переодетый гориллой!), это нелепое событие
в самом центре поля зрения обычно не замечалось испытуемыми36. Наконец, условие 5) просто отражает сдвиги порогов детекции изменений. Медленные изменения перестают быть стимулом для непроизвольного внимания и должны отслеживаться произвольно, в режиме выполнения самостоятельной сознательной задачи (Saiki, 2002).
В последние годы было проведено несколько демонстраций слепоты на изменения в реальных условиях (Simons & Levin, 1998). В одной из них участвующий в эксперименте психолог с картой города в руках останавливал случайного прохожего и задавал ему вопрос о том, как он может пройти к определенному зданию. Пока прохожий определялся с ответом, двое фиктивных рабочих проносили между прохожим и задавшим вопрос деревянную панель, за которой происходила замена спросившего на другого участника эксперимента, так что, когда панель проносилась, перед прохожим стоял уже другой человек. Примерно в 40% случаев эта подмена не замечалась (надо сказать, впрочем, что ни пол, ни возраст, ни общий вид в таких опытах не менялись). Эти наблюдения иллюстрируют не только особенности нашего восприятия, но и особую когнитивную сложность коммуникативных задач. Не случайно воры-карманники часто стараются вовлечь свою жертву в процесс общения, во время которого подельник обследует карманы. Характерно, что и здесь последующие попытки опознать участников эпизода часто оказываются малоуспешными. Другой известный пример — общение при управлении автомобилем. В отличие от разговора с попутчиком, темп и характер которого зависят от обстановки на дороге, разговор по телефону навязывает водителю свой ритм, в результате чего вероятность аварии возрастает в несколько раз.
Начав рассмотрение непроизвольного внимания с простейших эволюционных механизмов, мы приблизились к процессам, связанным с семантикой (значением) и прагматикой (смыслом — см. 7.1.2) ситуации. Хотя появление структур, аналогичных среднему мозгу, и префронталь-ной коры разделяют миллионы лет эволюции, принцип остается тот же — внимание привлекает все новое, необычное и неожиданное. Мы уже упоминали в предыдущей главе (см. 3 3.3), что варьирование релевантности событий в традиционных экспериментах на слепоту к изменениям позволяет практически полностью снимать эти эффекты (Vfelichkovsky et al., 2002a). Здесь особенно сильно выступает роль экспертных знаний, так как лишь тот, кто знает, что релевантно, а что нет, способен использовать подобную семантическую информацию. Эксперты в определенных областях более чувствительны к изменению переменных,
36 Как показывают новые исследования, речь идет, по-видимому, все-таки о подавле
нии иррелевантнои информации — полнота «счепоты» к таким дополнительным измене
ниям тем выше, чем более они похожи на мешающую решению задачи цепочку событий
(Most et al, 2001) 325
меняющих смысл ситуации (см. 8.3.4). Надо сказать, что в случае высших когнитивных механизмов непроизвольное внимание может выступать и в метакогнитивной функции — неожиданный вывод или новое, только что пришедшее в голову сравнение способны приковать наше внимание значительно более прочно, чем появление в поле зрения дамы с зонтиком.
При столь важной роли внимания в структурировании деятельности человека совсем не удивительно существование мощных и бурно развивающихся технологий, использующих непроизвольное внимание. Этой цели служат современные средства рекламы и компьютерной презентации данных, а также театральные и кинематографические приемы подсвечивания, ритмического движения, группировки, музыкального сопровождения. Древние интеллектуальные технологии риторики и поэтики представляют собой приемы повышения выразительности устной и письменной речи, что достигается с помощью необычных и ярких сравнений, введения ритмической структуры или постановки вопроса к аудитории, на который тут же дается заранее подготовленный ответ («риторический вопрос»).
Для невербальных технологий коммуникативного воздействия — иконописи, рекламы и типичных для эпохи массовых войн плакатов жанра «Ты записался добровольцем?» — характерно использование приема преследующего взгляда37. Действительно, как мы видели выше (см. 3.4.4), уже в конце первого месяца жизни глаза становятся особенно привлекательным стимулом нашего окружения. Нейрофизиологические исследования выявляют существование нейронов, чувствительных к: положению зрачка в схеме лица. Эти нейроны локализованы в передних височных долях коры и в расположенной непосредственно под ними миндалине (амигдале), участвующей в переработке эмоциональной информации (см. 5.3.2). Высокая чувствительность к направлению взгляда другого человека, особенно в сочетании с движениями его рук, позволяет поддерживать состояния совместного внимания (joint attention) по отношению к одним и тем же предметам непосредственного окружения38. Внутри состояний совместного внимания и развиваются первоначально речевые и социальные компетентности ребенка (Tomasello, 1999b). Поэтому они представляют собой непроизвольную основу развития произвольно контролируемых форм активности.
17 Психофизические основания, делающие возможным возникновение эффекта «преследующего взгляда» в случае изображений на плоскости, обсуждаются в работе Кёнде-ринка и ван Дорн (Koenderink & van Doom, 2003).
58 Сочетание направленности взгляда и движений руки исключительно успешно используется иллюзионистами для демонстрации волшебных исчезновений и превращений предметов (Tatler & Kuhn, in press). Оно же может использоваться в качестве средства отвлече-326 ния внимания противника в спорте.
4.4.2 Произвольное внимание и контроль действия
Курт Левин (Lewin, 1926/2001) предложил рассматривать сознательные намерения (интенции) и обусловленные ими произвольные действия как квазипотребности — напряженные системы, аналогичные мотивам деятельности, но возникающие на относительно короткое время и включающие в себя ситуативные, «полевые» влияния. Подобно настоящим потребностям, квазипотребности сенсибилизируют наши восприятие и мышление по отношению к релевантным аспектам ситуации. Координационная структура действия (которая, по нашему мнению, и есть внимание — см. 4.1.1) обычно удерживает динамический баланс эндогенных и экзогенных влияний вплоть до достижения удовлетворительного результата и исчезновения квазипотребности. Это описание отражает, быть может, наиболее фундаментальную дилемму организации поведения: продолжать ли попытки достижения поставленной цели или же сменить цель и выполняемое действие с учетом изменившихся обстоятельств (Goschke, 2002).
Как мы только что видели при обсуждении непроизвольного внимания, этот баланс может временно сдвигаться в направлении доминирования ситуативных факторов. Один из разделов прикладной психологии занимается описанием и классификацией повседневных сбоев в выполнении запланированных действий — вошел в комнату, чтобы найти книгу, а оказался у телевизора; хотел снять деньги в банкомате, но почему-то начал набирать на клавиатуре привычный номер телефона и т.д. Как правило, во всех этих случаях можно найти комбинацию факторов, ослабляющих произвольное внимание, и наличие ситуации, побуждающей нас привычно делать нечто иное. Произвольный контроль ослабляется в состояниях утомления и стресса, а также под влиянием фармакологических веществ. Такой сдвиг принимает постоянный характер при нарушениях работы фронтальных отделов мозга. Пожалуй, самым драматическим проявлением таких нарушений является эффект «расторма-живания» привычных схем предметных действий — пациентка с поражением лобных долей, увидев на столе врача спицы, берет их и без всякого повода начинает вязать, не будучи способной прервать действие. Эта клиническая разновидность полевого поведения называется синдромом утилитарного поведения (Lhermitte, 1983).
Связь лобных долей с контролем поведения известна в неврологии и нейропсихологии, по крайней мере, со второй половины 19-го века, когда был подробно описан случай Финеаса Гейджа — бригадира строителей железной дороги, которому при случайном взрыве вылетевший из шурфа лом разрушил обе лобные доли. Современники были поражены, что, несмотря на массивные разрушения префронтальной коры, сознание и все основные познавательные функции Гейджа, такие как восприятие, память и речь, остались сохранными. Однако он явно перестал в должной мере контролировать свое поведение и мышление, которые
стали импульсивными и во все возрастающей степени асоциальными — изменилась сама личность Гейджа. Опираясь на нейропсихологический материал двух мировых войн, А.Р. Лурия описал так называемый лобный синдром, в состав основных симптомов которого входят дезорганизация стратегического и оперативного планирования деятельности, неспособность пациента подчинить движения выражаемым в речи намерениям, неустойчивость внимания, а также неспособность переключиться на решение новой задачи, замену рациональных, целесообразных действий «эхопрактическим» повторением движений и инерционных стереотипов. В современной нейропсихологии продолжаются споры о том, существует ли на самом деле некоторый единый лобный синдром. Сегодня в этом контексте чаще всего используется несколько громоздкий термин дезэкзекутивный синдром (см. 5.2.3, 8.1.1 и 9.4.3).
Неоднородна уже анатомическая структура фронтальных долей. Занимая у человека не менее трети всего объема коры, они разделяются на несколько отделов. Наиболее задние, примыкающие к продольной (разделяющей левое и правое полушария) борозде отделы выполняют моторные функции. Далее в переднем направлении следуют премотор-ная кора, включающая, среди прочего, зону Брока (одна из важнейших речевых зон, обычно локализованная в левом полушарии — см. 7.1.1), фронтальные глазодвигательные поля и дополнительные моторные поля. Собственно префронтальная кора в свою очередь разделяется на дорзола-теральную, вентролатеральную и медиобазалъную кору, причем в составе последней иногда выделяют орбитофронтальную кору и фронтополярную кору — наиболее выдвинутый вперед участок мозга.
Фронтальные доли не вполне симметричны: премоторные отделы левого полушария, участвующие в регуляции речи (зона Брока), обширнее правых. Одновременно на последнем этапе эволюции — в антропогенезе — происходит ускоренное развитие правых фронтополярных отделов мозга. Фронтальные отделы связаны практически со всеми основными структурами коры и подкорковых образований, включая ба-зальные ганглии, таламус и средний мозг. Эти связи относятся к числу наиболее поздно развивающихся в онтогенезе — они частично устанавливаются только к четырем годам, а их полное оформление продолжается, как минимум, до окончания подросткового возраста (см. 2.4.4 и 9.4.2). К фронтальным долям (ее медиобазальным отделам) непосредственно примыкают структуры передней поясной извилины (anterior cingulate cortex), образующие с ними единую функциональную систему (см. 4.3.3).
Большинство нейропсихологических моделей подчеркивают скорее поведенческие аспекты выпадения функций фронтальных отделов мозга. Для А. Р. Лурия и его прямых последователей с лобными долями были связаны прежде всего планирование, регуляция и контроль текущей деятельности. В последние годы получены многочисленные дан-328
ные, свидетельствующие о ведущей роли префронтальной коры в преобразованиях и интеграции знаний (см. 5.3.3, 7.4.2 и 8.2.1). Согласно обсуждаемой ниже теории Д. Нормана и Т. Шаллиса (Norman & Shallice, 1987), префронтальные структуры являются субстратом системы внимательного контроля. Одним из источников данных для модели служат всевозможные ляпсусы — ошибочные действия, часто возникающие при внезапных прерываниях текущей деятельности, таких как телефонные звонки. Когда внимание отвлекается, то резко усиливается вероятность того, что действие начнет протекать по некоторому привычному, накатанному руслу. Совершенно очевидно, что произвольное внимание представляет собой атрибут процессов контроля, необходимых для преодоления автоматических тенденций выполнения привычного, хорошо заученного действия (см. 4.3.1 и 5.1.3).
Неоднородность выполняемых лобными долями функций затрудняет нахождение для них «общего знаменателя». Эти функции выявляются с помощью различных методов, причем наряду с нейропсихологи-ческим анализом отдельных случаев в последние годы все большую роль начинают играть данные нейровизуализации — трехмерного мозгового картирования, проводимого в процессе решения задач здоровыми испытуемыми. Мы кратко остановимся на основных группах выявляемых таким образом функций (см. 8.1.1 и 9.4.3). Первая группа связана с принятием решений и со сменой задачи. Именно в этом отношении пациенты часто не способны выйти за рамки заданной ранее установки, что проявляется как в трудностях инициации нового действия, так и в неспособности остановить старое. Патологическое повторение отдельных действий и мыслей — персеверация — характерный признак этих нарушений. Данные мозгового картирования в задачах принятия решения и при смене задачи говорят о ведущей роли левых префронтальных структур и правой фронтополярной коры.
Вторая группа функций по своей направленности в известном смысле противоположна первой, так как они препятствуют смене задачи. Для подобного длительного удержания внимания, по-видимому, существенны дорзолатеральные отделы правого полушария и медиоба-зальные структуры фронтальной коры (Brass et al., 2005). Многие операторские задачи инженерной психологии, такие как обнаружение околопороговых и редких сигналов (задачи на «бдительность»), относятся к этой категории (см. 2.1.2). Поражение дорзолатеральной коры обуславливает картину крайней лабильности и отвлекаемое™ «лобных» пациентов. Можно сделать вывод, что контроль действия есть динамический баланс — состояние левиновской «квазипотребности» — тенденций сохранения и смены задачи. Разумеется, в установлении и изменении отмененного баланса принимают участие и другие группы механизмов мозга, прежде всего, связанные с речью (зона Брока и расположенные спереди от нее структуры левой профронтальной коры), а также эмоци-
329
ями и мотивацией (медиобазальные отделы фронтальных долей, лимби-ческая система)39.
В 1980-х годах было предложено несколько теоретических описаний процессов контроля действия. Наиболее известной стала модель произвольного и автоматического контроля, которую разработали Дональд Норман и английский нейропсихолог Тим Шаллис (Norman & Shallice, 1986). Модель дает несколько более дифференцированное описание процессов контроля, чем это было типично для двухуровневых моделей, рассмотренных нами в предыдущем разделе (см. 4.3.3). Авторы постулируют три уровня функционирования модели. Высший уровень образуют процессы произвольного (сознательного) контроля, осуществляемые системой «внимательного руководства» {supervisory attentional system). На втором уровне находятся полуавтоматические, обычно не осознаваемые процессы, функция которых состоит в установлении приоритетов (contention scheduling) и разрешении локальных конфликтов между процедурами третьего уровня. Этот последний уровень связан с процессами полностью автоматической обработки, которые разворачиваются под контролем хранящихся в памяти схем привычных действий.
Несколько загадочная система внимательного (произвольного) руководства, которая образует центральный элемент данной модели, может быть охарактеризована с помощью следующего перечня условий деятельности, требующих ее непременного участия:
выполняемое действие включает этапы принятия решения и пла
нирования;в процессе решения возникают непредвиденные трудности;
процессы решения являются новыми или плохо выученными;
задача представляется сложной или даже опасной;
решение предполагает преодоление очень сильного привычного
ответа.
Если произвольный контроль нарушен, модель предсказывает переход контроля к схемам привычных предметных (утилитарных, эхопрак-тических) действий — как это часто и наблюдается при поражениях лобных долей. Усилия последних лет были направлены на проверку нейрофизиологической реальности этой системы. В частности, было установлено существование нескольких подсистем, взаимодействующих между собой при решении тех или иных задач. Например, по мнению
39 Поддержание длительного (sustained) внимания — в течение времени, выходящего за рамки оперативного контроля действия, — является областью исследований, которая относится скорее к сфере психологии мотивации, личности и саморегуляции деятельности. Соответственно, решение таких задач оказывается тесно связанным с индивидуальными психофизиологическими характеристиками. Примерами могут служить традиционные операторские задачам на бдительное отслеживание некоторого критического сигнала (см. 1.2.2), а также процессы решения научных проблем, которые могут растяги-330 ваться на десятилетия (см. 8.3.2).
канадского исследователя Дональда Стасса (Стасс, 2003), левая пре-фронтальная кора, по-видимому, участвует в сдвигах критериев выбора ответа — в смысле теории обнаружения сигнала (см. 2.1.2), а дорзолате-ральные участки правой префронтальной определяют релевантность той или иной информации, то есть то, что вообще становится для нас «сигналом», а что «шумом». Таким образом, различные подсистемы пре-фронтальных областей представляют собой не автономные модули, а компоненты некоторого единого механизма. Несмотря на эти уточнения, в теоретическом отношении система «внимательного руководства» продолжает оставаться подозрительно похожей на гомункулуса (см. 2.1.3). Мы подробнее остановимся на этой проблеме при обсуждении другой похожей структурной единицы — блока «центрального исполнителя» современных моделей рабочей памяти (см. 5.2.3) и при анализе общей организации когнитивно-аффективных механизмов (см. 9.4.3).
Наиболее интересным событием 1990-х годов стало начало интенсивных исследований процессов смены действия, или переключения задачи (task-set switching). Значение таких исследований состоит в том, что они прямо тестируют критически важный для механизмов контроля баланс тенденций сохранения и смены цели. А. Олпорт с сотрудниками (Allport, Styles & Hsieh, 1994), равно как и многие другие авторы, использовали для этого ряд очень простых, построенных по одному и тому же принципу ситуаций. Испытуемые должны постоянно менять характер действий, выполняемых по отношению к последовательно предъявляемым стимулам. Так, если стимулами являются цифры, то переключение может быть между сложением и вычитанием, если слова — между чтением и называнием цвета букв. Успешность работы сравнивается с результатами выполнения лишь одной из таких задач, в качестве контрольного условия. Обычно такое сравнение свидетельствует о значительном увеличении времени обработки при необходимости переключаться с одной задачи на другую. Подобная цена переключения складывается из двух компонентов — инерции предыдущей задачи и цены переформатирования процессов обработки в соответствии с требованиями новой задачи. Эти компоненты могут быть оценены с помощью экспериментальных манипуляций, например, изменения задачи от пробы к пробе или только между сериями проб.
Интерпретация экспериментов на переключение задачи вызывает сегодня оживленные споры. Хотя большинство исследователей считают, что полученные данные лишь уточняют наши знания о характеристиках работы гипотетических структур произвольного контроля (таких как системы «внимательного руководства» в модели Нормана—Шаллиса и «центрального исполнителя» в моделях рабочей памяти — см. 5.2.3), по мнению • Олпорта, эти данные прямо противоречат подобным моделям. Приводимые им аргументы не выстраиваются пока в стройную систему взглядов и скорее имеют характер отдельных эмпирических наблюдений.
331
Например, если некоторый «внимательный руководитель» осуществляет переформатирование когнитивных механизмов под новую задачу, на что уходит определенное время, 400—500 мс, то, увеличивая интервал между пробами до секунды и более, можно было бы ожидать исчезновения значительной части негативных эффектов — «цены» переключения. Увеличение интервала ведет к улучшению, но оно оказывается значительно меньше ожидаемого. Это, полагает Олпорт, доказывает, что переключение — процесс, скорее ведомый самой ситуацией, а не управляемый некоторой гомункулярной «центральной инстанцией». Действительно, когда в экспериментах попеременно предъявлялись цифры и слова, причем цифры нужно было складывать, а слова зачитывать, сам материал определял характер действия и связанная с переключением «цена» просто исчезала (Koch & Allport, in press). Еще одно интересное наблюдение состоит в том, что одновременная нагрузка на память и увеличение числа задач, между которыми происходит переключение, не оказывают влияния на цену переключения. Этот факт, еще требующий дополнительной проверки, трудно совместить с представлением о некоторой единой системе внимательного контроля (или единой системы ресурсов) как для оперативного запоминания, так и для смены задачи (см. 5.2.3).
Продвижение наметилось в вопросе о механизме переключения. Можно предположить, что переключение опирается на вербальную самоинструкцию. То, что участники таких экспериментов помогают себе, называя задачу, отмечалось и ранее, но только в последнее время стало предметом исследования. В экспериментах Томаса Гошке (Goschke, 2000) испытуемым в каждой пробе показывалась буква, А или В, красного или зеленого цвета. От пробы к пробе нужно было определять (путем нажатия на одну из двух кнопок) либо идентичность, либо цвет стимулов. В контрольных условиях характер задачи на протяжении серии проб не менялся. Одной из переменных был интервал между ответом и предъявлением следующего стимула. Когда интервал был равен 17 мс, его нельзя было использовать для подготовки переключения и по сравнению с контрольными условиями задача требовала на 300 мс больше. Когда интервал увеличивался до 1200 мс и испытуемые называли следующую задачу (то есть говорили «цвет» или «буква»), цена переключения уменьшалась в несколько раз. В одном из условий испытуемые должны были в том же темпе произносить слова-дистракторы (например, «вторник» и «среда»). Здесь, несмотря на продолжительный интервал 1200 мс, цена переключения вновь возрастала до 300 мс. Очевидно, что не просто вербализация, а лишь семантически адекватное называние (то есть процессы уровня Ε — см. 5.3.3) позволяет воссоздать требуемую координационную структуру предметного действия (уровень D).
Данные мозгового картирования подтверждают, что переключение задачи и принятие решения (с похожими колебаниями от анализа одной возможности к анализу другой и обратно — см. 8.4.2) вовлекают рече-332
вые механизмы передних отделов левого полушария, примерно соответствующие зоне Брока. Целый ряд идей о речевом контроле можно найти в работах отечественных авторов. И.П. Павлов проницательно писал о речевых значениях как о второй сигнальной системе, замещающей реальные объекты и, отчасти, действия с ними. Одно из основных положений теории культурно-исторического развития высших психических функций Выготского (см. 1.4.2) состоит о том, что произвольный контроль поведения формируется в сфере коммуникативного взаимодействия и опирается на использование речевых значений в качестве культурных стимулов-средств40. Мы уже упоминали теорию внимания как интериоризированного внешнего контроля П.Я. Гальперина (см. 4.3.1). Особенно релевантным является исследование А.Р. Лу-рия и Ф.Я. Юдович (1953), которые смоделировали в лабораторных экспериментах с детьми процессы формирования речевого контроля — начиная с повторения речевых названий действия вслед за взрослым и кончая их использованием в качестве самоинструкции.
Было бы ошибкой в свете этих данных возвращаться к позиции «лингвистической детерминированности» познания (см. 8.1.2). Путем опоры на внутреннюю речь воспроизводятся относительно хорошо выученные, фиксированные в памяти схемы действия. В общем случае речевой контроль является лишь фоновой координацией для личностно-смысловых механизмов. Последние связаны скорее с орбитофронталь-ной корой и префронтальными отделами правого полушария. Решение особенно сложных и новых задач неизменно вовлекает эти механизмы. Это относится даже к вербальному материалу, если он имеет металингвистический характер (поэтическая речь, ирония, юмор — см. 7.4.2). Серьезный аргумент дают клинические данные. Последствия мозговых поражений для самосознания обычно серьезнее при их локализации справа — пациент склонен игнорировать эти поражения и особенности своего состояния, что ведет к распаду личности. При левосторонних поражениях, несмотря на речевые выпадения, рефлексивное сознание сохраняется, как сохраняется, в ряде описанных в литературе случаев (Лурия, 1969), способность к творчеству. Именно эти признаки могли бы характеризовать высшие, так называемые метакогнитивные координации, которые мы подробно рассмотрим в последующих главах (см. 5.3.3 и 8.1.1).
40 Рефлексия — это особая задача, переход к которой требует участия внутренней речи.
Когда мы прерываем текущую активность и принимаем интроспективную установку, то
это всегда означает произвольную смену задачи, для чего требуется речевое опосредство
вание. Интроспективно внутренний диалог постоянно сопровождает процессы произволь
ного контроля. Коммуникативные задачи потому так сильно интерферируют с основной
деятельностью (см. 4.4.1), что процессы контроля обычно сохраняют речевую природу и
в их интериоризированной, внутренней форме. 333
4.4.3 Нейрофилософия и нейропсихология сознания
Приступая к обсуждению одной из мировых загадок, быть может, даже самой сложной из них, мы ставим себе скромную цель упорядочивания небольшой части существующих мнений и первых эмпирических данных о природе сознания. На всемирном психологическом конгрессе 2000 года в Стокгольме руководителям симпозиумов по вниманию и сознанию — Энн Трисман и канадо-эстонскому психологу Энделу Гул-вингу в один и тот же день был задан вопрос о соотношении внимания и сознания. Ответы были похожи, но с точностью до наоборот. По мнению Трисман, на этот вопрос нельзя дать ответ, поскольку никакого единого внимания не существует. Для Тулвинга ответ был невозможен, так как на самом деле не существует единого сознания. Основная проблема заключается в том, что феномены сознания даны нам в нашем самонаблюдении, то есть из позиции первого лица, тогда как, с научной точки зрения (см. 1.1.3 и 1.3.2), исследование может вестись только из внешней по отношению к изучаемой системе позиции третьего лица (см. 9.4.1). Значительная трудность состоит также в отмечавшейся выше неточности и многозначности используемых терминов (см. 4.1.1)41. Мы рассмотрим сначала общие нейрофизиологические гипотезы, потом нейропсихологические факты и уровневые объяснения.
Интересно, что если 30 лет назад разгадку проблем, связанных с психологией сознания, было принято искать прежде всего в физических теориях, таких как теория относительности или квантовая механика, то сегодня доминирующую роль играют нейрофизиологические и нейропсихологические соображения. В связи с этим можно даже говорить о наступившей эпохе нейрофилософии сознания. Центральный, отмечаемый всеми авторами факт состоит в распределенном характере обработки отдельных признаков объектов в разных участках мозга. Например, когда мы видим перед собой движущийся желтый автомобиль, его форма, направление движения и цвет выделяются различными модулярно организованными механизмами задних отделов коры. Как объяснить интеграцию всех этих параметров в нашем субъективном опыте?
Видный американский философ Даниел Деннетт в книге с легко запоминающимся названием «Объясненное сознание» (Dennett, 1992) критически проанализировал модели, связывающие акт осознания с ра-
41 В разных языках существуют часто не совпадающие по значению термины, одни из которых выделяют состояние совместного знания (русское «сознание», английское «consciousness»), другие — просто знания (немецкое «Bewusstsein»), третьи — бдительного бодрствования (английское «awareness»). Многие из этих терм'инов появились в соответствующих языках сравнительно недавно. До 18-го века наиболее близким по значению к сознанию словом русского языка было слово «совесть». Оно до сих пор сохранилось в этом значении в сербо-хорватском языке. Подобно латинскому «conscientia», французское «conscience» также употребляется в обоих значениях — как нравственное начало, совесть и как когнитивная способность к рефлексии. В некоторых языках мира, по-види-334 мому, вообще не удается найти прямые аналоги термина «сознание».
ботой некоторого нейрофизиологического центра (или блока в цепочке процессов переработки информации), в котором происходит пространственное объединение признаков объектов и событий. Эту точку зрения на сознание он называет гипотезой картезианского театра, поскольку Декарт, несмотря на крайний дуализм его концепции (см. 1.1.1), допускал пространственную конвергенцию тела (физиологических процессов) и души (внутреннего зрителя) в одной точке мозга42. Типичная для нейронных сетей параллельная распределенная обработка делает подобную конвергенцию в какой-либо определенной области мозга проблематичной, заставляя искать другие, прежде всего временные формы интеграции.
Одна из конкретных гипотез разрабатывается Нобелевским лауреатом по биологии Фрэнсисом Криком (открытие двойной спирали ДНК) и нейроинформатиком Кристофом Кохом. Их подход в действительности целиком опирается на более ранние работы немецких нейрофизиологов фон дер Мальсбурга и Зингера, обсуждавшиеся нами, вместе с рядом критических замечаний, в одном из предыдущих разделов этой главы (см. 4.2.3). Предполагается, что перцептивная интеграция, столь характерная для нашего сознательного восприятия, связана с синхронной активацией обширных областей сенсорной коры в диапазоне гамма-ритма, то есть ритма с частотой порядка 40—70 Гц. Нейроны, разряжающиеся в фазу в разных участках мозга, могли бы кодировать различные признаки одного и того же объекта во времени, без обязательного пространственного объединения информации в некоторой узко локализованной области мозга. Хотя этой гипотезе явно не хватает эмпирических доказательств (имеющиеся данные в основном получены при изучении нейронов зрительной коры кошки), известно, что именно гамма-ритм резко ослабевает в состоянии общей анестезии.
Еще одна близкая гипотеза была предложена в последние годы немецким нейрофизиологом Гансом Флором (Flohr, 2002). По мнению этого автора, акт осознания — это функция нейронной сети в целом, которая и сама меняется в его результате. Он одним из первых подчеркнул возможное значение биохимических и пороговых характеристик части синапсов нейронов головного мозга, а именно так называемых NMDA {N-methyl-D-asparaté) синапсов^. Их отличают относительно высокие пороги, но если подобный «синаптический барьер» все-таки преодолевается, то величина порога сразу и на длительное время снижается, так что
42 Местом такой конвергенции считался расположенный в области эпиталамуса эпи
физ (шишковидное тело, или шишковидная железа). В ряде отношений взгляды Декарта
оказываются, впрочем, более современными, чем может показаться на первый взгляд.
Во-первых, эпифиз, выделяя гормон мелатонин, участвует в регуляции состояний сна и
бодрствования, которые, в известном смысле, «связывают» (и «рассоединяют») «душу с
телом». Во-вторых, для Декарта в целом была характерна непространственная трактовка
субъективного опыта, играющая важную роль и в сегодняшних нейрофилософских гипо
тезах.
43 /УМШ-синапсы являются частью глутаматэргической системы, но их функциони
рование зависит также от других нейротрансмигтеров, например, ацетилхолина (см. 5.4.3). 335
пре- и постсинаптические нейроны с высокой вероятностью начинают в течение длительного времени работать как одно функциональное целое. В подобном описании довольно легко узнать реализацию хэббов-ской идеи клеточных ансамблей (см. 1.4.2 и 2.3.3).
Для преодоления высоких пороговых характеристик 7УЛШ4-синапсов в общем случае недостаточно одной только сенсорной, или модально-специфической, активации. Необходимой является одновременная конвергенция на тех же нейронах неспецифических влияний, источником которых служит восходящая активирующая ретикулярная формация (см. 2.4.3 и 4.4.1). Иными словами, активация должна быть массивной, как это имеет место, например, при ориентировочной реакции, возникающей в ответ на новое, неожиданное или субъективно значимое развитие событий. Как раз эти параметры способствуют осознанию конкретного эпизода, что ведет к одноразовому научению и формированию эксплицитной памяти (см. 5.3.2). Возможная связь ЖМШ-синапсов с сознанием была проверена с помощью их биохимического блокирования. Подобные манипуляции неизменно вели к общей анестезии. Гипотеза Флора может быть объединена с предположением о роли интегральных ритмов мозга (а именно гамма- и, возможно, более медленного, типичного для фронто-базальных структур мозга тета-ритма — см. 5.3.2), если учесть, что синхронизация активности множества нейронов позволяет лучше «пробивать» высокие синаптические пороги.
Намечающиеся нейрофизиологические подходы не позволяют пока объяснить содержательные аспекты нашего субъективного опыта, в особенности его временные характеристики. Между тем именно здесь научный анализ до сих пор наталкивается на фундаментальные трудности при интерпретации восприятия событий и произвольной инициации движений. Рассмотрим, например, хорошо известный и, казалось бы, простой феномен стробоскопического движения (см. 3.1.2). При последовательном показе двух неподвижных объектов на близких позициях и с асинхронностью включения около 100 мс мы обычно воспринимаем лишь один объект, движущийся от места первого предъявления к месту второго. Если признаки объектов (цвет или форма) отличаются друг от друга, то в процессе движения происходит соответствующая трансформация восприятия — примерно в середине траектории иллюзорный объект меняет свой цвет на цвет второго объекта. Вопрос состоит в том, откуда наше восприятие может знать направление и скорость движения, а также характер преобразований цвета (или формы) до того, как второй объект предъявлен.
Поэтому для многих авторов восприятие движения есть результат интерпретации стимульных событий, осуществляемой после показа второго объекта и лишь затем проецируемой в прошлое. С обычным для него остроумием Деннетт (Dennett, 1992) различает при этом оруэллов-скую и сталинскую модели детерминации содержаний сознания. Первая • модель обыгрывает работу «министерства правды» из знаменитого ро-336
мана Джорджа Оруэлла «1984». Это министерство занималось постоянным исправлением прошлого — вплоть до перепечатки старых газет — в интересах актуальной политической конъюнктуры. Применительно к стробоскопическому движению это могло бы означать, что вначале мы видим неподвижные объекты, но потом это восприятие корректируется на восприятие движения, а следы исходной версии событий стираются. По сталинской модели, все, что мы осознаем, есть результат отсроченной инсценировки, в общем случае имеющей слабое отношение к действительности. Прообразом здесь, очевидно, послужили показательные процессы 1930-х годов, в которых обвиняемые не только признавались в якобы совершенных преступлениях, но и сами помогали на подготовительном этапе в фабрикации доказательств.
Для Деннетта обе эти модели связаны с гипотезой картезианского театра. Гипотеза сцены и гипотеза внутреннего зрителя предполагают друг друга. Если нет сцены и нет зрителя, то отпадает необходимость какой-либо инсценировки. Собственную точку зрения в этом сложном вопросе Деннетт осторожно формулирует как гипотезу множественных набросков. Многочисленные латентные описания текущих событий сосуществуют одновременно, причем одни из них могут усиливаться по мере поступления новой информации, тогда как другие ослабевать. Отображаемое в подобных описаниях время событий не следует путать с временем поступления сенсорной информации. Так, если мы слышим фразу «Ваня пришел после Маши, но раньше всех пришла Ира», то, хотя в порядке поступления информации «Ваня» упоминается раньше, чем «Маша» и «Ира», в нашем осознании описываемых событий приход Иры будет предшествовать появлению Маши и Вани.
Гипотеза множественных набросков пока сама имеет довольно эскизный характер, не позволяющий делать экспериментально проверяемые предсказания. По нашему мнению, при обсуждении проблемы сознания нужно учитывать два обстоятельства. Во-первых, рефлексивное сознание и произвольный контроль часто запаздывают по отношению к их собственным фоновым операциям, в частности, наше внимание оказывается быстрее сознательных решений обратить на что-то внимание. Вероятная причина этого, как отмечалось, состоит в том, что принятие интроспективной (рефлексивной) установки предполагает произвольную смену задачи и вовлекает относительно медленные процессы внутренней речи (см. 4.4.2 и 7.1.2), запаздывающие по отношению к реальным событиям. Во-вторых, следует предположить существование нескольких, качественно различных форм осознания, отличающихся эволюционным уровнем обеспечивающих их механизмов (см. 8.4.3).
Рассмотрим сначала данные, показывающие, что осознание и произвольные интенции — это сравнительно медленные процессы, тогда как внимание — быстрый. Мы неоднократно подчеркивали выше, что перерывы в зрительном восприятии, связанные с саккадами и с морга-
337
ниями, обычно не осознаются нами, равно как и многие другие факты, например, наличие в поле зрения слепого пятна (участка сетчатки, лишенного рецепторов) или невозможность отчетливого восприятия объектов уже на расстоянии нескольких угловых градусов от точки фиксации. Почему наше сознание говорит, что мы видим огромное, наполненное светом и цветом пространство? Потому, что когда мы только начинаем спрашивать себя: «А вижу ли я отчетливо мое окружение, скажем, слева от рассматриваемого сейчас предмета?», наше внимание и глаза уже переместились туда и еще не вполне сформулированный вопрос прерывается ответом: «Вижу, конечно вижу!». Точно так же обстоит дело и со стабильностью видимого мира (см. 3.1.1). Всякий раз когда мы задаем себе вопрос о положении предметов, процессы быстрой пространственной локализации, оказывается, уже успели дать нам ответ. В результате у нас возникает впечатление непрерывного во времени и пространстве стабильного образа окружения.
В этом же контексте следует рассматривать и другую классическую проблему, в равной мере важную для моральной философии, психоанализа и когнитивной нейронауки. Мы объясняем наши действия и поступки в терминах свободно принимаемых решений, сознательных целей и намерений (см. 1.1.2 и 9.1.3). Но так ли существенны эти интенциональные состояния на самом деле, или они лишь оправдывают наши действия postfactuml В последние два десятилетия были проведены эксперименты, в которых можно было сравнивать время, когда испытуемые сообщали о том, что хотят совершить некоторое произвольное движение, и когда они реально начинали его делать или, по крайней мере, к нему готовиться. О последнем можно было судить по активации моторной коры (Libet et al., 1983) или по переводу взгляда в нужную область пространства (Velichkovsky, 1995). Эти признаки внимания и подготовки действия возникали за 300—500 мс до того, как испытуемые отдавали себе отчет в том, что они хотят осуществить соответствующее действие44. Не означает ли это, что настоящее решение было принято раньше, некоторым «мозговым политбюро» (или «исполкомом» — см. 9.4.3), а наша интроспекция представляет собой лишь последующую инсценировку в духе картезианского театра?
Данная проблема чрезвычайно сложна. В ряде случаев есть все основания полагать, что чувство волевого усилия — это просто иллюзия, дающая нам видимость объяснения причин наших действий (Wegner, 2002). Иными словами, волевое усилие — это не сама причина, а отра-
44 Поскольку произвольное действие, связанное с сознательным решением, требует большего времени, чем просто рефлекторный ответ на внешние события, датский физик, Нобелевский лауреат Нильс Бор как-то высказал предположение, что в классической ситуации американских вестернов противостояние двух ковбоев чаще должно вести к гибели того из них, кто решается стрелять первым. Новые данные об опережающем интроспек-338 цию развертывании действия в какой-то степени уравнивают шансы контрагентов.
жение наших предположений о возможной причине, разновидность метакогнитивных мыслей о самом себе (higher-order thoughts — Rosenthal, 2003). В самом деле, отчетливое впечатление причинно-следственной связи может возникать иллюзорно, при чисто случайном совпадении двух событий, как, например, в экспериментах Мишотта (см. 3.1.2). Выраженная диссоциация чувства волевого контроля и выполняемых действий характерна далее для некоторых психотических состояний, когда пациент начинает утверждать, что его действия контролируются кем-то другим. В состояниях гипноза такая диссоциация действительно может сопровождаться внешним контролем выполняемых действий.
С другой стороны, эти факты, видимо, еше недостаточны, чтобы в принципе поставить под сомнение свободу воли, ведь наблюдаемая в упомянутых экспериментах ранняя физиологическая активация и последующий субъективный отчет в норме никогда не противоречат друг ДРУГУ, разворачиваясь в русле некоторого единого действия на нескольких уровнях, имеющих разную временную «гранулярность». Процессы целеполагания в «верхней части» иерархии вполне могут начинаться раньше, запуская всю иерархию относительно элементарных процессов поддержки, а кончаться позже некоторых из низкоуровневых операций. Интересно, что при намечающейся трактовке функциональная архитектура произвольного действия становится похожей на иерархию монад, как их описывал, решая по сути дела ту же задачу, Лейбниц (см. 1.1.2). Следует отметить также, что реальные физиологические изменения и внешние движения обычно опережают осознания волевого усилия лишь в условиях гладкого протекания действия, когда справедливо утверждение, что «сознание медленное, а внимание быстрое». При возникновении трудностей это опережение сокращается и даже полностью исчезает (см. 9.1.3).
Существенной причиной, затрудняющей исследование сознания, является то, что в русле восходящей к Декарту традиции европейской мысли Нового времени о сознании принято говорить в общем виде, без учета возможного качественного и эволюционного разнообразия его форм и, соответственно, механизмов (см. 9.4.1). Так, большинство приведенных нами выше примеров имели отношение к тем или иным перцептивным феноменам. Естественно было бы говорить при этом о перцептивном сознании как особом случае феноменального сознания. Именно эту форму осознания гештальтпсихологи описывали как наивное и непредвзятое «осознание вещей, а не промежутков между ними». Центральной задачей здесь является интеграция перцептивных признаков предметов, причем решение этой задачи иногда осуществляется в режиме «здесь и теперь», без существенной опоры на память (см. 4.2.3 и 5.4.2).
Эндел Тулвинг провел недавно разграничение двух других, более высоких форм сознания, которые отличаются как раз их отношением к механизмам памяти. Первая из них — это обыденное сознание, или, как можно сказать, осознанное знание. В выбранной Тулвингом терминологии, восходящей к феноменологии Гуссерля, оно называется ноэтичес-
339
Рис. 4.18. Различные способы представления результатов регистрации движений глаз: А — точки или окружности на плоскости (диаметр окружностей соответствует длительности фиксации); Б — результаты кластеризации фиксаций, выявляющие зоны интереса; В — ландшафт внимания; Г — визуализация восприятия (по: \felichkovsky, Pomlun & Rjeser, 1996).
ким сознанием'1'5. Речь идет о семантической интерпретации, опирающейся на «безличностную» семантическую память (см. 5.3.2 и 6.1.1). Второй, еще более сложной формой является рефлексивное сознание, которое Тулвинг называет автоноэтическим. Оно связано с интегральной, личностно-смысловой оценкой ситуации, для обеспечения которой может использоваться так называемая эпизодическая память. Таким образом, все эти формы сознания выполняют интегративные функции, но
340
45 В современной литературе иногда в сходном контексте используется термин «access consciousness» — осознание возможности доступа к содержаниям памяти.
по разным основаниям и с использованием разных средств, в том числе весьма различных нейрофизиологических механизмов (см. 5.3.3).
Возвращаясь к перцептивному осознанию, естественно попытаться проверить его связь с двумя выделенными ранее уровнями — предметного (фокального) и пространственного, или «амбьентного», восприятия (см. 3.4.2). По отношению к фокальной (нижневисочной) системе ответ, очевидно, является утвердительным, но существует ли амбъентное осознание! Мнения на этот счет расходятся. Например, Милнер и Гудэйл (Milner & Goodale, 1995) считают, что процессы обработки информации в рамках дорзального потока полностью бессознательны. Эта точка зрения представляется другим авторам слишком радикальной, не подкрепленной соответствующими данными. Действительно, можно попробовать подойти к этому вопросу эмпирически, воспользовавшись, с одной стороны, описанной в предыдущей главе возможностью дифференциации амбьентных и фокальных зрительных фиксаций при рассматривании сложных изображений (см. 3.4.1), а с другой — предложенной нами (и впервые опробованной в работе Velichkovsky, Pomplun & Rieser, 1996) методикой ландшафтов внимания. На рис. 4.18 эта методика приведена в сопоставлении с другими способами представления данных глазодвигательных экспериментов.
Вооружившись методикой ландшафтов внимания, можно сделать дальнейший шаг, направленный на разделение фиксаций на связанные преимущественно с дорзальной и с фокальной обработкой. На рис. 4.19 показано, как выглядит восприятие некоторой сложной сцены (жанровая картина одного из «малых голландцев» 17-го века) с отфильтрованной амбьентной составляющей. То, что мы видим в варианте фокального восприятия (рис. 4.19В), одновременно и очень узнаваемо и отлично от нашего опыта. Несомненно, для полноценного восстановления общего феноменального впечатления, возникающего при рассматривании исходной картины, существенна заполненность пространственной периферии текстурами, светом и протообъектами. Именно так в общей амальгаме образа картины могла бы выглядеть амбьентная компонента перцептивного сознания, соответствующая, в терминологии H.A. Бернштейна, вкладу уровня пространственного поля С46.
46 Напомним, что, по Бернштейну, координации любого уровня, независимо от его
абсолютной высоты, могут осознаваться нами, если только он оказывается ведущим в
решении некоторой задачи. «Так, например, если очередной двигательный акт есть завя
зывание узла, текущее на уровне D, то его технические компоненты из уровня простран
ственного поля С, как правило, не достигают сознания. Если же следующее за ним дви
жение — потягивание или улыбка, протекающие на уровне В, то этот уровень осознается,
хотя он абсолютно и ниже, чем С... Конечно из этого не следует, чтобы степень созна
тельности была одинаковой у каждого ведущего уровня; наоборот, и степень осознавае-
мости и степень произвольности растет с переходом по уровням снизу вверх» (Бернш-
тейн, 1947, с. 43). 341
342
Рис. 4.19. Картина Яна Стэна «Безумный мир» (А) с выделенными участками амбьент-ной (Б) и фокальной (В) обработки (по: Vehchkovsky, 2002).
Результаты визуализации, приведенные на данном рисунке, полезны и для характеристики высших форм внимания. Так, содержанием фокальной обработки оказываются не столько объекты или их локальные детали, сколько эпизоды взаимодействия изображенных персонажей между собой и с объектами — «Кто?», «Что?», «С кем?». Иными словами, фокальное восприятие зрителя данной сложной сцены прежде всего демонстрирует внимание к вниманию другого человека. Конечно, на этой картине как раз изображена ситуация социального взаимодействия, но можно ли говорить о метакогнитивном «внимании к вниманию» в случае натюрморта или пейзажа? На самом деле внимательное восприятие и понимание пейзажа в неменьшей степени зависят от взаимоотношений между художником и зрителем. Визуализация фокального восприятия, скажем, «Ирисов» Ван Гога позволяет говорить о том, удалось ли художнику и зрителю установить контакт, доказывая тем самым интерсубъективный, личностно-смысловой характер высших форм внимания. Заметим также, что те или иные сцены вполне можно рассматривать на метакогнитивном уровне и безотносительно к межличностному восприятию, например, размышляя о смысле жизни.
Преимущество уровневой трактовки сознания отчетливо выступает при анализе клинических данных. Согласно классическим и некоторым новым работам по восстановлению движений, выпадение определенного класса движений может быть компенсировано за счет включения этих движений в задачи более высоких уровней (Леонтьев, Запорожец, 1945; Marcel, 1992). Так, пациент с поражениями уровня С может быть неспособен протянуть руку на определенное расстояние, однако он осуществляет это движение в контексте предметного действия (беря шляпу) или символического социального жеста (предлагая гостю чашку кофе). Похожие наблюдения обсуждаются и в современной нейропсихологии. В случае так называемого «слепозрения» {blindsight) — несколько спорного синдрома выпадения зрительного перцептивного сознания, возникающего иногда при поражениях зрительной коры, — пациенты теряют способность восприятия предметов, но могут восстановить некоторые сведения об их локализации и семантической принадлежности. Наиболее надежные результаты, свидетельствующие о подобных диссоциациях, получены при изучении значительно более частотного нарушения пространственного осознания, известного как синдром игнорирования полупространства {spatial hemineglect).
Этот синдром имеет несколько разновидностей, связанных с существованием множества возможных пространственных систем отсчета (см. 3.1.2). Чаще всего он выступает как игнорирование левой половины зрительного эгоцентрического окружения. Неврологические нарушения при этом обычно связаны с поражениями правых теменных или премоторных областей, то есть тех структур, которые являются корти-
343
кальным субстратом уровня пространственного поля С47. Специальные тесты показывают, что эти пациенты в принципе способны различать стимулы в левой части зрительного поля, но совершенно не обращают на них внимания ни в своем восприятии, ни в своих действиях. Проблемы возникают даже тогда, когда объекты в левой половине окружения показываются пациенту отраженными в зеркале, помещенном в правой половине поля зрения, наполнение которой само по себе осознается пациентами. Точно такое же игнорирование полупространства возможно и в пространственных представлениях этих пациентов, хотя, как показывают последние исследования, это происходит далеко не во всех случаях (см. 6.3.1).
Канадско-американская исследовательница Марлен Берманн (например, Behrmann & Tipper, 1999) показала, что в ряде случаев восприятие предметов может компенсировать выпадение пространственного осознания. Она показывала пациентам предметы, которые затем перемещались или поворачивались, так что некоторые их части теперь находились в обычно игнорируемой половине пространства. Оказалось, что в этом случае работа с объектами в целом и с их фрагментами, расположенными в обычно игнорируемой половине пространства, возможна, что доказывает компенсаторное влияние уровня предметного восприятия D на выпадения пространственного поля. Имеются данные о возможности выделения семантики, то есть влиянии еще более высокого уровня концептуальных структур Ε (см. 5.3.3). При показе в игнорируемой части полупространства изображений предметов пациенты не могут их назвать или опознать в прямом тесте на память. Но если им дается впоследствии задача лексического решения, то ее результаты свидетельствуют об имплицитной обработке неопознанных изображений: слова, семантически с ними связанные, ведут к значительно более быстрым ответам (McGlinchey-Berroth et al., 1996).
Самые яркие примеры уровневых эффектов при синдроме игнорирования полупространства были описаны в исследованиях нескольких глухонемых пациентов, проведенных известной американской исследовательницей, психолингвистом и нейролингвистом Урсулой Белуджи и ее коллегами (Poizner, Klima & Bellugi, 1987). В непосредственном восприятии и в своих предметных действиях эти пациенты демонстрируют типичную картину игнорирования левой половины пространственного окружения. Ситуация, однако, резко меняется, когда они начинают
47 Почему относительно редки случаи игнорирования правой половины пространства? Возможно, ответ состоит в различиях репрезентации пространства в левом и правом полушариях. Более компетентным оказывается правое полушарие, которое репрезентирует окружение в целом. Левое полушарие, напротив, репрезентирует только контрлатеральное, правое полупространство. Поэтому при поражениях левого полушария правое способно компенсировать частичное выпадение контроля за правой половиной пространства и продолжает контролировать левое полупространство. При поражениях правого полушария левое способно компенсировать лишь ослабление контроля за правым полу-344 пространством, но не выпадение левого полупространства.
общаться между собой, используя для этого язык жестов. Непосредственное пространственное окружение используется в языке жестов для символического размещения упоминаемых в разговоре персонажей и предметов, что позволяет затем ссылаться на них в ходе разговора в упрощенном режиме, просто указывая пальцем в направлении соответствующей области пространства. Как оказалось, глухонемые пациенты с выраженным синдромом игнорирования левой половины окружения столь же часто и одинаково эффективно используют при этом левое полупространство, как и правое (!). Такая диссоциация процессов ориентации в физическом и в символическом окружении может свидетельствовать о недостаточной дифференцированности современных нейрокогнитив-ных моделей, включая и наиболее совершенную из них теорию трех систем внимания Познера (см. 4.3.3).
Итак, наметившийся в современных когнитивных и, в особенности, нейрокогнитивных исследованиях подход к проблеме сознания во многом напоминает проверенное временем древнеримское правило «Разделяй и властвуй». Следует признать, что наше сознание лишь кажется однородной субстанцией48. Феномены сознания специфически связаны с уровневой организацией познавательных процессов, отражая содержания работы актуально ведущего уровня. Надо сказать, что на каждом из потенциально возможных уровней, равно как и при переходах между уровнями, это содержание выполняет важнейшую функцию интеграции относительно автономных («модулярных») механизмов нейрофизиологической обработки. Можно предположить, что по мере того, как будут уточняться детали процессов эволюционного развития и общей уровневой организации управления поведением, будет проясняться и мировая загадка научного объяснения сознания (см. 8.4.3). Одной из центральных областей применения идей уровневой организации, прямо связанной с различением нескольких форм осознания, стала в последние годы психология памяти, к рассмотрению проблем и методов которой мы сейчас и переходим.
48 Проблема возможной множественности форм сознания относительно нова и даже необычна для европейской философской мысли, лишь в последнее время, а именно уже в 20-м веке допустившей различение обыденного и рефлексивного сознания (см. 1.3.1). Вместе с тем, это стандартная точка зрения для классической индийской философии, понятийный аппарат которой в какой-то степени предвосхитил некоторые возникающие сегодня в когнитивной науке классификации.
345
5
ФУНКЦИОЫАЛЬНАЯ
СТРУКТУРА
ПАМЯТИ
Структура главы:
5.1 Основные подходы и феномены
Анализ ошибок: узнавание и воспроизведение
Анализ времени реакции: поиск в памяти
Непрямые методы: имплицитная память
5.2 Теории непосредственного запоминания
Трехкомпонентные модели
Теория уровней обработки
Эволюция модели рабочей памяти
5.3 Системы и уровни памяти
Теория двойного кодирования
Системы памяти: модель 2000+
От уровней памяти к стратификации познания
5.4 Память в повседневном контексте
Амнезии обыденной жизни
Обучение и формирование навыков
Развитие, старение и распад
348
Уже в обыденной речи мы склонны понимать под памятью некоторую емкость или контейнер, в котором в том или ином порядке размещаются запоминаемые объекты. «Представим себе, например, хоть на минуту, — писал И.М. Сеченов, — что умственное богатство взрослого человека распределено в его памяти приблизительно таким же образом, как книги в благоустроенной библиотеке... Аналогия с виду столь заманчива, что ум останавливается на ней совершенно невольно» (Сеченов, 1953, с. 254). В когнитивной психологии память сравнивалась с библиотекой, мастерской, хранилищем и даже... желудком коровы, так как последний имеет два различных отдела — «кратковременный» и «долговременный». Но главной аналогией для авторов психологических моделей памяти первоначально были блоки оперативной и внешней памяти вычислительного устройства.
По мере проведения экспериментальных исследований стали выявляться дополнительные подробности, поставившие старую «контейнерную» и более современную компьютерную метафоры под сомнение. Прежде всего обнаружено влияние материала и характера работы с ним. Долгое время усилия психологов были сосредоточены на изучении запоминания вербальной или легко вербализуемой информации. При этом было показано, что для ее долговременного сохранения необходимо проговаривание, опосредованное активностью кратковременной памяти. Такое вербальное кодирование обеспечивает большую доступность материала для произвольного воспроизведения и коммуникации. В реальных условиях запоминание большей частью имеет непроизвольный, или имплицитный, характер. Эти процессы преимущественно связаны с наглядно-действенными, процедурными формами памяти. Они вносят решающий вклад в узнавание предметов, пейзажей, лиц или интонаций голоса, а также в возможность переноса навыков различного рода, от автоматизмов чтения до умения ездить на велосипеде. Не менее увлекательными оказались новейшие исследования высших форм памяти, связанных с рефлексивным сознанием и личностным, эмоционально-оценочным отношением к тем или иным событиям. Наконец, анализ нарушений в работе памяти и массивное использование методов трехмерного мозгового картирования позволили впервые в общих чертах описать реальную нейрофизиологическую архитектуру этих процессов.
5.1 Основные подходы и феномены
5.1.1 Анализ ошибок: узнавание и воспроизведение
Исследование памяти и научения длительное время проходило в относительной изоляции от других разделов психологии, что привело к появлению собственной терминологии и специфических методов. Новые подходы, привнесенные в психологию когнитивным поворотом событий, ничего не изменили в том обстоятельстве, что при изучении памяти мы имеем дело с тремя более или менее четко отличающимися фазами, подлежащими, насколько это возможно, экспериментальному контролю: фазой кодирования материала (также фаза ознакомления или обучения), фазой сохранения материала и фазой извлечения материала из памяти (она же фаза тестирования). По сравнению с ранними направлениями для когнитивной психологии характерны, во-первых, интерес к микроструктуре процессов, лежащих в основе каждой из этих фаз, и, во-вторых, готовность допустить, что на самом деле существует много различных форм памяти, которые не сводятся к сохранению некоторого единого, более или менее прочного «следа».
Наиболее часто в современных исследованиях памяти используются две классические задачи — узнавание и воспроизведение^. Узнавание при этом представляется и обычно действительно оказывается более простой задачей, поскольку оно поддерживается предъявляемым на фазе извлечения информации тестовым материалом. Вместе с тем, эта простота относительна. Прежде всего, как будет показано ниже (см. 5.1.2), узнавание может включать целый ряд процессов, таких как поиск в памяти и принятие решения. С присутствием процессов принятия решения связаны типичные методические трудности в интерпретации результатов задач на узнавание, когда о нем судят по количеству ошибок или, что то же самое, по вероятности правильных ответов.
Речь идет о возможности угадывания правильного ответа. Если испытуемому последовательно предъявляются для узнавания объекты, половина из которых ранее показывались («старые»), а половина — нет («новые»), то кажется естественным допустить, что референтная (base-line) вероятность угадывания составляет 50%, ведь именно таким был бы процент правильных ответов при совершенно случайных ответах испытуемого. Ситуация, однако, является более сложной. Как видно из таблицы 5.1, эксперименты на узнавание формально идентичны ситуации обна-
1 Существует несколько вариантов этих классических тестов запоминания, в частности, свободное воспроизведение, при котором порядок воспроизведения элементов материала не имеет значения, и полное воспроизведение, в случае которого требуется восстановить также и порядок элементов. При так называемом воспроизведении с подсказкой испытуемому на стадии тестирования предъявляются фрагменты подлежащего восстановлению материала либо другая информация, поддерживающая процесс извлечения из памяти. Так можно добиться постепенного сближения условий воспроизведения и узнавания. 349
ружения сигнала на фоне шума (см. 2.1.2). Если по отношению к отдельным тест-объектам нужно принимать решение ДА или НЕТ, то обычно испытуемый не уверен на 100% в правильности своего ответа и поэтому должен определиться в выборе критерия ответа, или β. Этот критерий отражает субъективный баланс между правильным узнаванием («попаданиями») и ошибочной идентификацией нового стимула в качестве старого («ложными тревогами»). Таким образом, вероятность узнаваний зависит не только от успешности работы памяти (d'), но и от строгости выбранного для отсева ложных тревог критерия. Вероятность узнавания 0,4 при уровне ложных тревог 0,2 скорее всего свидетельствует о запоминании материала (этот вывод должен быть еще проверен статистически), тогда как вероятность узнавания 0,6 в сочетании с уровнем ложных тревог 0,6 заведомо говорит о явно случайных ответах. Применение теории обнаружения сигнала — важный аспект многих современных исследований с использованием узнавания и производных от него тестов запоминания.
Таблица 5.1. Матрица вариантов правильных и ошибочных ответов в тестах на узнавание
Ответы испытуемого | Предъявляемые тест-обьекты: «старые» «новые» | |
ДА | попадание | ложная тревога |
НЕТ | пропуск | верное отрицание |
350
С интерпретацией результатов подобных экспериментальных ситуаций связаны и другие, более содержательные вопросы. Так, одна из центральных дискуссий в когнитивной психологии последних лет связана с вопросом о том, какое значение в функционировании памяти имеет осознание, в частности, явно различные субъективные переживания, сопровождающие узнавание. В самом деле, один и тот же ответ ДА может быть вызван общим впечатлением знакомости объекта, а может сопровождаться припоминанием обстоятельств, при которых мы познакомились с ним. Является ли подобное различение между просто «знаемым» и «вспоминаемым» иррелевантным субъективным феноменом или же указывает на серьезные различия в самих механизмах памяти? Отметим также, что само это различение, очевидно, соответствует двум обсуждавшимся в предыдущей главе формам осознания, ноэтичес-кому и автоноэтическому (см. 4.4.3).
Английский психолог Джон Гардинер и его коллеги (например, Gardiner & Conway, 1999) проанализировали данные около 40 экспериментов на узнавание, в которых фиксировались оба модуса осознания, и пришли к выводу, что отчеты «вспоминаю» объективно сопровождаются значительно более лучшим узнаванием (в терминах показателя различимости d'), чем отчеты «знаю». Более того, исследования пока-
зали, что за этим различением скрываются не просто количественные градации прочности следа памяти, но две ее совершенно разные формы. Так, изменение интенсивности внимания на стадии ознакомления с материалом избирательно влияет на компонент «вспоминаю». Многократное тахистоскопическое предъявление материала при подпорого-вых режимах, напротив, увеличивает частотность отчетов «знаю» при неизменной частоте сообщений «вспоминаю». Подобная двойная диссоциация (см. 2.4.1) служит одним из важных аргументов в пользу разделения двух форм долговременной памяти — имеющей автобиографический оттенок эпизодической памяти («вспоминаю») и безличностной семантической («знаю»). Это различение будет подробно рассмотрено нами в одном из следующих разделов этой главы (см. 5.3.2).
Фундаментальная роль осознания видна на примере типичных ней-ропсихологических нарушений функционирования памяти. При амнес-тическом синдроме, возникающем при поражениях височных долей коры мозга и расположенных непосредственно под ними структур гиппокампа, пациент перестает сознательно узнавать то, что в принципе должно быть ему хорошо знакомо2. Пациент здоровается с врачом, обсуждает погоду или свое самочувствие, не замечая, что то же самое уже происходило несколько минут назад. Иными словами, все происходящее кажется ему новым, субъективное впечатление знакомости ситуации отсутствует. При этом, однако, нельзя сказать, что запоминание отсутствует полностью. Первые наблюдения такого рода были проведены известным русским психиатром С.С. Корсаковым (1854—1900). Швейцарский психолог Эдуар Клапаред (Claparede, 1911) особенно ярко продемонстрировал это в начале 20-го века, использовав, правда, не совсем корректный с этической точки зрения прием. Здороваясь с пациентом, он спрятал в протянутой для приветствия руке иголку. Когда Клапаред вторично появился в палате, пациент приветствовал его так, как будто видел в первый раз, но руки так и не подал.
Противоположная картина может наблюдаться иногда при нарушениях в работе фронтальных (лобных) долей коры головного мозга. В этом случае пациентам все кажется давно хорошо знакомым, они пытаются приветствовать совершенно чужих людей, обсуждают изменения внешнего вида построек и помещений, которые никак не могли
2 Этиология и механизмы амнестического синдрома могут быть очень различными:
черепно-мозговые травмы, энцефалит, кислородное голодание (гипоксия), алкоголизм,
дегенеративные старческие изменения тканей мозга. Наряду с височно-гиппокампаль-
ными травмами, он может вызваться поражениями субкортикальных отделов мозга, вклю
чающих базальные ганглии и таламус. Разные формы этого синдрома различаются между
собой прежде всего сохранностью или отсутствием возможности припоминания инфор
мации, приобретенной в период, предшедствоваший поражению, то есть наличием рет
роградной амнезии. Теоретические объяснения амнестического синдрома менялись на про
тяжении десятилетий, отражая доминирующие в когнитивных исследованиях подходы
(см. 5.2.1, 5.3.2 и 5.4.3). 351
видеть ранее, и т.д. В их рассказах о пережитых событиях обычно присутствуют многочисленные конфабуляции — псевдовоспоминания, явно не соответствующие действительности (Shallice, 2001). Одно из высказанных в связи с этим предположений состоит в том, что фронтальные области могут выполнять роль «детектора новизны», поэтому их поражения будут сопровождаться гипертрофированным чувством знакомое- ■ ти (Tulving, 2001). Мы видели, однако, что в столь общем виде это можно сказать практически о любой другой части мозга (см. 4.4.1). Формально, в терминах теории обнаружения сигнала (см. 2.1.2), данное нарушение выглядит как максимальная либерализация положения критерия принятия решений — вероятность попаданий и вероятность ложных тревог оказываются близкими к 1,03.
Все сказанное о роли осознания в связи с узнаванием справедливо и для воспроизведения — второй базовой методики, широко использовавшейся уже в классических исследованиях памяти Эббингауза и Барт-летта. Предельными случаями воспроизведения служат прямое (интроспективно) воспроизведение, когда искомое содержание оказывается доступным нашему сознанию, казалось бы, еще до того, как мы сформулировали вопрос, и непрямое, включающее развернутые элементы рассуждения и мышления. В этом процессе, как правило, особую роль играет дискурсивное мышление, а также более или менее явно используются семантические, фонематические, зрительные и вообще любые другие доступные признаки материала. Так, например, использование фонематических и графических признаков было установлено при изучении феномена «на кончике языка» (см. 2.2.1 и 7.1.3) и при отгадывании кроссвордов.
В отличие от узнавания, которое, как отмечалось, в определенном смысле «поддерживается извне», путем предъявления тест-обьекта, воспроизведение должно быть полностью построено при опоре на внутренние средства работы с памятью. Поэтому нам, как правило, значительно проще узнать что-либо, чем изначально восстановить по памяти. Особенно трудно воспроизвести по памяти сложную невербальную информацию, например, дать описание лица увиденного ранее, причем иногда без интенции запомнить человека. Неслучайно для профессиональной поддержки этой трудной задачи в криминалистике разработаны специальные компьютерные системы типа фоторобота. Отдельные фрагменты лица сначала генерируются по словесным описаниям на эк-
3 Два описанных синдрома представляют собой предельные случаи знакомых практически каждому из нас состояний jamais vu (франц. «никогда не видел») и déjà vu («уже видел»). Согласно данным недавних исследований с использованием мозгового картирования (Стасс, 2003), варьирование критерия принятия решений в задачах узнавания и обнаружения сигнала связано с работой структур левых префронтальных областей коры. Почему при этом одни поражения вызывают резкий сдвиг критерия вправо («никогда не 352 видел»), а другие — влево («уже все это видел»), пока остается неясным.
ране монитора, а затем проверяются с помощью процессов узнавания и, в случае необходимости, вновь и вновь корректируются.
Примерно таким же образом описывается микроструктура процессов воспроизведения и в так называемой двухстадийной теории, согласно которой воспроизведение включает узнавание в качестве составной части: на первой стадии воспроизведения с избытком генерируются гипотезы (в зависимости от характера материала, важная роль отводится при этом внутренней речи или воображению), а затем подключаются процессы узнавания, осуществляющие отбор информации для окончательного ответа. Эта теория довольно успешно описывает данные лабораторных исследований, однако ее едва ли можно распространить на весь диапазон возможных ситуаций и вариантов припоминания. Основным аргументом против этой теории служат данные о различиях в изменениях эффективности воспроизведения и узнавания под влиянием варьирования таких факторов, как знакомость и контекст.
Например, воспроизведение в большей степени, чем узнавание, зависит от контекстуальных переменных, что, кстати, относительно понятно, поскольку узнавание по определению уже предполагает (в положительных пробах) массивное использование контекста. Далее, нам легче узнать предъявлявшееся ранее редкое, низкочастотное слово, тогда как воспроизведение, напротив, улучшается в случае слов с высоким показателем частотности. Аналогичные данные получены и с невербальным материалом. Использовав субъективные оценки вероятности присутствия определенных объектов в таких естественных сценах, как кухня или ферма, А. Фридман (Friedman, 1979) сконструировала сложные изображения, содержавшие как типичные, так и атипичные объекты. При тестировании узнавания изменения типичных (частотных для данного контекста) объектов часто не замечались испытуемыми, тогда как подмена необычных предметов определялась очень хорошо. В целом ряде других работ была отмечена противоположная тенденция в случае воспроизведения, когда, как правило, лучше воспроизводились именно типичные объекты4.
Изменение контекста (при всей размытости значения этого термина) целенаправленно используется в многочисленных вариантах методики воспроизведения, таких как парные ассоциации и воспроизведение с подсказкой {cued recall), когда, например, для поддержки припоминания некоторого слова испытуемому предъявляется слово, близкое целевому
4 Эти разнонаправленные тенденции, к сожалению, до сих пор недостаточно изуче
ны. Вне всякого сомнения, воспроизведение есть в большей степени, чем узнавание, ком
муникативная задача — ведь в случае воспризведения предполагается развернутый рас
сказ о прошедших событиях. Коммуникативные задачи, как отмечалось в предыдущей
главе'(см. 4.4.1), особенно сильно интерферируют с механизмами непроизвольного вни
мания. Быть может, именно поэтому при воспроизведении мы перестаем в должной мере
замечать новизну материала, восстанавливая преимущественно привычную, частотную
информацию. 353
слову по звучанию или по значению. Как правило, в результате этого показатели воспроизведения улучшаются, так что в специально созданных экспериментальных условиях поддержанное семантически насыщенным контекстом воспроизведение может даже стать несколько успешнее узнавания.
Отчетливую зависимость воспроизведения от, казалось бы, совершенно иррелевантного контекста продемонстрировали эксперименты, проведенные известным английским психологом — и, что существенно, бывшим моряком — Аланом Бэддели вместе с его сотрудниками из Кембриджского центра прикладной психологии в начале 1980-х годов. Испытуемые в этих экспериментах заучивали некоторый вербальный материал (списки слов или технические инструкции) на суше и... под водой, на глубине 10 метров. Успешность воспроизведения оказалась зависящей от совпадения его условий с условиями, в которых эта информация заучивалась: при таком совпадении, как в «сухом», так и в «мокром» варианте, успешность воспроизведения возрастала почти на 40% (!). Результаты тестов на узнавание материала, напротив, не обнаружили подобной зависимости от совпадения контекста заучивания и тестирования сохраненной информации.
К широкому классу контекстуальных эффектов относятся многие другие феномены памяти. Одним из наиболее интересных является воспроизведение, зависящее от состояния {state-dependent recall). Его лучше всего проиллюстрировать на примере только что упомянутой работы Бэддели. Резонно предположить, что пребывание на большой глубине не оставляет участников эксперимента полностью равнодушными, вызывая состояния возбуждения, мобилизации или страха. Действительно, многочисленные психофизиологические и клинические исследования последних лет, равно как эксперименты, в которых изучалась зависимость памяти от настроения и эмоций, показали, что извлечение информации из памяти улучшается при воссоздании психологического, физиологического и биохимического «фона», сопровождавшего процессы обучения. Этим (по крайней мере, отчасти) может быть объяснен полученный Бэддели сильный эффект переноса5.
Нельзя ли, представляя себе контекст первоначального кодирования, облегчить воспроизведение? Именно так обычно и восстанавливается информация о прошедших событиях. Многие исследователи памяти (в том числе Вундт и Бартлетт, а в отечественной психологии П.П. Блонский) отмечали роль восстановления общего эмоционально-
5 В реальной жизни воспроизведение, зависящее от состояния, может иметь серьезные негативные последствия. В предельном случае возможно даже постепенное «расщепление» субьективного опыта и, в некотором смысле, расщепление личности на относительно автономные сферы: в одном состоянии «знаю» и «вспоминаю» одно, в другом типичном состоянии, например под влиянием алкоголя, «знаю» и «могу припомнить» не-354 что совсем иное
личностного отношения для успешного припоминания некоторых событий. Исследования последних лет, в частности, показывают, что для лиц, хорошо владеющих двумя или большим количеством языков, при попытках припоминания существенно задавать себе вопросы на том же языке, который предположительно доминировал и использовался для кодирования событий в момент их совершения.
Важное значение имеют также представления о месте (где некоторое событие могло произойти) и времени (когда это могло бы быть). В самом деле, для нас нет ничего более естественного в работе с памятью, чем стратегия мысленного просмотра некоторых знакомых помещений в поисках оставленной там вещи. С этой точки зрения можно в общем виде объяснить действенность некоторых проверенных временем мне-мотехнических приемов, таких как метод мест (см. также 5.4.2). Используя этот мнемотехнический прием, мы пытаемся представить себе зрительно объекты, соответствующие запоминаемым словам, и мысленно расставляем их внутри некоторого хорошо знакомого окружения, такого как собственный дом, городской квартал или «наизусть» знакомая улица6. Например, знаменитый мнемонист Ш., герой «Маленькой книжки о большой памяти» А.Р. Лурия (1968), который был способен к запоминанию после однократного ознакомления гигантских по человеческим меркам объемов материала, часто использовал в качестве интерактивного ментального контекста для кодирования и воспроизведения московскую улицу Горького (ныне опять Тверскую).
Аналогично обстоит дело и со временем событий. Произвольная память и, возможно, рефлексивное сознание, как впервые предположили Анри Бергсон и Пьер Жане, возникают в связи с формированием представления о временной оси, фиксирующей последовательность событий (см. 5.4.3 и 8.1.1). Локализация во времени — это часто еще и ключ к пониманию причинно-следственных связей, дающих ответ на вопрос, почему произошло то или иное событие. В свою очередь понимание причинно-следственных связей (то есть, безусловно, одна из основных целей нашей познавательной активности вообще) позволяет уточнить локализацию во времени, так как причина не может быть локализована позже, чем ее следствие. Установка на время события — «Когда это было?» — естественно предваряет и сопровождает наши попытки припоминания. Из сказанного вытекает важное следствие для студентов, сдающих экзамены: трудно придумать лучший контекст для
6 Заслугу разработки «метода мест» приписывают греческому поэту Симонидису, жив
шему около 2500 лет тому назад (Андерсон, 2002). Этот мнемотехнический прием полу
чил особенно широкое признание в Китае 18-го века, где даже считался тогда наиболее
выдающимся практическим открытием европейской науки. Причина такой высокой оцен
ки была связана с конфуцианскими традициями в распределении бюрократических
должностей — определяющую роль при этом играла способность чиновников любого ранга
заучивать наизусть классические тексты. 355
последующего успешного воспроизведения имен, названии и, скажем, содержания психологических концепций, чем их «привязка» к различным периодам истории этой дисциплины.
5.1.2 Анализ времени реакции: поиск в памяти
Опираясь на данные самонаблюдения, мы склонны считать узнавание практически мгновенным. Лишь в исключительных случаях оно превращается в довольно медленный процесс перебора и анализа содержаний прошлого опыта. Непосредственное извлечение из памяти предполагает ее высокую упорядоченность и существование однозначных связей между искомыми содержаниями и условиями припоминания, которые в случае узнавания совпадают с элементами самой воспринимаемой ситуации. В течение длительного времени предположение о непосредственном характере узнавания считалось достаточным для объяснения извлечения информации из памяти. Хронометрические исследования, проведенные с помощью метода аддитивных факторов (см. 2.2.3) американским психологом, сотрудником Белловских лабораторий фирмы AT&T Солом Стернбергом, впервые показали, что узнавание может включать несколько различных этапов, в том числе этап исключительно быстрого поиска нужного содержания среди репрезентаций более широкого множества.
Схема исследований С. Стернберга подробно описана в ряде работ и широко используется в современной экспериментальной психологии. Сначала испытуемому предъявляются для запоминания несколько объектов (буквы, цифры, слоги, слова и т.д.), называемых положительным множеством. Затем с небольшим интервалом предъявляется тестовый стимул. Задача состоит в том, чтобы как можно быстрее, но, по возможности, безошибочно определить принадлежность тестового стимула к положительному множеству. При выполнении данных условий в экспериментах С. Стернберга (Sternberg, 1969) и во многих последующих работах были получены линейные зависимости времени реакции (ВР) положительных ответов от величины положительного множества примерно следующего вида:
ВР= (400+40 п) мс, где η — величина положительного множества.
Такими же оказались и зависимости для отрицательных ответов (см. рис. 5.1А). Эти данные свидетельствуют об аддитивном влиянии двух факторов: нагрузки на память (величина положительного множества) и характера ответа (положительный или отрицательный).
Качественная интерпретация состояла в постулировании двух этапов переработки информации. На одном из них со скоростью, определяемой по наклону полученных зависимостей, осуществляется после-356 довательное сравнение репрезентации стимула с репрезентациями
1 6
Нагрузка на память
1 6
Нагрузка на память
Рис. 5.1. Типичные результаты хронометрических исследований поиска в памяти (А) и три теоретические модели: параллельного (Б), последовательного самооканчивающегося (В) и последовательного исчерпывающего (Г) поиска (по: Sternberg, 1969).
элементов положительного множества. На другом принимается решение о характере ответа. Поскольку это разные стадии, то поиск в памяти оказывается исчерпывающим, то есть продолжающимся без принятия решения об ответе до полного перебора всех элементов положительного множества, причем не только в отрицательных, но и в положительных пробах (см. 4.2.3). Теоретически возможна и интуитивно более понятна стратегия самооканчивающегося поиска — прерывание поиска и ответ сразу после нахождения совпадающего элемента. В этом случае прямые для отрицательных ответов должны были бы быть в два раза более крутыми, чем прямые для положительных ответов, так как здесь пришлось бы в среднем просматривать лишь половину репрезентаций элементов положительного множества (рис. 5.1В). Подобная непараллельность зависимостей означала бы взаимодействие факторов или, при содержа -
357
тельной интерпретации, локализацию операций поиска и принятия решения на одной и той же стадии переработки информации.
Несмотря на свою простоту, данный подход оказался полезным средством анализа познавательных процессов при узнавании, давшим толчок для беспримерного в истории психологического экспериментирования потока исследований. В частности, самим Солом Стернбергом (см., например, Sternberg, 1999) было установлено существование еще ряда факторов, влияние которых на время реакции узнавания ограничивалось главными эффектами. Такими аддитивными факторами были, например, читабельность стимулов (процессы перцептивного кодирования) и относительная вероятность проб различного типа (процессы моторного ответа). В окончательном варианте модель включала 4 этапа переработки информации:
перцептивное кодирование,
последовательный поиск в памяти,
принятие решения,
организация моторного ответа.
Каждому из этих этапов соответствовала своя группа аддитивных факторов, наиболее важным из которых была нагрузка на память — величина положительного множества (этап последовательного поиска).
Особый интерес представляет возможность связать данные о временных характеристиках поиска в памяти с объемом непосредственного запоминания. Сравнив результаты примерно 50 работ, в которых исследовались узнавание и воспроизведение цифр, цветов, букв, слов, геометрических фигур, случайных форм и бессмысленных слогов, П. Каванах (Cavanagh, 1972) установил соотношение, показанное на рис. 5.2. Оказалось, что средняя скорость сканирования в памяти является линейно возрастающей функцией от величины, обратной среднему объему непосредственной памяти. Данная зависимость получила следующую интерпретацию. Предположим, что кратковременная память имеет фиксированный объем и может хранить лишь ограниченное число признаков материала. Чем больше признаков необходимо для его спецификации (в этом смысле слова, наверное, можно считать более сложными, чем буквы), тем меньшее число единиц могло бы разместиться в памяти. В то же время если поиск в памяти при еще более дробном анализе оказывается процессом последовательного просмотра признаков репрезентации каждого элемента, то в случае материала, имеющего большую размерность признаков, поиск в целом будет медленнее. Одна и та же формальная характеристика — ограниченность объема кратковременной памяти в отношении числа последовательно сканируемых признаков — объясняет две довольно различные группы феноменов7.
7 Возможно, найденное соответствие не является причинно-следственной связью. Дело в том, что объем непосредственного запоминания частично связан с повторением материала про себя (см. 5.2.3). Нет оснований утверждать, что аналогичные процессы «внутренней речи» (в силу их относительно низкой скорости) вовлечены в решение задачи по-358 иска в памяти.
Величина, обратная объему непосредственной памяти
Рис. 5.2. Зависимость между величиной, обратной объему непосредственной памяти, и скоростью поиска в памяти (по: Cavanagh, 1972).
Одним из направлений этих исследований были попытки выйти за пределы ограниченного объема непосредственного запоминания. Что произойдет, если величина положительного множества выйдет за пределы «магического числа» Джорджа Миллера, то есть 7±2 единиц материала? Эксперименты показали, что в этом случае в области 6—8 элементов наблюдается надлом зависимостей времени реакции, так что кратковременному сегменту соответствуют более крутые, а долговременному — более пологие зависимости, свидетельствующие об относительно быстром поиске среди репрезентаций положительного множества. Хотя поиск в памяти осуществлялся быстрее, общее время реакции узнавания было более продолжительным. Этот последний факт говорит о переносе основной нагрузки со стадии поиска в памяти на стадии перцептивного кодирования и принятия решения либо даже об изменении микроструктуры процессов узнавания.
После рассмотрения в более широком диапазоне условий, исходная модель поиска в памяти потребовала дополнительных модификаций.
359
Например, оказалось, что при семантической группировке словесного материала (категории, впрочем, должны быть явно выделены) наклон функций времени реакции уменьшается, а положение точки пересечения с осью Y остается неизменным. Это означает либо увеличение скорости поиска, либо то, что он становится более селективным. Так как при введении двух категорий наклон уменьшается примерно на 25%, можно предположить, что имеет место частичная селективность: сначала в случайном порядке выбирается одна из двух категорий, а затем осуществляется исчерпывающий последовательный поиск, который прекращается после просмотра релевантной категории и продолжается, если была выбрана иррелевантная категория. Далее, в некоторых случаях оказалось, что отрицательные и положительные зависимости непараллельны, причем отношение их наклонов меньше, чем 2:1, как это должно быть при самооканчивающемся поиске. Эти результаты, в свою очередь, можно объяснить наличием испытуемых, использующих стратегию самооканчивающегося поиска. Эта, казалось бы, более эффективная стратегия ведет на самом деле к общему замедлению ответов8.
В прикладных исследованиях известного русского психолога А.Б. Леоновой (Leonova, 1998), использовавшей задачу поиска в памяти Стернберга в качестве теста на утомление, было обнаружено, что если в начале рабочего дня сборщицы электронных микросхем демонстрируют классическую картину исчерпывающего поиска, то к концу смены они переходят на самооканчивающийся режим поиска (с отношением наклонов 2:1), сопровождающийся заметным замедлением ответов. Это означает, что под влиянием утомления поиск в памяти и принятие решения о характере ответа перестают вносить аддитивный вклад во время ответа. Если при нормальном функциональном состоянии эти операции «разнесены» по разным этапам и принятие решения о характере ответа осуществляется только один раз, в самом конце обработки, то при утомлении эти процессы начинают осуществляться на одном и том же этапе — принятие решения (продолжать поиск или дать положительный ответ) осуществляется в связи с каждым элементарным актом проверки репрезентаций положительного множества. В результате узнавание начинает требовать постоянного сознательного контроля и функционирование памяти деавтоматизируется (см. 4.3.3 и 5.4.2).
Таким образом, попытки распространить частную модель поиска на основной фактический материал психологии памяти привели к постановке множества интересных вопросов, но пока не позволили интег-
8 Некоторые другие данные также требуют либерализации исходной модели Стернберга. Так, она не объясняет возникновение позиционных эффектов — ускорения времени реакции при совпадении тестового стимула с первыми или последними элементами положительного множества Если поиск исчерпывающий, то не вполне понятно также обнаруженное в ряде работ ускорение ответа на стимулы, дважды встречающиеся в тесто-360 вой последовательности или более часто предъявляемые в эксперименте.
рировать имеющиеся данные в рамках более общей теории (см. 5.2.1). Метод аддитивных факторов Стернберга сохраняет свое значение прежде всего как эвристический прием, используемый для описания микроструктуры сложных когнитивных процессов (Sternberg, 1999). Он, в частности, представляет интерес для работ по функциональному картированию мозга, где до сих пор преимущественно используется дон-деровская методика вычитания (Sternberg, 2004). Поскольку временная шкала имеет абсолютный характер и не допускает произвольных трансформаций, которые возможны в случае разнообразных шкал точности (например, шкалы вероятности правильных ответов), хронометрические данные широко используются и за пределами данной области, например, при анализе автоматических и сознательно управляемых компонентов обработки (см. 4.3.2), организации семантической памяти (6.2.1) и процессов понимания (7.3.1).
5.1.3 Непрямые методы: имплицитная память
Одним из наиболее важных современных направлений изучения памяти является анализ так называемого имплицитного запоминания. Речь идет о непрямой оценке влияния прошлого опыта на успешность тех или иных действий и операций. При этом применяются процедуры тестирования, которые не осознаются или, по крайней мере, не должны осознаваться испытуемыми как связанные с запоминанием мнестические задачи. Иными словами, имплицитное запоминание отличается от традиционного, или эксплицитного запоминания, тем, что его проявления не являются результатом выполнения задач типа узнавания и воспроизведения, прямо сформулированных как тесты на запоминание. Популярность этого рода исследований в последние 10—20 лет объясняется не только большой распространенностью эффектов имплицитной памяти, или «рййлшнг-эффектов9, но и рядом их неожиданных особенностей. Складывается впечатление, что для возникновения имплицитных эффектов иногда несущественны характер работы с материалом и даже само присутствие памяти в традиционном смысле слова.
Примером непрямого теста памяти может быть задача на дополнение фрагментов слова. В предварительных опытах выясняется референт-
9 «Прайминг» можно было бы перевести на русский язык как «предварение», мы, од
нако, будем использовать устоявшийся в литературе terminus techmcus. К этой категории
эффектов примыкает большое количество биологическх феноменов, которые, вообще
говоря, не имеют отношения к психологии. Примерами могут служить в среднем более
быстрое окончание родов второго ребенка по сравнению с первым и сенсибилизация
иммунной системы человека и животных, «узнающей» чужие белковые соединения через
длительное время после однократной конфронтации с ними 361
ная, или базовая (base-line), вероятность успешного дополнения некоторого фрагмента, например
_Р_к_ДИ_ ,
до осмысленного слова (этим дополнением здесь является слово «крокодил»). Основные эксперименты, направленные на изучение имплицитной памяти, проводятся с другими испытуемыми и состоят, как обычно, из трех стадий: кодирования материала, его удержания и тестирования памяти. На стадии кодирования материала испытуемый получает списки слов, среди которых, допустим, есть и слово «крокодил». Со всеми этими словами должна проводиться какая-то работа — подсчет слогов, семантическое шкалирование и т.д., причем от испытуемого тщательно скрывается сам факт исследования памяти. Через определенный интервал времени испытуемому неожиданно предъявляется задача на придумывание слов, которые подходили бы к предъявляемым фрагментам, среди которых может быть и _р_к_ли_ · Прайминг определяется как возможное облегчение решения задачи дополнения слова в результате его предварительного показа на стадии кодирования. Количественная оценка прайминга может проводиться двумя способами: путем сравнения актуальной вероятности правильного дополнения с подсчитанными ранее популяционными нормами (референтной вероятностью дополнения конкретного слова) или же путем ее сравнения со средней вероятностью дополнений в случае слов равной частотности, которые не показывались в данном эксперименте на стадии кодирования.
Эта ситуация интересна тем, что практически идентичный эксперимент можно провести в режиме эксплицитного тестирования — с тем же материалом и теми же этапами первоначального кодирования, сохранения и тестирования, но только с явным упоминанием на этапе тестирования необходимости воспроизведения ранее показанных слов, для поддержки припоминания которых и показываются фрагменты. Вместо прайминг-эффекта подсчитывается вероятность правильного воспроизведения. Хотя речь идет, казалось бы, лишь о феноменологических нюансах, сравнение имплицитной и эксплицитной ситуаций применения теста дополнения фрагментов слов выявляет их весьма существенные различия. Во-первых, показатели прайминга и прямого воспроизведения не коррелируют друг с другом, что трудно объяснить в рамках предположения о существовании единого для них формата сохранения информации («следа памяти»). Во-вторых, прайминг часто оказывается более стабильным показателем памяти, чем сознательное воспроизведение: он может сохраняться в течение более длительного времени и почти не меняться при варьировании условий кодирования, радикально влияющих на уровень воспроизведения (таких как отвлечение внимания). Более того, нормальный прайминг находят в группах испытуемых преклонного возраста и даже у пациентов с амнестическим синдромом. Произвольная память у них ослаблена или практически отсутствует. 362
Таблица 5.2. Примеры непрямых тестов, применяемых при изучении имплицитного запоминания
Преимущественные области тестирования | Разновидности тестов вербальные невербальные | |
Перцептивная | Дополнение фрагментов слова | Идентификация фрагментарных изображений |
Семантическая | Тест на знание обших фактов | Категоризация предметов |
Процедурная | Чтение инвертированного текста | Рисование зеркальных изображений |
Некоторые особенности этих результатов могут быть объяснены спецификой самого теста дополнения фрагментов слова, ориентированного скорее на перцептивные процессы обработки. Поэтому было предложено несколько десятков вариантов непрямых тестов, направленных на анализ других процессов (см. табл. 5.2). Исторически первыми непрямыми тестами были разнообразные методики анализа формирования навыков — умения ездить на велосипеде, плавать, печатать на машинке, читать тексты, написанные скорописью, и т.д. (Thorndike, 1932). Лежащие в основе формирования навыков процедурные формы памяти замечательны своим «долгожительством». В частности, как показал в начале 70-х годов прошлого века канадский психолог Пол Колере (Kolers, 1979), выработанный в течение нескольких недель тренировки навык чтения зеркально инвертированного текста сохраняется без особых изменений в течение года, причем не только у обычных испытуемых, но и у пациентов с амнестическим синдромом, для которых каждое следующее посещение лаборатории во время тренировки субъективно выглядело как первое в их жизни!
Для изучения имплицитных компонентов семантической памяти далее может использоваться тест общих знаний, представляющий собой набор стандартных вопросов типа «В названии самого известного романа Достоевского упоминается "наказание" и что еще?». Прайминг выражается здесь в увеличении вероятности правильного ответа, если ранее в каком-то контексте предъявлялось слово «преступление». (В случае данного вопроса базовая референтная вероятность правильного ответа составляет для студентов североамериканских университетов примерно 60%.) При изучении семантических, или концептуальных, связей интерес представляют также прайминг-эффекты, выражающиеся в активации целых семантических областей соответствующего понятия. Так, показ слова «врач» может облегчать последующую работу со
363
словами «доктор» и «больной», ускоряя их узнавание или принятие решения об их принадлежности к множеству осмысленных слов в задаче лексического решения (см. 4.3.2 и 7.2.2).
Возможные фундаментальные различия имплицитной памяти и сознательного припоминания заставляют обратить внимание на то, насколько избирательно различные методические процедуры позволяют тестировать каждую из этих гипотетических подсистем памяти. С одной стороны, в непрямых тестах часть испытуемых может иногда догадываться о подлинных целях экспериментов, в результате чего результаты оказываются не вполне чистыми — «контаминированными» влиянием эксплицитной памяти. С другой стороны, в случае традиционных прямых тестов, таких как эксплицитные задачи воспроизведения и узнавания, получаемые результаты могут искажаться неосознаваемым — автоматическим — влиянием имплицитных процессов. Для определения степени этих различных влияний на результаты выполнения прямых тестов запоминания канадский психолог Лэрри Джакоби предложил в начале 1990-х годов методический прием, получивший название методики диссоциации процессов (например, Jacoby, 1998). Этот методический прием позволяет операционализировать различия сознательных и бессознательных (или автоматических) процессов, дополняя тем самым два рассмотренных выше подхода — анализ времени реакции в задачах поиска (см. 4.2.3 и 5.1.2) и методику «проигрыша—выигрыша» Познера и Снайдера (см. 4.3.2).
Разработанный Джакоби метод может применяться с самыми разными прямыми тестами (как вербальными, так и невербальными), хотя в каждом случае его применение требует известной изобретательности. При этом всегда должны сравниваться результаты применения двух вариантов соответствующего теста, а именно варианты «включения» и «исключения». Значение этих понятий лучше проиллюстрировать на конкретном примере. Рассмотрим в качестве такого примера ситуацию использования теста воспроизведения с семантической подсказкой: сначала испытуемому показывается для запоминания ряд слов, а на стадии тестирования предъявляются для облегчения припоминания слова, семантически с ними связанные. Вариант «включения» — это то, что всегда делали испытуемые в исследованиях памяти, стараясь как можно лучше припомнить и воспроизвести целевое слово. Новым является только вариант «исключения»: в этом случае испытуемый должен постараться ответить на слово-подсказку любым семантически похожим словом, но только не тем, которое показывалось ему ранее.
Какая логика стоит за всем этим? Это можно пояснить еще одним примером, на этот раз с количественными данными. Допустим, что эмпирически установленная вероятность воспроизведения ранее показанного слова в варианте «включения» равна 0,8. В варианте «исключения» испытуемые также иногда воспроизводят ранее показанные слова — происходит такое воспроизведение по ошибке, так как они стараются 364
этого не делать. Пусть вероятность таких ошибочных воспроизведений ранее предъявленных слов в нашем гипотетическом примере равна 0,2. По мнению Джакоби, этих двух чисел достаточно, чтобы оценить количественный вклад процессов сознательного припоминания (С, от conscious) и имплицитной памяти (U, от unconscious) в решение данной задачи.
В самом деле, в варианте «включения» нужное слово может поступать из обоих источников — как эксплицитной, так и имплицитной памяти, а значит, справедливо следующее уравнение:
0,8 = С+ U-CU.
Следует обратить внимание на необходимость вычитания произведения двух вероятностей С и U, поскольку в противном случае это произведение было бы подсчитано дважды — ведь это вероятность влияния бессознательных имплицитных тенденций в том случае, когда целевое слово и без того уже воспроизводится благодаря эксплицитному, сознательному припоминанию. В варианте «исключения» ситуация совсем проста:
0,2= U(1 -С).
Очевидно, речь идет о совместной вероятности имплицитного влияния U и отсутствия влияния сознательного припоминания (1 — С), так как любое присутствие сознательного припоминания С должно было бы воспрепятствовать такому ответу. Решая эту простую систему двух уравнений с двумя неизвестными, можно получить оценки влияния сознательного припоминания и имплицитной памяти в данной задаче. Они равны соответственно 0,6 и 0,5.
Эти простые соображения послужили основой для значительного числа остроумных работ, направленных на выяснение роли «имплицитного познания» — бессознательных компонентов в процессах восприятия, запоминания и понимания (см. 4.3.3). Данные некоторых реальных исследований Джакоби и его последователей, демонстрирующие двойную диссоциацию вкладов сознательно контролируемых и автоматических процессов в самых различных условиях решения задачи воспроизведения, а именно в зависимости от внимания к материалу, параметров его предъявления и возраста испытуемых, приведены в табл. 5.3.
Как можно видеть из этой таблицы, данный подход позволяет получать чрезвычайно интересные и, судя по всему, систематические результаты. Вместе с тем, лежащие в основе методики диссоциации процессов допущения, а равно интерпретация результатов вызывают в последние годы бурные споры. Сам Джакоби считает, что показатель U представляет собой оценку обобщенного параметра знакомости, ведущую в задачах на узнавание к ответам «знаю», тогда как показатель С связан с оценкой вклада более рефлексивного ответа «вспоминаю» (см. 5.1.1). Если обратиться к табл. 5.3, то складывается впечатление, что данная процедура действительно выделяет в категории автоматические процессы нечто, очень похожее на имплицитную память — так, как она обычно описывается в исследованиях, опирающихся на применение непрямых тестов. Например, из других исследований (см. 5.4.3) известно, что эффективность имплицитной памяти у молодых и у (здоровых) пожилых людей примерно одинакова, тогда как произвольная память последних заметно ослаблена.
365
366
Таблица 5.3. Оценки величины вкладов сознательных и автоматических процессов в зависимости от условий кодирования и ответа, а также возраста испытуемых (по: Kelley & Jacoby, 2000)
Критическая переменная для диссоциации процессов | Сознательное припоминание, С | Автоматизмы памяти, U |
Внимание полное отвлеченное | 0,25 0,04 | 0,47 0,46 |
Время предъявления 10 сек 1 сек | 0,44 0,22 | 0,59 0,58 |
Возраст / 1 предъявление молодые старые | 0,38 0,20 | 0,45 0,44 |
Возраст / 3 предъявления молодые старые | 0,67 0,49 | 0,57 0,58 |
Результаты двух десятилетий интенсивных исследований имплицитной памяти говорят об отличии ее механизмов от процессов, лежащих в основе эксплицитного запоминания. Следует отметить, однако, что иногда использование различных непрямых тестов памяти, таких как перцептивный тест дополнения фрагментов слова и концептуальный (семантический) тест знания общих фактов, также приводит к существенно различающимся результатам, что позволяет сделать предварительный вывод о множественности механизмов самой имплицитной памяти. Если, таким образом, существует несколько различных форм не только эксплицитной, но и имплицитной памяти, то естественно возникает вопрос о том, как все эти разновидности памяти могут быть связаны между собой. Данные соответствующих экспериментов и их возможная интерпретация будут рассмотрены нами в одном из следующих разделов этой главы (см. 5.3.3), после анализа основных подходов к описанию процессов непосредственного запоминания.
5.2 Теории непосредственного запоминания
5.2.1 Трехкомпонентные модели
Представление о трех блоках памяти долгое время выполняло функции основной теоретической схемы когнитивной психологии, которая позволяла упорядочивать поток эмпирических данных, обрабатываемых и отчасти создаваемых находящимися на линии психологического эксперимента вычислительными машинами. Не затрагивая вопроса об истории различения первичной и вторичной памяти, следы которой теряются в 19-м веке, можно сказать, что в 1960-е годы практически все основные работы в этой области вели к выделению трех компонентов памяти человека. Очертания этих блоков можно найти уже у Д. Бродбента, затем Дж. Сперлинг обосновал существование «очень короткой» зрительной памяти, Н. Во и Д. Норман разработали первую математическую модель, а Улрик Найссер продемонстрировал в «Когнитивной психологии», каким образом огромное число разнообразных психологических феноменов можно привести в соответствие с этой жесткой структурной схемой.
В истории когнитивных исследований непосредственного запоминания выдающуюся роль сыграла трехкомпонентная модель памяти, предложенная в 1968 году американскими психологами Ричардом Ат-кинсоном и Ричардом Шиффрином (см. Аткинсон, 1980). Она была незначительно модифицирована тремя годами позже и показана в этой модификации на рис. 5.3. Очень похожие модели были разработаны затем и другими, в том числе российскими авторами.
Рис. 5.3. Модель памяти Р. Аткинсона и Р. Шиффрина (Аткинсон, 1980).
367
Согласно этой модели, информация из внешней среды попадает сначала в модатьно-специфические сенсорные регистры (гипа обсуждавшихся выше иконической и эхоической памяти — см. 3.2.1 и 3.2.2), где хранится около секунды в форме очень полного описания, своего рода отпечатка физической стимуляции. Затем информация либо стирается («угасает»), либо переводится в кратковременное хранилище, где остается на 10—20 секунд в форме амодатьного вербально-акустического кода. Управляя циркуляцией информации между блоками, можно удлинять этот срок. Типичными для блока кратковременной памяти являются именно процессы управления — проговаривание. перекодирование, принятие решения, выбор стратегии запоминания и т.д. Проговаривание выполняет функцию «вербальной петли» (verbal loop), позволяющей не только сохранять информацию в кратковременном хранилище, но и переводить ее в долговременную памя!ь. Чем дольше сохраняется материал в кратковременной памяти, тем прочнее формирующийся долговременный след. Сама долговременная память оказывается в этой модели перманентной — ее следы не подлежат распаду и сохраняются, в форме семантического кода, в течение месяцев и лег. Характеристики трех блоков памяти, как они понимались в 1970-е годы, представлены в табл. 5.4.
Исключительная популярность этой модели объясняется тем, что с ее помощью удалось единообразно объяснить — гомогенизировать — множество феноменов памяти, внимания и восприятия. При этом сама модель прямо воспроизводила архитектуру компьютера: три вида памяти соответствуют входным интерфейсам, активному процессору и пассивной памяти, а процессы управления — программным алгоритмам, определяющим движение и характер преобразований информации от поступления на вход системы до выдачи ответа. В работах 1960—70-х годов приводились десятки аргументов в пользу разделения кратковременной и долговременной памяти. При этом упоминались и клинические данные об особенностях запоминания информации пациентами с амнестическим синдромом"1. Подавляющее большинство аргументов было связано с анализом ошибок полного воспроизведения и зависимости от позиции элемента в ряду, то есть с классическим эффектом края, первоначально обнаруженным Эббингаузом (см. 1.2.3).
Действительно, в эти годы было установлено, что успешность воспроизведения первых и последних элементов последовательно предъявляемого для воспроизведения ряда букв, цифр или слов зависит от ряда различных факторов, что привело к разделению эффекта края на, соот-
111 Чаще всего в лих работах упоминался Корсаковскии синдром — нарушение памяти, чаще всего возникающее под влиянием длительной алкогольной интоксикации. Для этого варианта ачнестическот синдрома, описанного С.С. Корсаковым, характерны чрезвычайно плохое долговременное удержание новой информации, конфабулянии (псевло-воспоминания), а также общие затруднения в припоминании материала, выученного за-368 долго до начала заболевания (признак ретроградной амнезии — см 5.4.1 ).
Таблица 5.4. Характеристики блоков сохранения информации в трехкомпонентных моделях памя1и
Параметры и виды памяти | Сенсорные регистры | Кратковременная память | Долговременная память |
Ввод информации | механизмы предвнимания | внимание | проговаривание |
Репрезентация информации | след сенсорного воздействия | акустическая и/или артикуляционная, возможно, зрительная и семантическая | в основном семантическая |
Объем хранящейся информации | большой | маленький, в пределах «магического числа» | предел неизвестен |
Забывание информации | угасание | вытеснение, возможно, интерференция | возможно, отсутствует |
Время сохранения | порядка 300 мс | порядка 30 с | от минут до десятилетий |
Извлечение информации | считывание | поиск | возможно, поиск |
Стру к гура памяти | неассоциативная | неассоциативная | ассоциативная |
ветственно, эффект первичности и эффект недавности. Например, включение в запоминаемый список слов-синонимов (условие семантической интерференции) приводит к избирательному снижению эффекта первичности, тогда как в случае списка, состоящего преимущественно из гомофонов, то есть таких похожих по звучанию, но различных по значению слов, как «магнолия» и «Монголия» (условие артикуляцион-но-фонологической интерференции), уменьшается также и эффект недавности. Аналогичная разнонаправленность влияний на эффекты первичности и недавности была обнаружена для ряда других факторов — скорости предъявления материала, распределения повторений, отсрочки воспроизведения в условиях решения интерферирующей задачи и т.д. (см., например, Андерсон, 2002).
В рамках модели Аткинеона и Шиффрина эти факты получают простое объяснение, согласно которому эффект недавности обусловлен извлечением информации из вербально-фонологической кратковременной памяти, а эффект первичности — из семантической долговременной. В пользу гипотезы о фонематической основе кратковременного сохранения информации говорило также то, что даже в случае зрительного
369
предъявления буквенного материала ошибки при его непосредственном воспроизведении часто имеют характер акустического, а не зрительного смешения. Таким образом, с помощью одной модели объясняются данные о форме репрезентации (перцептивная, вербально-акустическая, семантическая), о продолжительности различных видов памяти и об объеме хранящейся в них информации.
Аткинсон и Шиффрин разработали также математическую модель, описывающую функционирование системы с тремя блоками памяти. Параметрами модели были величина буфера повторения, веройтность ввода нового элемента в буфер, темп увеличения прочности и распада долговременного следа. Примером использования этой модели может служить один из экспериментов на парные ассоциации, в котором двузначные числа из фиксированного набора ассоциировались с буквами. Испытуемые должны были по мере предъявления все новых символов называть букву, которая в последний раз ассоциировалась с данным числом, и запоминать новые ассоциации к этому же числу. Независимыми переменными были задержка между заучиванием ассоциации и ее тестированием, а также объем набора чисел. В этих достаточно жестких условиях данные лучше всего описывались следующими значениями параметров — величина буфера повторения г=2, вероятность ввода нового элемента в буфер а=0,32, скорость увеличения прочности 9=0,40, скорость распада следа Т=0,93. В одной из модификаций эксперимента условия были упрощены: после тестирования испытуемые должны были запоминать ту же самую ассоциацию. Это привело к сдвигу значений параметров: г=Ъ, α=0,65, θ=1,24, 7=0,82. Очевидно, долговременное сохранение стало здесь существенным подспорьем в решении задачи, поэтому испытуемые без прежней робости вводили новые элементы в буфер повторения. В общей сложности только первая статья этих авторов насчитывала 12 таких экспериментов. Во всех этих экспериментах удалось добиться довольно хорошей аппроксимации результатов.
Наконец, была предпринята попытка распространить трехкомпонент-ную модель на объяснение хронометрических данных экспериментов по опознанию. Р. Агкинсон и Дж. Джуола предположили, что каждый тестовый стимул ассоциирован с некоторым значением «знакомости», которое определяется частотой и недавностью предыдущих предъявлений. Отрицательные тестовые стимулы в задаче стернбергского типа характеризуются распределением, имеющим меньшее среднее значение знакомости, чем распределение положительных стимулов. Как видно из рис. 5.4А, определяющим для выбора той или иной стратегии узнавания является сопоставление знакомости с двумя критериями, устанавливаемыми испытуемыми. Если знакомость тестового стимула достаточно высока или низка по сравнению с положением высокого и низкого критерия, то это ведет к быстрым положительным или, соответственно, отрицательным ответам. Если знакомость занимает промежуточное положение, то испытуемый вынужден прибегать к более или менее развернутому поиску в памяти. Этот поиск разворачивается как в кратковременной, так и в долговременной памяти. 370
Τ"
369 369 369
Объем положительного множества
Рис. 5.4. Динамика зрительного опознания в зависимости от знакомости материала: А. Выбор стратегии опознания на основе величины знакомости (по: Аткинсон, 1980); Б. Изменение зависимости скорости ответов от объема положительного множества по ходу многодневного эксперимента (по: Величковский, 19826).
Вероятностная комбинация стратегий прямого доступа и развернутого поиска среди содержаний памяти позволяет объяснить ряд эффектов, известных из исследований поиска в памяти (см. 5.1.2). В ряде случаев, например в наших экспериментах, где использовались не простые буквенно-цифровые стимулы или слова, а сложные видовые слайды (Зинченко, Величковский, Вучетич, 1980), были в общих чертах получены традиционные зависимости, но наклон прямых был настолько мал (2—5 мс/слайд), что ни о какой строго последовательной обработке
371
не могло быть и речи — она должна была бы осуществляться со скоростью 200—500 изображений в секунду. Далее, данная модель объясняет наблюдаемую в ряде случаев разную динамику наклонов функций положительных и отрицательных ответов по мере проведения экспериментов на узнавание. Ее иллюстрируют показанные на рис. 5.4Б данные наших исследований — с течением времени наклон функций положительных ответов уменьшается, а отрицательных — растет.
Эти данные можно объяснить общим монотонным ростом знакомости, в силу которого распределение знакомости положительных в некоторой пробе стимулов сдвигается в зону быстрых положительных ответов, а распределение отрицательных постепенно выходит из зоны быстрых отрицательных ответов и оказывается в зоне поиска (ср. рис. 5.4А). Важной особенностью показанных здесь результатов является то, что по условиям нашего эксперимента рост знакомости мог происходить только в последовательные дни. Поскольку суточный интервал явно превышает продолжительность хранения информации в кратковременной памяти, рост знакомости мог происходить лишь на базе долговременных репрезентаций. Это могло бы означать, что кратковременная память является не столько независимым «хранилищем», сколько фрагментом более продолжительной формы памяти.
Попытки распространить трехкомпонентные модели на данные хронометрических исследований процессов поиска в памяти совпали с началом экспериментальной критики представлений о взаимодействии кратковременной и долговременной памяти, характерных для начального периода развития когнитивной психологии. В конце 1970-х годов стали выдвигаться многочисленные альтернативные предположения, например, что на самом деле существует лишь единственный след памяти или что в зависимости от типа материала и характера задачи механизмы запоминания могут быть совершенно различными.
Действительно, многие факты объясняет возникшая именно в этот период теория единого следа Уайна Уикелгрина Рассматривая аргументы, используемые для обоснования разделения памяти на кратковременную и долговременную, Уикелгрин пришел к выводу, что все они недостаточно убедительны. По его мнению, в памяти существует единственный след, прочность которого меняется под влиянием времени и интерференции со стороны вновь приобретаемого материала. Во-первых, многие данные можно объяснить просто различиями в кодировании, которые вторично влияют на показатели забывания. Так, с увеличением сходства между элементами запоминаемого материала интерференция и скорость забывания, очевидно, будут возрастать (см. 5.4 1). При фонологическом кодировании вербального материала такое сходство больше, чем при семантическом, так как в каждом языке существует лишь сравнительно ограниченный набор из 3—5 десятков фонем, но несколько десятков тысяч различных понятий (см. 7.1.1). Поэтому фонологический компонент единого следа будет распадаться быстрее, чем семантический. Во-вторых, известно (из первого закона Иоста — см 1.2.3), что скорость забывания уменьшается при увеличении интервала сохранения Если эк-
страполировать эту зависимость на первые секунды сохранения, то необходимость в постулировании особого кратковременного следа отпадает. Теоретическая функция сохранения выглядит следующим образом.
dm=a(l+ß) *(е »), где α, β, ψ, π > 0.
В этом уравнении dm — интервальная оценка прочности следа d', α — величина исходного уровня запоминания, β и ψ — параметры скорости изменения прочности, е — основание натуральных логарифмов, a π — параметр, определяющий степень сходства материала Если последний параметр близок к единице, то зависимость приобретает экспоненциальный характер, описывающий динамику кратковременного запоминания. Если он близок к нулю, зависимость принимает вид степенной функции, как в случае долговременной памяти.
Особую роль сыграла экспериментальная критика, показавшая, что в рамках трехкомпонентных моделей сделана попытка сведения качественно различных явлений к одной структурной схеме. Под вопросом постепенно оказалась и конвергенция методических процедур. Как мы отмечали выше, доказательством разделения памяти на блоки кратковременного и долговременного хранения служит эффект края. Однако американские психологи Генри Рёдигер и Роберт Краудер обнаружили эффект края в таких условиях, при которых весь материал должен был бы заведомо находиться в одном и том же блоке памяти, а именно в долговременной памяти. Когда они просили прохожих вспомнить всех президентов США, то в позиционных кривых полного воспроизведения наблюдался выраженный эффект края: более или менее стабильно припоминались лишь самые первые и самые последние президенты (с тремя «отклонениями» в середине ряда: А. Линкольном, Ф.Д. Рузвельтом и Дж.Ф. Кеннеди). Вполне возможно, что при семантической категоризации любой относительно однородной последовательности мы просто разделяем ее на две части, поэтому при необходимости воспроизведения типичные представители — первые и последние элементы — воспроизводятся наиболее успешно.
Предположение о смене форм репрезентации в каждом из блоков памяти было поставлено под сомнение данными о семантическом кодировании при кратковременном запоминании и фонематическом при долговременном. Особенно неожиданными оказались свойства памяти на сенсорно-перцептивный материал. Так, анализ узнавания тональных звуков показал, что память на них является как бы продолжением восприятия — интерференция в кратковременной памяти, как и воспринимаемое сходство звуков, объяснялись близостью в координатах музыкальной шкалы. В других исследованиях было показано, что испытуемые могут успешно (порядка 90% правильных ответов) узнавать отдельные звуки из прослушанного ими ранее набора сотен звуков — плач ребенка, скрип двери, лай собаки и т.д. Примерно то же самое было установлено по отношению к элементам набора синтетических запахов, хотя для них было довольно сложно придумать вербальные обозначения. Наконец, 373
сначала Р. Шепард, а затем Л. Стэндинг обнаружили исключительные возможности зрительного запоминания и узнавания материала. В последней из этих работ испытуемым однократно предъявлялось 11 000 (!) слайдов, и, тем не менее, успешность узнавания составила через четыре недели после ознакомления около 75% правильных ответов (при вероятности угадывания, равной 50%). Только предъявление материала продолжалось здесь двое суток (Standing, 1973).
В эксперименте, проведенном нами совместно с К.-Д. Шмидтом (Величковский, 1977), испытуемые должны были узнавать элементы набора из 940 цветных слайдов с видами городов, настолько похожих семантически, что вербальные описания не позволяли их различать. Несмотря на это, даже через пять недель после показа испытуемые могли отличить старые и новые слайды. Узнавание зависело только от длительности первоначального показа, а не от общего времени между последовательными слайдами — асинхронности включения, в течение которого могло бы происходить вербальное и семантическое кодирование. Следовательно, эта удивительная по возможностям форма долговременной памяти связана с процессами, которые разворачиваются лишь до тех пор, пока есть наличный сенсорный материал. В другой работе испытуемым предъявлялись 252 цветные фотографии, причем интервал предъявления варьировался на пяти уровнях: от 110 до 1500 мс. Успешность узнавания отдельных слайдов никак не коррелировала со временем, необходимым для возникновения словесных ассоциаций (Potter, 1999). Было установлено также, что при использовании сложного, предметно организованного зрительного материала позиционные кривые воспроизведения не обнаруживают обычного эффекта края, свидетельствующего об использовании процессов проговаривания.
Так как отличительной чертой кратковременной памяти считалось сохранение информации в форме фонологического и/или артикуляционного кода, а долговременной — в форме семантического, среди вызванных этими работами вопросов был вопрос о том, существуют ли эти блоки вообще. Действительно, если хранилища памяти разделяются по параметру продолжительности хранения информации, то минимальным требованием является инвариантность данных о времени удержания относительно различных методик и экспериментальных условий. Однако в результате многочисленных исследований так и не удалось точно определить время пребывания информации в кратковременной памяти: по разным подсчетам оно составляет от двух секунд до нескольких часов.
Требование инвариантности приложимо и к вопросу об объеме хранящейся информации. За полвека, прошедшие со времени публикации Дж. Миллера (см. 2.1.3), предпринималось множество попыток уточнить величину «магического числа». При этом только один автор — Герберт
Саймон (1918—2001) — подтвердил исходные результаты, все остальные 374
оценки оказались более низкими". Сравнение результатов нескольких десятков экспериментов, направленных на оценку объема кратковременной памяти, показывает, что мода распределения оценок (наиболее часто встречающееся в распределении значение) лежит где-то около трех единиц материала, то есть оказывается значительно ниже «магического числа». Вместе с тем, эти единицы очень подвижны — в их качестве могут выступить как отдельные фонемы, так и целые фразы, поэтому, например, объем удерживаемых в кратковременной памяти слов меняется в диапазоне от двух до 26.
Таким образом, хотя одни данные говорят о том, что в кратковременной памяти хранятся продукты относительно поверхностного фонематического описания материала, другие столь же убедительно свидетельствуют об удержании информации в зрительной форме, а равно о выполнении сложной семантической обработки. Как мы видели выше (см. 3.2.1 и 3.2.2), к концу 1970-х годов критике стало подвергаться и представление о периферических сенсорных регистрах. Постепенно характеристики всех блоков трехкомпонентной модели были поставлены под сомнение, так что сама эта модель стала частью истории психологии. На смену этому представлению пришли новые подходы, сосуществующие по сегодняшний день. Первый из них, к рассмотрению которого мы сейчас перейдем, отвергает концепцию блоков памяти и рассматривает память как побочный продукт решения более широких задач. Второй подход (см. 5.2.3) связан с развитием представлений о центральном компоненте трехблочных моделей — кратковременной памяти. Наконец, третий подход (см. 5.3.2) направлен на расщепление прежде единой долговременной памяти на отдельные подсистемы и уровни.
5.2.2 Теория уровней обработки
Общей чертой многих современных теорий познавательной активности является ее описание в терминах стадий, этапов или уровней. Подобные теории предполагают последовательный переход процесса переработки информации с одного уровня на другой, причем это движение начинается с анализа сенсорных признаков и кончается сложными семантическими преобразованиями (см., например, 4.1.1). Наиболее известным вариантом теорий такого рода в психологии памяти является подход, разработанный канадско-шотландским психологом Фергюсом Крэйком
11 Отличие данных Саймона от результатов других авторов может объясняться инди
видуальными различиями — он проводил эти опыты на себе. В 1978 году Саймон первым
из психологов был удостоен Нобелевской премии (правда, формально за работы в облас
ти экономики). Хотя сведения об особенностях памяти Нобелевских лауреатов в литера
туре отсутствуют, положительная корреляция между объемом непосредственного запо
минания и интеллектом хорошо известна (см. 8.4.3). 375
совместно с его коллегой Робертом Локартом (Craik & Lockhart, 1972; Lockhart & Craik, 1990). В рамках этого подхода подчеркивается необходимость переориентации стратегии исследований от описания структуры статичных блоков, или хранилищ, к описанию активных процессов, причем процессов более широких, чем собственно мнестические действия (то есть действия, сознательной целью которых является запоминание). Запоминание считается непроизвольным побочным продуктом в общем случае немнестической познавательной активности, а его прочность и длительность сохранения — функцией «глубины» этой активности.
Согласно этому подходу, обработка материала может осуществляться на разных уровнях, связанных с выделением поверхностных (перцептивных) или глубоких (семантических) признаков. При этом внутри каждого из уровней обработки можно выделить формы анализа, которые в свою очередь также различаются по глубине и по обширности вовлекаемых ассоциативных связей: «вертолет» можно определить как «то, на чем летают», как «летательный аппарат тяжелее воздуха» или как «летательный аппарат тяжелее воздуха, идея которого впервые была высказана великим Леонардо». Таким образом, глубина переработки, а следовательно, и память представляют собой скорее континуум (или градиент), чем дискретную цепочку блоков. Уровень переработки определяется интенцией субъекта. Поскольку познавательная активность обычно направлена «вглубь» — на выделение значения предметов и событий, это способствует длительному сохранению воспринятой информации.
Наряду с обработкой, ведущей ко все более глубокому и поэтому устойчивому когнитивному описанию, существует и другой способ сохранения материала — циркуляция информации на одном и том же уровне, или «удержание в поле внимания». Такая циркуляция обеспечивается работой механизма внимания с ограниченной пропускной способностью. В этом случае будут иметь место феномены первичной (кратковременной) памяти. Выраженность и характер этих феноменов зависят от уровня кодирования, соответствующего интенциям субъекта, и модальности, в которых работает внимание. Чем глубже уровень кодирования, тем больше объем удерживаемой информации и тем более абстрактен ее характер. В отличие от кратковременной памяти трех-компонентных моделей этот механизм не имеет фиксированной локализации и может работать как с поверхностными, так и с глубокими, семантическими репрезентациями. Находясь в состоянии первичной памяти, информация сохраняется, но, как только внимание отвлекается, она начинает теряться со скоростью, определяемой глубиной проведенной обработки, точнее, наиболее глубоким ее уровнем. Внимание и первичная память понимаются как некоторый единый функциональный механизм, выполняющий по отношению к разноуровневым продуктам когнитивной обработки подсобные, буферные функции. 376
Рис. 5.5. Экспериментальные данные, приводимые в пользу теории уровней переработки: А. Эффект отрицательной недавности; Б. Зависимость воспроизведения слов от сложности лингвистического контекста, подсказки и типа ответа (Craik & Tulving, 1975).
Экспериментальные исследования, возникшие в рамках данного подхода, были направлены прежде всего на демонстрацию связи запоминания с глубиной переработки, а не с продолжительностью пребывания в первичной памяти («кратковременном хранилище»). Одним из фактов, обнаруженных Ф. Крэйком, является эффект отрицательной недавности. В обычном эксперименте на свободное воспроизведение испытуемым последовательно предъявлялось 10 списков по 15 слов в каждом. После каждого списка испытуемый воспроизводил его, причем позиционные кривые полного воспроизведения неизменно обнаруживали эффект края с выраженным эффектом недавности. Когда эксперимент был окончен, испытуемого неожиданно просили воспроизвести как можно больше показанных ранее слов. Оказалось, что в этом случае слова, бывшие в отдельных списках последними, воспроизводятся особенно плохо (рис. 5.5А). Данный эффект можно считать следствием поверхностной переработки последних элементов списков. С другой стороны, Аткинсон и Шиффрин могли бы объяснить этот эффект недостаточным повторением последних элементов по сравнению с материалом, переведенным в долговременное хранилище.
Для сравнения объяснительных возможностей двух подходов необходимы были более убедительные факты. Таких фактов сейчас получено немало. Например, было установлено, что число повторений слова коррелирует с вероятностью его воспроизведения лишь в первых пробах. В .случае категоризованного вербального материала более существенным фактором оказалось то, организовано ли повторение в соответствии с группами понятий, присутствующих в списках. Иными словами, важна прежде всего организация повторений, а не их число.
377
В ходе своих экспериментов Крэйк показал, что испытуемые, инструктированные обязательно правильно воспроизводить четыре последних элемента списка, проговаривают главным образом эти элементы, но при внезапном тестировании после окончания эксперимента в целом (он включал предъявление нескольких таких списков) воспроизводят их не лучше, чем остальные. Все эти данные свидетельствуют о том, что повторение не выполняет само по себе отводимой ему в трехкомпонентных моделях функции автоматического перевода информации в долговременную память. Крэйк различает при этом разные формы повторения, между которыми может выбирать испытуемый. «Повторение,» имеет поверхностный характер и направлено на сохранение возможно более полной «реплики» информации в состоянии первичной памяти. Его влияние на запоминание оказывается относительно незначительным. «Повторение2», напротив, артикулирует семантические особенности материала и ведет к более глубокому и, следовательно, продолжительному кодированию (см. 5.4.3).
Основные эксперименты представителей теории уровней переработки используют варьирование ориентировочной задачи и несколько напоминают исследования непроизвольного запоминания, проводившиеся в Советском Союзе П.И. Зинченко (1903—1969) и A.A. Смирновым (1894—1980). Эти исследования продемонстрировали зависимость успешности запоминания от характера работы с соответствующим материалом в контексте некоторой, в общем случае немнестической (то есть не связанной с запоминанием как с сознательной целью) активности. Чем более сложной и осмысленной была обработка, тем лучше запоминался материал. Кроме того, все то, что нарушало привычную последовательность событий и на что было направлено наше внимание, — или, другими словами, все связанное с целями действий — при последующем внезапном тестировании припоминалось лучше, чем информация о множестве сопутствующих обстоятельств (см. 6.3.3).
Примером экспериментов «Торонтской школы» может служить работа Крэйка и Тулвинга (Craik & Tulving, 1975), за которой последовали сотни подобных исследований12. Типичный эксперимент состоял в предъявлении 60 слов. Перед показом каждого слова испытуемому задавался ориентирующий вопрос, который мог относиться к зрительным характеристикам слова (например, «Написано ли это слово заглавными буквами?»), его фонематическому рисунку («Рифмуется ли это слово со словом "скамейка"?») или особенностям значения («Относится ли это слово к названиям растений?»). Ожидалось, что эти вопросы вызовут различную по глубине обработку и, соответственно, наихудшее запоми-
12 Проведенный в начале 2002 года анализ показал, что статья Крэйка и Локарта( 1972) занимает второе место по частоте цитирования в истории экспериментальной психологии, уступая лишь классической работе Джорджа Миллера (1956 — см Миллер, 1964). Наиболее часто цитируемым психологом за последние 25 лет оказался коллега Крэйка по 378 университету Торонто Эндел Тулвинг
нание в первом случае и лучшее — в последнем. Такие результаты и были получены в целом ряде условий: при узнавании и воспроизведении, а равно при произвольном и непроизвольном запоминании. Было показано, что лучшее запоминание не объясняется просто более продолжительной работой с семантическим вопросом — вопрос: «Имеет ли структура слова вид "согласная-гласная-согласная"?» также приводил к плохому запоминанию. Нельзя объяснить полученные результаты и отсутствием подлинного восприятия слова при поверхностной переработке, поскольку результаты повторились, когда испытуемый записывал каждое слово либо получал ориентирующий вопрос уже после показа.
Одним из неожиданных аспектов полученных данных оказалось относительно слабое сохранение слов, ассоциированных с отрицательными ответами, то есть слов, которые не подходили к ориентировочному вопросу, например, не попадали в определенную семантическую категорию. Причем этот дополнительный эффект наблюдался только в случае глубоких уровней обработки (см. табл. 5.5). Для его объяснения Крэйк и Тулвинг предположили, что сохранение улучшается при большей ассоциативной «детализации» (elaboration) следа, то есть при увеличении числа и разнообразия связей, выявляемых в материале при его развертывании «в ширину» — на одном и том же уровне обработки. Такая «детализация» облегчается, если запоминаемый материал и контекст, в условиях которого он кодируется, могут быть интегрированы в некоторую целостную единицу. Это и имеет место в положительных пробах, где задаваемые ориентировочные вопросы и целевые слова естественно дополняют друг друга, особенно в случае глубоких уровней обработки.
Таблица 5.5. Вероятность правильного узнавания слов при различных условиях кодирования (по. Craik & Tulving, 1975)
Тип ответа | Тип вопроса: фигуративный фонетический семантический | ||
положительный | 0,23 | 0,53 | 0,81 |
отрицательный | 0,25 | 0,33 | 0,61 |
«Детализация» следа была подвергнута экспериментальному контролю с помощью использования вместо обычных ориентировочных вопросов предложений различной степени сложности с одним пропущенным словом. Испытуемый должен был определить, подходит ли предъявлявшееся ему слово на место пропущенного. Как видно из рис. 5.5Б, вероятность последующего воспроизведения слов возрастала при увеличении сложности предложений, причем этот рост был выражен более сильно в
379
том случае, когда слова могли быть включены в контекст предложения (положительные ответы). Если слово и предложение не могут образовать целостной единицы (отрицательные ответы), степень воспроизведения оставалась невысокой. Результаты становятся еще более рельефными, если на стадии первоначального кодирования предъявлять слова в контексте осмысленных предложений, а при воспроизведении предъявлять испытуемому исходное предложение в качестве подсказки. Таким образом, подсказка более эффективна, когда она присутствует при первоначальном кодировании, образуя с запоминаемым материалом единое целое. Можно сделать и обратное утверждение: если подсказка эффективна, она должна быть каким-то образом представлена в следе хранящегося в памяти события.
Последняя формулировка совпадает с выдвинутым ранее Энделом Тулвингом принципом специфического кодирования (известным также как принцип адекватной переносу обработки). Этот принцип подчеркивает значение возможно более полного пересечения процессов, задействованных на стадии извлечения из памяти, с операциями, использовавшимися для кодирования информации на стадии ознакомления с материалом. Учет этого принципа давал возможность дополнить теорию уровней обработки, связанную преимущественно с процессами первоначального кодирования, представлениями о процессах, разворачивающихся во время извлечения информации из памяти. В последних вариантах теории уровней переработки предполагается, что «припоминание» происходит при совпадении или достаточном сходстве репрезентаций, полученных во время кодирования и при тестировании.
При всей кажущейся очевидности принцип специфического кодирования означает отход от традиции вербального научения, так как он подчеркивает значение контекста запоминания и воспроизведения, а не прочности следа. Например, хотя слова «холод» и «тепло» образуют значительно более прочную ассоциативную связь, чем слова «песок» и «тепло», если в задаче парных ассоциаций первоначально предъявлялась вторая пара, то на стадии тестирования для восстановления слова «тепло» более эффективной подсказкой оказывается «песок», а не «холод». Если степень пересечения (сходства) гипотетических операций при первоначальном кодировании и при тестировании высока, то и результаты в конкретном тесте запоминания будут более высокими. Вместе с тем, специфическое кодирование не является полноценным объяснительным принципом. Будучи сформулированным в очень общей форме, он оставляет открытым вопрос о влиянии способа работы с материалом при первоначальном ознакомлении на последующее припоминание. Этот вопрос подробно обсуждается нами в следующем разделе данной главы в связи с анализом возможного соответствия между «уровнями обработки» Крэйка и Локарта и уровневыми механизмами познавательных процессов в целом (см. 5.3.3). В частности, данные экспериментов с систематическим сравнением роли сходства кодирования и извлечения инфор-380
мации из памяти на разных уровнях обработки позволяют значительно уточнить уровневое объяснение (Velichkovsky, 2002).
В обширных прикладных исследованиях («память и старость», «память и алкоголизм» и т.д.) Крэйк и его коллеги отмечают также, что глубина и ширина переработки зависят не только от задачи, но и от функционального состояния человека, которое может меняться под влиянием ожидания, эмоционального контекста, возраста, утомления, фармакологического фона и т.д. Взаимодействуя, эти факторы придают репрезентациям событий определенную уникальность13. В этой связи можно говорить о важности «единственности» следа. Воспроизведение оказывается успешным в той мере, в какой доступная при тестировании информация может быть однозначно соотнесена с кодированными перцептивно-семантическими репрезентациями. Когда один и тот же ориентирующий вопрос задается по отношению ко все большему числу слов в списке, успешность воспроизведения снижается при той же глубине обработки, а сам вопрос оказывается менее эффективной подсказкой. Таким образом, существенным оказывается целый ряд переменных: «глубина», «ширина» («детализация»), «специфичность» и «единственность» кодирования (Craik, 2002).
Все это свидетельствует о достаточной гибкости теории уровней переработки, позволяющей ей ассимилировать данные, получаемые в рамках весьма разных линий исследований. Но и эта теория наталкивается на определенные трудности. Роль «троянского коня» сыграл принцип специфического кодирования. После его включения в теорию уровней переработки был проведен более полный анализ роли специфического кодирования. Эти работы неожиданно показали, что если при тестировании испытуемому дается в качестве подсказки рифмующееся слово, то лучше могут воспроизводиться слова, которые первоначально воспринимались в условиях фонематической, а не семантической ориентирующей задачи. Более того, даже совсем поверхностная переработка, связанная, например, с особенностями шрифта напечатанного текста или тембра голоса, может приводить к возникновению устойчивых мнестических эффектов, если только для их выявления используется адекватная процедура тестирования. Под вопросом оказался главный тезис — более глубокая переработка ведет к лучшему запоминанию.
Были выявлены и другие ограничения действенности условий кодирования. Так, например, оказалось, что эффекты уровня обработки преимущественно связаны с эксплицитными (прямыми) тестами памяти, причем и в этой категории наиболее устойчивые результаты были
" Так можно подойти к объяснению феномена воспроизведения, зависящего от со
стояния, а также отмечавшейся В. Вундтом, Φ Бартлеттом и отечественным психологом
П.П. Блонским роли восстановления общего эмоционального отношения в припомина
нии деталей прошедших событий (см. 5.1.1) 381
получены с вербальным материалом. При использовании имплицитных тестов памяти, подобных перцептивному тесту дополнения слова (см. 5.1.3), манипуляция уровней обработки не меняет величину прайминг-эффектов. Иными словами, то, что мы делаем с материалом, существенно меняет показатели эксплицитного запоминания, но никак не сказывается на эффектах имплицитной перцептивной памяти (хотя вли^-яние уровня обработки при кодировании, похоже, восстанавливается при использовании тестов на имплицитную семантическую память — см. 5.3.3).
Наконец, критике были подвергнуты и логические основания теории уровней обработки. По мнению Алана Бэддели, авторы данной концепции попали в порочный круг: они сначала постулировали зависимость успешности запоминания от «глубины» переработки, а затем приняли данные об изменении успешности запоминания, полученные в различных условиях, за доказательство этого предположения и эмпирический критерий «глубины». Основной вопрос, следовательно, состоит в том, можно ли найти независимые от памяти критерии, позволяющие определять «глубину», или «уровень», тех или иных процедур кодирования материала. Похоже, что такие критерии были найдены в последние годы. Ими оказались параметры распределения мозговой активности при решении разнообразных когнитивных задач. Мы подробно остановимся на этих исследованиях в следующем разделе этой главы (см. 5.3.3), а сейчас рассмотрим другой, исключительно влиятельный подход, который продолжает более традиционную линию анализа, намеченную уже в трехкомпонентных моделях памяти.
5.2.3 Эволюция модели рабочей памяти
В отличие от Крэйка и Локарта, которые разработали подход, довольно радикально отличающийся от возникших в рамках компьютерной метафоры представлений, другие авторы попытались уточнить характеристики центрального блока трехкомпонентных моделей — кратковременной памяти. Алан Бэддели и его ученик Джон Хич (Baddeley & Hitch, 1974) выдвинули гипотезу, согласно которой кратковременная, или, в их терминологии, рабочая память неоднородна и сама состоит как минимум из трех блоков. Первый и высший из них — это центральный исполнитель (centralexecutive)™, контролирующий распределение внимания и способный осуществлять сложные преобразования информации. Ему
14 В английском языке термин «исполнитель» в общем случае имплицирует более высокий и более автономный социальный статус, чем в русском языке, где помимо собственно «исполнителя» обычно еще подразумевается существование других, иерархически надстроенных инстанций, принимающих решения и дающих указания о том, что сле-382 дует исполнять.
подчинены две служебные (slave, то есть буквально «рабские») системы:
■ артикуляционная петля, которая выполняет буферные функции, сохра-
няя в течение пары секунд ограниченный объем продуктов фонемати-
> ческого анализа, и зрительно-пространственный блокнот (в действи-
I тельности, скорее «этюдник» — sketch-pad). Последний представляет
1 собой зрительный аналог артикуляционной петли и позволяет удержи-
вать в течение нескольких секунд информацию о двух-трех (или, быть
может, всего лишь одном — Phillips & Christie, 1977) объектах,
ι Теория рабочей памяти исключительно популярна сегодня в психо-
логии и за ее пределами, поскольку процессы оперативного сохранения и преобразования информации, во-первых, играют критически важную роль во многих повседневных задачах и, во-вторых, обнаруживают высокую корреляцию с показателями интеллекта (см., например, Lepine, Barrouillet & Camos, 2005). Кроме того, Алан Бэддели и его коллеги на протяжении более двух десятилетий постоянно уточняли представления о рабочей памяти, включая в ее состав все новые компоненты. Подобным образом они часто реагировали на данные, противоречащие первоначальной версии теории.
В этой двухуровневой модели настоящей наследницей кратковременной памяти является артикуляционная петля. Она и оказалась в центре внимания многих исследований. Базовым эффектом, объясняющим необходимость введения артикуляционной петли в состав модели, является эффект длины слова: непосредственное воспроизведение ряда слов оказывается лучше для коротких, чем для длинных слов. Более того, объем непосредственного воспроизведения испытуемых удается довольно точно предсказать, оценивая число слов, которые они могут произнести за две секунды. Связь объема непосредственной памяти с временем произнесения можно объяснить существованием петли повторения, в чем-то подобной склеенному концами отрезку магнитофонной ленты фиксированной длины.
Усложнение картины принесли проведенные в 1980-е годы эксперименты с подавлением артикуляции, например, с помощью конкурирующей задачи называния чисел. Подавление артикуляции устраняло такие проявления вербальной кратковременной памяти, как эффект длины слова и эффект недавности, но происходило это лишь при зрительном, а не при акустическом предъявлении словесного материала. Поэтому было предположено, что воспринимаемая на слух информация может автоматически кодироваться и удерживаться независимо от процессов артикуляции в некотором пассивном фонологическом хранилище, специфически связанном с восприятием устной речи. Как показывают данные мозгового картирования, этот подблок вербальной части рабочей памяти локализован в нижних теменных отделах левого полушария, в непосредственной близости к задней части верхней височной борозды, или речевой зоны Вернике (см. 7.1.1). Процессы артикуляции, напротив,
383
сопровождаются активацией структур, расположенных в передних, фронтальных отделах левого полушария, широко известных как другая речевая область — зона Брока (см. 7.3.3).
Неожиданные результаты принесли эксперименты с пациентами, у которых были селективно нарушены процессы артикуляции. Ни задачи на кратковременную память, ни основные тесты понимание речи при этом не были сколько-нибудь серьезно нарушены. В результате возникла дискуссия о том, зачем вообще нужна артикуляционная петля. По мнению Бэддели (Baddeley, 1990), она необходима, например, при изучении нового языка, когда нужно удерживать пока еще бессмысленные фонетические структуры. Действительно, заучивание парных ассоциаций слов родного языка и бессмысленных для этих пациентов речевых звуков (на самом деле это были слова незнакомого им языка) оказалось полностью невозможным. Так как, согласно исследованиям развития памяти (см. 5.4.3), устойчивое использование артикуляции для лучшего запоминания наблюдается у детей лишь начиная примерно с 5 лет, на более ранних этапах развития, при усвоении лексикона родного языка, более важным, по-видимому, является пассивное фонологическое хранилище. Мы еще вернемся к спорному вопросу о роли внутренней речи в процессах оперативной обработки информации в конце данного подраздела.
Не избежал расщепления и второй служебный блок рабочей памяти — зрительно-пространственный «блокнот». Его введение в модель было обусловлено фактами запоминания информации в зрительной, или наглядно-образной, форме, например, при визуализации предметных референтов слов. Вопрос состоял в том, какие компоненты — пространственные или чисто зрительные — играют при этом решающую роль. Бэддели и его сотрудники провели исследование, в котором изучалась успешность мысленного движения по краям визуализируемой буквы (тест интерференции Брукса — см. 4.2.2). Одно условие было зрительным, но непространственным — испытуемый должен был параллельно с регистрацией поворотов «мысленного взора» отмечать изменения яркости светящейся панели. Второе условие было незрительным, но пространственным. Испытуемый, сидевший с завязанными глазами в темном помещении, пытался освещать качающийся маятник с помощью фонарика. При попадании луча света на прикрепленный к маятнику фотоэлемент менялась высота звукового тона. Оказалось, что первое условие (зрительная интерференция) не влияет на движение в плане зрительного образа, тогда как пространственное отслеживание на слух его полностью нарушает. Так же негативно пространственная задача влияла и на успешность использования мнемотехнического «метода мест» (см. 5.1.1).
Разделение пространственных (пространственно-действенных) и
зрительных (форма и цвет) компонентов этой подсистемы рабочей па-
384 мяти, таким образом, не вызывает сомнений. Оно подтверждается и
нейрофизиологическими данными, например, результатами трехмерного мозгового картирования. Пространственная обработка включает активации задних теменных отделов коры, а также активацию субкортикальных (базальные ганглии) и фронтальных (дорзо-латеральная префронтальная кора правого полушария) структур. Последняя интерпретируется как проявление произвольного внимания к местоположению объектов. Собственно зрительные компоненты рабочей памяти активируют затылочные и нижневисочные доли коры. Эта диссоциация соответствует известному разделению систем локализации (дорзальная система) и идентификации (вентральная система), подробно обсуждавшемуся нами ранее (см. 3.4.2), или уровням С и D, как эти системы были обозначены в теории построения движений Бернштейна (см. 1.4.3 и 8.4.3).
Центральный исполнитель — главный и наиболее спорный компонент рабочей памяти. По ироническому замечанию специалиста по эволюции поведения Марлина Дональда (Donald, 1991), центральный исполнитель подобен Будде (или, может быть, гомункулусу?), «восседающему на вершине процессов оперативного запоминания и оживляющемуся лишь тогда, когда на его рабочий стол попадают вопросы, с которыми не смогли справиться когнитивные психологи». Первоначально этот блок понимался несколько диффузно, как резервуар центрального пула ресурсов и одновременно структура, управляющая стратегиями распределения внимания. В 1990-е годы были предприняты попытки более детального анализа центральных процессов управления (экзеку-тивных процессов) с помощью специально подобранных задач. Важную роль сыграло сравнение решаемых центральным исполнителем задач с функциями фронтальных (лобных) долей. Классические описания возникающего при поражениях этих областей коры лобного синдрома, данные в работах А.Р. Лурия и других авторов, подчеркивают крайнюю неустойчивость, отвлекаемость и одновременно ригидность внимания, неспособность понять суть сложных взаимоотношений, неумение справиться с новым типом задач — при относительно нормальном выполнении рутинных заданий15. Все эти признаки могут быть своего рода негативной характеристикой центрального исполнителя.
Основная задача, используемая для экспериментального тестирования работы центрального исполнителя, заключается в продуцировании возможно более случайных последовательностей чисел или букв из
15 Как мы отмечали выше, в настоящее время под влиянием исследований рабочей
памяти для обозначения этого синдрома чаще используется термин дезэкзекутивный син
дром (см. 4.4.2 и 8.1.3). Изменение традиционного названия обусловлено нежеланием
априорной привязки подобной поведенческой картины к фронтальным областям коры,
поскольку аналогичные изменения, в принципе, могут быть вызваны нарушениями в ра
боте других анатомических структур (например, базальных ганглиев, связанных с фрон
тальной корой рядом петлеобразных соединений) 385
некоторого, заранее заданного набора (допустим, от 1 до 9 или от 1 до 15). При выполнении подобной задачи случайного генерирования трудно удержаться от повторений или реализации определенной стратегии перебора символов. Все это уменьшает случайность (то есть повышает избыточность — см. 2.1.1) генерируемых последовательностей. Степень случайности может легко оцениваться компьютером. Успешное решение данной задачи, следовательно, предполагает постоянную смену стратегий извлечения информации из памяти и их рекомбинации, по типу тестов на переключение внимания с одной задачи на другую, но с дополнительной существенной нагрузкой на память (см. 4.4.2). Одновременное выполнение вторичных заданий приводит к снижению показателя случайности. Например, при необходимости запоминания ряда символов случайность продуцируемых последовательностей линейно снижается с увеличением количества таких удерживаемых в памяти символов.
Новые данные, однако, говорят о том, что задача случайного генерирования не является тестом центрального исполнителя в чистом виде. Так, постоянное присутствие исходного набора элементов в поле зрения испытуемых позволяет им генерировать более случайные последовательности, а значит, решение этой задачи зависит также и от работы «зрительно-пространственного блокнота». Взаимодействие центральных, амодальных механизмов внимания и мышления именно со зрительно-пространственными репрезентациями особенно заметно в случае таких задач, как нахождение оптимального хода в той или иной шахматной позиции (см. 8.3.3). Характерно, что в случае испытуемых-экспертов (начиная с уровня международного мастера и выше) нагрузка на артикуляционные механизмы перестает влиять здесь на качество и скорость принятого решения. В большом количестве других ситуаций, подобных пониманию текста и, в особенности, ведению беседы, на первый план выступают взаимодействия многоуровневых речевых процессов и механизмов социального интеллекта (см. 7.1.2).
Проверка связи рабочей памяти с функциями фронтальных долей коры, проводившаяся как с помощью трехмерного мозгового картирования процессов решения задач нормальными испытуемыми, так и путем нейропсихологического анализа отдельных клинических случаев, выявила неоднородность возможных компонентов центрального исполнителя. Явно различной оказалась локализация центральных механизмов удержания и активного преобразования амодальной перцептивной информации. В рамках префронтальных структур были также обнаружены не только амодальные, но и модально-специфические (прежде всего зрительные) механизмы, хотя этот последний результат, полученный в нейрофизиологических исследованиях на приматах, иногда оспаривается психологами, изучающими память человека.
В последние годы наметилось дополнительное разделение центрального исполнителя по принципу диссоциации, с одной стороны, механизмов удержания и обработки материала, а с другой — процессов, ответственных за принятие решений (см. 8.4.2). Дело в том, что именно 386
принятие решений, а не традиционные функции внимания или памяти, оказывается селективно нарушенным у некоторых групп пациентов с фронтальными поражениями. Для этих пациентов характерна выраженная беспомощность как раз в ситуациях выбора одного из нескольких возможных вариантов действия. Более того, механизмы принятия решения и собственно целенаправленной реализации уже принятого решения, по-видимому, также требуют специального различения. (Оно обсуждается в современных исследованиях мотивации как различение процессов, локализованных по разные стороны мотивационно-волево-го «Рубикона» — см. Хекхаузен, 2003.)
Еще одна новая линия исследований, меняющая представление о рабочей памяти, возвращает нас к вопросу о роли речи. В первоначальном варианте модели ее роль была сведена к служебным функциям про-говаривания (артикуляции) и удержания продуктов фонологической обработки. По отношению к этим функциям в какой-то момент даже возникли сомнения в их существенности для оперативной обработки. Ситуация изменилась с началом изучения процессов смены задачи, то есть изменения установки с выполнения одной задачи на выполнение другой {task-set switching — см. 4.4.2). Инициировавший эти исследования оксфордский психолог Дэвид Олпорт является одним из критиков концепции рабочей памяти. Им было, в частности, показано, что выполнение тестов на переключение задачи, хотя и требует от испытуемого предельной внимательности, не интерферирует с нагрузкой на память, а следовательно, оперативное запоминание и смена задачи едва ли управляются единой инстанцией, типа центрального исполнителя (или системы внимательного контроля Шаллиса—Нормана). Развитие этих работ, в свою очередь, позволило установить, что процессы произвольной смены задачи осуществляются с помощью вербальной самоинструкции (Goschke, 2000). Этот результат изменяет представление о роли артикуляции и неожиданно ставит внутреннюю речь, по любимому выражению Выготского, «во главу угла» структуры произвольного контроля действия.
Подвижность единиц и речевое опосредование говорят о том, что рабочая память скорее должна рассматриваться не как фиксированная структурная единица процессов обработки информации, а как функциональная система (или высшая психическая функция в понимании Выготского и Лурия — см. 1.4.2 и 5.4.1 ), осуществляющая текущий контроль за сохранением и оперативной заменой целей наших познавательных и практических действий. Эта общая функция предполагает высокую гибкость и интеграцию значительного числа различных механизмов. В самом деле, многолетние попытки найти местоположение рабочей памяти в мозге выявили чрезвычайно пеструю картину локализации компонентов. Данные об основных нейропсихологических механизмах, выявленных в ходе этих исследований, приведены в табл. 5.6.
387
Таблица 5.6. Основные мозговые корреляты компонентов рабочей памяти
Компоненты рабочей памяти | Вовлеченные мозговые области | Функции и типичные задачи |
Центральный исполнитель | Дорзолатеральная префронтальная кора Фронтополярная кора Медианная и вентролате-ральная префронтальная кора | Распределение и переключение внимания, случайное генерирование Принятие решений, самоконтроль Поддержание внимание и оценка материала |
Артикуляторная петля Фонологическое хранилище | Левая премоторная область (зона Брока), мозжечок Верхняя височная борозда, нижнетеменная кора | Контроль артикуляции, повторение, удержание псевдослов Сохранение продуктов фонологической обработки |
Зрительно-пространственный блокнот | Затылочно-теменные и правые префронтальные зоны Затылочно-височные области | Удержание пространственной информации, удержание образа Узнавание отдельных объектов (лиц) и сложных сцен |
Последовательно уточняя параметры и состав рабочей памяти, Алан Бэддели поднял комплекс проблем, затрагивающих организацию познавательной активности и ее мозговых механизмов в целом. Можно ожидать обогащения рабочей памяти и другими блоками хранения информации. Так, относительно недавно Бэддели (Baddeley, 2001) ввел в модель «эпизодический буфер» — новую служебную систему, которая должна удерживать в течение непродолжительного времени информацию о текущих событиях, в особенности если они имеют автобиографический характер16. В связи с постоянно растущим числом блоков и субкомпонентов перед теорией рабочей памяти стоят сегодня, как минимум, два конкретных вопроса — как организовано взаимодействие всех этих подсистем между собой и как они взаимодействуют с долго-
388
16 В случае этого нового функционального блока речь идет, очевидно, о структуре, аналогичной обсуждаемой ниже эпизодической памяти (см. 5.3.2). Конечно, тенденция добавлять «всего понемножку» подозрительно похожа на стратегию построения модели «маленького человечка в голове», чреватую опасностью бесконечного регресса объяснительных моделей (проблема Юма — см. 1.1.2). По мнению Бэддели (личное сообщение, январь 2003), «гомункулярный подход» вполне возможен в качестве эвристического приема, который должен быть уточнен последующими экспериментами. Еше один неудобный методологический вопрос в данном случае связан с выполнением попперовского принципа фальсифицируемости теорий (см. 1.4.1).
временной памятью (рис. 5.6).. Например, в диалоге нужно не только удерживать фонологическую информацию в течение нескольких секунд, но и главным образом понимать, что и с какой целью было сказано, для осуществления адекватного ответа (см. 7.1.2). Понимание же, очевидно, предполагает контакт с более долговременными, семантическими репрезентациями.
Все более распространенной становится точка зрения, согласно которой рабочая память представляет собой не столько независимое хранилище с некоторым запасом ресурсов внимательной обработки, сколько просто активированное подмножество структур долговременных репрезентаций. В самое последнее время эта точка зрения начинает получать и нейрофизиологическое подтверждение. Данные нейрови-зуализации показывают, что, похоже, нет заметного топографического различия между структурами мозга, в которых можно фиксировать следы разных видов долговременной памяти, и соответствующими блоками рабочей памяти (см. 6.1.3).
Эти результаты подтверждают позицию таких критиков, как К. Эрик-сон и У. Кинч (Ericsson & Kintsch, 1995), давно предлагавших говорить о долговременной рабочей памяти. С их точки зрения, необходимо допустить существование прямых связей между перцептивными процессами и структурами долговременной памяти. В противном случае непонятны феномены быстрой экспертной оценки ситуации. Экспертные оценки обычно не обнаруживают выраженных ограничений объема представленной информации, известных из традиционных работ по кратковременной или по рабочей памяти. Очевидно, здесь теория Бэд-дели наталкивается на старую проблему — если осмысленная группировка, как хорошо известно, способствует непосредственному запоминанию, то само формирование таких осмысленных групп возможно
389
только при контакте с долговременными компонентами наших знаний и умений. В форме количественной аналогии предложение Эрик-сона и Кинча можно понять так. Предположим, что объем рабочей памяти равен 5 единицам. Но если материал знаком и рабочая память есть подмножество активированных фрагментов долговременной памяти, то легко представить, как благодаря использованию эффективных приемов кодирования или сформировавшимся связям между семантическими структурами (то есть, по сути дела, бартлеттовским схемам — см. 1.4.3 и 6.3.1) эти 5 единиц сразу смогут активировать значительное число дополнительных единиц, что резко расширяет возможности рабочей памяти.
Изложенная точка зрения подтверждается исследованиями запоминания релевантного материала экспертами в различных областях (см. 8.3.3). Так, опытные медики способны группировать случайные диагностические сведения в описания типичных синдромов заболеваний с некоторыми специально маркируемыми отклонениями, что позволяет им запоминать после однократного просмотра большие массивы сведений, недоступные для памяти новичков. К. Эриксон продемонстрировал, что, учитывая сформировавшиеся интересы испытуемых, можно постепенно научить их демонстрировать выдающиеся достижения в запоминании, казалось бы, бессмысленного материала. Так, один из его испытуемых смог улучшить свои показатели непосредственного запоминания с 8 до 80 цифр. Большой любитель спорта, он научился кодировать цепочки цифр в форме репортажа о результатах фиктивных соревнований по бегу на различные дистанции.
В одном из последних по времени исследований (Houde & Tzourio-Mazoyer, 2003) был проведен нейрофизиологический анализ решения арифметических задач в уме обычными испытуемыми и «человеком-калькулятором», обладающим способностью чрезвычайно быстрого извлечения корня из многозначных чисел, причем с точностью примерно 60 знаков после запятой. Трехмерное картирование показало, что помимо активации тех же областей, что и у испытуемых контрольной группы (нижнетеменные и левые префронтальные структуры), в данных активации мозга «человека-калькулятора» наблюдались определенные отличия. Они состояли в активации правой префронтальной коры, которая ответственна за продолжительное сохранение невербального материала в активированном виде (см. 4.3.3) и, как будет показано в следующем разделе (см. 5.3.3), за разновидность долговременной памяти, связанную с кодированием и особенно извлечением личностно значимой информации. Этот факт может вновь указывать на особую роль личностно-смыс-ловых (метакогнитивных и мотивационных) факторов в формировании и функционировании выдающейся памяти.
Вместе с тем, пока полностью сохраняется возможность редукционистского объяснения природы рабочей памяти, а тем самым, и параметров интеллектуальных достижений. Так, недавно было проведено обширное сравнение группы задач на оперативную память, которые допускали произвольный выбор стратегий обработки информации, с
предельно упрощенными тестами (типа теста называния предъявляемых зрительно букв), режим выполнения которых жестко навязывался компьютером, не оставлявших испытуемым возможности выбора стратегии решения (Lepine, Barrouillet & Camos, 2005). Оказалось, что результаты выполнения простых тестов служат еще более хорошим предиктором показателей творческого интеллекта и понимания. Авторы данного исследования считают стратегические компоненты задач на оперативное запоминание своего рода статистическим шумом, маскирующим влияние более элементарных, в смысле их фундаментальности, параметров когнитивной обработки. Эти последние, по мнению авторов, скорее всего, связаны с временными особенностями функционирования нейрофизиологических процессов. Следует ожидать интенсивного обсуждения и перепроверки результатов этого нового исследования, поскольку они в равной степени важны как для изучения рабочей памяти, так и для понимания природы индивидуальных различий интеллекта (см. 8.1.1).
Итак, в результате критики трехкомпонентных моделей первоначальное жесткое разделение кратковременной и долговременной памяти как последовательных блоков хранения информации было поставлено под сомнение. В центре внимания психологов оказались проблемы обработки семантической информации, а рабочая память стала пониматься как совокупность активированных фрагментов постоянных репрезентаций знания, обычно называемых схемами (см. 6.3.1). Эти взгляды оказались одним из основных источников коннекционизма в психологии — направления, представители которого часто вообще отрицают структурированность памяти (см. 2.3.3). По мнению большинства современных авторов, такая точка зрения чрезмерно радикальна. Значительная часть междисциплинарных исследований памяти последних лет бьша направлена в первую очередь на выделение различных глобальных подсистем и уровней процессов долговременного запоминания.
5.3 Системы и уровни памяти
5.3.1 Теория двойного кодирования
В своем субъективном опыте мы обычно находим разнообразные сенсорные, прежде всего зрительные, впечатления, которые могут относиться как к актуальной ситуации, так и к некоторым более ранним событиям. Психологические исследования зрительных образов, казалось бы, давно возвращенных когнитивной психологией из бихевиористского «изгнания», продолжают оставаться достаточно противоречивыми. Так, современные исследования эйдетизма — способности к чрезвычайно отчетливому представлению давно отсутствующих в поле зрения объектов и сцен — заставляют усомниться в правильности сообщений о
391
почти повсеместной распространенности эйдетических образов у детей, накопленных в 1920-е годы в работах представителей так называемой марбургской психологической школы. В самом деле, 40 лет спустя в результате одного из обследований среди 1570 школьников города Мар-бурга не было обнаружено ни одного эйдетика17.
Другие данные, несомненно, свидетельствуют о существовании феноменальной зрительной памяти, которая, однако, исключительно редка. К таким данным прежде всего относятся результаты исследования памяти мнемониста Ш., проведенного А.Р. Лурия. Но и в этом случае некоторые детали не позволяют говорить просто об эйдетической памяти. «Я узнаю не только по образам, — отмечал Ш., — а всегда по тому комплексу чувств, который этот образ вызывает. Их трудно выразить — это не зрение, не слух... Это какие-то общие чувства» (Лурия, 1968, с. 19) Как ни увлекательны исследования, направленные на поиск и анализ примеров уникальных познавательных способностей, когнитивные психологи обычно пытаются работать не с отдельными случаями, а с общими механизмами познавательных процессов.
Наиболее известной теорией образной памяти является теория двойного кодирования канадского психолога Алана Паивио (например, Paivio, 1975; 1977). По его мнению, для объяснения имеющихся фактов необходимо предположить существование в нашей памяти двух «независимых, но взаимодействующих систем»: вербальной и невербальной (образной). Использование невербальной системы позволяет более успешно решать задачи, требующие симультанного пространственного представления конкретной информации, тогда как вербальная лучше приспособлена для обработки последовательностей абстрактных символов во времени. Каждая система организована как иерархия из четырех уровней. Первый уровень служит для первоначальной сенсорной обработки информации. На втором уровне происходит контакт информации с соответствующей частью разделенной на две автономные системы долговременной памяти: в случае образной системы это приводит к извлечению представлений, в случае вербальной — к активации репрезентаций слов. На следующем, ассоциативном уровне осуществляется активация похожих следов памяти. Взаимодействие систем оказывается возможным на четвертом, референционном уровне, когда устанавливается соответствие («референция») образных и вербальных описаний некоторым объектам.
17 Марбургская психологическая школа была наиболее близким национал-социализму направлением психологии, довольно быстро утратившим научное значение Были ли данные о распространенности эйдетизма фальсифицированы9 Этот вывод не обязателен Во-первых, эти данные подверждались многими современниками, например, Л С Выготским, H А Бернштейном и А Р Лурия Во-вторых, за четыре десятилетия что-то могло случиться с условиями проявления эйдетической памяти Например, ее развитие может подавляться, если окружение перенасыщено динамичной зрительной информацией, 392 ведь именно начиная с 1960-х годов широкое распространение получило телевидение
Для обоснования своей точки зрения Паивио привлек данные из нескольких различных областей. В дифференциальной психологии большинство тестов умственных способностей имеют независимые шкалы для вербального и пространственно-практического интеллекта, которые лишь относительно слабо коррелируют между собой. Согласно ней-ропсихологическим данным, многие вербальные механизмы связаны с левым полушарием, тогда как невербальные — скорее с правым. Так, согласно исследованиям, проводимым с помощью трехмерного мозгового картирования, образное представливание информации чаще всего сопровождается активацией теменных и теменно-затылочных отделов мозга, тогда как вербальное кодирование включает левые фронтальные и височные структуры коры (см. 7.3.3). Наконец, собственные, более традиционные психологические эксперименты Паивио свидетельствуют о том, что вероятность правильного воспроизведения слов зависит от суммарного (аддитивного) влияния вербального и образного кодирования. Избыточность этого двойного кодирования и объясняет, по мнению Паивио, лучшее запоминание картинок и конкретных слов по сравнению с абстрактными словами.
Существенную информацию о природе образов дали исследования внутренних трансформаций зрительных представлений, таких как мысленное вращение или конструирование фигур, а также сравнение (по памяти) размеров, удаленности и других метрических характеристик объектов. Первой и, возможно, до сих пор наиболее известной работой такого рода были эксперименты Р. Шепарда и Дж. Метцлер (Shepard & Metzler, 1971). Они предъявляли на экране дисплея пары конфигураций типа показанных на рис. 5.7. Испытуемые должны были как можно быстрее
Рис. 5.7. Фигуры, используемые для изучения мысленного вращения А Поворот в плос
кости рисунка, Б Поворот с выходом в третье измерение, В Несовместимые фигуры 393
определить, относятся ли эти конфигурации к одному и тому же повернутому на различный угол объекту. Латентное время положительных ответов оказалось при этом линейной функцией угла поворота, что соответствует предположению об осуществлении испытуемыми мысленного поворота фигур с постоянной угловой скоростью (о некоторых ограничениях — см. 9.3.2). Более того, зависимости времени реакции от угла поворота были идентичными при вращении фигур в плоскости экрана и с выходом в третье измерение, что говорит об осуществлении этого вращения в некотором аналоге трехмерного «изотропного» пространства18.
Хотя эти результаты исследований образных явлений больше не вызывают серьезных вопросов, существуют другие, довольно противоречивые данные, по поводу которых вот уже свыше двух десятилетий ведутся оживленные споры. Здесь мы обрисуем лишь основные подходы к проблеме и проанализируем образы как средство запоминания. В следующей главе мы рассмотрим также формат сохранения наглядной информации (6.3.1 и 6.4.2). В двух последующих главах будет обсуждаться связь воображения с речью (7.3.2) и мышлением (8.3.1). Наконец, в последней главе мы вернемся к теоретическим вопросам и общей интерпретации данных (9.1.3). Эта распределенность материала по нескольким главам объясняется серьезностью проблемы. Не приходится удивляться, что наметилось несколько альтернативных по отношению к теории двойного кодирования подходов, среди которых следует выделить прежде всего радикальную теорию образов и теорию ментальных пропозиций.
В рамках первого подхода зрительные образы понимаются как ментальные картинки или сцены, сохраняющие в более или менее полном виде конкретные перцептивные характеристики объектов и служащие, как когда-то считал Э.Б. Титченер, а до него и философы-сенсуалисты, основным элементом когнитивных репрезентаций. Видным представителем этой точки зрения является американский нейропсихолог Стивен Косслин. Им и его сотрудниками разработана модель, в которой генерирование образов описывается как результат активации гипотетической нейрофизиологической структуры — зрительного буфера, сравниваемого с дисплеем вычислительной машины — отсюда второе название данного подхода: теория кортикального дисплея. Предполагается, что та же структура активируется сенсорной информацией в ходе процессов восприятия. Образ — это пространственная репрезентация, в принципе
18 В дальнейшем Шепард пришел к выводу что трансформациям обычно подвергается репрезентация стимула, уже находящаяся в памяти, а не воспринимаемая в данный момент. Нечто подобное обнаружено и в экспериментах стернбергского типа (см. 5.1.2): когда в задаче на поиск в памяти коды тестового стимула и положительного множества не совпадают, то «переводу» почему-то последовательно подвергаются элементы положительного множества, а не воспринимаемый тестовый стимул, хотя в последнем случае это до-394 статочно было бы сделать только один раз.
подобная той, которая лежит в основе реального восприятия объектов и сцен, но только несколько менее четкая, чем восприятие19.
В последнее время радикальная теория образов получила развитие в работах ученика Найссера Барсалу (Barsalou, 1999), который полагает, что все многообразие форм знания, в том числе и понятийного, может быть комбинацией фрагментов «просеянного» избирательным вниманием сенсомоторного и перцептивного опыта. Для успеха этого подхода, считает Барсалу, чувственный опыт нужно рассматривать не интроспективно (феноменологически), а с точки зрения специфики лежащих в его основе нейрофизиологических процессов и состояний. В этом случае, однако, сохраняются некоторые типичные трудности образного подхода, например, объяснение возможности существования абстрактных категорий или осуществления столь простого в языковых конструкциях логического отрицания некоторой порции сведений — «Неверно, что (х)». Решение подобных проблем Барсалу ищет на пути рассмотрения образов как особых схематических структур знания — фреймов, допускающих различные комбинаторные трансформации, в частности, рекурсивную подстановку одних фреймов в качестве аргументов в другие фреймы (см. 6.4.2). Это новое развитие объективно означает ревизию положений радикальной теории образов и позволяет надеяться на синтез различных подходов, тем более, что похожие представления начинают появляться и в современной когнитивной лингвистике (см. 7.3.2).
Согласно второму подходу, образы не являются объяснительной категорией и в действительности как за образами, так и за словами лежит одна и та же гомогенная форма репрезентации, понимаемая по образцу логического пропозиционального исчисления. Единицами подобных репрезентаций являются пропозиции — логические суждения, которые напоминают предложения естественного языка. Они имеют предикатно-аргументное строение и, с точки зрения соответствия предметной ситуации, а также другим пропозициям в «базе знаний» (памяти), могут быть либо истинными, либо ложными (см. 2.2.3). Интерес к пропозициям обусловлен тем, что их комбинация позволяет автоматически осуществлять логический вывод, то есть оценивать истинность некоторых новых суждений, если они содержат элементы уже встречавшихся ранее репрезентаций. К числу наиболее известных
" Мнение о том, что представления являются ослабленными копиями восприятий,
было широко распространено в истории философии (см. 1.1.2). Как считает разделяю
щий эту точку зрения Шепард, между физическими объектами, нейрофизиологически
ми процессами и субъективными образами существуют отношения изоморфизма. Вместо
прямого структурного изоморфизма гештальтпсихологов (см. 1.2.1), Шепард имеет в виду
«изоморфизм второго порядка», сохраняющий информации об отношениях между объек
тами, а не о конкретных признаках объектов. Точное значение этого принципа не полу
чило в работах Шепарда подробного истолкования. Не ясно, например, в каком смысле
можно говорить об изоморфизме в связи с восприятием и визуализацией вторичных ка
честв объектов (см. 1.1.1). 395
представителей этой точки зрения относятся Зенон Пылишин (Pylyshyn, 2003), который первым выступил против анализа того, что «мысленный взор сообщает мысленному мозгу», а также Дж.Р. Андерсон (2002) и ряд других авторов, противопоставивших «неоментализму» анализа образов «неоассоцианизм» абстрактно-символьного описания когнитивных структур.
Данные о возможности мысленного вращения фигур объясняются в рамках этого подхода следующим образом. Предположим, что положение точки χ в фигуре репрезентировано в системе полярных координат в форме двух пропозиций:
ДИСТАНЦИЯ (χ,ρ,η) и НАПРАВЛЕНИЕ (χ,ρ,ο),
где η и о — соответственно дистанция и направление д: по отношению к точке отсчета ρ (центр вращения).
Тогда процесс вращения фигуры представляет собой просто замену параметра о для каждой точки фигуры. Чтобы смоделировать результаты экспериментов Шепарда по мысленному вращению фигур, достаточно последовательно менять параметр о с очень небольшим шагом. «Аналоговый» аспект заложен в процесс этой замены и не связан с природой самой репрезентации, которая в принципе остается дискретной логической функцией. Трехмерное вращение могло бы осуществляться тем же образом, для его реализации понадобился бы лишь дополнительный параметр в категории «направление»20. Надо сказать, что представители данного подхода совсем не обязательно отрицают, что процессы восприятия и воображения могут совпадать, так как и само восприятие понимается ими как логическое описание пространственных отношений между локальными элементами типа точек, линий и углов. Именно с такими абстрактными многоуровневыми описаниями работают современные компьютерные программы генерирования и обработки изображений.
В пользу пропозициональной точки зрения приводятся некоторые экспериментальные данные. Так, было показано, что образное кодирование ведет к лучшему запоминанию только тогда, когда представляемые объекты объединяются нашим воображением в некоторую взаимодействующую структуру. Дж.Р. Андерсон и Г. Бауэр (см. Андерсон, 2002) объясняют это тем, что для эффективного сохранения в памяти объекты должны быть репрезентированы не просто как «А» и «В», а в соответствии со схемой логического суждения — «Предикат (А, В)». Еще одним источником аргументов против радикальной теории образов (хотя и не обязательно в пользу теории ментальных пропозиций) служат накапливающиеся данные о качественных различиях наших наглядных пред-
20 Некоторая дискретность операции мысленного вращения действительно была обнаружена в ряде недавних исследований. Но она оказалась связанной с саккадическими движениями глаз: во время саккад процессы мысленного вращения прерываются — по-396 добно тому, как прерывается и обработка сенсорной зрительной информации (см. 3.1.1).
ставлений и реального восприятия (см. 9.1.2). Наконец, для обоснования пропозиционального подхода также привлекаются результаты классических и современных исследований, свидетельствующих о взаимодействии перцептивной и вербальной информации в задачах понимания и запоминания невербального материала, такого как геометрические фигуры или фотографии лиц.
Действительно, это взаимодействие выражено очень отчетливо — сильнее, чем это можно было бы ожидать на основе исходной версии теории двойного кодирования, где вербальная и образная системы могут взаимодействовать лишь на выходе из долговременной памяти. Однако возможно, что этот факт говорит лишь о необходимости либерализации теории двойного кодирования, а не ее замене пропозициональными моделями. Во-первых, упоминавшиеся выше нейропсихоло-гические данные свидетельствуют о различиях механизмов вербального и образного кодирования. Во-вторых, характер взаимодействия этих двух форм обработки и представления знаний явно демонстрирует их взаимодополняемость: если неопределенной является зрительная информация, то любая вербальная подсказка сильнейшим образом влияет на ее запоминание; при неопределенности (обедненности) вербальной информации, поддержка в ее понимании и запоминании может быть оказана невербальным осмысленным материалом (см. 7.3.1 и 7.3.2).
На рис. 5.8 показаны два примера обедненных зрительных изображений, запоминание которых зависит от словесного обозначения. Таким образом, запоминание и обработка бессмысленных изображений находятся под контролем вербальной системы. Напротив, в случае осмысленных картин, по-видимому, возможна прямая связь зрительных репрезентаций с понятийными структурами, так как задачи на установление семантических отношений легче решаются здесь в случае образного,
Рис. 5.8. Примеры изображений, запоминание которых зависит от интерпретации: А —
«мытьё полов»; Б — «шея жирафы». 397
а не вербального кодирования21. Весьма ярко взаимодействие вербальных и образных компонентов знаний выступает при изучении процессов понимания, которые мы рассмотрим в одной из следующих глав (см. 7.3.2).
Эти данные вызывают определенные сомнения в справедливости трактовки зрительных образов как конкретного и поверхностного описания объектов в терминах их сенсорных качеств, перенесенной в современную психологию из эмпирицизма 18-го века. Даже Паивио, считающий образы одной из двух основных форм репрезентации знания, связывает их с кодированием конкретной информации. Против этой точки зрения говорят результаты Дж. Ричардсона (Richardson, 1981 ), показавшего, что нужно различать конкретность и образность как разные семантические характеристики. В экспериментах на свободное воспроизведение он вводил слова, которые были образными и абстрактными (например, «фантазия») либо необразными и конкретными («шарлатан»). Оказалось, что успешность воспроизведения определяется образностью, но не конкретностью. Эти факторы взаимодействуют, причем в случае абстрактных слов влияние образности выражено сильнее. В одной из последующих работ этого автора было показано, что в позиционных кривых полного воспроизведения образное кодирование слов взаимодействует с эффектом первичности, а не с эффектом недавности, который обычно связывается с относительно поверхностной обработкой.
О том, что зрительные образы не сводятся к наглядным картинкам, писал уже Альфред Бине, отмечавший, что запоминание шахматных позиций мастерами имеет обобщенный характер, чем отличается от попыток запоминания множества деталей начинающими шахматистами (см. 8.3.3). Некоторые результаты говорят о роли интермодальных или, быть может, амодальных компонентов образов. Так, при предъявлении трехмерных объектов для тактильного узнавания, слепые от рождения испытуемые решают эту задачу с помощью процессов мысленного вращения того же типа, который известен из описанных выше экспериментов Шепарда и Метцлер, проводившихся со зрячими испытуемыми и при зрительном показе объектов.
В одной из работ Найссера испытуемые продемонстрировали способность в равной степени использовать преимущества образного кодирования предложений «табакерка в кармане Наполеона» и «табакерка на столе Наполеона» для последующего воспроизведения слова «табакерка», хотя субъективные оценки яркости и отчетливости образа табакерки в случае первого предложения были существенно ниже. Промежуточный
11 Интересно, что использование инструкции (ориентировочной задачи) на перцептивное или семантическое кодирование, как эт о принято делать в рамках подхода Крэйка и Локарта (см 5 2 2), в случае осмысленных изображений часто не ведет к изменению успешности запоминания Видимо, это происходит из-за того, что даже при желании испытуемого кодировав подобный материал лишь на уровне перцептивных признаков ав-398 тематически осуществляется «глубокая» семантическая обработка (см 3 3 3)
итог нашего обсуждения состоит в том, что интроспективные характеристики образов служат плохим предиктором успешности их использования как мнемотехнического средства. По-видимому, в случае образов речь идет скорее о схематической пространственной организации знания, которая будет подробнее рассмотрена в следующих главах (см. 6.3.1 и 9.1.2). Опора на репрезентации высокого уровня («ментальные пространства» — см. 7.4.1) может быть проиллюстрирована следующим примером. Пусть нам показывается некое коллективное фото европейских политиков. Если при этом произносится фраза, задающая пространственные отношения между ними, скажем, «На этой фотографии руководителей европейских государств британский премьер-министр Блэр полностью закрыт президентом Шираком», то после этого всякое припоминание фотографии будет служить эффективным напоминанием как о Шираке, так и о Блэре, хотя никакой зрительной информации о Блэре на сенсорный «кортикальный дисплей» первоначально не поступало.
5.3.2 Системы памяти: модель 2000+
Если разделение вербальной и образной систем описывает скорее два параллельных модуса представления информации в долговременной памяти, другое важное разграничение скорее говорит о возможности выделения разных иерархических уровней организации процессов запоминания. Эндел Тулвинг подчеркнул в 1972 году, что большинство психологических экспериментов в области памяти связано с эпизодической памятью, фиксирующей информацию об отдельных событиях прошлого опыта испытуемых. Эти события могут быть как личностно значимыми, так и вполне банальными — подобно предъявлению некоторого слова в составе списка, подлежащего последующему воспроизведению. Эпизодической памяти Тулвинг противопоставил семантическую память, понимаемую как «субъективный тезаурус, то организованное знание, которым обладает субъект о словах и других... символах, об их значениях, об отношениях между ними и о правилах, формулах и алгоритмах, используемых для манипулирования этими символами, понятиями и их отношениями» (Tulving, 1972, р. 386). В отличие от эпизодической памяти, семантическая память не регистрирует контекстуальные — время и место — свойства входных сигналов, фиксируя лишь их когнитивные референты22.
22 Аналогичное различение можно найти уже в работах Τ Рибо (учитель Π Жане) Он
выделял локализованную во времени память, имеющую автобиографический характер, и
некоторую безличную форму сохранения знании и умений Позднее разграничение запо
минания событий индивидуальной биографии и усвоения общих знании, навыков и при
вычек обсуждал в работе «Материя и память» французский философ-виталист Анри Берг
сон (1911) По его мнению, лишь первая из этих форм памяти является «памятью духа»,
свободной от материальных «привычек тела» 399
Это различение привело к возникновению одной из важнейших линий исследований памяти, которая получила в последние годы серьезное нейропсихологическое обоснование. Первоначально внимание исследователей было сконцентрировано на описании эпизодической и семантической памяти как двух независимых систем, своего рода «макромодулей» в рамках процессов долговременного хранения информации. Тулвинг выделил ряд свойств, отличающих их друг от друга. Во-первых, эпизодическая память в значительно большей степени подвержена забыванию. Во-вторых, извлечение из эпизодической памяти (как только что отмечалось) сопровождается более или менее осознанным воспроизведением пространственно-временного контекста соответствующего эпизода. В-третьих, любой акт сознательного припоминания сам по себе имеет статус эпизода, который образует новую «запись» в эпизодической памяти. В-четвертых, эпизодическая память имеет автобиографический характер, хотя, безусловно, не всякое автобиографическое знание обязательно базируется на припоминании отдельных эпизодов своего прошлого опыта.
Всплеск интереса к разделению эпизодического и семантического хранения был связан с анализом функциональных и патологических изменений в работе памяти. Хорошо известная каждому особенность памяти заключается в том, что часто мы узнаем предметы или других людей, но далеко не всегда можем вспомнить где, когда и при каких обстоятельствах мы впервые познакомились с ними («знаю», но не могу «вспомнить» — см. 5.1.1). В психологической литературе этот феномен получил название амнезии на источник. Подобная селективная забывчивость на обстоятельства конкретных эпизодов собственной биографии наталкивает на мысль, что в данном случае мы имеем дело с ослабленной эпизодической и сохранной семантической памятью. Интересно, что амнезия на источник становится особенно выраженной с возрастом, по мере возникновения старческих изменений возможностей запоминания. Нечувствительность к источнику сведений характеризует также самые ранние этапы развития памяти в онтогенезе (см. 5.4.3).
Особенно привлекательной представляется перспектива описания таких особенностей возникающих при поражениях мозга амнестичес-ких расстройств, как селективное выпадение эпизодической памяти при относительной сохранности семантической. Действительно, при необходимости решения варианта ассоциативного теста, когда в ответ на предъявление некоторого слова нужно придумать некоторое описание, пациенты с амнестическим синдромом дают безличные определения, вместо столь типичных для нормальных испытуемых припоминаний разнообразных «случаев из жизни». Так, в ответ на слово «флаг» пациент может дать его абстрактное словарное описание, например, «символ государственности» или «прямоугольный кусок материи», но обычно не
вспоминает ни одного эпизода, в котором он лично стоял или в силу сте-400
чения обстоятельств даже спал под государственным флагом. Иными словами, амнестический синдром объясняется здесь селективным выпадением эпизодической памяти при сохранной семантической (а не нарушением перевода информации в долговременную память как в трех-компонентных моделях — см. 5.2.1).
Спорным вопросом оказалось возможное взаимодействие эпизодической и семантической памяти. С одной стороны, естественно предположить, что семантическая память формируется на основании абстрагирования общих аспектов множества отдельных эпизодов прошлого опыта, то есть в некотором смысле расширяется на базе и за счет эпизодической памяти. С другой стороны, понимание даже элементарных эпизодов и ситуаций нельзя представить без контакта с долговременными компонентами знаний, а значит, вне опоры на семантическую память.
Эти круговые взаимоотношения несколько напоминают отношения между значением и личностным смыслом — двумя «образующими сознания» теории деятельности А.Н. Леонтьева (см. 1.4.2). Уилер, Стасс и Тулвинг (Wheeler, Stuss & Tulving, 1997) действительно описывают особенности сознательного переживания в качестве основного различительного признака двух рассматриваемых систем памяти. С этой точки зрения, для эпизодической системы характерно присутствие самосознания (или autonoetic consciousness — «я вспоминаю»), а для семантической — безличностного, или энциклопедического, знания {noetic consciousness — «известно»). Еще одной важной особенностью эпизодического припоминания является то, что оно предполагает возможность мысленного перемещения в противоположном потоку времени направлении, от Т2 (время возникновения интенции на припоминание) к Т, (время припоминаемого эпизода), с последующим возвратом к моменту Т2. Если продлить временную ось в данной простой схеме в будущее, то мы столкнемся с так называемой проспективной памятью, примерами которой могут служить некоторые запланированные действия — «обязательно бросить письмо в почтовый ящик по дороге на работу» и т.д. Нейропсихологические исследования свидетельствуют о том, что оба варианта «путешествия во времени» опосредованы работой одних и тех же структур мозга, локализованных в префронтальных долях коры, особенно справа. Не случайно ориентация во времени тесно связана с формированием рефлексивного сознания, личности и автобиографической памяти (см. 5.4.3 и 8.1.1).
Вопрос о взаимодействии эпизодической и семантической памяти может быть переведен в эмпирическую плоскость, если проанализировать его в контексте нейропсихологических нарушений. Подобный анализ показывает, что взаимоотношения этих систем памяти явно асимметричны. Если нарушена семантическая память, то более или менее обязательно нарушена и эпизодическая. Нарушение эпизодической памяти, однако, еще не ведет автоматически к выраженным проблемам с
401
извлечением информации из семантической памяти, как мы видели выше на примере амнестического синдрома (см. 5.1.1). Что происходит с процессами приобретения новых знаний об общих фактах, если система эпизодического запоминания нарушена? Тулвинг и его коллеги смогли представить убедительные данные, что накопление новых знаний возможно и в этом состоянии, то есть семантическая память может быть относительно автономна от эпизодической. Анализ онтогенетического развития также свидетельствует о более раннем становлении безличностной семантической памяти по сравнению с механизмами осознанного эпизодического припоминания (см. 5.4.3).
Подобная асимметричность отношений в любом случае говорит не столько о модулярности и строгой параллельности, сколько об уровневых взаимоотношениях, в которых семантическая память образует иерархически более низкий (и эволюционно относительно более ранний) уровень, чем эпизодическая. Данный вывод, похоже, подтверждается анализом нейрофизиологических механизмов. В ряде исследований с применением мозгового картирования у здоровых испытуемых было установлено, что припоминание событий собственной биографии связано с повышенной активацией правых префронтальных областей, тогда как извлечение из памяти общих знаний (семантическая память) ведет к активации левых височных и левых фронтальных структур коры (Nyberg, 2002). Эти данные вполне вписываются в представление о двух иерархически связанных между собой структурах, поскольку префронтальная кора, в особенности ее правополушарные участки относятся к числу наиболее новых и быстрорастущих в филогенезе областей мозга.
Точка зрения Тулвинга и его учеников (например, психолога из Гарвардского университета Даниела Шектера) об особом значении префронтальных механизмов в эпизодическом запоминании оспаривается известным нейрофизиологом Лэрри Сквайром, который, во-первых, скептически относится к самому разделению семантического и эпизодического хранений, считая, что они относятся к одной и той же группе механизмов декларативной (то есть доступной осознанию и вербальному отчету — «декларированию») памяти. Во-вторых, согласно его данным, основанным на обширных экспериментах с животными и на изучении клинических случаев, субстратом декларативной памяти являются височные доли коры и расположенные прямо под ними структуры гиппокампа. Опираясь на данные анализа поражений, ведущих к амнестическому синдрому, Сквайр, а вместе с ним и большинство работающих в этой области нейрофизиологов видят в височно-гиппокампальном комплексе центральный механизм консолидации следа — перевода актуально воспринимаемой информации в формат долговременного хранения (см. 1.2.3).
Гиппокамп в целом относится к древней, лимбической коре мозга.
Он впервые появляется у рептилий как ассоциативная нейронная сеть,
402 связывающая обонятельный мозг и амбьентные зрительные механизмы
(корпус стриатум в базальных ганглиях и зарождающаяся дорзальная кора — см. 3.4.2), что обеспечивает отображение пространственного окружения в формате интермодальных, аффективно размеченных «когнитивных карт» (см. 6.3.2 и 9.4.3). Гиппокамп хорошо развит у всех млекопитающих (Aboitiz, Morales & Montiel, 2003). Его центральная роль в фиксации новой информации объясняется двумя обстоятельствами. Первым из них являются обширные анатомические связи с различными областями коры и с субкортикальными структурами, включая префрон-тальные отделы коры и расположенную поблизости миндалину. Она играет важную роль в регистрации аффективных впечатлений (в основном страха и гнева) и выработке условных рефлексов на основе подкрепления и наказания. Второй особенностью гиппокампа является высокая плотность нейронов с NMDA-синапсами (см. 4.4.3). Эти синапсы встречаются и в других участках мозга, но в существенно меньшей концентрации. Как отмечалось, они отличаются способностью долговременного и одноразового — здесь и теперь — изменения пороговых характеристик, что напоминает быстроту изменений сознательного опыта23. Для изменения их порогов должны, однако, выполняться специальные требования, такие как относительно высокий энергетический уровень конвергирующих на этих синапсах влияний. Это может требовать одновременной активации со стороны как специфических кортикальных, так и неспецифических, субкортикальных структур, прежде всего восходящей ретикулярной активирующей формации (см. 2.4.3 и 4.4.1).
Интенсивность активации гиппокампа служит хорошим предиктором успешности последующего воспроизведения (Alkire et al., 1998). В последнее время были проведены эксперименты на запоминание и узнавание слов пациентами с вживленными на длительное время электродами (эти пациенты с тяжелыми формами эпилепсии наблюдались в связи с подготовкой к нейрохирургической операции). Эксперименты показали, что для фиксации информации в памяти на стадии кодирования необходима прежде всего синхронизация работы нейронов гиппокампа и его непосредственного окружения, в частности, нейронов так называемой энторинальной коры, соединяющей гиппокамп с неокортексом (Fell et al., 2002). Поскольку одной из близлежащих к гиппокампу структур также оказывается миндалина, этот же механизм мог бы объяснить и особую устойчивость памяти на эмоциональные события. Типичным для нейрофизиологических процессов эмоциональной интеграции памяти является возникновение относительно медленного (4—8 Гц), так называемого тета-ритма. Взаимоотношения миндалины и гиппокампа, впрочем, немонотонны — в случае сильных аффектов и острого стресса активация миндалины угнетает работу гиппокампальных структур. Так
23 Вместе с тем, гиппокамп не должен считаться чем-то вроде «субстрата сознания».
При его поражениях пациенты сохраняют способность к рефлексивному мышлению. Они
могут общаться и способны произвольно вспоминать события и информацию, которые
относятся к отрезкам времени, предшествовавшим поражению. Иными словами, обыч
но у них нет выраженной ретроградной амнезии. Роль гиппокампа, как отмечалось, види
мо, состоит именно в быстрой консолидации актуальной интермодальной информации,
что является необходимой предпосылкой для сохранения в памяти новых эпизодов (см.
также 5.4.1 и 5.4.3). 403
может возникать диссоциация между нарушенным эксплицитным запоминанием и сохранным имплицитным узнаванием. Судя по всему, подобная диссоциация может лежать в основе посттравматического синдрома (см. 9.4.3).
Согласно мнению еще одной группы исследователей (Mishkin et al., 1999), собственно гиппокамп ответствен за эпизодическую память, а окружающие его структуры — за семантическую. Поэтому узнавание семантического типа («знаю» — см. 5.1.1) иногда возможно и при локальных поражениях гиппокампа, тогда как при более обширных поражениях, вовлекающих как височные доли, так и нижележащие анатомические образования, часто одновременно страдают оба вида памяти. Новые нейрокогнитивные исследования развития височно-гиппокам-пального комплекса показывают, что выпадения собственно гиппокампа сказываются на функциях памяти сравнительно поздно, в возрасте 5—7 лет, подтверждая, таким образом, гипотезу об иерархических отношениях между гиппокампом и его ближайшим окружением (Bachevalier & Vargha-Khadem, 2005). Как в этом случае можно объяснить многочисленные данные мозгового картирования, а равно клинические наблюдения, свидетельствующие об особой роли префронтальных структур коры в процессах извлечения эпизодической информации? Функция этих структур, по-видимому, состоит прежде всего в реализации процессов произвольного управления эпизодической (и автобиографической) памятью. К числу важнейших из таких процессов относятся, во-первых, формирование интенции на извлечение (retrieval volition) личностно-релевантной информации и, во-вторых, контроль за правильностью выполнения этого мнестического действия (см. 4.3.3 и 5.4.3).
Интересно, что все перечисленные авторы в целом склоняются сегодня к уровневым представлениям об организации памяти. Так, Сквайр фактически является сторонником двухуровневой модели — он противопоставляет декларативному запоминанию относительно низкоуровневые процессы процедурной памяти. Если декларативные процессы отвечают на вопрос «что?», то процедурные — на вопрос «как?» (см. 1.4.2). Примерами процедурного запоминания могут быть моторные навыки и перцептивные прайминг-эффекты, выявляемые с помощью таких методик, как тест дополнения фрагментов слова (см. 5.1.3). Клинические наблюдения показывают, что процедурное запоминание возможно при нарушениях височно-гиппокампальных и префронтальных механизмов. Согласно данным трехмерного мозгового картирования, субстратом перцептивных прайминг-эффектов являются соответствующие по сенсорной модальности первичные и вторичные отделы коры. Нейрофизиологические механизмы сенсомоторных навыков и условных рефлексов, по-видимому, в основном связаны с субкортикальными структурами, такими как базальные ганглии и мозжечек. В этом отношении между пред-404 ставлениями Сквайра и Тулвинга нет противоречий: Тулвинг и его пос-
ледователи склонны рассматривать прайминг-эффекты в качестве нижнего уровня в иерархии систем памяти — этот уровень предшествует, с их точки зрения, семантической памяти.
Процедурная память демонстрирует двойную диссоциацию по отношению к декларативной памяти. Пациенты с некоторыми тяжелыми формами амнезии и с болезнью Альцгеймера (это заболевание сопровождается дегенеративными изменениями нейронов коры, прежде всего ее высших, ассоциативных отделов), у которых серьезно нарушены как эпизодическая, так и семантическая память, тем не менее, обнаруживают нормальные прайминг-эффекты в ответ на предъявление зрительной или акустической информации, а также обычную динамику сенсомотор-ного научения в соответствующих тестах (см. 5.4.3 и 6.1.2). Как показал нейропсихолог Джон Габриели (Gabrieli, 1998), при поражениях задних отделов коры перцептивные прайминг-эффекты могут значительно ослабевать, хотя декларативная память, в частности, эксплицитное узнавание того же самого материала, остается без серьезных изменений. Подобные случаи, однако, исключительно редки, поэтому следует подождать дальнейших публикаций по данному вопросу. Более однозначной и общепризнанной является возможность селективного нарушения формирования сенсомоторных навыков при относительной сохранности когнитивных форм памяти. Это имеет место на ранних стадиях болезни Паркинсона и при так называемой хорее Хантингтона — заболеваниях, связанных прежде всего с нарушениями в работе базальных ганглиев (эти нарушения обусловлены недостатком и, соответственно, переизбытком нейромедиатора дофамина — см. 9.4.3).
Интересные результаты были получены при анализе перцептивных
прайминг-эффектов. Как считает Тулвинг, они позволяют сделать вывод
о существовании особой перцептивной системы репрезентации, имею
щей имплицитный характер. Хотя эта система могла бы показаться лишь
механизмом, инерционно фиксирующим сенсорные параметры стиму
ляции (нечто вроде долговременной иконической или эхоической па
мяти), эксперименты свидетельствуют о том, что перцептивная импли
цитная память, возможно, обладает некоторыми фундаментальными
знаниями о мире (Cooper, 1994). Испытуемые в этих экспериментах
должны были работать с изображениями, показанными на рис. 5.9. Не
которые из задач были эксплицитными тестами на узнавание, и в них
оба класса объектов, как реалистические, так и невозможные (с точки
зрения физического воплощения), показали одинаковые результаты.
Другие тесты были имплицитными — с их помощью, например, опреде
лялось насколько быстро испытуемый работает с изображением при по
вторном его предъявлении. Оказалось, что если в случае реалистических
объектов обнаруживается выраженный прайминг, то в случае невозмож
ных прайминг отсутствует. Видимо, перцептивная память каким-то об
разом «распознает», что возможно, а что невозможно в реальном мире,
«отказываясь работать» с совсем уж фантомными структурами. Такое
распознавание — нетривиальные достижение, поскольку математичес
кая задача выявления признаков «невозможности» объекта в общем слу
чае чрезвычайно сложна (см. Пенроуз, 2003). 405
Рис. 5.9. Примеры возможных (А) и невозможных (Б) объектов из экспериментов по сравнению имплицитной и эксплицитной невербальной памяти (по Cooper, 1994).
406
Включены ли прайминг-эффекты в процессы узнавания? Трудно представить себе, что имплицитные процессы не имеют отношения к некоторым ранним этапам восприятия и узнавания. Об этом косвенно говорит тот факт, что поразительные возможности узнавания сложного зрительного материала (см. 5.2.1), как и эффекты имплицитной зрительной памяти, также возможны лишь до тех пор, пока материал сохраняет свою реалистичность. Поскольку в предметных сценах наиболее выражена их структурированность относительно вертикального измерения (рыба в реке, самолет в небе, дом на земле и т.д.), в ряде исследований узнавания сложных предметных сцен (Величковский, 19826) вводились пространственные повороты слайдов при ознакомлении и тестировании. Зеркальные повороты, менявшие левые и правые части при ознакомлении и тестировании, практически не влияли на узнавание. Если же при ознакомлении изображение ставилось «с ног на голову», то это заметно ухудшало его последующее узнавание как уже виденного, причем значительно более сильное ухудшение наблюдалось при продолжи-
тельных отсрочках тестирования (несколько недель). Этот эффект также зависел от длительности экспозиции, достигая максимальной выраженности при наименьшей ее величине, составлявшей в наших опытах около 300 мс. Следовательно, естественная ориентация сложных предметных изображений способствует их долговременному запоминанию, но формируется это влияние на относительно ранних этапах восприятия (см. 3.3.3).
Приведенные данные говорят о том, что узнавание естественных пространственных сцен связано с навыками перцептивной ориентировки в этом материале. Гипотетической основой узнавания при этом служит сходство микроструктуры операций при первоначальном восприятии и последующем тестировании. В литературе по психологии восприятия давно обсуждается вопрос о возможной роли сходства траекторий движений глаз в качестве критического фактора, определяющего зрительное узнавание. Если бы это предположение подтвердилось, можно было бы, в частности, связать перцептивные прайминг-эффек-ты с моторными навыками Однако ожидаемая корреляция сходства траекторий обследования изображений при ознакомлении и повторном предъявлении с успешностью узнавания никогда не была продемонстрирована убедительно. Более того, против этого предположения прямо говорит тот факт, что уменьшение угловых размеров изображения на стадии тестирования существенно меняет параметры движений глаз, но совершенно не влияет на успешность узнавания24.
Таким образом, несмотря на продолжающиеся интенсивные споры о роли отдельных нейрофизиологических структур, в психологии и нейрофизиологии впервые начинает вырисовываться когерентная картина системной организации памяти. В зависимости от масштаба рассмотрения разные авторы выделяют различное число систем памяти, однако все они сравнительно легко соотносятся между собой. Л. Сквайр делит память на две глобальные системы: декларативную (память «что?») и процедурную (память «как?»). Эндел Тулвинг и его коллеги проводят важное с психологической точки зрения разделение первой из этих систем на эпизодическую и семантическую память. Процедурная память, в свою очередь, естественно распадается, как минимум, на две подсистемы — перцептивную и моторную. Подобное описание памяти не является всеобъемлющим, так как оно не включает элементарные формы научения (типа формирования условных рефлексов и привыкания). Но оно представляется достаточным для обсуждения большинства интересующих когнитивную психологию памяти вопросов.
24 Полезным было бы разделение саккадических движений глаз в подобных исследо
ваниях на связанные с амбьентной и фокальной обработкой (см. 3.4.1). Быть может, эти
два класса движений различным образом связаны с узнаванием, а именно такая связь
более вероятна в случае фокальной обработки, тогда как амбьентная обработка и соот
ветствующие саккадические движения должны быть чувствительны к изменениям раз
меров изображения. 407
5.3.3 От уровней памяти к стратификации познания
Разработанное в течение последних 10—15 лет представление о системах памяти позволяет подойти к объяснению основной массы накопленных в психологии данных о процессах эксплицитного и имплицитного запоминания. Однако при таком объяснении без должного ответа все еще остается несколько серьезных проблем. Не вполне ясен, например, статус имплицитных концептуальных процессов, тестируемых с помощью вопросов на знание общих фактов (см. 5.1.3) — по содержанию они тяготеют к семантической, то есть декларативной памяти, а по типу задействованных операций — к процедурной. Следовало бы показать также, как только что описанная модель системной организации памяти, построенная почти исключительно на базе анализа извлечения информации в различных ситуациях тестирования, соотносится с данными о характере процессов, вовлекаемых в первоначальное кодирование материала. Наконец, очень важно понять место подобных систем памяти в более общей структуре познавательных процессов.
Процессы кодирования материала, как мы видели в предыдущем разделе, находятся в центре интересов теории уровней обработки Крэй-ка и Локарта. Можно ли установить соответствие между различными уровнями обработки при кодировании и уровневыми механизмами при тестировании памяти? Поверхностное, перцептивное кодирование в теории Крэйка и Локарта, скорее всего, должно соответствовать механизмам имплицитной перцептивной памяти. Более глубокое, семантическое кодирование — семантической памяти Тулвинга. Вопрос состоит лишь в том, какое «сверхглубокое» кодирование могло бы соответствовать эпизодической памяти. Очевидно, таким кодированием может быть оценка материала с точки зрения его личностного смысла для испытуемого. Для выяснения этих вопросов нами совместно с Ф. Крэй-ком и Б. Чэллисом были проведены эксперименты, отличительной чертой которых была комбинация всех перечисленных форм кодирования — от перцептивного до семантического и метакогнитивного (оценка личной значимости материала) — с максимально большим количеством разнообразных тестов памяти. Среди этих тестов наряду с традиционными прямыми задачами на извлечение информации из памяти (узнавание и различные тесты на воспроизведение) были также непрямые (или имплицитные) тесты, причем как перцептивные, так и концептуальные (Velichkovsky, 2001).
В одном из типичных экспериментов испытуемые должны были ра
ботать со списками из 120 существительных. Все эти слова ранее были
стандартизированы в целом ряде отношений. Кроме общей частотности
и вероятности ассоциативного воспроизведения в ответ на показ семан
тически или графически похожих слов, было известно, например, с ка
кой базовой вероятностью испытуемые данной выборки (студенты уни-
408 верситета Торонто) могут угадать одно из этих слов при предъявлении
определенного фрагмента его букв. Было также известно, с какой базовой вероятностью они могут ответить на вопросы типа: «В названии наиболее известного романа Достоевского упоминается преступление и что еще?» (понятно, что слово «наказание» входило в список 120 целевых существительных). Эти слова кодировались при пяти различных условиях. Одно из них было контрольным — традиционное интенциональ-ное заучивание слов с целью последующего воспроизведения. Остальные условия были условиями непроизвольного запоминания при различных уровнях обработки: графическом (подсчет букв, выступающих из строки — как «h» и «р»), фонологическом (подсчет числа слогов), семантическом (определение принадлежности слова к категории живых существ), метакогнитивном (оценка личностной значимости). Примерно через час после кодирования испытуемые должны были решать одну из шести задач. Четыре из них были традиционными прямыми тестами эксплицитного припоминания: 1) узнавание, 2) полное воспроизведение, 3) воспроизведение с семантической подсказкой, 4) воспроизведение с графемной подсказкой. Два следующих теста были непрямыми: 5) семантический тест на знание общих фактов и 6) перцептивный тест дополнения фрагментов слова (см. 5.1.3).
Если расположить условия кодирования в следующем порядке: перцептивное, фонологическое, семантическое, интенциональное, мета-когнитивное, а в тестах памяти отдельно сгруппировать прямые и непрямые тесты, как это и сделано на рис. 5.10, то результаты приобретают упорядоченный характер. Они позволяют сказать, насколько сильно то или иное условие кодирования усиливает успешность запоминания по
личностный смысл намеренное запоминание категоризация слог буква
LSDs
число
минимально
значимых
различий
ФС
409
410
сравнению с базовой для данного теста памяти величиной. Как можно видеть, группа прямых тестов запоминания демонстрирует кумулятивный рост успешности узнавания и воспроизведения, причем узнавание начинает улучшаться уже после перцептивного кодирования. Интересно, что вид этих функций в значительной степени не зависит от специфических комбинаций тестов на память и уровней обработки, что позволяет сделать вывод о более выраженном влиянии собственно уровней обработки по сравнению с эффектами специфического кодирования (то есть соответствия условия кодирования некоторому тесту на память — см. 5.2.2). Из всех пяти использованных форм обработки метакогни-тивное кодирование, связанное с оценкой личностного смысла, действительно ведет к лучшим результатам. Как правило, результаты непроизвольного запоминания в случае оценки личностной значимости оказываются более высокими, чем при условии интенционального кодирования — сознательного заучивания материала для последующего воспроизведения!
Соответствующие функции для непрямых тестов выглядят значительно более плоскими, одно- или двухступенчатыми. Перцептивный прайминг в задаче дополнения фрагмента слова остается одним и тем же при всех уровнях обработки, начиная с перцептивного, ориентированного на форму букв кодирования. В случае семантического непрямого теста общих знаний эффект варьирования уровня обработки проявляется лишь начиная с этапа семантического кодирования материала. При более поверхностных перцептивном и фонологическом кодированиях какой-либо семантический прайминг полностью отсутствует, что однозначно говорит о связи результатов этого имплицитного семантического теста с обработкой в семантической памяти, а не с процессами в имплицитной перцептивной системе.
В чем тогда состоит специфика процессов, лежащих в основе выполнения прямых и непрямых тестов? Прежде всего те и другие тесты, очевидно, апеллируют к одним и тем же иерархически организованным механизмам. Однако присутствие в явном виде задачи вспомнить, характеризующее прямые тесты, по-видимому, позволяет объединить механизмы разных уровней в единую функциональную систему. Успешность узнавания и разных видов воспроизведения определяется поэтому в прямых тестах суммарным вкладом ряда уровней, участвовавших в первоначальном кодировании материала. Специфика непрямых тестов состоит тогда в отсутствии подобной вертикальной интеграции между уровнями — результаты их выполнения зависят от работы относительно специализированных, «модулярных» механизмов. Так, при самых разнообразных способах первоначального кодирования лишь его ранний, перцептивный компонент влияет на успешность перцептивного теста дополнения фрагмента слова.
Дополнительные исследования, проведенные с помощью методов мозгового картирования, обнаружили закономерные сдвиги процессов активации структур мозга при изменении использованных в описанном эксперименте уровней обработки. Зрительное перцептивное кодирование вызывает активацию затылочных регионов коры, которые примерно совпадают с областями, ответственными за прайминг-эффекты в зри-
тельных имплицитных тестах. Фонологическое и семантическое кодирование вовлекают височные и левые фронтальные структуры коры. Эти же структуры обычно выявляются в задачах категоризации и извлечения информации из семантической памяти. При подобном семантическом кодировании возможна также активация гиппокампа. Наконец, оценка материала с точки зрения его личностного смысла (вариант метакогни-тивного кодирования) сопровождается дополнительной активацией пре-фронтальных, фронтополярных и правых префронтальных регионов. Именно эти области имеют статус филогенетически наиболее новых или, точнее, наиболее быстро растущих в антропогенезе структур коры головного мозга. Их активация постоянно наблюдается при любых попытках воспроизведения эпизодической и, в особенности, автобиографической информации (Craik et al., 1999; Velichkovsky, 1999). Поскольку такая информация чаще всего эмоционально значима, в этом случае можно ожидать особенно сильной и когерентной активации комплекса миндалины и гиппокампа.
Таким образом, существует довольно полное совпадение между кортикальными механизмами кодирования и воспроизведения информации. Росту успешности показателей запоминания в прямых тестах при варьировании уровней обработки соответствует прогрессивная активация все более новых в эволюционном отношении нейрофизиологических структур, расположенных вдоль глобального градиента роста от задних к передним областям коры (см. 2.4.3). В табл. 5.7 суммированы данные о мозговых механизмах, лежащих, с одной стороны, в основе эффектов уровней обработки (кодирования), а с другой — в основе систем памяти, согласно классификациям Тулвинга и Сквайра. В крайнем правом столбце таблицы показано также возможное соответствие этих механизмов более общим уровням когнитивной организации, выделенным нами в развитие идей H.A. Бернштейна об уровнях построения движений (Величковский, 19866; Velichkovsky, 1990).
Рассмотрим обоснованность этого последнего сравнения механизмов памяти с уровнями когнитивной организации несколько подробнее. Как мы видели, широко обсуждаемым в современных исследованиях системам перцептивной, семантической и эпизодической памяти соответствуют различные уровни обработки (кодирования) материала. Решаемые этими механизмами задачи не сводятся, однако, только к функциям памяти. Например, височные доли и левые фронтальные области — основные структуры из числа обеспечивающих функционирование семантической памяти — участвуют и в ряде других процессов, например, в процессах порождения речи и категоризации. Следуя традиции Бернштейна, воспользовавшегося буквами латинского алфавита для обозначения уровней построения движений (см. 1.4.3), мы предложили называть соответствующую группу механизмов концептуальными структурами, или уровнем Е. Концептуальные структуры, судя по всему, используются для описания типичного, ожидаемого положения дел ...
Таблица 5.7. Соответствие различных уровневых представлений в психологии памяти и исследованиях когнитивной организации вероятным мозговым механизмам
Адекватные | Системы | Системы | Вероятные | Уровни |
формы | памяти | памяти | мозговые | когнитивной |
кодирования | по Тулвингу | по Сквайру | механизмы | организации |
Оценка | Эпизоди- | Декларатив- | Правые пре- | Метакогни- |
личностной | ческая | ная («что?») | фронтальные и | тивные |
значимости |
|
| фронтополяр- | координации, |
|
|
| ные зоны. | F |
|
|
| Гиппокамп. |
|
|
|
| Миндалина |
|
Категоризация. | Семанти- |
| Левые фрон- | Концептуаль- |
Речевое коди- | ческая |
| тальные и | ные структу- |
рование зри- |
|
| височные зоны. | ры, Ε |
тельного |
|
| Близкое окру- |
|
материала |
|
| жение |
|
|
|
| гиппокампа |
|
Зрительное | Имплицит- | Процедур- | Модальные и | Предметные |
кодирование | ная перцеп- | ная («как?») | интермодальные | восприятия |
формы, фоно- | тивная |
| зоны задних от- | и действия, D |
логическое — |
|
| делов коры. Пре- |
|
речи |
|
| моторная кора |
|
Тренировка | Имплицит- |
| Теменные и | Простран- |
точностных и | ная сенсо- |
| премоторные | ственное |
гимнастических | моторная |
| зоны коры. | поле^ С. |
движений |
|
| Базальные ганг- | Синергии, В |
|
|
| лии. Таламус |
|
|
|
| и мозжечок |
|
412
в мире. Поэтому они служат основой для феноменов обыденного сознания (см. 6.4.3).
Выраженная полифункциональность характерна для работы филогенетически наиболее быстро растущих в антропогенезе префронталь-ных структур коры. Они ответственны не только за формирование интенции на припоминание личностно значимых событий, но и за кодирование материала в контексте личностного к нему отношения, а также за множество других задач, не имеющих прямого отношения к функциям эпизодической или автобиографической памяти. В их число входят вьщеление релевантной для данной задачи информации и торможение иррелевантной, длительное произвольное поддержание внимания, произвольное изменение стратегии работы (переключение зада-
чи — см. 4.4.2), сложные умозаключения (см. 8.2.1), а также понимание поэтических метафор, иронических замечаний и анекдотов (см. 7.4.2).
Поскольку эти задачи связаны с произвольным управлением собственной познавательной активностью — целеполаганием, принятием решений, запоминанием, восприятием, мышлением, порождением и пониманием речи, — соответствующие механизмы в их совокупности естественно назвать уровнем метакогнитивных координации F (Велич-ковский, 19866). Этот уровень вовлекается в работу тогда, когда ситуация приобретает в каком-то отношении особый характер, например, становится личностно значимой или подчеркнуто необычной, даже абсурдной. Содержание его работы во многом определяется взаимодействием с уровнем концептуальных структур Е, который выполняет в этом отношении функцию гигантского семантического фильтра — обычно лишь то, что отклоняется от банальности повседневных ситуаций, становится предметом метакогнитивного анализа (см. 8.4.3).
Это представление меняет взгляд на многие рассмотренные в этой главе феномены. Прежде всего оно позволяет внести необходимые коррективы в современные теории памяти. В случае теории уровней обработки вместо обычного дихотомического разделения «поверхностной» и «глубокой» обработки мы можем говорить теперь о целом ряде уровней, как в приведенной только что таблице. Кроме того, многоуровневая трактовка проясняет причины особой эффективности «глубокой» (семантическая категоризация, уровень Е) и «сверхглубокой» (оценка личностного смысла, уровень F) форм кодирования. Как мы только что отметили, эти формы кодирования вовлекают в работу наиболее новые в филогенетическом отношении и продвинутые в переднем направлении структуры коры головного мозга. Когерентная активация этих структур должна вести к особенно выраженным изменениям в нейронных сетях гиппокампа и его непосредственного окружения (энторинальная кора), которые считаются сегодня вероятным субстратом процессов эксплицитного запоминания (см. 5.3.2).
В начальный период развития когнитивной психологии — под влиянием компьютерной метафоры — все формы обработки информации «внутри» организма считались связанными с ее пребыванием в том или ином «блоке памяти». Этот подход начинает меняться в последние годы. Особенно радикально меняется сама трактовка отношения памяти и познания — вместо того чтобы пытаться вывести все остальные когнитивные процессы из памяти, исследователи начинают рассматривать функции и структуры памяти в зависимости от общей, главным образом, уровневой организации деятельности и познания. Одновременно, как будет показано в следующем разделе, становится все более ясным, что в ряде случаев результативность нашей памяти нельзя объяснить одними лишь внутренними формами сохранения информации — приходится допустить существование своего рода «внешней памяти», находящейся вне организма. Как ни сложны все эти вопросы, сегодня они могут быть 413
впервые отчетливо сформулированы. Более того, даже понятно, каким образом нужно искать на них ответы25.
5.4 Память в повседневном контексте
5.4.1 Амнезии обыденной жизни
В отличие от лабораторных исследований, в повседневной жизни нас сравнительно мало интересует проблема механизмов запоминания и очень волнует проблема забывания — имени сотрудника или студента, значения иностранного слова или времени давно запланированной встречи. Уже Эббингауз (Ebbinghaus, 1885) попытался найти общий математический закон динамики забывания. Забывание бессмысленных слогов в его экспериментах успешно описывалось отрицательной логарифмической функцией. С появлением моделей, выделяющих кратковременную и долговременную память, было высказано предположение, что разные участки кривой забывания могут описываться разными функциями (см. 5.3.2). Следует отметить, что в реальности некоторые воспоминания сохраняются и даже усиливаются со временем (феномен реминисценции), обрастая новыми подробностями, особенно если они имеют личностно значимый характер. Имплицитная память, как мы видели (см. 5.1.3), также может быть очень устойчивой, и ее забывание требует специального рассмотрения. Все это говорит об ограниченной полезности описаний единой функции забывания.
Тем не менее при контролируемых лабораторных условиях вид кривой забывания стабилизируется и может быть с достаточной степенью точности описан математически, что имеет большое значение именно в практическом отношении. Например, оценивая последствия травм головного мозга или влияние новых фармакологических веществ, разрабатываемых для поддержки психологических функций, хотелось бы знать, где локализованы соответствующие эффекты, на фазах кодирования или сохранения информации в памяти? Для ответа на этот вопрос нужно иметь возможность оценивать эффективность кодирования и скорость забывания.
414
ъ Исследования активации микрообластей мозга должны определить степень совпадения структур, ответственных за кодирование и извлечение информации. Это важно для проверки гипотезы о различной степени межуровневой интеграции в зависимости от наличия сознательной задачи — возможно, что только такая задача, активируя префрон-тальные (в частности, фронтополярные) структуры, позволяет интегрировать модулярные механизмы обработки в функциональную систему произвольного припоминания (Palier, 2001; Stuss & Alexander, 2005 ш press).
В обзоре под названием «Сто лет забывания» (Rubin & Wenzel, 1996) было показано, что данные многочисленных экспериментов на заучивание и узнавание достаточно хорошо аппроксимируются рядом математических функций с отрицательным ускорением, прежде всего, логарифмическими (как полагал Эббингауз) или же экспоненциальными функциями (как считали Мюллер и Иост — см. 1.2.3). Наиболее удобно пользоваться экспоненциальной функцией вида·
у = а хе*1,
где у — это интервальная оценка различимости старого и нового материала (она может быть получена на основе вычисления d'), a — параметр исходной степени кодирования, b — параметр «наклона» кривых, или скорости забывания, е — основание натуральных логарифмов, t — интервал времени сохранения (еще лучше данные описывались при подстановке в уравнение квадратного корня от t). На рис. 5.11 показано, как меняются кривые забывания при независимом варьировании параметров кодирования и скорости забывания. Анализ этих параметров свидетельствует о том, что во многих случаях нарушения функций памяти — при болезни Альцгеймера и при связанном с поражением гиппокампа височном амнестическом синдроме — основным «локусом» изменений явля-
Интервал сохранения
415
ется стадия кодирования, в частности, внимание к материалу, а не последующее удержание информации в памяти (см. 5.4.3).
Существует значительное число психологических и психофизиологических теорий, или, точнее, довольно эскизно обрисованных гипотез о природе забывания. Большинство этих теорий представляет лишь исторический интерес, так как они возникли еще в период представлений об едином следе памяти — «мнеме». Мы кратко рассмотрим здесь три гипотезы, представляющиеся сегодня наиболее перспективными: теорию интерференции, теорию законченного действия и теорию вытеснения.
Согласно теории интерференции, причиной забывания являются процессы взаимодействия следов и внешние воздействия на систему памяти. В столь общей формулировке у этой теории возникают явные проблемы с принципом фальсифицируемости Поппера (см. 1.4.3), так как «процессы взаимодействия» протекают в живом организме всегда. По направленности интерференционных влияний во времени некоторое уточнение вводят понятия про- и ретроактивной интерференции. С их помощью уже во времена Мюллера и Пильцекера (см. 1.2.3) объяснялся классический эффект края в позиционных кривых полного воспроизведения: первые элементы ряда подвержены только ретроактивной интерференции, последние — только проактивной, а элементы, расположенные ближе к середине запоминаемой последовательности, испытывают оба вида интерференции. Это приводит к характерному «прогибанию» (U-образной форме) позиционных кривых. К эффектам интерференции следов относят также влияние сходства материала на успешность его запоминания, хотя надо заметить, что характер этого влияния может быть различным в зависимости от процедуры тестирования памяти — отрицательным при узнавании и положительным при воспроизведении (см. 5.1.1).
Не всегда ясно, какая из грех глобальных фаз функционирования памяти — кодирование, сохранение или извлечение — преимущественно подвержена интерференции. Так, забывание учебного материала часто объясняется невнимательностью — поверхностным кодированием материала учеником уже на стадии восприятия и понимания. В самом деле, в предыдущей главе мы подробно обсуждали примеры того, как простое отвлечение внимания (нарушение контроля текущего действия) ведет к эффектам более или менее полной функциональной слепоты — «слепоты невнимания» (см. 4.4.1).
Особенно серьезные последствия для памяти имеют черепно-мозговые травмы, патологические изменения тканей мозга, отравления и состояния гипоксии. При этом различают антеро- и ретроградную амнезию. Хотя эти клинические формы амнезии обычно считаются следствием ускоренного забывания, данные выявляют более сложную картину. Новые исследования антероградной амнезии, возникающей при поражениях медиальных отделов височных долей и гиппокампа, показывают, что собственно 416
скорость забывания (она определялась по наклону кривых забывания, как на рис. 5.10) остается неизменной, а нарушенными оказываются скорее процессы кодирования (White & Ruske, 2002). При травматической амнезии с течением времени нередко наблюдается постепенное восстановление памяти на события, непосредственно предшествовавшие травме. Это означает, что ретроградная амнезия, по крайней мере частично, обусловлена нарушениями, связанными с фазой извлечения из памяти. Эффективное моделирование амнезии в лабораторных и клинических условиях возможно при использовании фармакологических средств, в частности, из числа тех, которые ведут к общей анестезии (часто эти средства ведут к нарушениям в работе N MDA-синапсов — см. 4.4.3 и 5.4.3). В некоторых ситуациях амнестических расстройств забывание не является полным, что удается продемонстрировать с помощью непрямых (имплицитных) тестов памяти.
Но амнезии возникают отнюдь не только в результате некоторых непосредственных физико-химических воздействий. Американская исследовательница Элизабет Лофтус обнаружила эффект непродолжительной ретроградной амнезии при просмотре фильма, содержащего сцену жестокого нападения. Забывание распространялось на детали всех событий, непосредственно предшествовавших (порядка 2 минут) нападению. Естественно предположить, что значительно более выраженный эффект подобная, чисто функциональная амнезия может иметь в реальных условиях. Надо сказать, что в теоретическом плане эти результаты напоминают эффекты обратной зрительной маскировки, которые могут вызываться внезапным показом изображения, имеющего для наблюдателя аффективное значение (см. 3.1.3). Отдаленным аналогом антероградной амнезии служат эффекты отвлечения и «мигания» внимания, наблюдаемые при обработке быстро предъявляемых последовательностей стимулов (см. 4.1.2).
В качестве второй теории забывания мы упомянули выше «теорию законченного действия». Строго говоря, такой теории пока не существует, но она может быть намечена на основании общих соображений и анализа данных. Как показывают исследования непроизвольного запоминания, проводимые в рамках теории уровней обработки (см. 5.2.2 и 5.3.3), память может рассматриваться как побочный продукт того, что мы делаем с материалом. Действие является единицей деятельности, ее базовым осмысленным сегментом (см. 1.4.3). Пока действие не завершено, необходимо помнить о цели, а также поддерживать его многоуровневое информационное обеспечение26. Завершение действия означает возможность «сброса», по крайней мере, части этой информации.
26 Разнообразие возможных действий определяет практически открытый список уча
ствующих-в их обеспечении структурно-функциональных механизмов, что, кстати, и де
лает столь сложной предпринятую Бэддели задачу описания компонент рабочей памяти
(см. 5.2.3). Инвариантной особенностью контроля текущего действия является лишь уча
стие префронтальной коры и передней поясной извилины (Brass et al., 2005; Gehring &
Knight, 2000, Posner, 2004). 417
Иными словами, можно предположить существование особого механизма модуляции забывания в такт с сегментацией деятельности. Классические наблюдения Б.В. Зейгарник продемонстрировали исчезновение детальной памяти на подсобную информацию после завершения действия, делающего эту информацию ненужной27. Последующие эксперименты, правда, выявили более сложную картину, особенно в отношении запоминания обстоятельств незаконченного действия — в ряде случаев здесь также наблюдалось плохое запоминание, хотя по логике «эффекта Зейгарник» сохранение должно было быть хорошим (Хек-хаузен, 2003).
Очевидно, для развития этой теории придется решить несколько сложных задач. Главная из них — определение статуса того, что делает субъект. До сих пор мы не знаем, чем на самом деле является наблюдаемое в реальных условиях или моделируемое лабораторно «действие» и чем в силу этого становится используемое для тестирования памяти прерывание — досадной задержкой в достижении личностно значимого результата, паузой, предшествующей возобновлению того же действия, или же просто прекращением операций, иррелевантных по отношению к подлинным целям и мотивам. При таком спектре возможностей результаты начинают определяться индивидуальными особенностями испытуемых. Например, общий депрессивный фон и склонность к поддержанию status quo, а не к его изменению (англ. state-orientation trait = ориентация на состояние как личностная черта) коррелируют с улучшением запоминания неоконченных действий (Kühl, 2000). Вероятное объяснение неожиданного подтверждения «эффекта Зейгарник» именно в случае этой группы лиц состоит в том, что они испытывают трудности в отказе от однажды поставленной цели, сколько бы иррелевантной с точки зрения смыслообразующих мотивов их деятельности она ни была. У пациентов с депрессией это сочетается с нарушением автоматизированных форм обработки информации и обеднением эпизодической памяти. Можно сказать, что в этом, специальном случае мы имеем дело с действием в относительно чистом виде, без обычной его включенности в систему личностно-смысловых контекстов «сверху» и поддержки со стороны иерархии самонастраивающихся операций «снизу».
Еще один вопрос связан с уровнем выполняемого «действия». Процессы прямого сенсомоторного взаимодействия с окружением обычно вовлекают относительно низкоуровневые нейрофизиологические механизмы и, судя по всему, имеют меньшую временную «зернистость», чем осознанное («фокальное») восприятие, припоминание личностно значимых событий или доказательство математической теоремы (см. 3.4.2). Видимо, поэтому в случае сенсомоторных операций часто не удается
27 Эта работа была выполнена под руководством Курта Левина. В их исходном, экологически валидном, но методически не очень строгом варианте наблюдения Б.В. Зейгарник заключались в опросе официантов в берлинских ресторанах, показавшем, что они хорошо помнят характер и стоимость заказа клиентов до тех пор, пока последние не рас-418 плачиваются и не покидают заведение.
обнаружить следов памяти, хотя до сих пор не вполне ясно, формируются ли они вообще с самого начала, просто быстро распадаются сами собой или же подвергаются дополнительному подавлению. Мы еще вернемся к обсуждению этого вопроса в конце данного подраздела.
Гипотеза вытеснения возникла в психоанализе. В отличие от теорий интерференции и законченного действия она имеет более частный характер, связанный с работой механизмов психологической защиты, преодолением (англ. coping) влияния воспоминаний травматического содержания. Наш собственный опыт говорит, что острота болезненных воспоминаний со временем притупляется и они если и не забываются полностью, то, по крайней мере, меняют свой характер. Имеющиеся на этот счет научные данные несколько противоречивы. Испытавшие психическую травму лица иногда могут довольно детально рассказать, что с ними случилось (Andrews et al., 1999). Вместе с тем, психиатрические исследования женщин, ставших жертвами сексуального насилия, показывают, что спустя 17 и более лет до 40% из них не могут ничего об этом вспомнить, а еще 16% отмечают, что в их жизни были периоды, когда они, казалось бы, полностью забывали эти события (Williams, 1994). В клинических формах так называемого посттравматического синдрома (PTSD — posttraumatic syndrome disease) нарушения произвольного припоминания обстоятельств травмы очевидны, причем иногда на фоне сохранного имплицитного узнавания деталей аффектогенной ситуации (см. 5.3.2 и 9.4.3).
Изучение вытеснения связано с большими методическими и этическими трудностями. Серьезную проблему представляет собой проверка аутентичности воспоминаний, особенно из далекого прошлого. Психотерапевтические приемы, направленные на осознание имевших место, но забытых событий, легко способствуют возникновению псевдовоспоминаний, иногда сопровождаемых обилием деталей. В литературе описываются случаи, когда люди очень подробно «вспоминали» об осуществлявшихся над ними инопланетянами хирургических операциях или об изощренных сатанинских ритуалах, жертвами которых они якобы были. Кроме того, работу бессознательного (или сверхсознания), предположительно цензурирующего содержания нашего сознательного опыта, очень трудно исследовать в контролируемых условиях. Экспериментально проще изучать произвольное забывание. В типичных экспериментах испытуемым предъявляется список слов, одни из которых они должны запомнить, а другие забыть. Такая инструкция явно влияет на успешность последующего внезапного воспроизведения, хотя, похоже, это влияние более выражено по отношению к материалу с нейтральным содержанием, и, следовательно, не может объяснить сам феномен вытеснения.
Интересная возможность состоит в том, что «вытеснение» на самом деле представляет собой не «выдавливание» информации из памяти — перевод воспоминаний в состояние небытия, а изменение их статуса. Военным психологам известно правило, согласно которому «солдат по- . .
мнит не сам бой, а свой первый рассказ о бое». Как серьезная, часто неразрешимая проблема, «уже случившееся» постоянно привлекает наше внимание, заставляет искать решение, в частности, апеллируя к помощи других. То, что первоначально имеет статус памяти об эпизоде собственной биографии (уровень F), в результате многократного возвращения и повторного пересказа, обычно с более или менее значительными вариациями, постепенно превращается в вариант семантической памяти (уровень Е), знания вообще28. Этому переходу способствует осмысление казалось бы банальных истин, типа «Жизнь прожить не поле перейти!», выполняющих роль универсальных метакогнитивных средств перехода от автобиографического опыта — «Как это случилось со мной?» — к безличностной энциклопедической справке — «Так бывает». Для метакогнитивных координации характерна также манипуляция истинностными параметрами знаний (см. 8.1.3 и 8.2.3). Такой контрфактический контекст припоминания-сомнения хорошо иллюстрирует роман A.M. Горького «Клим Самгин». Оказавшись когда-то свидетелем и невольным виновником гибели ребенка, главный герой этого романа постоянно возвращается в своих воспоминаниях к этому травматическому эпизоду, но в характерной релятивизирующей форме: «А был ли мальчик? Может, мальчика и не было?»
Серьезной практической проблемой является оценка свидетельских показаний. С точки зрения когнитивной науки, они должны рассматриваться с чрезвычайной осторожностью. Во-первых, уже наше восприятие представляет собой лишь наиболее вероятную интерпретацию, а совсем не точную реплику имевших место событий (см. 3.3.1 и 9.3.1). Во-вторых, содержания эпизодической памяти подвержены забыванию, причем если событие имело травмирующий характер, то, возможно, еще и в варианте вытеснения.' В-третьих, как будет показано ниже (см. 8.2.3), для наших оценок и решений часто характерна установка на подтверждение — мы целенаправленно ищем подтверждения наших ожиданий (убеждений и предубеждений), хотя во многих случаях, например, при даче свидетельских показаний или при проверке научных гипотез, правильнее было бы занять критическую позицию. Кроме того, принятие всякого решения находится под влиянием так называемой эвристики доступности: информация, которая легко доступна, непроизвольно привлекает наше внимание и служит основой для принятия решений (см. 8.4.1). Поэтому любые выделяющие человека признаки, такие как блуждающий взгляд или грязный свитер, вполне могут оказать решающее влияние на «опознание».
28 Вариативность даже простейших наших действий была впервые установлена в исследованиях феномена психического пресыщения Анитрой Карстен, работавшей в 1920-е годы в Берлинском университете под руководством Курта Левина. Такая вариативность является проявлением одной из фундаментальных метапроцедур мышления — ВАРЬИРОВАНИЯ. Ее особенности будут подробно рассмотрены в одной из следующих глав 420 (см. 8.1.3).
Следует отметить также возможное влияние внушаемости и воображения. Допрос (как, впрочем, и любой вопрос или интервью) создает контекст, который при восстановлении информации может вести к искажениям и псевдовоспоминаниям. Выраженное влияние оказывает уже формулировка вопроса. Пару десятилетий назад это продемонстрировали американские психологи Э. Лофтус и С. Палмер. Они показывали испытуемым короткие фильмы, в одном из которых была сцена столкновения автомобилей. Через неделю испытуемых неожиданно просили подробно ответить на вопросы об этом инциденте. В разных вариантах вопроса о скорости автомобилей использовались глаголы «врезались», «столкнулись» или «соприкоснулись» («С какой скоростью двигались машины перед тем, как они врезались друг в друга?»). Средняя оценка скорости менялась в зависимости от этого почти на 40 км/час. Можно возразить, что информация о скорости плохо передается в фильме. Поэтому существенно, что, отвечая на вопрос с глаголом «врезались», испытуемые почти в три раза чаще рассказывали о выбитых стеклах, чем при использовании глагола «соприкоснулись». На самом деле выбитых стекол, рассыпанных по дороге, в фильме не было — в показанном эпизоде стекла лопнули, но не выпали из рамок29.
Наряду с понятием эпизодической памяти, по определению имеющей автобиографический характер (см. 5.3.2), в литературе используется его житейский аналог, термин автобиографическая память. Соответствующие исследования обычно концентрируются на изучении припоминания личностно значимых событий, отличающихся от лабораторных экспериментов с предъявлением списков слов или последовательностей слайдов. Как показывают данные мозгового картирования, припоминание значимых эпизодов собственной биографии сопровождается активацией тех же правых префронтальных структур, что и в случае эпизодической памяти. Типичным для работ по автобиографической памяти является проведение обширных опросов («Как Вы впервые узнали о распаде Советского Союза?», «О террористических актах 11 сентября в Нью-Йорке?» и т.д.), не требующих ни оборудования, ни, строго говоря, теории. За экологическую валидность, однако, приходится расплачиваться надежностью результатов. Проблема состоит в установлении аутентичности описываемых событий. Поучительный пример приводит в одной из работ Жан Пиаже. Долгое время он считал своим первым детским воспоминанием попытку его похищения прямо из коляски, когда лишь вмешательство няни спасло его от похитителей.
29 Влияние вопроса наблюдается главным образом тогда, когда у испытуемых есть ос
нования предполагать, что спрашивающий, во-первых, осведомлен и, во-вторых, нейт
рален в отношении опрашиваемых событии. Под влиянием этих результатов при опросе
свидетелей и пострадавших в последнее время психологами предлагается использовать
определенные правила организации речевого общения, в совокупности получившие на
звание когнитивное интервью. 421
Значительно позже родители Пиаже получили от бывшей няни письмо с просьбой простить ее за давний обман — она придумала историю с похищением, чтобы получить внеочередной отпуск (см. 5.4.3).
Улрик Найссер и его ученики (например, Hirst & Gluck, 1999) воспользовались возможностью сравнения подробных показаний одного из участников так называемого уотергейтского скандала с магнитофонными записями реальных переговоров30. В этих показаниях ближайший советник президента Никсона Джон Дин демонстрирует, наряду с неточностью в воспроизведении отдельных деталей и последовательности микрособытий, постоянные смысловые искажения в свою пользу. Это можно объяснить особенностями осознания прошлого (в варианте оруэлловской или сталинской моделей — см. 4.4.3), хотя причиной может быть и просто заинтересованность ответчика в создании максимально благоприятного впечатления. Более интересна сама динамика показаний, с постоянными возвращениями к ключевым эпизодам и изменениями формулировок. В результате происходит сдвиг от эпизодической к семантической памяти, с характерной для последней амнезией на источник. Найссер предложил недавно назвать эту памятьрепезодичес-кой, от «репетиция» — повторение с целью подготовки выступления. В современной научной литературе иногда возникают споры о полезности таких, скорее феноменологических исследований, поскольку сами воспоминания столь часто неадекватны. По мнению Найссера, понимание этой неадекватности и есть важнейший результат изучения автобиографической памяти.
Приведенные примеры относятся к метакогнитивным механизмам, суть которых состоит в манипулировании знаниями. Проблемы возникают и при слишком низком, сенсомоторном уровне активности, не имеющем доступа к высшим формам памяти. Примером служит наше взаимодействие с техническими устройствами. Развитие компьютерных технологий в течение последних 20 лет проходит под непосредственным влиянием когнитивных исследований. В результате открытия гигантских возможностей зрительного узнавания (см. 5.2.1), в начале 1980-х годов произошла замена способа взаимодействия человека и компьютера. Вместо интерфейсов командной строчки {command-line interfaces), когда в процессе «диалога» с компьютером пользователь должен был впечатывать в строку название требуемой команды, используются знакомые сегодня каждому графические интерфейсы {graphical user interfaces, GUIs). Их применение с иконическими знаками, указывающими на характер связанных с этим знаком функций, и компьютерной мышки либо аналогичных устройств пространственного ввода инфор-
30 Эта инициированная окружением президента Ричарда Никсона в 1972 году попытка похищения предвыборных документов оппозиционной демократической партии (ее штаб-квартира находилась в гостинице «Уотергейт») привела к громкому судебному про-422 цессу и вынужденной отставке самого президента США.
мации привело к значительному ослаблению когнитивной нагрузки пользователя.
Вместо декларативной семантической памяти (уровень концептуальных структур Е) на название команд, специфику правил и соответствующих формальных операций задействованными оказались сравнительно низкоуровневые процессы — перцептивное узнавание и простые сенсомоторные операции, пространственно «привязанные» к определенному месту на дисплее (уровни предметного действия D и пространственного поля С). Это открыло возможность для массового использования компьютеров, в частности, лицами без специального образования. Проблема состоит в том, что освобождаемые ресурсы не всегда используются для лучшего решения задач или обучения. Складывается впечатление, что легко доступная, более или менее постоянно присутствующая в нашем непосредственном окружении информация образует своего рода «внешнюю память». Она не усваивается когнитивно, хотя и используется в контексте сенсомоторной и перцептивной активности. Деятельность строится по принципу «внешний мир является лучшей моделью самого себя» (см. 9.3.3).
Первыми соответствующие факты описали в начале 1970-х годов американские инженерные психологи. Сначала Дональд Норман обратил внимание на то, что по отношению к некоторым типичным объектам нашего окружения мы можем вновь и вновь допускать ошибочные действия, не обнаруживая сколько-нибудь выраженного обучения. Примером могут служить попытки подогреть пищу на электрической плите, когда время от времени (и так в течение ряда лет!) мы опять включаем не ту конфорку, хотя, казалось бы, давно можно было раз и навсегда выучить соответствующую простую связь. Не менее яркий факт установил коллега Нормана Раймонд Никерсон. Он внезапно просил студентов на лекции нарисовать по памяти различные американские монеты, например цент. Хотя каждый из студентов тысячи раз держал в руках и видел этот объект, оказалось, что практически никто не способен без ошибок, да и вообще сколько-нибудь полно восстановить изображенную на каждой из сторон монеты информацию. В британской популяции вероятность припоминания, в какую сторону смотрит королева на самой распространенной в Соединенном Королевстве монете, оказалась близкой к 50%, то есть была случайной. Выраженные ошибки наблюдались не только при воспроизведении информации, но также и при узнавании изображений монет.
В главе о внимании мы упоминали исследования зрительного поиска, проводимые Джереми Вольфе и Тоддом Хоровитцем (см. 4.2.3). Обычно в таких задачах при каждой пробе меняют положение не только объектов-целей, но также заново «перемешивают» и иррелевантные объекты (ди-стракторы). Это делается специально для того, чтобы избежать обучения, которое может с течением времени делать процессы поиска более эффективными. В одном из их экспериментов испытуемым 300 раз подряд была по ошибке показана одна и та же конфигурация дистракторов
423
(менялось только расположение цели), и оказалось, что скорость поиска, определяемая зависимостью времени решения задачи от числа дист-ракторов, совершенно не изменилась. Иными словами, испытуемые тратили примерно одно и то же время на обработку дистракторов, когда видели их в первый и в трехсотый раз, никак не используя возможное знание об их идентичности и взаимном расположении.
Отсюда делается вывод, что зрительный поиск сопровождается полной амнезией на предыдущие пробы и осуществляется в «вечном настоящем времени». Вместе с тем, иногда обучение (ускорение зрительного поиска в последовательных пробах) оказывается возможным. Оно, например, возникало, когда задача усложнялась и испытуемые должны были держать все объекты в памяти, не имея их постоянно перед глазами. Кроме того, согласно новым данным, улучшение в решении серии таких задач критическим образом зависит от существования некоторых закономерных отношений между целевыми объектами и дистракторами. Когда эти отношения случайны, как в экспериментах Вольфе и Хоро-витца, каждая новая проба оказывается по сути дела новым действием. Более того, резкое тахистоскопическое предъявление материала каждый раз запускает всю спираль уровней обработки (см. 3.4.1 и 4.4.1), что сопровождается «сбросом» ненужных более сведений. Если же информация о дистракторах все-таки способна как-то сориентировать процессы целенаправленного поиска, то возникает, по меньшей мере, имплицитное обучение (см., например, Peterson et al., 2001). Авторам будущих версий действенной (или деятельностной) трактовки памяти и процессов забывания, по-видимому, придется как-то интегрировать все эти факты в свои теории.
5.4.2 Обучение и формирование навыков
Парадоксальным образом проблема обучения длительное время не относилась к числу центральных тем когнитивных исследований. Бихевиористская традиция, когда обучением (или, вернее, научением, поскольку экспериметы в основном проводились на животных) оперантного типа объяснялось все, что только может представлять потенциальный интерес для психологии и педагогики, явно противоречила имеющемуся у каждого из нас опыту множества возможных путей приобретения знания и отрицательно повлияла на интерес к такого рода исследованиям. Характерно, что даже Курт Левин, первоначально с энтузиазмом выдвигавший задачу единообразного (или «галилеевского»— см. 1.3.2) объяснения возможно более широкого спектра психологических феноменов, в конце жизни неожиданно выступил с критикой бихевиористского подхода, сравнив его с попытками описать все химические реакции одной-единственной формулой.
В рамках компьютерной метафоры ранней когнитивной психологии, на фоне десятков и сотен исследований кратковременной памяти, обучению не уделялось сколько-нибудь сопоставимого внимания. Впер-
вые оно начинает систематически рассматриваться в теоретическом плане при создании так называемых глобальных когнитивных моделей (они будут рассмотрены в следующей главе — см. 6.4.1), а также в контексте моделирования познания с помощью нейронных сетей (см. 2.3.3). Вместе с тем, практическая значимость процессов обучения и их возможных механизмов обусловили появление растущего числа когнитивных исследований этой проблемы. Основными признаками этих работ являются:
выделение нескольких, часто иерархически связанных между собой
форм обучения;распространенность представлений об относительно узком (моду
лярном, или «домено-специфическом» — см. 2.3.2) характере воз
никающих в результате обучения изменений;интерес к сфере микросоциальных взаимодействий как к одной из
основ специфически человеческих форм обучения;попытки использования возникающих теорий на практике — при
менительно к процессам обучения в школе, а также формированию
и развитию навыков.
Отход от бихевиористского принципа единообразного объяснения хорошо иллюстрирует работа видной представительницы современного необихевиоризма Трэси Кендлер (Kendler, 1995), которая установила в экспериментах на дискриминантное обучение31, что животные и маленькие дети научаются находить правильное решение (задуманную экспериментатором комбинацию перцептивных признаков) в результате очень медленного, ассоциативного в своей основе кодирования как релевантных, так и иррелевантных признаков изображений. Старшие дети и взрослые, напротив, используют стратегию активной проверки гипотез, направленную на выявление релевантных признаков. Методической особенностью этих экспериментов была полная и внезапная замена (reversal shift) значения признаков — положительные становились отрицательными и наоборот. При таком внезапном изменении «правил игры» вторая, активная стратегия, предположительно опосредованная символическим знанием, обеспечивает возможность значительно более быстрой адаптации и нахождения нового «решения». По мнению Кендлер, эти данные свидетельствуют о существовании двух фило- и онтогенетических уровней обучения — «ассоциативного» и «когнитивного». Разумеется, речь идет здесь об относительно искусственных лабораторных экспериментах, но аналогичные, требующие перестройки поведения ситуации часто возникают и в повседневной жизни.
Полезными для рассмотрения более реалистических примеров являются уровневые представления, разработанные в когнитивной психологии. Самым общим из них стало выдвинутое Дональдом Норманом и
31 Эта типичная для бихевиористских исследований задача состояла в данном случае в
выборе одной из двух одновременно предъявлявшихся зрительных конфигураций, кото
рые отличались между собой формой, цветом и размерами. 425
его учеником Дэвидом Румелхартом в начале 1980-х годов представление о трех качественно различных типах изменений в процессах обучения. Знания рассматриваются ими как схематические структуры. Эти структуры прежде всего демонстрируют постоянную градуальную адаптацию ко все более тонким параметрам активирующих наши знания ситуаций. Как форма обучения, подобная настройка лежит в основе совершенствования навыков. Принципиально иная форма обучения связана с обогащением схем путем добавления к их составу новых терминов, понятий и фактов. Примером может служить традиционное, .ориентированное скорее на накопление знаний, чем на их использование, академическое обучение. Наконец, иногда нам удается (самим или при помощи других) обнаружить новые закономерности в имеющихся знаниях, что позволяет качественно, «скачком» расширить возможности их применения. Норман называет эту форму обучения, близкую к творческому мышлению, переструктурированием, но в литературе встречаются и другие названия, например, «обучение путем открытия» или (в работах гештальтпсихологов — см. 1.3.1) «обучение посредством инсайта»32. Еще одна группа понятий связана с идеями социокультурного опосредствования познавательной активности (см. 1.4.3). Как отмечал Л.С. Выготский в 1930-е годы в своем обсуждении проблемы соотношения обучения и познавательного развития, правильно построенное обучение может опережать и вести за собой развитие. Такое обучение происходит в зоне ближайшего развития, то есть при поддержке и в контексте общения ребенка со взрослым. Понятие зоны ближайшего развития (англ. zone of proximal development — ZOPED) стало в последние годы очень популярным в психолого-педагогической литературе, однако оно все еще является общим, философским понятием, нуждающимся в экспериментальном уточнении (см. 8.4.3). С этим же кругом идей связано уже упоминавшееся в предыдущей главе понятие совместное внимание (Joint attention). Это понятие оказывается полезным как раз для анализа микродинамики общения и совместного обучения. Оно может быть операционализировано с помощью регистрации направления линии взора и использовано для улучшения процессов совместного решения задач (VelichJcovsky, 1995). Исследования влияния состояний совместного внимания на речевое и когнитивное развитие ребенка, а также первые попытки учета этого психологического понятия при создании новых средств коммуникации и в роботике будут подробно рассмотрены в последующих главах (см. 7.1.2, 7.4.3 и 9.2.3).
32 Надо сказать, что эти формы обучения примерно соответствуют трем группам механизмов памяти, выделенным в предыдущем разделе (см. 5.3.2), а именно перцептивной и сенсомоторной имплицитной памяти («настройка»), семантической памяти («обогащение») и эпизодической памяти («переструктурирование»), по крайней мере, с точки зрения связи последней с самосознанием («автоноэтическим сознанием», по Тулвингу) и 426 оперирующими над знаниями метапознавательными процессами (см. 5.3.3).
Используя предложенную Норманом и Румелхартом общую схему анализа — переструктурирование, обогащение и градуальная настройка (адаптация), можно попытаться более подробно рассмотреть отдельные примеры процессов обучения. Мы начнем этот анализ со школьного и академического обучения, а закончим процессами формирования навыков.
Складывается впечатление, что основой всех серьезных продвижений в обучении, ведущих к переструктурированию существующих представлений, служит интеграция первоначально изолированных областей знания (см. также 6.3.1). Ученица Найссера Элизабет Спелке провела в последние десятилетия ряд доказывающих это исследований обучения математике (Spelke, 1999). Первоначально знания в области арифметики и геометрии развиваются независимо друг от друга, так что уже до начала школьного обучения дети могут пересчитать число объектов и способны правильно ответить на вопросы о многих свойствах прямых. Тем не менее до 6 лет дети обычно не знают дробей и отрицают возможность бесконечного деления отрезка пополам, поскольку этот процесс рано или поздно приводит к выделению «совсем маленьких», неделимых далее точек. Преодоление этих ограничений предполагает интеграцию обеих областей. Решающим моментом в понимании дробей является осознание того, что на любой линейке имеются точки, расположенные между обозначающими целые числа рисками. От понимания того, что любое целое число может быть разделено пополам, лишь незначительный шаг ведет к осознанию возможности бесконечного деления любой дроби и к последующему обратному переносу этого нового знания на свойства геометрических объектов и пространства в целом33.
Как иллюстрация экспериментального подхода к проблеме социальных механизмов обучения, интерес представляют работы известной американской исследовательницы Микелин Кай и ее сотрудников (например, Chi et al., 2001). Они проанализировали особенности процессов центрированного на индивиде обучения, когда прикрепленный к студенту наставник-преподаватель, или «тьютор»- (от англ. tutor), один на один помогает ему разобраться в учебном предмете. Исходными для этой работы послужили три группы фактов. Во-первых, согласно данным контрольного тестирования, такое обучение оказывается успешнее, чем обучение в группах и классах (от 30 и более чело-
33 Конечно, даже десятилетия спустя наше знание основ математики остается не вполне
совершенным, отчасти потому, что оно противоречит повседневному опыту — фактичес
кой невозможности бесконечного деления любого реального отрезка (см. 6.4.3). Мы час
то не отдаем себе отчета в многочисленных контринтуитивных следствиях интеграции
арифметики и геометрии в единую предметную область. Так, мы едва ли отчетливо пони
маем, что между 1 и 2 расположено столько же чисел, сколько между 1 и 1000 или что не
существует точки, ближайшей к последней точке отрезка. Поскольку всякое знание в прин
ципе парциально, то суть обучения во многом сводится к выяснению того, где можно об
этом прочитать и у кого можно спросить. 427
век). Во-вторых, в ходе такого индивидуализированного обучения происходит явное улучшение знаний... самого тьютора34. В-третьих, эффективность обучения не зависит от различий в возрасте тьютора и учащегося, а также от того, имеет ли тьютор какую-либо педагогическую подготовку. Существенно, впрочем, чтобы он в достаточной степени владел своей предметной областью и сам мог отчетливо понимать, о чем идет речь.
Проведенные этой группой авторов эксперименты на материале курса физиологии были направлены на прояснение критических для психологии обучения вопросов. Анализ данных выявил ряд зависимостей успешности обучения от взаимодействия учащегося и тьютора, которые не вписываются в картину односторонней передачи «культурно-исторического опыта» от тьютора студенту. Заметим также, что от обучающей активности тьютора зависит немногое. В самом деле, его замечания не систематичны, так как он больше озабочен пересказом того, что знает сам, а не тем, что нужно учащемуся, и часто игнорирует затруднения своего подопечного. В одном из экспериментов тьютору запрещалось давать объяснения и комментировать ответы, но он должен был посредством общих вопросов (типа «Почему Вы так считаете?») поддерживать самостоятельную учебную активность учащегося. Несмотря на сокращение обратной связи, результаты обучения не ухудшились, а с точки зрения глубины понимания предмета даже стали лучше. Итак, предположение, что студент учится на основании систематических пояснений, не подтверждается, так как характер активности преподавателя (что и когда он говорит) не имеет решающего значения. Важнее оказалось то, что студенты сами делают ошибки и признают их таковыми. Лучшим предиктором успешности обучения были вопросы и замечания студента по поводу собственных знаний.
Иными словами, для обучения важна метакогнитивная активность студента, провоцируемая общением как таковым и направляемая в определенное русло совместным предметом обсуждения. Сама возможность существования такого общего подхода к обучению, однако, до сих пор остается для многих авторов спорной (см., например, Андерсон, 2002). Речь идет о классической проблеме философской педагогики Нового времени — проблеме формальной дисциплины. Существует ли дисциплина (то есть предметы типа логики, математики или обязательных для учебных программ гимназий мертвых языков, греческого и латинского), изучение которой «подготавливает ум» для усвоения любых знаний? Известнейшим критиком концепции формальной дисциплины был автор ранних бихевиористских теорий обучения Эдвард Торндайк
14 Несомненно, не лишен горькой правды старинный студенческий анекдот про профессора, который жалуется на доставшихся ему непонятливых студентов: «Представьте себе, три раза им объяснил — в конце концов уже и сам все понял, а до них никак не 428 доходит!»
(Thorndike, 1932). Правда, его эксперименты вряд ли можно считать адекватными, так как они были ограничены анализом переноса умений решения простых задач в области геометрии. Кроме того, за прошедшее время изменились критерии оценки данных: то, что для Торндайка было «очень незначительным переносом», сегодня вполне можно было бы назвать «выраженным праймингом». Поэтому применительно к семантически богатым областям этот важный вопрос все еще остается открытым.
Традиционные прикладные исследования обучения имеют отношение к более простым ситуациям, когда речь идет, по классификации Нормана, об обучении как о процессе обогащения памяти новыми знаниями, а на первый план выступают мнемотехнические приемы и стратегии улучшения запоминания. Здесь обнаруживается практическая значимость многих рассмотренных выше результатов. Особый интерес представляют данные, полученные в рамках теории уровней обработки (см. 5.2.2). На успешность непроизвольного запоминания влияет то, что мы делаем с материалом, то есть такие факторы, как «глубина», «ширина» и «единственность» кодирования (Craik, 2002).
Согласно результатам наших исследований (Velichkovsky, 2002), использование кодирования, основанного на оценке личностной значимости (личностного смысла), оказывается в общем случае наиболее эффективным путем к хорошему запоминанию. Более того, при таком кодировании непроизвольное запоминание может оказаться успешнее произвольного (см. 5.3.3). Иными словами, чтобы выучить материал, совсем не обязательно его заучивать (а тем более «зубрить»). Лучших результатов можно добиться, попытавшись понять и оценить его в одном из индивидуально значимых («смыслообразующих») контекстов, например, с точки зрения прагматической полезности, логической законченности или эстетического совершенства. Кроме того, запоминание улучшается, когда работа с материалом обеспечивает выявление возможно большего количества семантических связей («детализация»), но возникающая при этом репрезентация оказывается уникальной («единственность»).
Чтобы ввести изучаемый материал, например текст учебника, в более широкий семантический контекст, полезен предварительный просмотр материала и попытки формулировки вопросов (эти вопросы, кстати, учащимся лучше сформулировать самим — поэтому данное учебное пособие и не содержит заранее подготовленного списка вопросов). В англоязычных странах студентам рекомендуется методический прием работы с текстом, чаще всего называющийся SQ3R (по первым буквам названий пяти последовательных действий — survey, question, read, recite, review). Согласно рекомендуемому порядку действий, работа с текстом должна начинаться с его беглого просмотра (survey или preview), направленного на выяснение того, о чем вообще идет речь. На втором этапе студент задает себе более конкретные вопросы (question), используя для 429
Рис. 5.12. Старинный метод определения количества дней в последовательных месяцах года.
этого, например, подзаголовки текста. Затем следуют собственно чтение (read), с последующим повторением (recite) основных положений и сжатым резюме (review) приобретенных знаний. Хотя конкретные особенности данного подхода к изучению текстового материала не основаны на каких-либо серьезных исследованиях35, он, безусловно полезен, поскольку дисциплинирует учебную работу студента и улучшает ее результаты. Речь идет, таким образом, о системе правил, организующих или упорядочивающих поведение, — формальной (то есть безразличной к содержанию) учебной дисциплине, хотя и в другом смысле, чем это имелось в виду Джоном Локком или Торндайком.
В специальных случаях для запоминания последовательной информации используются те или иные мнемотехнические приемы. Так, только что упомянутая необычная аббревиатура SQ3R («ЭС-КЬЮ-ТРИ-А») единственным образом кодирует три буквы латинского алфавита, позволяющие студенту припомнить названия пяти действий, которые он должен выполнить, оказавшись один на один с учебником. В ряде ситуаций возможно использование очень специальных мнемотехнических приемов. Пытаясь вспомнить, сколько дней нам осталось работать в марте или октябре, мы можем на всякий случай обратиться к проверенной детской
430
35 Существует множество вариаций этого метода, такие как PQ3R, PQ4R, SQ4R и т.д. В частности, появление еще одного «R» обычно связано с предложением «обдумать» (rethink) содержание прочитанного. Одновременная банальность и полезность таких рекомендаций типична и для многих других метапроцедур (то есть процедур работы со знаниями — см. 8.1.3). Их функция, очевидно, состоит прежде всего в организации познавательной активности, придании ей целенаправленного и целесообразного характера.
считалочке, связанной с перебором костяшек руки (см. рис. 5.12). Если косточка, то 31 день, если ямка, то 30 (или даже меньше в феврале, который представляет собой особый случай и требует еще и учета года — високосный или нет). Точно так же для перечисления семи цветов радуги нам нужно только вспомнить странную фразу «Каждый Охотник Желает Знать, Где Сидит Фазан», и припоминание последовательности цветов от красного до фиолетового уже не должно составить труда. Более универсальный характер имеет упоминавшийся выше метод мест (см. 5.1.1), хотя его возможности ограничены размером пространственного окружения, используемого для размещения запоминаемых объектов и воображаемой прогулки.
Областью педагогической практики, где использование общих мне-мотехнических приемов имеет доказанное практическое значение, является обучение иностранным языкам, особенно на ранних его этапах, а также тогда, когда оно не поддерживается постоянным общением с носителями изучаемого языка в естественных условиях. Как правило, обучение иностранным языкам в школе представляет собой чрезвычайно медленный и неэффективный процесс. Согласно британским данным, даже лучшие учащиеся не способны выучить в этих условиях более 4 слов за урок, а около 25% учащихся обычно вообще не запоминают ни одного (Milton & Меага, 1998).
Чтобы улучшить эту ситуацию, Ричард Аткинсон (один из авторов трехкомпонентных моделей памяти — см. 5.2.1) предложил так называемый метод ключевых слов, позволяющий ассоциативно связать фонологическую форму слова в малознакомом языке А со значением слова в известном языке Б. Например, как облегчить американскому курсанту запоминание значения русского слова «линкор»? Сначала в любом случае ему нужно выучить буквы русского алфавита, чтобы иметь возможность воссоздать звуковой образ слова. Затем найти в лексиконе английского языка слово или имя, чисто ассоциативно вызываемое в памяти этим звуковым образом, например, Lincoln, link или liqueur. Памятуя, что всякое кодирование должно быть уникальным, «возьмем» американского президента Линкольна и «посадим» его в кресло под орудия главного калибра дредноута с российским флагом. (В качестве альтернативы можно, конечно, загрузить боевое судно ящиками с ликером, но здесь возникают дополнительные, совершенно ненужные ассоциации.) Контрольные исследования показывают, что после такого кодирования слово «линкор» с очень высокой вероятностью вызывает соответствующий образ (—»«Линкольн»—»«большой военный корабль») и правильно переводится (Herrmann, Raybeck & Gruneberg, 2002).
Чрезвычайный интерес представляют собой психологические механизмы обучения чтению и письму с помощью китайских иероглифов и производных от них японских канжи. Хотя их заучивание и связано с, казалось бы, чудовищной нагрузкой на память, но в действительности оно облегчается многочисленными иконическими, сравнительно легко узнаваемыми включениями, поддерживающими широко разветвленную и достаточно избыточную сеть образных ассоциаций (см. также 7.2.1). Зная «иконическую этимологию» этих слов-знаков, вполне
431
можно поставить себе задачу овладеть минимальным набором из примерно 3000 иероглифов, рекомендованных в настоящее время японским министерством образования для повседневного использования (Henshall, 1995). Более того, судя по всему, овладение иероглифической письменностью ведет к некоторым неспецифическим побочным эффектам для когнитивного развития в целом. Оно играет положительную роль в развитии интеллектуальных способностей, поддерживая наглядно-образную интерпретацию абстрактных научных и технических понятий. Овладение этой мощной системой образного кодирования наиболее близко соответствует функции искомой европейской педагогикой и философией «формальной дисциплины» — если в начале обучения в школе китайские и японские дети еще несколько отстают от своих европейских и североамериканских сверстников, то к концу обучения они начинают их быстро обгонять, причем фактически во всех без исключения академических дисциплинах.
Особую область прикладных исследований образуют работы по формированию навыков. О навыках говорят в том случае, когда процессы выполнения некоторого действия со временем приближаются или достигают стадии автоматизации (см. 4.3.2)36. Обычно навык трактуется как некоторое приобретенное умение, которое в явном виде включает сенсомоторные звенья (навыки письма или вождения автомобиля), хотя иногда присутствие двигательных компонентов может быть и не столь очевидным (навыки чтения и счета или «навыки общения»). Многочисленные теории единодушно описывают процесс формирования навыков в терминах стадий или фаз автоматизации. Так, инженерные психологи П. Фиттс и М. Познер выделили в 1960-е годы когнитивную, ассоциативную и автономную фазы формирования. На первой фазе имеет место вербальное кодирование необходимых действий, на второй они фиксируются в долговременной памяти и могут ассоциативно извлекаться оттуда в нужной последовательности при одновременно сохраняющемся сознательном контроле. Наконец, на последней происходит полная автоматизация и соответствующие операции выполняются автономно, как бы сами по себе. В советской психологии П.Я. Гальперин дополнительно подчеркнул роль детальных речевых самоинструкций на промежуточном этапе формирования, в связи с чем он называл его этапом «развернутой речи про себя».
36 Мы не останавливаемся здесь на работах, которые связаны с описанием формы кривой научения (Андерсон, 2002). Обычно для этого оказывается достаточным использования выходящей на плато степенной функции Существование большого количества альтернативных предложений (см. Groeger, 2000) лишний раз доказывает, что практически любая математическая формула с достаточным количеством свободных параметров может быть использована для описания любой эмпирической зависимое -432 ти (см. 9.1.2).
В современных когнитивных исследованиях распространено мнение Дж.Р. Андерсона (Андерсон, 2002), согласно которому формирование навыка есть переход от декларативных («что?») к процедурным («как?») репрезентациям (см. 6.4.1). Эта точка зрения близка некоторым нейрофизиологическим моделям памяти (см. 5.3.2), однако она очень неспецифична в отношении участвующих механизмов. Кроме того, декларативный характер знаний не без основания оспаривается в ряде направлений семантики и лингвистики (см. 6.1.1 и 7.3.2). Более интересным нам представляется уровневый подход H.A. Бернштейна (сформулированный, напомним, в 1947 году!), выдвинувшего предположение, что новое действие сначала выполняется на некотором ведущем уровне и целиком осознается. Затем оно расщепляется на ряд операций, которые постепенно автоматизируются, находя для себя более низкие, фоновые уровни.
Рассмотрим в качестве примера важный (до повсеместного введения в будущем автоматических коробок передач) компонент управления автомобилем — переключение скоростей. Для начала кто-то другой должен подробно объяснить, как это делается. На этой, совместной фазе обучения решающее значение имеют механизмы, названные нами мета-когнитивными координациями (уровень F) и концептуальными структурами (уровень Е). Затем переключение педалей и рукоятки скорости на длительное время становится предметным действием (уровень D), протекающим под сознательным контролем (самоинструкция) и с участием зрения. Постепенно — в результате нормановской «настройки» или каких-то других изменений — переключение скоростей оказывается там, где оно и должно быть, превращаясь в типичную синергию. Соответствующие процессы (уровень В) не требуют сознательного мониторинга, за исключением случаев деавтоматизации в результате технических сбоев, а также переутомления или стресса. Интересно, что менее частая, потенциально более опасная и отличающаяся в разных моделях автомобилей операция включения задней скорости обычно так и остается предметно-пространственным действием (уровни D и С или, соответственно, вентральная и дорзальная системы обработки — см. 3.4.2).
Иерархические модели объясняют формирование навыков как процесс освобождения ресурсов вышележащих уровней для решения новых задач и контроля еще не автоматизированных действий. Факт состоит в том, что по мере формирования и автоматизации навыков выполнения некоторого действия увеличивается возможность перехода к решению других задач — иными словами, происходит «освобождение ресурсов внимания» (см. 5.4.2). Современные нейропсихологические исследования позволяют, до известной степени, проследить эти процессы in vivo. Так, эксперименты с применением трехмерного мозгового картирования показывают, что выполнение нового действия обычно сопровождается выраженной активацией префронтальных областей, функция которой
433
состоит в активном подавлении тенденций использования уже известных правил и способов работы (Raichle, 1998)37. По мере формирования навыка наблюдается резкое снижение активации, прежде всего в префрон-тальных областях, хотя одновременно может возрастать активность задних, например верхнетеменных, отделов коры.
Но всегда ли формирование навыков представляет собой последовательный сдвиг обработки «сверху вниз»? Две группы фактов заставляют предположить, что механизмы разных уровней способны, в пределах своей компетентности, демонстрировать элементарные формы имплицитного обучения, проходящего вне зависимости от сознательных целей и усилий. Первая группа фактов связана с анализом нейропсихологичес-ких данных о специфических выпадениях памяти и их последствиях. Как отмечалось выше (см. 5.3.2), семантическая память может продолжать развиваться у пациентов с нарушенной эпизодической памятью, а перцептивные автоматизмы совершенствуются в случае нарушений декларативной памяти в целом (Gabneli, 1998). Вторая группа фактов была выявлена при изучении сенсомоторных навыков реагирования на последовательно предъявляемые сигналы. Введение статистических регу-лярностей в последовательность сигналов может приводить к настройке навыка и улучшению работы независимо от того, догадывается ли испытуемый о существовании таких регулярностей (Willingham & Goedert-Eschmann, 1999). Таким образом, адаптивные изменения, видимо, могут параллельно происходить в разных звеньях и на разных уровнях механизмов формирования навыков.
Вполне возможны, в частности, переходы на более высокий уровень, например, в поисках нового решения задачи или новых способов выполнения действия при изменившихся условиях. Особенно интересны данные о формировании сложных когнитивных навыков логического — дедуктивного — решения задач (Houde & Tzourio-Mazoyer, 2003). В этом случае, как показывают данные трехмерного мозгового картирования, общие сдвиги активации происходят в направлении от задних, теменно-затылочных к передним, точнее левым префронтальным отделам коры (они непосредственно примыкают к речевой зоне, известной как зона Брока — см. 7.1.1). Эти нейрофизиологические изменения могут означать, что решение задачи начинает выполняться в произвольном режиме, при опоре на внутреннюю речь и вопреки отвлекающему перцептивному сходству. Параллельно с этими изменениями уровня контроля снижается количество ошибок, связанных с выбором решения на основании поверхностных, перцептивных признаков объектов.
Специальным случаем повышения уровня контроля является деавто-матизация сенсомоторного навыка, например в результате утомления
37 Необходимость такого подавления драматически усиливается в ситуациях прямого конфликта навыков, предполагаемых разными культурами. Примером служит процесс формирования навыка счета в культуре арабского языка, где сначала дети учат цифры дома в записи справа налево. Затем, в школе, при изучении математики и овладении пространственными приемами вычислений, дети вынуждены переучиваться записывать числа в обратном направлении — слева направо, хотя текстовый комментарий (условие задачи) 434 продолжает записываться ими справа налево (см. 9 4.2).
или перераспределения внимания (см. 5.1.2). Для лучшею понимания таких взаимодействий было бы интересно провести эксперименты с манипуляцией внимания испытуемых. Что произойдет, если попытаться вновь поставить под сознательный, произвольный контроль уже сформированный навык? Будет ли при этом обнаружен эффект, соответствующий известной притче о сороконожке, которая, задумавшись о том, в каком порядке переставлять ноги, не смогла больше двигаться? В одном из недавних исследований (Beilock et al., 2002) опытные спортсмены (игроки в гольф и футболисты) должны были продемонстрировать некоторое сложное упражнение (например, дрибблинг — проведение мяча в режиме слалома между поставленными в ряд шестами) в трех условиях: контрольном, распределения внимания (здесь нужно было одновременно отслеживать слова, предъявляемые через наушники) и концентрации внимания на выполняемом упражнении. В последнем условии испытуемые должны были в ответ на внезапный сигнал отмечать, какой элемент движения они выполняют. Результаты показали, что привлечение внимания к компонентам автоматизированного навыка действительно ухудшает его эффективность, тогда как отвлечение внимания способно даже несколько улучшить показатели выполнения по сравнению с контролем.
Обучение перестает быть «Золушкой» когнитивной науки и все больше вьщвигается в центр ее практических приложений. Современные технологии обучения опираются на «учебные пособия», значительно более сложные, чем линейка или даже компьютер. Так, поскольку метаког-нитивная активность выражена в большей степени, когда ты обучаешь кого-либо, а не когда тебя обучают (либо ты пытаешься выучить некоторый материал для сдачи экзамена), то одно из направлений, наметившихся в последнее время в школьном обучении, использует технологию обучаемых роботов. При этом школьники программируют перемещения виртуального антропоморфного агента (Davis et ai., 2005) между узлами-понятиями в семантических пространствах соответствующих дисциплин (см. 6.1.2). Общим направлением этих работ является, во-первых, использование так называемых интеллигентных интерфейсов, которые не ждут эксплицитного запроса со стороны пользователя, а сами отслеживают, когда они должны помочь, например, подсказать перевод забытого слова в процессе чтения иностранного текста (см. 7.4.3). Вторым стратегическим направлением становится преодоление самой компьютерной метафоры и переход к использованию эмоционального контекста обучения (Picard et al., 2004). Эта тенденция явно прослеживается и в развитии когнитивной науки в целом (см. 9.4.3).
В силу особой практической значимости в последние годы происходит также быстрое развитие средств поддержки процессов формирования сложных навыков, подобных управлению автомобилем или полетам на истребителе. Такие специальные навыки, как ведение группового воздушного боя, требуют до двух и более тысяч часов тре-
435
нировки. Летную подготовку в подобном объеме практически невозможно реализовать в естественных условиях, так как даже учебные упражнения с использованием реальной боевой техники оказываются слишком дорогостоящими и опасными. Поэтому современные тренажеры, в особенности, использующие технологию виртуальной реальности (с ее основными вариантами, такими как расширенная виртуальность — см. 3.3.2), имеют не меньшее стратегическое значение, чем собственно боевые самолеты. Число и характеристики тренажеров едва ли не в первую очередь учитываются сегодня при оценке военной мощи потенциального противника, а запрограммированные в них сценарии возможного развития событий вполне могут приближаться по сложности к партитуре классического балета38.
5.4.3 Развитие, старение и распад
Изучение наиболее ранних фаз развития памяти проводится с помощью поведенческих методик, направленных на анализ процессов предпочтения, привыкания (угасание ориентировочной реакции — см. 3.4.3 и 4.4.1), а также формирования условных и оперантных рефлексов. Результаты применения этих методик свидетельствуют о постоянном расширении возможностей сохранения информации в первые дни, недели и месяцы жизни, причем зачастую такое сохранение удается обнаружить в диапазоне интервалов времени, типичных для долговременного запоминания. Запоминание возможно даже во время внутриутробного развития. В одном из исследований (DeCasper & Spence, 1986) матери ежедневно в течение последних месяцев беременности читали вслух один и тот же монолог из современной пьесы. Через 56 часов после появления на свет новорожденным предъявлялась магнитофонная запись того же самого или другого монолога. Работа магнитофона управлялась сосательными движениями новорожденных. Было обнаружено, что в случае знакомого текста они продолжали сосать пустую соску в течение всего времени чтения, причем независимо от того, зачитывается ли текст их матерью или незнакомым человеком. Предъявление другого монолога не вызывало такой активности.
38 При создании тренажеров не так важна натуралистичность, как правильное отображение критически важных для формируемого навыка параметров. Примером служит навык управления движением супертанкеров. В начале 1980-х годов нефтяная фирма ESSO построила на озере недалеко от Гренобля учебный танкер и целую систему причальных сооружений в 1/25 реальной величины. При этом, правда, время реализации команды, то есть время от подачи команды изменить курс до фактического изменения курса судна также оказалось в несколько раз меньше (оно составляет в реальных условиях примерно 20 мин). В результате тренировка вызвала отрицательный перенос — успешность проведе-436 ния реальных танкеров оказалась ниже, чем без тренировки.
В литературе, посвященной первому году жизни, наиболее полно представлены данные об имплицитной памяти, хотя имеются сообщения и о присутствии узнавания в возрасте всего лишь 2 месяцев (Rovee-Collier & Наупе, 2000). Эти исследования в целом говорят о том, что эксплицитная память развивается с задержкой по сравнению с имплицитными прайминг-эффектами. Систематический анализ эксплицитной памяти становится возможным с развитием речи. К концу первого года начинает развиваться лексикон и на базе более ранних, так называемых базовых категорий (они примерно соответствуют понятиям среднего уровня абстрактности — см. 6.2.2) формируются концептуальные структуры. Дети также легко усваивают порядок действий, которые сопровождают, например, приготовление ко сну, протестуя, если он нарушается, а при чтении им знакомой сказки замечают перестановку эпизодов. В основе этих проявлений семантической памяти лежат сценарии — схематические структуры знания, выстроенные вокруг последовательности типичных событий (см. 6.3.3).
Появление и становление грамматической речи делает возможным воспроизведение-рассказ, позволяющий судить о припоминании индивидуальных событий. К концу второго года жизни ребенок, способный связно рассказать, что случилось в определенном, выходящем за рамки привычных событий эпизоде, лучше вспоминает его и через 18—20 месяцев. Именно эпизодическая память представляет собой научную проблему, поскольку в отличие от прайминг-эффектов и семантической категоризации она предполагает рефлексивное осознание (или «автоноэтическое сознание», по Тулвингу) некоторой информации как соответствующей собственному прошлому опыту.
Особый интерес поэтому представляет субъективный статус имеющихся у ребенка знаний. По мнению австрийского психолога Иозефа Пернера (Perner, 2000), до двух лет знания остаются неосознанными. Лишь после этого возраста ребенок начинает понимать, когда он знает нечто, а когда нет, демонстрируя это в своем поведении. Например, он сразу открывает коробку, если знает, что в ней был спрятан объект, и не решается открыть, если не знает. Несколько позднее (примерно 2 года 4 месяца) в речи начинают использоваться выражение «Я не знаю». Но и после этого, по мнению Пернера, дети не способны к подлинному эпизодическому припоминанию. Так, они не делают различия между принципиально разными источниками знания — увидел и пережил сам или узнал со слов других. Для характеристики автобиографической памяти это различие весьма существенно39. Например, воспоминания Пиаже о
39 Нечувствительность к источнику сведений характерна для семантической памяти
(см. 5.3.2). Иными словами, даже если некоторая мнестическая задача состоит, казалось
бы, в эпизодическом припоминании, она может решаться средствами относительно бо
лее низкого уровня категориальных структур, с опорой на общее впечатление знакомое -
ти (то есть с использованием эвристики «знаю» — см. 5.1.1). 437
попытке его похищения, упоминавшиеся нами в начале этого раздела (см. 5.4.1), приходится рассматривать скорее как феномен воображения, а не памяти, поскольку источником информации здесь оказались не лично пережитые события, а рассказы взрослых.
Существенно, что трехлетний ребенок еще не отличает в полной мере собственные знания от знаний других людей, атрибутируя им те же знания, которыми располагает сам. В типичной тестовой ситуации экспериментатор в присутствии ребенка и некоторого третьего лица, обычно матери, прячет под одну из коробок шоколадку. После этого мать покидает помещение на некоторое время, а экспериментатор на глазах у ребенка перепрятывает шоколадку. Если .сразу перед возвращением матери экспериментатор спрашивает ребенка, где она теперь будет искать шоколадку, то ребенок с уверенностью показывает на новую коробку, игнорируя, казалось бы, очевидные различия индивидуальных знаний о ситуации. Наконец, у ребенка нет полноценного представления о времени: даже узнавая себя в видеофильме, дети этого возраста не учитывают в своих ответных реакциях время изображаемых событий, был ли этот фильм снят только что или же несколько недель назад.
Можно считать установленным, что примерно в возрасте четырех лет происходят важные изменения, проявляющиеся в том, что ребенок начинает осознанно различать собственные знания о ситуации и знания других людей, стабильно демонстрируя это различение в своем поведении и в речи (см. 7.1.2 и 8.1.1). В общепринятой терминологии когнитивных исследований развития речь идет о появлении в этом возрасте «теории психики» {theory of mind, ToM — см., например, Karmiloff-Smith, 1993), или «индивидуальной теории психики»40. Эти изменения одновременно делают возможным и более рефлексивное личностное отношение к ситуации. Их можно считать также проявлением возникновения метакогнитивных координации. Действительно, нейропсихологические исследования (Stuss, Gallup & Alexander, 2001) выявляют решающую роль фронтомедианных и правых префронталь-ных областей коры, ранее идентифицированных нами как вероятный субстрат уровня F, в функционировании (и выпадениях, например при аутизме) индивидуальной теории психики. Одновременно улучшается ориентировка во времени и начинаются изменения, затрагивающие частные познавательные процессы. Изменения процессов запоминания выражаются в возникновении метапамяти — знаний об особен-
40 Перевод термина «theory of mind» на другие языки сопряжен с большими трудностями. Не очень удачным, конечно, представляется упоминание «теории», а перевод понятия «mind» традиционно является предметом споров. В русскоязычной литературе иногда используется термин «модель психического». Мы решили пойти на более близкий к пер-438 воисточнику перевод, с указанием индивидуального характера формирующейся «теории».
ностях собственной памяти, позволяющих значительно оптимизировать ее работу.
Едва ли не самым известным феноменом памяти, имеющим отношение как раз к этому периоду онтогенетического развития, является феномен детской амнезии. Впервые описанный еще Фрейдом, этот феномен состоит в том, что у взрослых обычно нет воспоминаний или, по крайней мере (как показывает и соответствующий статистический анализ), достоверно слишком мало воспоминаний, относящихся к возрасту, предшествовавшему 3—4 годам. Интересно, что одновременно дети этого возраста могут легко припоминать более ранние события, иногда даже события первого года жизни. Для объяснения детской амнезии было предложено много различных гипотез, из которых мы рассмотрим здесь лишь наиболее известные:
ранние впечатления хуже кодируются и запоминаются, чем более
поздние;ранние впечатления кодируются более примитивной системой
памяти, которая допускает лишь имплицитное, но не эксплицит
ное извлечение;ранние впечатления сохраняются, но их припоминание подавля
ется (вытесняется) сознательным «Я»;детям в более раннем возрасте не хватает личностного контекста
кодирования и извлечения опыта, который предполагает понятия
«Я» и представления о времени.
Первое объяснение, конечно, является правильным, но слишком общим, не вскрывающим ни специфики затруднений, ни причину их связи с определенным возрастом. Второе фактически неверно, так как эксплицитное извлечение в действительности возможно, но только в отношении безличностной, семантической памяти («знаю» или просто «известно» — см. 5.1.1). Третье, психоаналитическое объяснение верно указывает на связь данного феномена с личностью, но при этом опирается на непроверенные допущения о содержаниях «бессознательного», аффективном характере этих содержаний и взаимодействии уровней, протекающем по типу подавления, или вытеснения. Для большинства этих допущений до сих пор отсутствуют доказательства (см. 5.4.1). Более того, некоторые из них, похоже, не подтверждаются, поскольку среди немногих ранних воспоминаний можно найти примеры как эмоционального, так и вполне нейтрального (с точки зрения взрослых) содержания. Последнее объяснение в наибольшей степени соответствует имеющимся на сегодня фактам, в их совокупности говорящим о появлении в этом возрасте нового уровня организации и связанной с ним личностно-смысловой «системы координат». Этот уровень, названный нами уровнем метакогнитивных координации (F), делает возможным автономное функционирование эпизодической памяти и произвольное планирование действий во времени.
Важное замечание по поводу становления высших форм памяти состоит в уточнении роли социального взаимодействия. Развитие
439
индивидуальной теории психики коррелирует с интенсивностью социальных контактов и ускоряется, когда у ребенка есть братья и сестры (Регпег, личное сообщение, ноябрь 2002). В терминологии Л.С. Выготского, речь идет о том, что память в качестве мн/и/?опсихологической функции появляется после памяти как мнте/шсихологической, то есть распределенной между участниками действия, функции (см. 1.4.2). Так, если типичной стратегией припоминания у взрослых является мысленный поиск в некотором представляемом окружении, то онтогенетически ему предшествует реальный поиск (допустим, оставленной где-то школьной тетради), организуемый и проходящий при участии близких. Такое совместное припоминание (joint reminiscing) стало в последние годы предметом ряда замечательных исследований41. Как оказалось, развернутость и направленность речевого рассказа матери об актуальных или прошлых событиях влияют на успешность их последующего припоминания ребенком в диапазоне возрастов от 3 до, как минимум, 7 лет, причем иногда это влияние обнаруживается лишь несколькими годами позже. Структура этих корреляционных зависимостей, однако, претерпевает изменение между 4 и 5 годами, когда успешность эпизодического припоминания начинает устойчиво зависеть также от индивидуальных особенностей описания событий самим ребенком (Nelson & Fivush, 2000).
Появление метакогнитивных координации, в частности метапамя-ти, во многом меняет функционирование памяти. Часто это проявляется в использовании определенных приемов или стратегий решения мнестических задач, которые затем автоматизируются и приобретают характер полурефлекторного ответа на ситуацию. Примером может служить проговаривание при запоминании вербального или легко вербализуемого материала, которое начинает систематически использоваться детьми сравнительно поздно, в возрасте 5—7 лет. Таким образом, повторение во внутренней речи — не фиксированный компонент когнитивной архитектуры (подобный вербальной петле ранних моделей памяти — см. 5.2.1) и не обязательное условие понимания речи (см. 7.1.3), а метакогнитивная стратегия, причем вполне гибкая, как это было установлено и в рамках теории уровней обработки (см. 5.2.2). При условии достаточного внимания и мотивации эффективность этой простейшей стратегии запоминания может быть чрезвычайно высока.
41 Совместное припоминание, как развернутое повествовательное («нарративное») действие, не сводится только к эффектам совместного внимания. В одной из работ (Pipe et al., 1999) детям 5 лет предлагалась новая игровая ситуация, которая детально описывалась взрослым либо с использованием названий всех предметов, либо столь же подробно, но с большим числом дейктических (указательных) оборотов и слов, таких как «это», «туда», «с тем». Хотя дейктическая речь поддерживает состояние совместного внимания (см. 7.4.3), последующее вербальное припоминание, равно как и невербальное разыгро-440 вание ситуации ребенком, оказалось во втором случае заметно хуже.
Например, ученики существующих во многих странах мира школ Корана демонстрируют способность заучивания наизусть сотен страниц классического арабского языка, хотя этот язык часто остается для них полностью непонятен.
Наиболее типичной особенностью метапамяти и целенаправленных мнестических действий является работа с контекстом. Так, при воспроизведении мы прежде всего пытаемся восстановить контекст запоминания, причем используем для этого механизмы разных уровней когнитивной организации. Пытаясь вспомнить правописание слова, мы зачастую обращаемся с сенсомоторному опыту письма, а припоминая — иногда десятилетиями позже — имена школьных товарищей, стараемся восстановить не только конкретные автобиографические эпизоды, но и общие, имеющие отношение к обучению семантические категории. Для нас характерно также заблаговременное создание контекста будущего припоминания, что в значительной степени определяет всю организацию нашей среды обитания — инструменты в мастерской, продукты питания на кухне или оттиски статей и книги в кабинете42.
Задача организации деятельности во времени уже на ранних этапах развития человеческого общества способствует возникновению проспективной памяти и поддерживающих ее средств, от знаменитых узелков, завязанных на память, и солнечных часов до современных электронных «органайзеров». Проспективная память возможна в двух вариантах — ориентации на некоторое будущее событие («бросить письмо в первый же почтовый ящик») и ориентации на абстрактное время («в пятницу к 8.00 быть в аэропорту»). Вторая форма представляется более сложной и общественно значимой, так как она делает действия универсально предсказуемыми, что критически важно для социальной кооперации. Элементарная забывчивость, простительная в кругу родственников или знакомых, становится проступком и даже преступлением в условиях индустриального производства43.
Сравнительные исследования ретроспективной и проспективной памяти у взрослых испытуемых показывают, что эти виды памяти, судя по всему, опираются на одну и ту же шкалу субъективного времени,
42 Новые возможности и проблемы возникают сегодня в связи с распространением единого цифрового формата сохранения практически неограниченных объемов информации. Поиск фотографий, снятых во время летнего отпуска, или любимого музыкального произведения может поэтому уже в ближайшем будущем потребовать применения технологий мультимедийных баз данных.
41 Немецкий социолог Макс Вебер (1864—1920) считал точность характерной особен
ностью «протестантской этики», а французский психолог Пьер Жане — не протестант, а
католик — в работе «Эволюция памяти и понятие времени» (Janet, 1928) обосновал мне
ние о ведущей роли представлений о времени для становления рефлексивного сознания.
Именно по отношению ко времени наблюдаются особенно выраженные различия в раз
ных культурах. Это, в частности, влияет на типичные опоздания студентов на лекции в
Северной Америке, России, Германии или на Ближнем Востоке 441
которая представляет собой нелинейную трансформацию шкалы физического времени. Более детальные исследования обнаруживают, что речь идет, скорее всего, о гиперболической функции (Ainslie, 2001)44. Главное отличие двух возможных направлений движения, в будущее и в прошлое, состоит в том, что в проспективном варианте — при ответах на вопросы «Что Вы будете делать завтра, через месяц, через год?» — обычно генерируется значительно больше ответов, чем при ответе на аналогичные ретроспективные вопросы (Maylor, Chater & Brown, 2001).
Считается, что эффективность нашей памяти достигает своего максимального развития к 20—30 годам, а затем она начинает сначала медленно, а затем все быстрее (особенно после 60) снижаться. Это распространенное мнение об изменении памяти в процессе нормального старения требует ряда уточнений. Во-первых, исследования демонстрируют расхождение данных, полученных в лабораторных условиях и в повседневной жизни. В последнем, экологически валидном случае пожилые люди зачастую обнаруживают... более высокую точность и меньшую забывчивость, чем молодые взрослые. Очевидно, что за счет организации среды (опоры на «внешнюю память» — см. 5.4.1 и 9.3.3), использования социальной поддержки и известной ритуализации собственного поведения в течение длительного времени возможна практически полная компенсация негативных возрастных изменений.
Во-вторых, данные ряда исследований свидетельствуют о различной динамике возрастных изменений для разных форм памяти. В то время как вербальная память, лежащая в основе изучения второго языка, наиболее эффективна в возрасте 3—6 лет, память на социально-значимые события иногда формируется в соответствующем эмоци-онально-мотивационном контексте лишь к 50—60 годам (см. 7.1.2 и 9.4.2). В самом первом приближении, можно сказать, что возрастные нарушения распространяются как бы в направлении «сверху вниз», повторяя процессы раннего развития, но только в обратном порядке. Нормальное старение прежде всего затрагивает эпизодическую память, причем все более выраженной становится, как и в детском возрасте, амнезия на источник — пространственно-временной контекст приобретения знаний (см. 5.3.2). Кроме того, страдают проспективная и рабочая память, что проявляется в усиливающейся забывчивости и рассеянности. Все это очень похоже на селективное ослабление механизмов метакогнитивных координации (уровень F), что подтверждается данными о преимущественной локализации возрастных изменений
44 Данный характер субъективной шкалы времени может объяснять нашу явную подверженность импульсивным влияниям, фиксированность на заботах настоящего и своеобразную «психологическую близорукость» по отношению к более отдаленным событи-442 ям и проблемам.
Рис. 5.13. Соотношение нейрофизиологических изменений и функций памяти в старческом возрасте (по: Anderson & Craik, 2000).
в нейронных структурах префронтальной коры и в таких связанных с ними структурах, как гиппокамп и его непосредственное окружение (рис. 5.13).
На фоне сокращения рождаемости и старения населения индустриально развитых государств мира, изучение возрастных изменений памяти стало одним из центральных направлений работы многих когнитивных лабораторий. Мы рассмотрим здесь лишь несколько типичных психологических эффектов, выраженность которых усиливается в старческом возрасте. Одним из них является эффект ложной памяти. Этот эффект состоит в том, что конвергирующая активация привычных ассоциаций на стадии ознакомления с материалом может вести к ошибочному воспроизведению похожих по значению, но не предъявлявшихся слов. Например, если предъявить испытуемому список «молоко», «хлеб», «кофе», «масло», то при воспроизведении через какое-то время он с известной вероятностью назовет «сливки». Усиление этой тенденции с возрастом по сути дела означает, что семантическая память выходит
443
из-под произвольного, метакогнитивного контроля. Другой интенсивно исследовавшийся феномен, получивший название эффект веера (Андерсон, 2002), заключается в том, что чем больше фактов узнает испытуемый по поводу определенного понятия или лица (например, утверждений о личностных качествах некоторого индивида), тем медленней он верифицирует соответствующие частные утверждения (см. 6.4.1). Усиление этого эффекта в старости также указывает на дефицит контроля при выборе релевантных и игнорировании (торможении) иррелевантных сведений.
Ослабление такой глобальной метапроцедуры, как КОНТРОЛЬ, конечно, должно проявляться в целом ряде ситуаций и задач, не связанных только с функциями памяти. В самом деле, одним из самых надежных тестов, выявляющих старческие изменения, является обсуждавшийся в предыдущей главе эффект Струпа (см. 4.3.1). Основу интерференции в этом случае образует как раз ослабление контроля за выполнением произвольной задачи (обычно называнием цвета букв), связанной с подавлением спонтанно возникающих привычных тенденций (чтением слова). Еще один красивый результат, который следует упомянуть в этой связи, вновь имеет отношение к памяти, но состоит в том, что в преклонном возрасте наблюдается ослабление произвольного забывания (Zacks, Hasher & Li, 2000)! Таким образом, в старости мы не только хуже припоминаем, но одновременно и хуже забываем — когда именно забывание является нашей сознательной целью. Очевидно, что при этом страдает не столько гипотетическая рабочая память, сколько наша произвольная работа с памятью.
Как показывают многочисленные работы, имплицитные формы памяти, такие как процессы формирования условных рефлексов и перцептивные прайминг-эффекты, обычно относительно устойчивы к возрастным изменением. Особенно интересен поэтому вопрос о том, как процессы старения сказываются на работе семантической памяти. Наиболее обширное лонгитюдное исследование такого рода было развернуто в последние годы группой шведских авторов во главе со шведским психологом Ларсом-Гёраном Нилссоном (например, Nilsson & Soderlund, 2001). Если скорректированы изменения, связанные со все более частыми и серьезными заболеваниями, то складывается впечатление, что семантическая память в целом оказывается практически столь же устойчивой к возрастным изменениям, как и имплицитная память.
Эту достаточно когерентную картину возрастных изменений памяти в процессе старения могут драматически усиливать и искажать типичные заболевания позднего возраста — старческая деменция и болезнь Алъцгеймера (англ. Alzheimer's disease, AD). В особенности последнее заболевание, первые проявления которого могут наблюдаться уже начиная с 45—60 лет, является частой причиной прогрессирующей инвалидности в пожилом возрасте, протекающей на фоне массивного распада
444
функций памяти45. Поражая в первую очередь ассоциативные (фронтальные и височные) области коры головного мозга, оно не только усиливает возрастные нарушения метакогнитивных процессов (произвольного внимания, оперативного запоминания, рефлексивного осознания и эпизодической памяти), но и распространяется на следующий уровень когнитивной организации, связанный с семантической памятью (уровень концептуальных структур Е).
Интересно, что в развитии самой этой болезни также просматривается знакомая динамика — первыми предвестниками будущего заболевания служат ухудшение эпизодической памяти наряду с ослаблением и нестабильностью произвольного внимания. На пике болезни Альцгеймера быстро ухудшается семантическая категоризация, распадается речь (что также является частым следствием сопутствующей старческой деменции), теряются остаточные знания, а затем нарушаются процессы узнавания и исполнение повседневных культурных навыков. В конце концов эти процессы делают пациентов полностью зависящими от их социального окружения. Следует заметить, что абстрактная семантическая информация сохраняется при этом лучше и дольше, чем конкретная, то есть наблюдается несколько другая картина, чем в самом начале когнитивного развития, когда первыми усваиваются категории, соответствующие понятиям промежуточного уровня абстрактности (см. 6.2.2).
Когнитивная нейропсихология, ориентированная на поиск локальных механизмов, испытывает затруднения при объяснении глобальных дегенеративных изменений, наблюдающихся в случае болезни Альцгеймера. Их интерпретация возможна, с одной стороны, в рамках общих уровневых представлений, а с другой — на пути использования подходов, развиваемых в так называемой «мокрой нейрофизиологии», биохимии и молекулярной генетике. Эти подходы направлены на выявление роли различных нейромедиаторов (см. 2.4.3 и 9.4.3). Данные о селективной гибели синаптических рецепторов, чувствительных к аце-тилхолину, были положены в основу популярной сегодня холинэргичес-кой гипотезы, объясняющей природу когнитивных симптомов болезни Альцгеймера дефицитом этого нейромедиатора (White & Ruske, 2002). Ацетилхолин является медиатором неспецифических влияний восходящей ретикулярной активирующей системы на кортикальные структуры, в частности, на нейроны с неоднократно упоминавшимися выше NMDA-синапсами (см. 4.4.3 и 5.3.2). Такая энергетическая «подпитка» необходима для того, чтобы «пробить» высокие пороги NMDA-синап-сов и вызвать их продолжительное изменение. Если данный механизм
45 Согласно данным международной Ассоциации болезни Альцгеймера (Alzheimer's
Association, 1996), в возрастной группе от 75 до 84 лет этим заболеванием в Соединенных
Штатах и Западной Европе страдает каждый пятый человек, а в группе от 85 лет — уже
практически каждый второй (47%). 445
нарушается в одном из его звеньев, то процессы кодирования и консолидации резко замедляются. Манипулируя в экспериментах веществами агонистами и антагонистами ацетилхолина, удается спровоцировать симптомы начальной стадии болезни Альцгеймера у здоровых испытуемых и, что важно, добиться временного улучшения клинической картины у больных46.
Несколько неожиданным результатом исследований последних лет оказался тот факт, что у пациентов с болезнью Альцгеймера может оставаться нормальным собственно темп забывания, являющийся, казалось бы, синонимом распада следов памяти (см. 5.4.1). Иными словами, если обеспечивается высокий исходный уровень кодирования (на что в данном случае, естественно, уходит относительно много времени), то практически нормальными оказываются и результаты тестов на запоминание. Близкие закономерности вырисовываются и при некоторых других расстройствах памяти, связанных с более локальными поражениями мозга, прежде всего в области височно-гиппокампальных структур. Эти данные ставят ряд вопросов о соотношении процессов первоначального кодирования (восприятия, понимания, а также до сих пор несколько загадочной консолидации) и последующего сохранения информации. Предварительное объяснение можно искать в теории уровней обработки, рассматривающей память как побочный продукт того, что мы делаем с материалом (см. 5.2.2 и 5.3.3), но тогда еще надо установить, в чем состоят нарушения восприятия и понимания, связанные с недостатком ацетилхолина или же с нарушениями в работе гиппокампа. В любом случае есть основания надеяться на предстоящую более полную интеграцию работ по патологии памяти с исследованиями уровневых и биохимических основ поведения и познания.
Рассмотрение разрушения и гибели сначала личностного, а затем и культурного опыта нельзя назвать особенно оптимистическим финалом главы о памяти. Крупные выпадения, вовлекающие высшие мозговые механизмы, затрудняют и делают невозможными аккуратную и критическую работу произвольного запоминания. И все-таки, если нарушена только эпизодическая память (как, например, при локальных поражениях гиппокампа), то это можно компенсировать дополнительным перцептивным, семантическим и метакогнитивным кодированием, о чем свидетельствует нормальная динамика забывания и вполне надежная семантическая память, позволяющая накапливать общие знания и даже демонстрировать определенные академические достижения, на уровне окончания средней школы. Конечно, если нарушены механизмы семантической памяти, то все еще длинный список прайминг-
44 Накапливаются данные о тесной связи возникновения возрастных нейродегенера-
тивных заболеваний, включая болезнь Альцгеймера. с одной из аллелей гена АРОЕ. Этот
ген, участвующий в регуляции работы холинэргической системы, играет важную роль в
процессах транспортировки липидов (белков) к растущим нейронам, а также в устране-
446 нии их фрагментов из гибнущих клеток (см. 2.4.3 и 4.3.3).
_-
Γ"
эффектов, которые остаются сохранными при выпадении эксплицитного припоминания, служит слабым утешением. В практическом плане остается лишь социальная поддержка, привычное предметное окружение в роли «внешней памяти» и надежда на то, что бурно развивающиеся новые подходы в изучении молекулярных'механизмов познавательных процессов позволят остановить или, хотя бы частично, скомпенсировать распад.
447
Борис Митрофанович Величковский
КОГНИТИВНАЯ НАУКА Основы психологии познания
Том 1
Оригинал-макет подготовлен в издательстве «Смысл»
Директор издательства Д. А. Леонтьев Редактор Н. В. Крылова, Е. Г. Лунякова
Корректор Н. С. Самбу Компьютерная верстка: Е. Г. Егорова
Художник Е. Г. Яцута
Изд. № 101112366. Подписано в печать 17.04.2006. Формат 70х 100/16. Бумага офсетная Гарнитура Newton С. Печать офсетная. Усл. печ. л. 36,4. Тираж 2500 экз. Заказ № 7198.
Лицензия ИД № 04850 от 28.05.2001. Издательство «Смысл» (ООО НПФ «Смысл») 103050, Москва-50, а/я 158. Тел./факс: (495) 195-37-13, 189-95-88 e-mail: smysl@smysl.ru http://www.smysl.ru
Издательский центр «Академия», www.academia-moscow.ru
Санитарно-эпидемиологическое заключение № 77.99.02.953.Д.004796.07.04 от 20.07.2004. 117342, Москва, ул. Бутлерова, 17-Б, к. 360. Тел./факс: (495)330-1092, 334-8337.
Отпечатано с электронных носителей издательства.
ОАО "Тверской полиграфический комбинат", 170024, г. Тверь, пр-т Ленина, 5. Телефон: (4822) 44-52-03, 44-50-34, Телефон/факс (4822) 44-42-15 Интернет/Home page - www.tverpk.ru Электронная почта (E-mail) - sales@tverpk.ru
Ученье - свет, а неученье - тьма
народная мудрость.
Да будет Свет! - сказал Господь
божественная мудрость
NataHaus - Знание без границ:
Скромное воплощение народной и божественной мудрости.:-)
библиотека
форум
каталог
-----------------------------------------------------------------------------
Ссылки (links):