Аткинсон Р. и др. Введение в психологию

ОГЛАВЛЕНИЕ

Часть IV. Научение, запоминание и мышление

Глава 7. Научение и обусловливание

Научением [Научение (learning) следует отличать от обучения (teaching) и образования (education), как это будет ясно из дальнейшего изложения. — Прим. ред.] наполнена наша жизнь. С ним связано не только освоение нового навыка или учебного предмета, но также и эмоциональное развитие, социальное взаимодействие и даже развитие личности. Мы учимся разному: чего бояться, что любить, как быть вежливым, как вести себя с близкими и так далее. Учитывая, что научение пронизывает всю жизнь человека, неудивительно, что мы уже встречались с ним на многих примерах — например, как дети учатся воспринимать окружающий мир, устанавливать свою половую принадлежность и контролировать свое поведение по стандартам взрослых. Теперь, однако, мы перейдем к более систематизированному анализу научения.
Научение можно определить как относительно устойчивое поведение, возникающее в результате практики; изменения поведения, возникающие благодаря созреванию (а не практике) или временным состояниям организма (таким как усталость, или состояниям, вызванным приемом лекарств), сюда не относятся. Однако не все случаи научения одинаковы. Можно выделить четыре его типа: а) привыкание, б) классическое обусловливание, в) оперантное обусловливание и г) то, что называют комплексным научением. Привыкание — простейший вид — сводится к научению игнорировать стимул, ставший уже знакомым и не вызывающий серьезных последствий; например: научение игнорированию тиканья новых часов. И классическое, и оперантное обусловливание связаны с формированием ассоциаций, т. е. с научением тому, что некоторые события происходят вместе. При классическом обусловливании организм усваивает, что за одним событием следует другое; например, ребенок научается тому, что за видом груди последует вкус молока. При оперантном обусловливании организм усваивает, что совершаемая им реакция будет иметь определенные последствия; например, маленький ребенок научается тому, что если ударить брата или сестру, то за этим последует неодобрение родителей. В комплексном научении помимо формирования ассоциаций содержится нечто большее, например, применение некоторой стратегии при решении задачи или построение мысленной карты своего окружения.
Существуют и другие формы научения; к ним относятся импринтинг, моделирование и подражание и опосредованное обучение. Эти формы обучения будут рассматриваться в следующих главах. В данной главе мы сосредоточимся прежде всего на обусловливании и сложных видах научения. Однако прежде чем говорить о научении и обусловливании, мы должны рассмотреть, как применяются различные психологические подходы в исследованиях научения.

 

Подходы к научению

Как мы помним по первой главе, в психологии есть три наиболее важных подхода: бихевиористский, когнитивный и биологический. В исследованиях научения не меньше, чем во всякой другой сфере психологии, участвуют все эти три подхода.
Многие ранние работы по научению и особенно по обусловливанию проводились в рамках бихевиористского подхода. В них изучалось то, как животные научаются устанавливать ассоциации между стимулами или между стимулом и ответной реакцией. Основное внимание уделялось внешним стимулам и реакциям — в соответствии с общей позицией бихевиоризма, что поведение лучше всего понимать в терминах внешних причин, а не умственных процессов. Бихевиористский подход к научению содержал и другие ключевые положения. Согласно одному из них, простые ассоциации классического или оперантного типа являются «кирпичиками», из которых строится все научение. Так, бихевиористы полагали, что такая сложная вещь, как освоение речи, по сути есть заучивание множества ассоциаций (Staats, 1968). Согласно другому положению, независимо от того, что именно заучивается и кто именно заучивает — будь то крыса, которая научается проходить лабиринт, или ребенок, осваивающий операцию деления столбиком, — везде действуют одни и те же базовые законы научения (Skinner, 1971, 1938). Руководствуясь такими взглядами, бихевиористы сосредоточились на изучении того, как подкрепления и наказания в простых лабораторных ситуациях влияют на поведение животных, в частности крыс и голубей.
<Рис. Научение может быть определено как относительно постоянные изменения в поведении, происходящие в результате практики. Благодаря практике могут обучаться как люди, так и животные.>
В ходе этой работы было открыто множество явлений и получены богатые данные, которые и сегодня составляют основу многого из того, что нам известно об ассоциативном научении. Но как мы увидим, в свете последующих работ положения бихевиористов должны были претерпеть существенные изменения. Чтобы объяснить обусловливание, не говоря уже о комплексном научении, необходимо учитывать, что знает данный организм о связи между стимулом и реакцией (даже если организм — это крыса или голубь); тем самым мы вступаем на территорию когнитивного подхода. Кроме того, в случае комплексного научения помимо ассоциаций следует учитывать стратегии, правила и тому подобное, а для этого опять-таки надо принять когнитивный подход. Далее, теперь выясняется, что не существует единого свода правил, лежащих в основе научения во всех ситуациях и у всех организмов. В частности, у различных видов механизмы научения различны, и это приводит нас к биологическому подходу.
Таким образом, современные исследования научения требуют интегрированного подхода, рассматривающего все три перечисленных выше взгляда на научение.

 

Классическое обусловливание

Классическое обусловливание — это процесс научения, при котором ранее нейтральный стимул начинает ассоциироваться с другим стимулом вследствие того, что второй стимул сопровождает первый.
Изучение классического обусловливания началось в первые годы XX века, когда российский физиолог Иван Павлов, уже получивший тогда Нобелевскую премию за исследования пищеварения, обратился к научению. Еще изучая пищеварение, Павлов заметил, что при одном только виде тарелки с едой у собаки начинает выделяться слюна. У любой собаки будет выделяться слюна, когда ей в рот кладут пищу, но эта собака научилась ассоциировать вид тарелки со вкусом пищи. Наткнувшись на случай ассоциативного научения, Павлов решил выяснить, можно ли научить собаку ассоциировать пищу с другими вещами, например со светом или звуком.
<Рис. Иван Павлов со своими сотрудниками.>

Эксперименты Павлова

В основном эксперименте Павлова сначала в слюнную железу собаки вживляют фистулу, чтобы измерять количество выделенной слюны. Затем перед собакой ставят миску, в которую автоматически может подаваться мясной порошок. Экспериментатор включает свет в окошке перед собакой. Через несколько секунд в миску подается немного мясного порошка, и свет выключается. Собака голодна, и записывающее устройство регистрирует обильное слюноотделение. Выделение слюны — это безусловный рефлекс (БУР), поскольку здесь никакого научения нет; по той же причине мясной порошок — это безусловный стимул (БУС). Эту процедуру повторяют несколько раз: свет, затем пища, свет, затем пища и так далее. После этого, чтобы проверить, научилась ли собака ассоциировать свет с пищей, экспериментатор включает свет, но не подает никакого мясного порошка. Если у собаки выделяется слюна, значит, она научилась этой ассоциации. Такое слюноотделение является условной реакцией (УР), а свет в данном случае — условным стимулом (УС) (таб. 7.1).

Таблица 7.1. Элементы классического обуславливания


Безусловный стимул (БУС)

Стимул, автоматически вызывающий реакцию, как правило, рефлекторную, без предварительного обуславливания

Безусловная реакция (БУР)

Первоначальная реакция на безусловный стимул, используемая в качестве базиса выработки обусловленной реакции на ранее нейтральный стимул

Условный стимул (УС)

Ранее нейтральный стимул, начинающий вызывать условную реакцию благодаря ассоциациям с безусловным стимулом

Условная реакция (УР)

Заученная или приобретенная реакция на стимул, первоначально не вызывавший реакции

Эту собаку научили, или обусловили, ассоциировать свет с пищей и реагировать на него выделением слюны. Схема эксперимента Павлова показана на рис. 7.1.


Рис. 7.1. Схема классического обусловливания. Ассоциация между безусловным стимулом и безусловной реакцией существует в начале эксперимента, и ее не надо заучивать. Ассоциация между условным и безусловным стимулами заучивается. Она возникает путем парного предъявления условного и безусловного стимулов (может быть также заучена ассоциация между условным стимулом и условной реакцией).

Варианты эксперимента. С годами психологи разработали множество вариантов павловского эксперимента. Чтобы оценить эти варианты, укажем на некоторые важные аспекты эксперимента с обусловливанием. Каждое парное предъявление условного стимула (УС) и безусловного стимула (БУС) называется пробой. Пробы, во время которых испытуемый научается ассоциировать эти два стимула, называют стадией приобретения. Говорят, что во время этой стадии повторные предъявления пары УС (свет) и БУС (пища) усиливают, или подкрепляют, ассоциацию между двумя стимулами, как показывает левая кривая на рис. 7.2. Если эта реакция не подкрепляется (БУС неоднократно пропускается), реакция будет постепенно уменьшаться; это называется угасанием и показано правой кривой на рис. 7.2.


Рис. 7.2. Приобретение и угасание условной реакции. Левая кривая отражает стадию приобретения в эксперименте. Количество капель слюны, выделяемой в ответ на условный стимул (до предъявления БУС), показано на вертикальной оси; количество проб — на горизонтальной оси. После всех проб приобретения экспериментатор переходит к стадии угасания; результаты показаны на кривой справа (по: Pavlov, 1927).

Понятия приобретения и угасания создают интуитивное ощущение, что мы рассматриваем классическое обусловливание как научение предсказанию того, что произойдет дальше. (Это — ядро когнитивного подхода к обусловливанию, который мы рассмотрим позднее.) Когда предсказание успешно (т. е. подкреплено), животное научается и далее делать такое предсказание (т. е. имеет место приобретение); когда внешняя ситуация меняется так, что предсказание устаревает (не подкрепляется), животное научается его тормозить (угасание).
Обусловливание у разных видов. Классическое обусловливание распространяется на царство животных и может происходить у таких примитивных организмов, как плоские черви. Плоские черви сокращают свое тело, когда их раздражают слабым электрическим током, и если они прошли через достаточное количество сочетаний электрических ударов (БУС) со светом (УС), то со временем они будут сокращаться в ответ только на свет (Jacobson, Fried, Horowitz, 1967). Множество реакций у человека также можно классически обусловливать. Большинство таких реакций — непроизвольные. Для иллюстрации рассмотрим тяжелое положение раковых больных, проходящих химиотерапию с целью остановить рост опухоли. При химиотерапии пациентам делаются инъекции токсических веществ, в результате чего у них часто возникает тошнота. После нескольких сеансов химиотерапии пациентов иногда начинает тошнить, и им становится плохо, когда они еще только входят в процедурную. Неоднократное парное сочетание химиотерапии (БУС) и вида процедурной (УС) заставляет пациентов ассоциировать это помещение с химиотерапией, что приводит у них к ощущениям расстройства желудка еще до начала процедуры. Близкое явление возникает у маленьких детей, болеющих раком, когда перед сеансом химиотерапии им дают мороженое. Мороженое предназначалось для того, чтобы дети не так расстраивались перед предстоящей процедурой, но, увы, оно становится обусловленным ощущениями химиотерапии (теперь мороженое — это УС, а химиотерапия — БУС). В результате эти дети едва ли захотят есть мороженое даже вне ситуации химиотерапии (Bernstein, 1978).
<Рис. Плоские черви — примитивные плоские симметричные организмы, обладающие мягким телом, — часто используются в биологических экспериментах.>

Некоторые феномены и их применение

Открытие большого числа феноменов значительно укрепило всеобщность классического обусловливания и сделало его важным видом научения.
Обусловливание второго порядка. До сих пор в нашем рассмотрении обусловливания БУС всегда был биологически значимым — это были пища, холод или электрораздражитель. Однако силу БУС могут обретать и другие стимулы, если их последовательно сочетать с биологически значимыми БУСами. Вспомним пример с собакой, на которую воздействует свет (УС), после чего следует пища (БУС), и свет начинает вызывать условную реакцию. После того как у собаки выработан условный рефлекс, свет приобретает силу БУСа. Если теперь собаку поместить в обстановку, где на нее будет воздействовать звук, за которым в каждой пробе будет следовать свет (но не пища), то этот звук сам по себе со временем будет вызывать условную реакцию, хотя он никогда не сочетался с пищей. (Здесь должны быть также другие пробы, в которых свет снова сочетается с пищей; иначе первоначальная условная связь между светом и пищей угаснет.)
Существование такого обусловливания второго порядка значительно расширяет границы классического обусловливания, особенно у людей, для которых биологически значимые БУСы встречаются относительно часто. Теперь все, что надо для того, чтобы произошло обусловливание, — это сочетание одного стимула с другим, где последний сочетался предварительно с биологически значимым событием. Обратимся опять к примеру с химиотерапией. Предположим, что для пациента вид процедурной комнаты стал условным сигналом ощущений от химиотерапии (биологически значимым событием). Если пациенту неоднократно предъявлять нейтральный стимул, скажем, звук, за которым следует изображение процедурной, пациент может начать испытывать некоторые неприятные ощущения от одного только этого звука.
Генерализация и дифференцировка. После того как условная реакция стала ассоциироваться с определенным стимулом, эту же реакцию может вызывать другой стимул. Предположим, что у человека выработан условный рефлекс — средней силы эмоциональная реакция на звук камертона, соответствующий ноте "до" малой октавы. Уровень эмоциональности можно измерить по кожно-гальванической реакции (КГР): во время эмоционального напряжения изменяется электрическая активность кожи. У этого человека КГР будет меняться также в ответ на более низкий или более высокий тон без специального обусловливания (рис. 7.3). Чем больше новые стимулы похожи на первоначальный УС, тем вероятнее они будут вызывать условную реакцию. Этот принцип, называемый генерализацией, частично объясняет способность человека реагировать на новые стимулы, сходные с уже знакомыми.


Рис. 7.3. Градиент генерализации. Стимул 0 означает тональный звук, который первоначально служил условным сигналом кожно-гальванической реакции (КГР). Стимулы +1, +2 и +3 представляют тестовые звуки, высота тона которых возрастает; стимулы -1, -2 и -3 представляют звуки, высота тона которых убывает. Заметьте, что величина генерализации уменьшается с возрастанием разницы между тестовым и тренировочным тонами.

Процесс дифференцировки является комплементарным по отношению к генерализации. Если генерализация — реакция на сходство, то дифференцировка — реакция на различие. Условная дифференцировка вырабатывается посредством избирательного подкрепления, как показано на рис. 7.4. Например, вместо одного тона теперь есть два: тон меньшей высоты, УС-1, за которым всегда следует электрический удар, и тон большей высоты, УС-2, за которым ничего не следует. Первоначально у испытуемых КГР появляется на оба тона. В ходе обусловливания, однако, амплитуда условной реакции на УС-1 постепенно возрастает, а амплитуда реакции на УС-2 уменьшается. В ходе такого дифференциального подкрепления у испытуемых вырабатывается условная реакция различения этих двух тонов. Более высокий тон, УС-2, стал сигналом для торможения заученной реакции.


Рис. 7.4. Условная дифференцировка. Дифференцировочными стимулами служили два звуковых тона, сильно различающиеся по частоте (УС1 = 700 Гц, УС2 = 3500 Гц). Безусловным стимулом служило электрическое раздражение левого указательного пальца только в тех пробах, в которых предъявлялся УС1. Сила условной реакции, в данном случае КГР, постепенно возрастала вслед за УС1 и угасала вслед за УС2 (по: Baer & Fuhrer, 1968).

Генерализация и дифференцировка происходят в повседневной жизни. Маленький ребенок, который научился ассоциировать вид своей комнатной собачки с игривостью, может поначалу относиться так ко всем собакам. Со временем, благодаря дифференциальному подкреплению, этот ребенок будет ожидать игривости только от собачек, похожих на его собственную. Вид угрожающей собаки будет тормозить реакцию приближения ребенка к ней.
Условный страх. Классическое обусловливание играет роль и в эмоциональных реакциях, таких как страх. Представим, что крысу помещают в закрытый ящик, в котором она периодически подвергается электрическому раздражению (путем электрификации пола). Как раз перед электрическим ударом раздается тональный сигнал. После неоднократного сочетания тона (УС) и удара током (БУС) тон сам по себе будет вызывать у крысы реакцию, являющуюся признаком страха, когда она перестает рыскать и притаивается; кроме того, у нее поднимается кровяное давление. У этой крысы был выработан условный страх при воздействии на нее того, что когда-то было нейтральным стимулом.
Начиная с плодотворного эксперимента Уотсона и Рэйнера (Watson & Rayner, 1920) стало известно, что у человека тоже можно выработать условный страх. Таким путем человек может приобрести множество страхов, особенно в раннем детстве (Jackobs & Nadel, 1985). Возможно, наилучшим свидетельством того, что это — классическое обусловливание, служит то, что некоторые из этих страхов, особенно иррациональные страхи — фобии, можно устранить психотерапевтическими методами, основанными на принципах классического обусловливания. Например, у человека, который сильно боится кошек, этот страх можно преодолеть путем постепенного и неоднократного предъявления ему кошек. Наверное, когда-то давно кот был у него условным стимулом для некоторых вредных безусловных стимулов, и теперь, когда этот человек неоднократно воспринимает такой УС при отсутствии БУС, этот обусловленный страх угасает. Заметьте, что если бы этого человека не лечили, он бы просто избегал кошек; следовательно, угасания не произошло бы и его фобия сохранилась бы. (Обсуждение обусловливания в связи с фобиями см в гл. 15, а в связи с терапией — в гл. 16.)

Предсказуемость и когнитивные факторы

До сих пор мы анализировали классическое обусловливание только применительно к внешним или окружающим событиям: за одним стимулом регулярно следует другой, и организм начинает их связывать между собой. Хотя этот бихевиористский взгляд доминировал много лет, уже давно находились исследователи, утверждавшие, что решающий фактор, который стоит за обусловливанием, — это то, что животное знает (Tolman, 1932). Согласно этому когнитивному взгляду, классическое обусловливание дает организму новое знание о связи между двумя стимулами; при наличии УС он научается ожидать БУС. Далее мы рассмотрим роль когнитивных факторов в классическом обусловливании.
Одновременность или предсказуемость? Со времен Павлова исследователи пытались определить, какой фактор для классического обусловливания является главным. Павлов полагал, что решающим фактором является совпадение УС и БУС во времени, то есть эти два стимула должны появиться близко по времени, чтобы выработалась ассоциация. Однако для совпадения по времени как основного фактора классического обусловливания есть альтернатива: необходимо, чтобы УС был надежным предвестником БУС. Другими словами, чтобы произошло обусловливание, БУС должен появляться с большей вероятностью при предъявлении УС, чем при его отсутствии.
В одном важном эксперименте (Rescorla, 1967) одновременность сопоставлялась с предсказуемостью. В некоторых пробах собак раздражали электрическим током (БУС), а в каких-то из этих проб электрическому удару предшествовал звуковой сигнал (УС). Процедуры для двух экспериментальных групп показаны на рис. 7.5. Число совпадающих по времени пар из звука и удара током в обеих группах было равным. Независимой переменной в группе А был звук, появлявшийся перед каждым электрическим ударом, а в группе Б наличие или отсутствие звукового сигнала перед таким ударом было равновероятно, так что звук здесь не имел реальной предсказующей силы. Предсказующая сила звука оказалась решающей: в группе А условный рефлекс сформировался быстро, а в группе Б — нет (это определялось по тому, реагирует или нет собака на звук так, как если бы она хотела избежать удара током). В других группах этого эксперимента (на рис. 7.5 не показаны) сила обусловливания была непосредственно связана с предсказательной ценностью УС, сигнализирующего о появлении БУС. Последующие эксперименты подтверждают вывод, что отношение предсказания между УС и БУС важнее, чем совпадение их по времени или частота парного предъявления УС и БУС (Rescorla, 1972).


Рис. 7.5. Эксперимент Рескорлы. На схеме показаны условия для двух экспериментальных групп. В каждой группе было 16 проб. Заметьте, что в некоторых пробах за УС следует БУС (УС + БУС); в некоторых пробах УС и БУС предъявляются по одному, а в некоторых нет ни УС, ни БУС. В правой части схемы показано число разных событий для двух групп. Количество проб с событием УС+БУС одинаково в обеих группах, как и количество проб, в которых предъявляется только УС. Различаются эти две группы количеством проб, в которых появляется только БУС (в группе А — никогда, в группе Б — с той же частотой, что и остальные типы проб). Таким образом, в группе А экспериментатор создал ситуацию, в которой звук являлся неплохим (хотя и несовершенным) предвестником скорого появления удара током, тогда как в группе Б звук не имел предсказательной ценности в отношении последующего удара. Условная реакция на УС легко выработалась в группе А и вообще не сформировалась в группе Б.

То, что делала собака в предыдущем эксперименте, можно сравнить с обычным действием ученого. Встречаясь с вероятностью важного отрицательного явления, например грозовой бури, ученый-метеоролог пытается отыскать что-либо, что предвещало бы это явление. Это не может быть просто что-то из того, что происходит одновременно с грозой, потому что такому критерию удовлетворяет множество безобидных событий (например, тучи и даже наличие деревьев). Метеоролог должен найти события, предвещающие грозу в том смысле, что они происходят перед грозой, но не происходят в другое время. Сходным образом, когда собаке в предшествующем эксперименте приходилось иметь дело со значимым отрицательным явлением в виде удара током, она тоже пыталась найти какое-то предупреждающее его событие. И подобно метеорологу, эта собака не обращается к событиям, которые просто происходят одновременно с ударом (например, вид экспериментальной установки или звук в экспериментальной группе Б); собака отыскивает явление, которое происходит всякий раз перед ударом, но не происходит в другое время (звук в экспериментальной группе А) и, следовательно, действительно предупреждает об ударе током.
Предсказуемость и эмоции. Предсказуемость важна также для эмоциональных реакций. Если определенный УС надежно предвещает наступление боли, то отсутствие этого УС предупреждает, что боли не будет и организму можно расслабиться. Следовательно, УС — это сигнал «опасности», а его отсутствие — сигнал «безопасности». Когда такие сигналы неустойчивы, эмоциональные издержки организма могут стать разорительными. Когда у крыс есть надежный предвестник грядущего удара током, они реагируют страхом только при наличии сигнала опасности; если же надежного предвестника у них нет, они непрерывно беспокоятся и у них даже может развиться язвенная болезнь (Seligman, 1975).
Здесь отчетливо видны параллели с эмоциями человека. Если зубной врач дает ребенку сигнал опасности, предупреждая, что сейчас будет больно, ребенку будет страшно, только пока процедура не кончится. Напротив, если зубной врач всегда говорит, что «больно не будет», хотя на самом деле иногда бывает больно, ребенок, не имея сигналов опасности и безопасности, может испытывать сильное беспокойство при каждом появлении зубного врача в кабинете. Во взрослом возрасте многие из нас переживали беспокойство, находясь в потенциально опасной ситуации, где не было предостерегающих сигналов. Неприятные события по определению неприятны, но неприятные и непредсказуемые события уж совсем непереносимы (этот момент подробнее обсуждается в гл. 14).
<Рис. Если знаешь, когда будет больно, беспокойство снижается.>

Биологические ограничения

В этой главе мы уже упоминали о том, что разные биологические виды научаются одному и тому же при помощи различных механизмов. Относящиеся сюда феномены были открыты этологами — биологами и психологами, изучающими поведение животных в естественном окружении. Эти феномены говорят о том, что то, чему организм может научиться путем обусловливания, определяется его биологическим устройством.
Этологический подход. Этологов, как и бихевиористов, интересует поведение животных, но они уделяют большее внимание не научению, а эволюции и генетике. Поэтому этологи придерживаются иного подхода к научению, полагая, что оно жестко ограничено генетическими задатками животного и что разные виды научаются одним и тем же вещам разными способами. (С другой стороны, ранние бихевиористы полагали, что законы научения у всех видов одинаковы.) Как отмечают этологи, когда животное учится, оно подчиняется генетически заданному «поведенческому проекту»; так же как архитектурный проект накладывает ограничения на те функции, которым может служить здание, так и поведенческий проект генетически ограничивает виды ассоциаций, которым организм может научиться. То есть животные предпрограммированы заучивать определенные вещи определенными способами.
Ограничения в классическом обусловливании. Некоторые наиболее яркие демонстрации ограничений в классическом обусловливании получены в исследованиях вкусового отвращения. В типичном эксперименте крысе дают пить раствор с добавкой, скажем, ванили. Выпив его, крыса слегка отравляется и заболевает. Когда крыса выздоравливает, ей опять предлагают ванильный раствор. Теперь крыса добросовестно избегает этого раствора, поскольку она научилась ассоциировать вкус ванили с болезненным состоянием. Довольно очевидно, что такое избегание — пример классического обусловливания: первоначальный вкус раствора — это УС, болезненные ощущения — это БУС, а после обусловливания вкус сигнализирует о возможном наступлении болезни.
Согласно ранним идеям бихевиористов, можно было бы ожидать, что свет или звук выполняет ту же сигнальную функцию, что и вкус. То есть если свет — столь же эффективный стимул, как и вкус, то ассоциацию между светом и болезненным ощущением выработать ничуть не труднее, чем ассоциацию между вкусом и болезненным ощущением. Но на самом деле оказывается иначе. Это было показано в эксперименте, представленном в табл. 7.2. На первом этапе экспериментальной группе крыс дают лизать трубку, содержащую раствор с добавкой; каждый раз, когда крыса лижет трубку, предъявляются щелчок и свет. Так крыса ощущает три стимула одновременно — вкус раствора, а также свет и щелчок. На втором этапе этих же крыс слегка отравляют. Вопрос: какие стимулы — вкус или свет + щелчок — будут ассоциироваться с болезненным ощущением? Чтобы ответить на него, на третьем, и последнем, этапе крысам экспериментальной группы снова дают ту же трубку; иногда у раствора в трубке тот же вкус, что и раньше, но нет света и щелчка, а иногда раствор безвкусный, но свет и щелчок предъявляются. Животные избегают раствора, когда они ощущают его вкус, а не при предъявлении пары свет + звук; следовательно, крысы ассоциировали с болезнью только вкус. Как показывает контрольный эксперимент, представленный в нижней части табл. 7.2, эти результаты нельзя приписать тому, что вкус — более сильный УС, чем свет + щелчок. На втором этапе крысам контрольной группы вместо мягкой отравы давали удар током. Контрольные крысы на заключительном этапе эксперимента избегали раствора только тогда, когда предъявлялся свет + щелчок, а не когда они ощущали только вкус (Garcia & Kolling, 1966).

Таблица 7.2. Эксперимент по ограничениям и вкусовому отвращению

 

Этап 1

Этап 2

Этап 3

Экспериментальная группа

Вкус и свет+щелчок

Болезненное ощущение

вкус —> избегать
свет+щелчок —> не избегать

Контрольная группа

Вкус и свет+щелчок

Удар током

вкус — > не избегать
свет+щелчок —> избегать

План эксперимента, показывающего, что вкус — более сильный сигнал для болезненного ощущения, чем для удара током, тогда как свет+щелчок — более сильный сигнал для удара током, чем для болезненного ощущения (по: Garcia & Koelling, 1966).

Таким образом, вкус — более сильный сигнал для болезненного ощущения, чем для удара током, а свет + щелчок — более сильный сигнал для удара током, чем для болезненного ощущения. Почему существует такая избирательность ассоциаций? Она не согласуется с представлениями раннего бихевиоризма, что стимулы равной силы могут заменять друг друга; поскольку и вкус, и свет + щелчок могут стать эффективным УС и поскольку после проявления болезненных ощущений и раздражения от удара током и то и другое могут стать эффективным БУС, то любой из этих УС мог бы ассоциироваться с любым из БУС. Напротив, избирательность ассоциирования прекрасно согласуется с этологическим подходом и его акцентом на эволюционной адаптации животных к своему окружению. В естественных условиях обитания крысы (как и другие млекопитающие) при выборе пищи полагаются на вкус. Следовательно, может существовать генетически предопределенная, или «встроенная», связь между вкусом и пищеварительными реакциями, что благоприятствует ассоциации между вкусом и болезненными ощущениями, но не между светом и болезнью. Кроме того, в естественном окружении крысы боль, возникающая в результате таких внешних факторов, как холод или ранение, всегда вызывается внешними стимулами. Следовательно, может существовать встроенная связь между внешними стимулами и «внешней болью», благоприятствующая ассоциации между светом и ударом током, но не между вкусом и ударом током.
Если крысы научаются ассоциировать вкус с болезненными ощущениями потому, что это согласуется с их естественными способами выбора пищи, то, может быть, другим видам с иными способами выбора пищи будет трудно научиться ассоциировать вкус с болезненными ощущениями? Именно это и происходит. В естественных условиях птицы выбирают пищу по внешнему виду, а не по вкусу, и они легко научаются ассоциировать свет с болезнью, но не вкус с болезнью (Wilcoxin, Dragoin & Kral, 1971). Таким образом, здесь мы видим прекрасный пример того, как разные виды научаются одному и тому же (причине заболевания) различными способами. Короче, если мы хотим знать, что и чем можно обусловливать, нельзя брать УС и БУС порознь; мы должны рассмотреть их в сочетании и выяснить, насколько хорошо оно соответствует встроенным взаимосвязям. Такой вывод значительно отличается от того, что законы научения одинаковы для всех видов и ситуаций.

 

Оперантное обусловливание

В классическом обусловливании условная реакция часто напоминает обычную реакцию на безусловный стимул. Слюноотделение, например, — нормальная реакция собаки на пищу. Но если вы хотите научить организм чему-то новому, например научить собаку новому трюку, классическое обусловливание вам не поможет. Какой безусловный стимул заставит собаку сидеть или перекатываться? Чтобы обучить собаку, вам придется сначала убедить ее проделать нужный трюк, а потом вознаградить ее похвалой или пищей. Если продолжать такжелать, собака со временем научится этому трюку.
Многое из поведения в реальной жизни похоже на это: реакциям научаются потому, что они действуют, или воздействуют на окружение. Такой тип научения, называемый оперантным обусловливанием, свойствен и человеку, и животным. Оставленный один в кроватке, ребенок может спонтанно брыкаться, вертеться или лопотать. Собака, оставшись одна в комнате, может метаться взад-вперед, что-то вынюхивать, может подобрать мячик, уронить его или поиграть с ним. Ни один организм не реагирует на появление или исчезновение конкретного внешнего стимула. Все они воздействуют на свое окружение. Но если организм уже осуществляет определенное поведение, вероятность того, что он повторит это действие, зависит от того, что следует за последним. Ребенок будет чаще лопотать, если за каждым таким действием следует родительское внимание, и собака будет чаще поднимать мячик, если за этим следует ласка или вознаграждение пищей. Если считать, что у ребенка есть цель вызвать родительское внимание, а у собаки цель — пища, то оперантное обусловливание сводится к научению тому, что определенное поведение ведет к достижению определенной цели (Rescorla, 1987).

Закон эффекта

Изучение оперантного обусловливания началось на рубеже нашего века с ряда экспериментов Торндайка (Е. L. Thorndike, 1898). Торндайк, на которого сильно повлияла дарвиновская теория эволюции, стремился показать, что научение у животных неотрывно от научения у человека. Типичный эксперимент проходил так. Голодного кота сажали в клетку, дверца которой была закрыта на простую задвижку, а совсем рядом с клеткой клали кусочек рыбы. Поначалу кот пытался добраться до рыбы, протягивая лапы между прутьев. Когда это не получалось, кот перемещался по клетке, предпринимая самые разные действия. В какой-то момент он случайно задевал задвижку, выходил на свободу и съедал рыбу. Затем кота сажали обратно в клетку и бросали снаружи новый кусочек рыбы. Кот совершал примерно ту же последовательность действий, пока ему опять не удавалось открыть задвижку. Эта процедура повторялась снова и снова. Продолжая пробы, кот отбрасывал многие бесполезные действия, постепенно достигая удачного открывания задвижки и выхода на свободу, как только его помещали в клетку. Этот кот научился открывать задвижку, чтобы получить пищу.
Все это выглядит так, как будто кот действует разумно, но Торндайк утверждал, что здесь присутствует мало «интеллекта». За все время не было такого момента, чтобы у кота появилась догадка о решении этой задачи. Вместо этого достижения кота постепенно улучшались с продолжением проб. Кот не догадывается, а просто ведет себя по типу проб и ошибок, и когда после совершения какого-то действия немедленно следует вознаграждение, научение этому действию закрепляется. Это закрепление Торндайк называл законом эффекта. Он утверждал, что при оперантном научении в силу закона эффекта из набора случайных реакций выбирается та, за которой идут положительные последствия. Этот процесс сходен с эволюцией, в которой закон выживания самого приспособленного выбирает из набора случайных вариаций вида именно те изменения, которые способствуют выживанию этого вида. Закон эффекта, таким образом, провозглашает выживание самых приспособленных реакций (Schwartz, 1989).

Эксперименты Скиннера

Б. Ф. Скиннер — виновник целого ряда изменений в представлениях о том, что такое оперантное обусловливание и как его изучать. Его метод исследования оперантного обусловливания был проще, чем у Торндайка (например, использовалась только одна реакция), и стал широко принятым.
<Рис. Б. Ф. Скиннер явился основоположником изучения оперантного обуславливания.>
Вариации эксперимента. В эксперименте Скиннера голодное животное (обычно крысу или голубя) помещают в ящик, подобный изображенному на рис. 7.6, с популярным названием «ящик Скиннера».

Рис. 7.6. Устройство для оперантного обусловливания. На фото показан ящик Скиннера с кассетой для подачи пищевых шариков. Компьютер используется для управления экспериментом и регистрации реакций крысы.

Ящик внутри пуст, если не считать выступающего рычага, под которым стоит тарелка для еды. Небольшая лампочка над рычагом может включаться по усмотрению экспериментатора. Оставленная одна в ящике, крыса передвигается и исследует его. Случайно она обнаруживает рычаг и нажимает на него. Частота, с которой крыса вначале нажимает на рычаг, — фоновый уровень. После установления фонового уровня экспериментатор запускает в действие кассету с пищей, расположенную снаружи ящика. Теперь каждый раз, когда крыса нажимает на рычаг, небольшой шарик пищи выпадает в тарелку. Крыса съедает его и вскоре снова нажимает на рычаг; пища подкрепляет нажатие на рычаг, и частота нажатий стремительно растет. Если кассету с пищей отсоединить, так что при нажатии на рычаг пища больше не подается, частота нажатий будет уменьшаться. Следовательно, оперантно обусловленная реакция (или просто операнта) при неподкреплении угасает точно так же, как и классически обусловленная реакция. Экспериментатор может установить критерий дифференцировки, подавая пищу только тогда, когда крыса нажимает на рычаг при горящей лампочке, и тем самым вырабатывая условную реакцию у крысы путем избирательного подкрепления. В этом примере свет служит дифференцировочным стимулом, который контролирует реакцию.
Итак, оперантное обусловливание повышает вероятность некоторой реакции, когда определенное поведение сопровождается подкреплением (обычно в виде пищи или воды). Поскольку в ящике Скиннера рычаг присутствует всегда, крыса может нажимать на него так часто или не часто, как сама выберет. Таким образом, частота реакции служит удобной мерой силы операнты: чем чаще совершается реакция за данный временной интервал, тем больше ее сила.
Следует указать на отношение между терминами «вознаграждение» и «наказание», с одной стороны, и «положительное» и «отрицательное подкрепление», с другой. Термин «вознаграждение» может использоваться синонимично с термином «положительный подкрепляющий фактор» — событие, которое увеличивает вероятность той или иной формы поведения, если оно следует за данной формой поведения. Однако наказание — это не то же самое, что отрицательный подкрепляющий фактор. Термин «отрицательное подкрепление» означает прекращение наступления нежелательных событий, следующих за той или иной формой поведения; как и положительное подкрепление, оно увеличивает вероятность соответствующей формы поведения. Наказание же имеет противоположный эффект: оно уменьшает вероятность наказуемого поведения. Наказание также может быть как положительным (воздействие неприятного стимула), так и отрицательным (лишение положительного стимула) (см. табл. 7.3).

Таблица 7.3. Типы подкрепления и наказания


Тип

Определение

Эффект

Пример

Положительное подкрепление

Приятный стимул, следующий за желательной формой поведения

Увеличивает вероятность желательной формы поведения

Высокая оценка на экзамене

Отрицательное подкрепление

Прекращение воздействия неприятного стимула вслед за желательной формой поведения

Увеличивает вероятность желательной формы поведения

Разрешение ребенку пойти погулять после того, как он прекратил истерику

Положительное наказание

Воздействие неприятного стимула вслед за нежелательной формой поведения

Уменьшает вероятность нежелательной формы поведения

Низкая оценка на экзамене

Отрицательное наказание

Прекращение воздействия приятного стимула вслед за нежелательной формой поведения

Уменьшает вероятность нежелательной формы поведения

Запрещение смотреть телевизор ребенку, который плохо себя ведет

Применение к воспитанию детей. Хотя в оперантном обусловливании любимыми экспериментальными животными были крысы и голуби, оно применимо ко многим биологическим видам, включая нас самих. Действительно, оно может многое сказать нам о воспитании детей. Особенно ярким примером этому служит такой случай. У маленького мальчика были вспышки гневного раздражения, если он не получал достаточно внимания от родителей, особенно перед сном. Поскольку родители рано или поздно откликались, проявляемое ими внимание подкрепляло гнев ребенка. Чтобы снять эту гневную раздражительность, родителям посоветовали выполнять обычный ритуал укладывания спать, а затем игнорировать протесты ребенка, хотя это и может быть болезненно. При воздержании от подкрепления (уделения внимания) вспышки гнева должны угасать; именно это и произошло. Всего за 7 дней время, в течение которого этот ребенок плакал в постели, сократилось с 45 минут до нуля (Williams, 1959).
<Рис. Склонность детей к истерикам можно ослабить, если их поведение не подкреплять родительским вниманием.>
Еще одно применение оперантного обусловливания к воспитанию детей касается временного соотношения между реакцией и ее подкреплением. Лабораторные эксперименты показали, что немедленное подкрепление более эффективно, чем задержанное; чем больше времени проходит между оперантной реакцией и подкреплением, тем меньше сила реакции. Многие специалисты по психологии развития отмечали, что задержка подкрепления — важный фактор ухода за маленькими детьми. Если ребенок по-доброму относится к домашнему животному, его действия лучше всего можно закрепить вознаграждением (похвалой, например) немедленно, не откладывая это на потом. Сходным образом, если ребенок бьет кого-либо без провокации в свой адрес, то такое агрессивное поведение будет исключено с большей вероятностью, если его наказать немедленно, не откладывая на потом.
Формирование. Предположим, вы хотите использовать оперантное обусловливание, чтобы научить вашу собаку трюку — например, нажимать носом на звонок. Вы не можете ждать, пока собака сделает это сама собой (и тогда подкрепить это), поскольку ждать можно вечно. Если требуемое поведение действительно новое, вы должны обусловить его, используя преимущество естественных вариации в действиях животного. Чтобы научить собаку нажимать звонок носом, можно давать ей пищевое подкрепление каждый раз, когда она приближается к зоне звонка, заставляя ее с каждым подкреплением подходить ближе и ближе к нужному месту, пока наконец нос собаки не коснется звонка. Такая техника, когда подкрепляются только те отклонения в реакциях, которые нужны экспериментатору, называется формированием поведения животного.
Применяя метод формирования, животных можно научить отрабатывать трюки и последовательности действий. Два психолога с сотрудниками подготовили тысячи животных многих видов для телевизионных шоу, рекламы и окружных ярмарок (Breland & Breland, 1966). В одном популярном шоу участвовала «Присцилла, привередливая свинка». Присцилла включала телевизор, ела завтрак за столом, подбирала грязную одежду и клала ее в. корзину, пылесосила пол, выбирала свою любимую еду (среди продуктов, конкурирующих с продукцией ее спонсора!) и принимала участие в викторине, отвечая на вопросы аудитории нажатием на выключатели лампочек, показывавших «да» или «нет». Она не была особо одаренной свиньей: на самом деле, поскольку свиньи растут очень быстро, новую «Присциллу» готовили каждые 3-5 месяцев. Подлинной изобретательностью отличались все же не свиньи, а экспериментаторы, которые использовали оперантное обусловливание и формировали поведение, чтобы добиться желаемого результата. Путем формирования оперантных реакций голубей тренировали находить людей, потерявшихся в море (рис. 7.7), а морских свинок тренировали находить подводное оборудование.
<Рис. Оперантное обусловливание и формирование поведения используются в дрессировке животных для обучения их выполнению различного рода трюков.>

Рис. 7.7 Поиск и спасение с помощью голубей. Береговая охрана использовала голубей для поиска людей, потерявшихся в море. Применяя методы формирования, голубей тренировали распознавать оранжевый цвет — международный цвет спасательных жакетов. Три голубя пристегнуты в ящике из оргстекла, прикрепленном к днищу вертолета. Ящик поделен на секции, так что каждая птица смотрит в своем направлении. Когда голубь обнаруживает оранжевый объект или любой другой объект, он клюет ключ, и у пилота звенит звонок. Тогда пилот разворачивается в направлении, указанном среагировавшей птицей. Для обнаружения удаленных объектов в море голуби подходят больше, чем люди. Они могут смотреть на воду в течение долгого времени, не страдая от усталости глаз: у них превосходное цветовое зрение, а зона фокусировки у них 60-80 градусов, тогда как у человека — 2-3 градуса (по: Simmons, 1981).

Феномены и их применение

Существует ряд явлений, значительно расширяющих сферу действия оперантного обусловливания и указывающих на возможное его применение к поведению человека.
Условное подкрепление. Большинство из рассмотренных нами подкреплений называются первичными, поскольку, как и пища, они удовлетворяют основные потребности. Если бы оперантное обусловливание происходило только с первичными подкреплениями, оно не было бы таким распространенным в нашей жизни, поскольку первичные подкрепления не столь часты. Однако практически любой стимул может стать вторичным, или условным, подкреплением, если его последовательно сочетать с первичным подкреплением; условные подкрепления значительно расширяют диапазон оперантного обусловливания (так же как обусловливание второго порядка значительно расширяет диапазон классического обусловливания).
Небольшая вариация типичного эксперимента по оперантному обусловливанию иллюстрирует работу условного подкрепления. Когда крыса в ящике Скиннера нажимает на рычаг, моментально звучит тон, за которым вскоре дается пища (пища — первичное подкрепление; звук станет условным подкреплением). После того как у животного выработалась условная реакция, экспериментатор переходит к ее угашению, так что когда крыса нажимает на рычаг, не появляется ни пищи, ни звука. Через какое-то время крыса перестает нажимать на рычаг. Затем возобновляется звук, но не пища. Когда животное обнаруживает, что при нажатии рычага включается звук, частота нажатий заметно возрастает, преодолевая угасание, хотя никакой еды за этим не следует. Звук приобрел качество подкрепления сам по себе путем классического обусловливания; устойчиво сочетаясь с пищей, он сам стал сигналом пищи.
Наша жизнь изобилует условными подкреплениями. Доминируют из них два: деньги и похвала. Предположительно, деньги являются сильным подкреплением потому, что они часто сочетаются с первичными подкреплениями: можно купить пищу, выпивку, удобства — это только несколько очевидных примеров. И похвала — даже без обещания первичного подкрепления — может во многом поддерживать деятельность.
<Рис. Похвала является эффективным подкрепляющим фактором для многих людей.>
Генерализация и дифференцировка. То, что было верно для классического обусловливания, верно и для оперантного: организмы генерализуют то, что они выучили, и генерализацию можно ограничить тренировкой на дифференцировку. Если родители подкрепляют маленького ребенка за ласкание домашней собачки, он вскоре генерализует эту реакцию ласки на других собак. Поскольку это может быть опасно (соседская собачка может оказаться свирепым сторожевым псом), родители ребенка могут провести некоторую дифференцировочную тренировку, так чтобы он ласкал свою собаку, но не соседскую.
Дифференцировочная тренировка будет эффективна в той степени, в какой присутствует дифференцируемый стимул (или набор стимулов), позволяющий четко отличать случаи, где реакция должна иметь место, от случаев, где ее нужно подавить. Вышеупомянутому маленькому ребенку будет легче научиться, какую собаку ласкать, если его родители смогут указать на признак собаки, сигнализирующий о ее дружественности (виляние хвостом, например). Вообще, дифференцировочный стимул будет полезен в той степени, в какой его присутствие предсказывает, что за реакцией последует подкрепление, а его отсутствие предсказывает, что за реакцией подкрепления не последует (или наоборот). Так же, как и в классическом обусловливании, предсказательная сила стимула имеет решающее значение для обусловливания.
Режимы подкрепления. В реальной жизни отдельные эпизоды поведения подкрепляются редко; иногда за усердную работу хвалят, но часто она остается непризнанной. Если бы оперантное обусловливание происходило только при постоянном подкреплении, его роль в нашей жизни была бы ограниченной. Оказывается, однако, что после того как поведение возникло, оно может поддерживаться, если его подкреплять только часть всего времени. Это явление известно как частичное подкрепление, и его можно проиллюстрировать в лаборатории на примере голубя, который научается клевать ключ, чтобы получать пищу. После того как эта операнта сформировалась, голубь продолжает клевать ключ с высокой частотой, даже если он получает подкрепление только от случая к случаю. Иногда голуби, вознаграждавшиеся пищей в среднем один раз за 5 минут (12 раз в час), клевали ключ 6000 раз в час! Кроме того, угасание, следующее за поддержанием реакции на частичное подкрепление пищей, идет гораздо медленнее, чем угасание, следующее за поддержанием реакции на непрерывное подкрепление. Это явление известно как эффект частичного подкрепления. Данный эффект понятен на чисто интуитивном уровне, поскольку если подкрепление для поддержания реакции является лишь частичным, случаи угасания и поддержания реакции труднее отличить друг от друга.
Когда подкрепление осуществляется только часть всего времени, нам нужно знать, каков в точности его распорядок: после каждой третьей реакции? или каждые пять секунд? Оказывается, что режим подкрепления определяет схему реагирования. Некоторые расписания подкрепления называют пропорциональным режимом, потому что при этом подкрепление зависит от числа совершенных реакций. Это как на заводе, когда рабочему платят за определенный объем работы. Коэффициент пропорциональности может быть фиксированным или переменным. При режиме с фиксированной пропорцией (его называют режимом ФП) число реакций, которые должны совершиться, равно определенной величине. Если это число составляет 5 (ФП 5), то это значит, что подкрепление последует по совершении 5 реакций, если оно равно 50 (ФП 50), потребуется совершить 50 реакций, и т. д. Вообще, чем выше пропорция, тем с большей частотой организм реагирует, особенно если его первоначально тренировали при относительно низком коэффициенте (скажем, ФП 5), а затем непрерывно увеличивали коэффициент до величины, скажем, ФП 100. Это как если бы на заводе рабочему сначала платили по 5 долларов за каждые 5 зашитых швов, но потом настали тяжелые времена, и ему пришлось за те же 5 долларов делать 100 швов. Но, пожалуй, самая примечательная особенность поведения при режиме с ФП состоит в том, что сразу после очередного подкрепления в росте реакций наступает пауза (см. левую часть рис. 7.8). Заводскому рабочему трудно начать новую серию швов сразу после того, как он сделал их достаточно, чтобы получить вознаграждение.


Рис. 7.8. Типичные схемы реакций на четыре основные режима подкрепления. Каждая кривая отображает совокупное число реакций животного в зависимости от времени; наклон кривой отражает частоту его реакций. Кривые слева относятся к пропорциональному режиму. Обратите внимание на горизонтальные участки кривой для режима с ФП: они соответствуют паузам (нет роста совокупного числа реакций). Кривые справа отображают условия интервального режима. Кривая для режима с фиксированным интервалом (ФИ) опять содержит горизонтальные участки, соответствующие паузам (по: Schwartz, 1989). ФП — фиксированная пропорция; ПП — переменная пропорция, ФИ — фиксированный интервал; ПИ — переменный интервал.

При режиме с переменной пропорцией (ПП) подкрепление также дается после совершения определенного количества реакций, но их число варьируется непредсказуемо. Так, при режиме ПП 5 количество реакций, требуемых для подкрепления, иногда составляет 1, иногда 10, а в среднем 5. В отличие от поведения при режиме с ФП, при режиме с ПП не наблюдается пауз в росте реакций (см. левую часть рис. 7.8), предположительно потому, что у организма нет возможности определить, что подкрепление появится нескоро. Хороший пример режима с ПП в повседневной жизни — работа игрового автомата. Количество реакций (игр), необходимое для выдачи подкрепления (выигрыша), все время меняется, и у игрока нет способа предсказать, когда последует подкрепление. Режим ПП может порождать очень высокую частоту реакций (как, видимо, и рассчитали владельцы казино).
Помимо пропорциональных существуют интервальные режимы, в которых подкрепление выдается только по прошествии определенного времени. Такие режимы тоже бывают фиксированными и переменными. При фиксированном интервале (ФИ) организм получает подкрепление за первую реакцию по прошествии определенного времени с момента ее последнего подкрепления. Например, при режиме ФИ 2 (2 минуты) подкрепление дается только по истечении 2 минут после последней подкрепленной реакции; реакции в течение этого двухминутного интервала проходят без последствий. Особенность реагирования при режиме ФИ — пауза, возникающая сразу после подкрепления (она может быть даже длиннее, чем пауза при режиме ФП). Еще одна особенность реагирования при режиме ФИ — это возрастание частоты реакций по мере приближения окончания периода (см. правую часть рис. 7.8). Хороший пример режима ФИ в повседневной жизни — доставка почты, которая приходит только раз в день (ФИ 24 часа) или, в некоторых местах, дважды в день (ФИ 12 часов). Так, сразу после доставки почты вы не будете ее проверять снова (у вас пауза), но по мере приближения окончания интервала доставки почты вы снова начинаете ее проверять.
При режиме с переменным интервалом (ПИ) вознаграждение все еще зависит от прошествия определенного интервала, но его длительность колеблется непредсказуемо. При расписании ПИ 10 (10 минут), например, критический интервал иногда может быть 2 минуты, иногда 20 и т. д. при средней величине 10 минут. Если при режиме ФИ частота реакций меняется, то при режиме ПИ 1 организмы реагируют с одинаково высокой частотой (см. правую часть рис. 7.8). В качестве примера режима ПИ в повседневной жизни можно привести дозванивание по занятому номеру. Чтобы получить подкрепление (дозвониться), надо подождать какое-то время после последней реакции (набора номера); сколько придется ждать в целом — непредсказуемо (см. табл. 7.4).

Таблица 7.4. Режимы подкрепления


Пропорциональные режимы

Режим с фиксированной пропорцией

Подкрепление дается после определенного количества реакций

Режим с переменной пропорцией

Подкрепление дается после определенного количества реакций, количество которых непредсказуемо варьируется

Интервальные режимы

Режим с фиксированным интервалом

Подкрепление дается через определенное время, прошедшее после предыдущего подкрепления

Режим с переменным интервалом

Подкрепление дается через определенное время, прошедшее после предыдущего подкрепления, при этом продолжительность интервалов непредсказуемо варьируется

Обусловливание неприятными стимулами

Мы говорили о подкреплении так, будто оно всегда положительное (пища, например). Но отрицательные или неприятные события, например удар током или невыносимый шум, тоже часто используются для обусловливания. Существуют различные виды обусловливания неприятными стимулами, в зависимости от того, применяются ли они для ослабления имеющейся реакции или для заучивания новой. [Стоит обратить внимание на соотношение терминов вознаграждение и наказание, с одной стороны, и положительное и отрицательное подкрепление, с другой. Вознаграждение может использоваться как синоним положительного подкрепления — события, появление которого вслед за реакцией повышает вероятность этой реакции. Но наказание — это не то же самое, что отрицательное подкрепление. Последнее означает прекращение неприятного события вслед за реакцией. Наказание имеет противоположный эффект: оно уменьшает вероятность реакции. — Прим. автора.]
Наказание. При тренировках с наказанием за реакцией следует неприятный стимул или событие, что ведет к ослаблению реакции или подавлению последующих ее проявлений. Предположим, маленький ребенок, который учится пользоваться цветными карандашами, начинает рисовать на стене (это нежелательная реакция); если его шлепают по руке, когда он это делает (наказание), он научается так не делать. Сходным образом, если крыса, которая учится проходить лабиринт, получает удар током каждый раз, когда она идет не туда, она скоро научится избегать прошлых ошибок. В обоих случаях наказание используется для снижения вероятности нежелательного поведения. [Другими словами, происходит угасание ориентировочной реакции на безусловный стимул. — Прим. ред.]
Наказание может подавить нежелательную реакцию, но у него есть несколько недостатков. Во-первых, его эффект не столь предсказуем, как эффект вознаграждения. Вознаграждение, по сути, говорит: «Повтори то, что ты уже сделал»; наказание говорит «Перестань!» и не может предложить альтернативу. В результате организм может заменить наказываемую реакцию еще менее желательной. Во-вторых, побочные результаты наказания могут оказаться вредными. Наказание часто ведет к антипатии или страху перед наказывающим человеком (родителем, учителем или нанимателем) и перед самой ситуацией (домом, школой или офисом), где происходило наказание. Наконец, крайне суровое или болезненное наказание может вызвать агрессивное поведение, более серьезное, чем первоначальное нежелательное.
Эти предостережения не означают, что наказание никогда не должно применяться. Оно может эффективно снимать нежелательную реакцию, если другая реакция вознаграждается. Крысы, которые научились находить более короткий из двух путей в лабиринте, чтобы добраться до пищи, быстро переключаются на более длинный, если в коротком пути их бьет током. Временное подавление, вызываемое наказанием, дает крысе возможность научиться идти длинным путем. В этом случае наказание служит эффективным средством переориентировать поведение, поскольку оно информативно, а это и есть ключ к гуманному и эффективному применению наказания. Ребенок, который получил удар током от электроприбора, может научиться тому, какие соединения безопасны, а какие — нет.
<Рис. Угроза наказания — эффективное средство мотивации. Надпись на дорожном знаке: НЕ СИГНАЛИТЬ. Штраф 50$.>
Избегание и предотвращение. Неприятные события могут также использоваться при научении новым реакциям. Организм может научиться реагировать так, чтобы прекратить неприятное событие, например, когда ребенок научается закрывать кран, чтобы горячая вода не лилась в его ванну. Это называется научением избеганию событий. Организм может реагировать и так, чтобы предотвратить неприятное событие до его начала, например, когда мы научаемся останавливаться на красный свет, чтобы предотвратить несчастные случаи (и получение штрафных квитанций). Это называется научением предотвращению событий.
Научение избеганию часто предшествует научению предотвращать события. Это иллюстрирует следующий эксперимент. Крысу помещают в ящик, состоящий из двух отделений, разделенных барьером. В каждой пробе животное помещают в одно из отделений. В некоторый момент звучит предупреждающий звук, а пять секунд спустя к полу этого отделения подается ток; чтобы уйти от удара током, животное должно перепрыгнуть через барьер в другое отделение. Первоначально животное делает это, когда ток уже включен, — здесь имеет место научение избеганию. Но по мере тренировки животное научается прыгать, услышав предупредительный звук, и тем самым целиком избегает удара током — это научение предотвращению.
Научение предотвращению вызвало широкий интерес, отчасти потому, что в нем есть что-то весьма загадочное. Что представляет собой подкрепление реакции предотвращения? В вышеизложенном исследовании — что подкрепляет прыжок крысы через барьер? Интуитивно кажется, это — отсутствие раздражения током, но отсутствие чего-то можно рассматривать как несобытие. Как может несобытие служить подкреплением? В одном из решений этой загадки предполагается, что в таком научении есть две стадии. На первой стадии происходит классическое обусловливание: при неоднократном сочетании предупреждения (УС) и наказующего события, то есть удара током (БУС), животное заучивает реакцию страха на предупреждение. На второй стадии происходит оперантное обусловливание: животное научается, что определенная реакция (перепрыгивание барьера) устраняет неприятное событие, то есть страх. Короче, то, что поначалу кажется несобытием, на самом деле — страх, и предотвращение можно представлять как прекращение страха (Rescorla & Solomon, 1967; Mowrer, 1947).

Контроль и когнитивные факторы

В нашем анализе оперантного обусловливания подчеркивалась роль факторов окружения: за реакцией неизменно следовало подкрепляющее событие, и организм научался ассоциировать данную реакцию с данным подкреплением. Но в когнитивной теории предотвращения, о которой мы говорили, предполагается, что в оперантном обусловливании, так же как и в классическом, важную роль играют когнитивные факторы. Как мы увидим, иногда полезно рассмотреть ситуацию оперантного обусловливания организма как приобретение им нового знания о взаимосвязи между реакцией и подкреплением.
Одновременность или контроль? Как и в случае классического обусловливания, мы хотим знать, какой фактор является решающим, чтобы произошло оперантное обусловливание. Опять-таки один из вариантов — совпадение по времени: операнта становится условной, когда подкрепление немедленно следует за поведением (Skinner, 1948). Более когнитивный вариант ответа, близко связанный с предсказуемостью, — это фактор контроля: операнта становится условной, только когда организм интерпретирует подкрепление как событие, контролируемое его реакцией. Некоторые важные эксперименты (Maier & Seligman, 1976) больше говорят в пользу фактора контроля, чем в пользу фактора совпадения по времени (см. также обсуждение контроля и стресса в гл. 15).
Основной эксперимент состоит из двух стадий. На первой стадии некоторые собаки узнают, что раздражение током или его отсутствие зависит от их поведения (или контролируется им), а другие собаки научаются тому, что у них нет контроля над раздражением током. Собак испытывают парами. Оба члена пары находятся в упряжи, ограничивающей их движения, и неожиданно они получают удар током. Один член пары — «ведущая» собака — может выключить электричество, нажав носом на рядом расположенный выключатель; другой член пары — «ведомая» собака — никак не может контролировать удар током. Каждый раз, когда ведущая собака получает удар, то же достается и ведомой собаке; и каждый раз, когда ведущая собака выключает ток, у ведомой собаки он тоже прекращается. Таким образом, и ведущая и ведомая собаки получают одинаковое количество ударов током.
Чтобы узнать, что выучили собаки на первой стадии, нужна вторая стадия, на которой экспериментатор помещает обеих собак в новое устройство — ящик, разделенный барьером на две половины. Это такое же устройство для теста на предотвращение события, какое мы рассматривали немного выше. Как и ранее, в каждой пробе сначала звучит тон, указывающий, что отделение, занимаемое сейчас животным, вот-вот подвергнется воздействию электричества; чтобы избежать раздражения, животное должно научиться при предупреждающем звуке прыгать через барьер в другое отделение. Ведущие собаки быстро научаются этой реакции. Но с ведомыми собаками происходит совсем иное. Они с самого начала не делают движения через барьер, и по мере продолжения проб их поведение становится все более пассивным, пока собака под конец не впадает в полную беспомощность. Почему? Потому что на первой стадии ведомые собаки узнали, что удары током — вне их контроля, и это убеждение в бесконтрольности сделало обусловливание на второй стадии невозможным. Если убеждение в бесконтрольности делает невозможным оперантное обусловливание, то, может быть, именно убежденность в контроле делает его возможным. Многие другие эксперименты свидетельствуют в пользу того, что оперантное обусловливание происходит, только когда организм воспринимает подкрепление как нечто, что он может контролировать (Seligman, 1975). Подробнее о приобретенной беспомощности будет сказано в гл. 15.
Научение зависимости. О приведенных результатах молено говорить и в терминах зависимостей. Можно сказать, что оперантное обусловливание происходит только тогда, когда организм воспринимает зависимость между своими реакциями и подкреплением. На первой стадии упомянутого выше исследования соответствующая зависимость имела место между нажатием выключателя и окончанием раздражения током; восприятие этой зависимости равнозначно выяснению того, что, когда выключатель нажат, вероятность окончания раздражения больше, чем когда он не нажат. Собаки, которые не воспринимают этой зависимости на первой стадии эксперимента, не ищут никаких зависимостей и на второй стадии. В свете фактора зависимости ясно, что эти результаты изучения оперантного обусловливания сходятся с данными о роли предсказуемости в классическом обусловливании: знание, что УС предсказывает БУС, можно интерпретировать как выражение того, что организм обнаружил зависимость между этими двумя стимулами. Таким образом, и в классическом, и в оперантном обусловливании организм усваивает именно зависимость между двумя событиями. В классическом обусловливании поведение определяется конкретными стимулами; в оперантном обусловливании поведение определяется конкретными ожидаемыми реакциями.
Наша способность узнавать зависимости развивается очень рано, как показывает следующее исследование 3-месячных младенцев. Все младенцы в эксперименте лежали в своих кроватках, головы на подушках. Под каждой подушкой был выключатель, который замыкался каждый раз, когда младенец поворачивал голову. Для испытуемых контрольной группы каждый раз, когда они поворачивали голову и замыкали выключатель, на противоположной стороне кроватки включалась движущаяся игрушка. Для этих младенцев имела место зависимость между поворотом головы и движением игрушки: с поворотом головы движение игрушки было более вероятным, чем без него. Эти младенцы быстро научились поворачивать голову и реагировали на движение игрушки знаками радости (они улыбались и лопотали). Совсем другая картина была у испытуемых экспериментальной группы. Для этих младенцев игрушка приводилась в движение примерно так же часто, как и у контрольных испытуемых, но двигалась она или нет — было вне их контроля: здесь отсутствовала зависимость между поворотами головы и движением игрушки. Эти младенцы не научились двигать головой более часто. Кроме того, через какое-то время они уже не демонстрировали признаков удовольствия от движения игрушки. При отсутствии контроля над ней игрушка, видимо, потеряла часть своей подкрепляющей функции.

Биологические ограничения

Как и в случае классического обусловливания, биология накладывает ограничения на то, что можно выучить путем оперантного обусловливания. Эти ограничения касаются соотношений между реакцией и подкреплением. Для иллюстрации рассмотрим голубей в двух экспериментальных ситуациях: научение с вознаграждением, когда животное приобретает реакцию, подкрепляемую пищей, и научение с прекращением, когда животное приобретает реакцию, подкрепляемую прекращением ударов током. В случае с вознаграждением голуби учатся гораздо быстрее, если в качестве реакции нужно клюнуть ключ, а не хлопать крыльями. В случае с прекращением раздражения током происходит наоборот: голуби учатся быстрее, если условная реакция — это хлопанье крыльями, а не клевание (Bolles, 1970).
Как и в случае классического обусловливания, приведенные результаты расходятся с предположением, что во всех ситуациях работают одни и те же законы научения, и этологически это вполне понятно. Случай с вознаграждением, когда пища сочетается с клеванием (но не хлопанием крыльев), является частью естественной активности птиц, связанной с едой. Значит, разумно предположить, что существует генетически заданная связь между клеванием и едой. Сходным образом, в варианте с прекращением раздражения током имеется опасная ситуация, а естественной реакцией голубя на опасность является хлопанье крыльями (но не клевание). Как известно, у птиц небольшой репертуар оборонительных реакций, и они быстро учатся прекращению только в том случае, если соответствующая реакция принадлежит к естественным оборонительным.
Описанные выше этологические исследования демонстрируют нам новый возможный способ взаимодействия биологического и психологического подходов. Этологические концепции помогают нам придать смысл полученным ранее результатам психологических исследований. Например, они объясняют нам, почему голуби обучаются быстрее в ситуации, включающей вознаграждение, если реакцией является клевание, однако в ситуации, включающей избегание, они обучаются быстрее, если реакцией является хлопание крыльями.

 

Комплексное научение

Согласно когнитивному подходу, основной вопрос научения — и интеллекта вообще — лежит в способности организма к мысленному представлению различных аспектов мира и оперированию этими мысленными репрезентациями, а не самим миром. Во многих случаях мысленные репрезентации состоят из ассоциаций между стимулами или событиями; эти случаи соответствуют классическому и оперантному обусловливанию. В других случаях содержание репрезентаций сложнее. Это может быть карта окружающей местности или абстрактное понятие причины. Есть также случаи, когда операции, выполняемые с мысленными репрезентациями, сложнее ассоциативных процессов. Эти операции могут принимать форму мысленных проб и ошибок, путем которых организм испытывает в уме различные возможности. Они могут составлять многоэтапную стратегию, в которой некоторые мысленные этапы предпринимаются только потому, что они открывают путь к последующим этапам. Идея стратегии, в частности, расходится с предположением, что сложное научение строится из простых ассоциаций. Далее мы рассмотрим явления научения, прямо указывающие на необходимость принимать в расчет не-ассоциативные репрезентации и операции. Некоторые из этих явлений относятся к животным, а некоторые — к выполнению человеком задач, сходных с обусловливанием.

Когнитивные карты и абстрактные понятия

Одним из первых сторонников когнитивного подхода к научению был Эдвард Толмэн. Он изучал то, как крысы заучивают путь через сложный лабиринт (Tolman, 1932). По его мнению, крыса, пробегающая по сложному лабиринту, не заучивает последовательность из реакций типа «повернуть налево» или «повернуть направо», а формирует когнитивную карту — мысленное представление о схеме лабиринта.
В более новых исследованиях найдены убедительные подтверждения наличия у крыс когнитивной карты. Рассмотрим лабиринт, изображенный на рис. 7.9. Он состоит из центральной платформы с восемью одинаковыми рукавами, расходящимися от нее радиально. В каждой пробе экспериментатор помещает пищу в конце каждого рукава; крысе надо научиться пройти каждый рукав (и получить там пищу), не возвращаясь ни в один из рукавов дважды. Крысы замечательно учатся этому; после 20 проб они практически никогда уже не заходят в один и тот же рукав дважды. (Они справляются с этим, даже если лабиринт пропитывают лосьоном после бритья, чтобы уничтожить запаховые признаки тех рукавов, где еще осталась пища.) Самое важное, что крысы редко пользуются стратегиями, которые предпочли бы люди, например, прохождение рукавов в определенном порядке, скажем по часовой стрелке. Крыса проходит рукава в случайном порядке, и это говорит о том, что она заучила не жесткую последовательность реакций. Что же тогда она заучила? Видимо, крыса выработала картоподобную репрезентацию этого лабиринта, в которой определены пространственные отношения рукавов, и в каждой пробе она мысленно отмечает каждый посещенный ею рукав (Olton, 1979, 1978).


Рис. 7.9. Лабиринт для изучения когнитивных карт. В конец каждого рукава кладут пищу, и задача крысы — найти всю пищу, не повторяя свои пути. Показанная здесь схема отражает совершенное научение: крыса посетила каждый рукав лабиринта только один раз, съев все, что она там нашла; она ни разу не вернулась в пустой рукав.

В более новых исследованиях, где участвовали приматы, а не крысы, получены еще более сильные свидетельства в пользу сложных мысленных репрезентаций. Особенно примечательны исследования, показавшие, что шимпанзе могут приобретать абстрактные понятия, хотя когда-то считалось, что эта сфера принадлежит только человеку. В типичном эксперименте шимпанзе учились использовать в качестве слов пластиковые значки различных форм, величин и цветов. Они, например, смогли заучить, что один значок означает «яблоки», а другой — «бумага», причем физического сходства между значком и объектом не было. Из того, что шимпанзе могут заучивать эти обозначения, следует, что они понимают такие конкретные понятия, как «яблоко» и «бумага». Больше впечатляет то, что они могут приобретать и абстрактные понятия, например «такой же», «другой», «причина». Так, шимпанзе могут научиться использовать свой значок «такой же», когда им показывают либо два значка «яблоко», либо два значка «апельсин», и свой значок «другой», когда им показывают значок «яблоко» и значок «апельсин». Сходным образом, шимпанзе, видимо, понимают причинные отношения. Они используют значок «причина», когда им показывают немного резаной бумаги и ножницы, но не когда им показывают целый лист бумаги и ножницы (Premack, 1985a; Premack & Premack, 1983).
<Рис. При помощи методики, разработанной Премэком, экспериментатор тестирует способность шимпанзе пользоваться языком путем манипулирования с пластиковыми значками, представлящими конкретные слова.>

Инсайт в научении

В недавнем прошлом, пока многие ученые пытались изучать сложное научение у видов, очень далеких от человека (у крыс и голубей), другие сочли, что лучшее подтверждение сложного научения следует искать у других видов приматов. Среди таких ученых был Вольфганг Кёлер, работы которого с шимпанзе, проведенные в 1920-х годах, и сегодня не утратили своей актуальности. Кёлер ставил перед шимпанзе задачи, оставлявшие некоторое пространство для догадок (инсайта), поскольку ни один из элементов задачи не был скрыт от глаз шимпанзе (в отличие от работы раздатчика пищи в ящике Скиннера, которую животное наблюдать не могло). Как правило, Кёлер помещал шимпанзе в огороженное пространство, а аппетитный фрукт, чаще — банан, находился вне досягаемости. Чтобы заполучить фрукт, животному надо было использовать находящийся рядом предмет в качестве инструмента. Обычно шимпанзе решал эту задачу и делал это способом, предполагавшим наличие у него некоторой способности к инсайту. Вот типичное изложение Кёлера:
«Султан [самый умный шимпанзе Кёлера] сидит на корточках у прутьев клетки, но не может достать лежащий снаружи фрукт при помощи только имеющейся у него короткой палки. Более длинная палка лежит за прутьями, примерно в двух метрах в стороне от объекта и параллельно решетке. Ее нельзя схватить рукой, но можно придвинуть ближе с помощью маленькой палки (иллюстрацию похожей задачи с несколькими палками см. на рис. 7.10). Султан пытается достать фрукт с помощью меньшей палки. Когда это не получается, он отрывает кусок проволоки, который торчит из сетки его клетки, но тоже напрасно. Затем он смотрит вокруг (в ходе этих тестов всегда было несколько длинных пауз, во время которых животные тщательно просматривали всю видимую зону). Неожиданно он опять подбирает короткую палку, подходит к прутьям клетки прямо напротив длинной палки, подтягивает ее к себе с помощью "приспособления", хватает ее и идет с ней к месту напротив цели (фрукта), которую он и достает. С того момента, когда его взгляд падает на длинную палку, его действия составляют неразрывное целое, без пробелов, и хотя выуживание большой палки при помощи маленькой можно представить как полное и отдельное действие, из наблюдений ясно, что оно появляется внезапно после периода замешательства и сомнения — пристального оглядывания, — который несомненно имеет отношение к финальной цели и немедленно переходит к завершающему действию по достижению конечной цели» (Koehler, 1925, р. 174-175).

Рис. 7.10. Задача с несколькими палками. При помощи короткой палки шимпанзе притягивает к себе палку достаточно длинную, чтобы добраться до кусочка фрукта. Она научилась решать эту задачу, поняв связь между палками и кусочком фрукта.

Некоторые аспекты поведения этих шимпанзе отличаются от поведения кошек у Торндайка или крыс и голубей у Скиннера. Во-первых, решение было внезапным, а не явилось результатом постепенного процесса проб и ошибок. Во-вторых, после того как шимпанзе решила задачу, с этих пор она будет решать ее с малым числом ненужных движений. Это существенное отличие от крысы в ящике Скиннера, которая продолжает совершать ненужные реакции во многих пробах. Далее, шимпанзе у Кёлера могли легко переносить выученное на новую ситуацию. В одной задаче, например, Султана не сажали в клетку, но несколько бананов поместили слишком высоко, чтобы он мог до них дотянуться (рис. 7.11). Для решения этой задачи Султан сложил один на один несколько разбросанных вокруг ящиков, взобрался на этот «постамент» и ухватил бананы. В последующих задачах, если фрукты снова оказывались слишком высоко, Султан находил другие предметы для постройки подставки; в некоторых случаях он использовал стол и небольшую лестницу, а один раз Султан притянул самого Кёлера и использовал экспериментатора как подставку.

Рис. 7.11 Шимпанзе конструирует подставку. Чтобы добраться до бананов, свисающих с потолка, шимпанзе ставит ящики один на один и делает подставку.

Таким образом, у решения шимпанзе есть три важнейших особенности: внезапность; повторяемость после того, как оно один раз найдено; возможность его переноса. Эти особенности не свойственны поведению типа «проб и ошибок», которое наблюдали Торндайк, Скиннер и их коллеги. Скорее, решения шимпанзе отражают мысленные пробы и ошибки. То есть животное формирует мысленную репрезентацию задачи, манипулирует компонентами этой репрезентации, пока не нападает на решение, и затем реализует его в реальном мире. Решение потому и кажется внезапным, что умственные процессы обезьяны недоступны исследователям. Само решение сохраняется в дальнейшем, поскольку мысленная репрезентация со временем не исчезает. И это решение можно переносить на другие ситуации, поскольку репрезентация либо достаточно абстрактна, чтобы охватить не только первоначальную ситуацию, либо достаточно податлива, чтобы распространить ее на новую ситуацию.
Из работы Кёлера следует, что комплексное научение часто состоит из двух фаз. В начальной фазе задача решается, чтобы получить само решение; на второй фазе это решение сохраняется в памяти и воспроизводится каждый раз, когда возникает сходная проблемная ситуация. Следовательно, комплексное научение изначально связано с памятью и мышлением (это темы следующих двух глав). Кроме того, такое двухфазное строение характерно не только для научения шимпанзе, но и для многих случаев сложного научения у человека. Действительно, попытка моделировать человеческое научение была недавно включена в программы исследований по искусственному интеллекту (Rosenbloom, Laird & Newell, 1991).
<Рис. «Deep Blue», компьютер фирмы IBM, играющий в шахматы, с применением искусственного интеллекта обыгрывает гроссмейстера Гарри Каспарова. Каспаров считает, что компьютер фактически обучился формулировать стратегии, а не просто следует правилам игры в шахматы, заложенным в его программу.>

Предубеждения

В исследованиях на животных преимуществом пользуется научение с абсолютно предсказуемыми соотношениями. Например, в большинстве экспериментов по классическому обусловливанию за УС в 100% случаев следует БУС. Но в реальной жизни отношения между стимулами или событиями обычно не являются абсолютно предсказуемыми. Исследования ассоциативного научения с менее чем абсолютными соотношениями проводились в основном на людях. Во многих работах использовались совершенно новые задачи, не очень связанные с предубеждениями испытуемых. В таких случаях испытуемые весьма чувствительны к степени объективной связи между стимулами (Wasserman, 1990; Shanks, 1987). Но нас интересуют как раз исследования, где использовались задачи, прямо затрагивающие предубеждения. В них было показано, что предубеждения могут влиять на то, чему научаются, откуда следует, что в научении участвуют не только процессы формирования ассоциаций между входными сигналами.
В интересующих нас исследованиях в каждой пробе предъявлялась пара стимулов, скажем, изображение и описание человека; задачей испытуемого было установить связь между членами этих пар — например, что изображения высокого человека имеют тенденцию ассоциироваться с краткими описаниями. Некоторые поразительные данные о роли предубеждений были получены в тех случаях, когда никакой объективной связи между этими стимулами не существовало, и все же испытуемые такую связь «находили». В одном эксперименте испытуемых просили указать возможную связь между рисунками психически больных и проявлявшимися у них симптомами. В каждой пробе испытуемым показывали рисунок человека, сделанный пациентом, и один из шести симптомов, среди которых были «подозрительность к другим людям» и «хочет, чтобы о нем заботились». Задачей испытуемых было определить, есть ли в рисунке какой-либо признак — например, что-то в глазах или очертании рта, — относящийся к какому-либо из этих симптомов. На самом деле эти шесть симптомов сочетались с рисунками в случайном порядке, так что никакой связи между признаками (рисунком) и симптомом не было. И тем не менее испытуемые неизменно сообщали о наличии такой связи, причем знание о ней, по всей видимости, сложилось у них до участия в эксперименте: например, что большие глаза связаны с подозрительностью или что большой рот связан с желанием заботы со стороны других. Эти несуществующие, но правдоподобные отношения называют мнимыми ассоциациями (Chapman & Chapman, 1967).
В этом исследовании предубеждения относительно стимулов определили то, что было «выучено». Поскольку предубеждения являются частью знаний человека, эти результаты свидетельствуют о когнитивной природе такого научения. Но здесь ничего не говорится о том, как происходит научение, когда надо заучить объективно существующую ассоциацию. Этот вопрос анализировался в следующем исследовании.
В каждой пробе испытуемым предъявлялись две меры честности человека, взятые из двух совершенно разных ситуаций. Например, одна мера могла заключаться в том, насколько часто мальчик списывает в школе у одноклассника домашнюю работу, а другой мерой могли быть свидетельства, насколько часто тот же мальчик врет дома. Хорошо известно, что большинство людей полагают (ошибочно), что две меры одного и того же свойства личности (честности, например) всегда высококорреспондируют. Это основное предубеждение. На самом деле объективная связь между этими двумя мерами честности варьировалась в зависимости от условий эксперимента, иногда оказываясь весьма слабой, а задачей испытуемых было оценить силу этой связи путем перечеркивания числа в диапазоне от 0 (отсутствие связи) до 100 (полная связь). Результаты показали, что испытуемые неизменно переоценивали силу этой связи. Их предубеждение, что честный человек честен во всех ситуациях, заставляло их видеть больше, чем есть на самом деле (Jennings, Amabile & Ross, 1982).
В этом исследовании предубеждения испытуемых иногда расходились с объективной ассоциацией, которую надо было усвоить. В таких случаях люди, как правило, следуют своим предубеждениям. Если люди считают, например, что две различные меры честности человека тесно связаны, они «обнаружат» такую связь даже при отсутствии объективной ассоциации. Однако по мере того как данные (объективная ассоциация) делаются все более заметными, предубеждения постепенно сдают свои позиции, и тогда человек усваивает то, что есть на самом деле (Alloy & Tabachnik, 1984).
Результаты предыдущих исследований напоминают то, что в восприятии мы назвали обработкой по принципу «сверху вниз» (см. гл. 5). Вспомним, что так называются ситуации, в которых окончательный перцепт воспринимающего складывается из объединения ожиданий того, что он желал бы видеть, с тем, что действительно имеется на перцептивном входе. При обработке по принципу «сверху вниз» в научении происходит объединение предубеждений об ассоциативной связи с объективными входными данными об этой связи, что в результате и приводит к окончательной оценке ее силы.
Влияния предубеждений на научение играют важную роль в педагогике. В частности, преподавая, скажем, физиологию пищеварения, нельзя игнорировать предубеждения об этом предмете. Учащиеся зачастую пытаются ассимилировать новую информацию с учетом своих предубеждений. С педагогической точки зрения, лучше всего дать проявиться этим предубеждениям вовне, так чтобы их мог оспорить преподаватель, если они в самом деле ошибочны (Center & Stevens, 1983).
Подводя итог, скажем, что это направление исследований демонстрирует важную роль предубеждений в научении человека, укрепляя тем самым когнитивный подход к научению. Это направление связано также с этологическим подходом к научению. Подобно крысам и голубям, ограниченным в научении только теми ассоциациями, которые для них заготовила эволюция, мы, люди, ограничены в научении теми ассоциациями, к которым мы подготовлены своими предубеждениями. Без тех или иных априорных ограничений нам приходилось бы учитывать слишком много потенциальных ассоциаций, и ассоциативное научение стало бы тогда хаотичным, да и едва ли возможным.

 

Нейронный базис научения

Биология нейронов и их соединений, роль которых была продемонстрирована при анализе ощущений и восприятия, играет важную роль также в исследованиях процессов научения, в особенности — классического обусловливания и таких простых форм научения, как привыкание. Далее мы кратко рассмотрим некоторые ключевые идеи, лежащие в основе этой активно развивающейся области исследований.

Структурные изменения

Ученые полагают, что нервная основа научения заключена в структурных изменениях нервной системы, и они все больше ищут эти изменения на уровне нервных соединений. Чтобы оценить эти идеи, надо вспомнить из гл. 2, как устроено нервное соединение и как оно передает импульс. Импульс от одного нейрона к другому передается по аксону нейрона-отправителя. Поскольку аксоны отделены синаптической щелью, аксон отправителя выделяет медиатор, который распространяется сквозь эту щель и стимулирует нейрон-получатель. Точнее говоря, когда импульс проходит по аксону отправителя, он активирует окончания этого нейрона, высвобождая медиатор, который вбирается рецепторами нейрона-получателя. Весь этот механизм называется синапсом. Ключевыми моментами, относящимися к научению, являются следующие: 1) некоторые структурные изменения в синапсе и есть нервная основа научения и 2) результатом этого структурного изменения является более эффективная синаптическая передача.
Что может служить подтверждением этой гипотезы? Молено было бы, например, показать, что после сеанса научения синапс стал более эффективным, т. е. он легче срабатывает при следующей стимуляции. В настоящее время это трудно продемонстрировать на организмах любой сложности: если вы регистрируете активность определенных нейронов, то как вы можете найти задачу научения, влияющую именно на эти нейроны? Ученые выбрали путь, при котором сначала подвергается электрической стимуляции определенный набор нейронов (предполагается, что так имитируется обучение), а затем проверяется, возрастает ли активность этих нейронов при последующей стимуляции. Такой рост активности был найден в ряде участков мозга кролика, и он может длиться несколько месяцев. Это явление называют долговременной потенциацией, и оно косвенно подтверждает идею структурных изменений при научении (Berger, 1984; Bliss & Lomo, 1973).

Клеточные изменения при простых формах научения

Пока мы не были достаточно конкретны относительно того, какого рода структурные изменения увеличивают эффективность синапсов. Возможностей несколько. Одна из них — возрастание в результате научения количества медиаторов, выделяемых нейроном-отправителем; это может происходить потому, что число окончаний аксона, выделяющих медиатор, увеличивается. Еще одна возможность — рост количества, но не высвобождаемых медиаторов, а медиаторов, захватываемых принимающим нейроном, например, в силу возрастания количества его рецепторов. Третья возможность — увеличение размера синапса или появление совершенно новых синапсов (Carlson, 1998). Возможно, что несколько вариантов верны одновременно, причем при различных типах научения могут происходить разные виды структурных изменений.
Чтобы изучать процессы научения на таком уровне нервной детализации, исследователям приходится работать с элементарными формами научения и организмами с простейшей нервной системой. В начале главы уже упоминался один простейший вид научения — привыкание. При этом процессе ослабляется реакция организма на слабый стимул, если он не вызывает серьезных последствий, — например, перестает слышаться громкое тиканье часов. Близкий случай в научении — сенсибилизация, когда организм научается усиливать свою реакцию на слабый стимул, если за ним следует другой стимул, угрожающий или болезненный. Например, мы научаемся сильнее реагировать на звук работающего прибора, если за этим часто следует поломка. Привыкание и сенсибилизация найдены фактически на всех уровнях животного царства, но сейчас нас интересуют улитки. Они имеют простую и доступную нервную систему, делающую их весьма подходящими для изучения структурных изменений в синапсах, сопровождающих элементарное научение.
Когда улитку неоднократно слегка трогают, она сначала реагирует, но в течение примерно 10 повторов привыкает к касаниям. Исследователи показали, что такое научение с привыканием сопровождается уменьшением количества медиатора, выделяемого нейроном-отправителем. У этой улитки можно наблюдать и сенсибилизацию. Для этого легкое прикасание к ее телу должно сопровождаться сильным стимулом, приложенным к хвосту, и через несколько таких проб реакция улитки на касание становится более выраженной. Было показано, что научение с сенсибилизацией опосредуется повышением количества медиатора, выделяемого нейроном-отправителем (Kandel, Schwartz & Jessel, 1991). Эти результаты служат относительно прямым подтверждением, что элементарные виды научения опосредуются структурными изменениями на уровне нейронов (подробности о синаптических процессах даны в разделе «На переднем крае психологических исследований»).
А что с ассоциативным научением? Опосредуется ли классическое обусловливание структурными изменениями, подобными описанным выше? То, что классическое обусловливание сходно с сенсибилизацией (и то и другое связано с изменениями реакции на слабый стимул на основе другого, более сильного стимула), позволяет предположить, что у этих двух типов научения должна быть сходная нервная основа. Действительно, было предложено нервное объяснение классического обусловливания, чрезвычайно сходное с объяснением сенсибилизации (Hawkins & Kandel, 1984).

 

Резюме

1. Научение можно определить как относительно устойчивое изменение поведения, являющееся результатом тренировки. Различают четыре типа научения: а) привыкание, при котором организм научается игнорировать знакомый стимул, не вызывающий серьезных последствий; б) классическое обусловливание, при котором организм научается тому, что за одним стимулом следует другой; в) оперантное обусловливание, при котором организм научается тому, что его реакция влечет определенные последствия; г) комплексное научение, включающее в себя больше чем просто формирование ассоциаций.
2. Первые исследования научения велись с позиций бихевиористского подхода. Обычно в нем предполагается, что: а) поведение лучше объяснять внешними, а не внутренними причинами; б) простые ассоциации служат «кирпичиками» всякого научения; в) законы научения одинаковы для разных видов и разных ситуаций. В свете последующих работ эти предположения были модифицированы. Современный анализ научения включает в себя когнитивные факторы, биологические ограничения и бихевиористские принципы.
3. В экспериментах Павлова если условный стимул (УС) систематически предшествует безусловному стимулу (БУС), то УС начинает служить сигналом для БУС, вызывая условную реакцию (УР), которая часто похожа на безусловную реакцию (БР). Стимулы, похожие на УС, в некоторой степени также вызывают УР, хотя такую генерализацию можно ограничить при помощи дифференцирующей тренировки. Эти явления происходят в самых разных организмах — от плоского червя до человека. Есть ряд важных приложений классического обусловливания к человеку, включая условный страх и условную толерантность к наркотикам. В последнем случае условная реакция на стимул, связанный с употреблением наркотика, противоположна эффекту, вызываемому этим наркотиком.
4. В обусловливании играют роль также когнитивные факторы. Чтобы произошло классическое обусловливание, УС должен надежно предсказывать БУС; то есть когда предъявляется УС, вероятность возникновения данной реакции должна быть выше, чем когда УС не предъявляется. Роль предсказуемости видна также в явлении блокировки: если один УС надежно предсказывает БУС и к нему добавляется еще один УС, то связь между дополнительным УС и БУС не будет заучена. Модели классического обусловливания построены на понятиях предсказуемости и новизны.
5. Данные этологов ставят под вопрос предположение, что законы научения одинаковы для всех видов и всех ситуаций, с которыми встречается данный вид. Этологи полагают, что способности животного к научению ограничены предопределенной «генетической программой». Существование таких ограничений в классическом обусловливании подтверждено в исследованиях вкусового отвращения. Крысы легко научаются ассоциировать болезненные ощущения со вкусом вызвавшего их раствора, но они не могут научиться ассоциировать болезнь со светом. Птицы, напротив, могут научиться ассоциировать болезнь со светом, но не болезнь со вкусом.
6. Оперантное обусловливание происходит в ситуациях, где реакция воздействует на окружение, а не вызывается безусловным стимулом. Первые систематические исследования оперантного обусловливания провел Торндайк, который показал, что животные осуществляют поведение по типу проб и ошибок и что всякое поведение, за которым следует подкрепление, закрепляется (закон эффекта).
7. В экспериментах Скиннера животное, как правило крыса или голубь, научается простой реакции, например нажимать на рычаг, чтобы получить подкрепление, Частота реакций — удобная мера силы реакции. Формирование — это процедура тренировки, применяемая, когда желаемая реакция — новая; оно предполагает подкрепление только тех изменений в поведении, которые отвечают требованиям экспериментатора.
8. Есть ряд явлений, которые расширяют сферу применения оперантного обусловливания. Одно из них — условное подкрепление, при котором стимул, ассоциированный с подкреплением, сам по себе приобретает подкрепляющую силу. Другие относящиеся сюда явления — генерализация и дифференцировка; организмы генерализуют реакции на простые ситуации, хотя эту генерализацию можно поставить под контроль дифференцировочного стимула. Наконец, существуют режимы подкрепления. После того как поведение сформировалось, оно может поддерживаться при подкреплении, которое дается только в части всего времени. Когда именно должно следовать подкрепление, определяется типами режима: постоянная пропорция, переменная пропорция, фиксированный интервал, переменный интервал.
9. Существуют три типа обусловливания неприятными стимулами. При наказании за реакцией следует неприятное событие, что приводит к подавлению этой реакции. При избегании организм научается прекращать неприятное событие. При предотвращении организм научается реагировать так, чтобы предотвратить неприятное событие еще до его начала.
10. В оперантном обусловливании есть место и когнитивным факторам. Чтобы оперантное обусловливание произошло, организм должен верить, что подкрепление хотя бы частично находится под его контролем; то есть он должен уловить зависимость между своими реакциями и подкреплением. Биологические ограничения также играют роль в оперантном обусловливании. Существуют ограничения на то, какие подкрепители с какими реакциями могут ассоциироваться. У голубей, когда подкреплением служит пища, научение идет быстрее, если реакцией должно быть клевание ключа, а не хлопание крыльями; но когда подкреплением служит прекращение раздражения током, научение идет быстрее, если реакцией должно быть хлопание крыльями, а не клевание ключа.
11. Согласно когнитивному подходу, основной вопрос научения состоит в способности организма мысленно представлять себе различные аспекты мира и оперировать этими мысленными репрезентациями, а не самим миром. При комплексном научении мысленные репрезентации отражают нечто большее, чем только ассоциации, а из мысленных операций может складываться стратегия. Исследования комплексного научения у животных показывают, что крысы могут формировать когнитивную карту своего окружения, а также приобретать абстрактные понятия, такие как причина. Другие исследования демонстрируют, что шимпанзе могут решать задачи путем инсайта и затем переносить готовые решения на сходные задачи.
12. Узнавая отношения между стимулами, которые не вполне предсказуемы, люди часто полагаются на свои предубеждения об этих отношениях. Это может приводить к тому, что люди обнаруживают отношения, которые объективно не имеют места (мнимые ассоциации). Когда отношение присутствует объективно, наличие предубеждения о нем может вести к переоценке предсказательной силы этого отношения; если объективное отношение противоречит предубеждению, человек может предпочесть последнее. Подобные эффекты служат примером обработки по принципу «сверху вниз» в научении.

Ключевые термины

научение
классическое обусловливание
безусловный рефлекс
безусловный стимул
условный рефлекс
условный стимул
генерализация
различение
оперантное обусловливание
формирование (моделирование)
схемы пропорций
фиксированные
пропорциональный режим (подкрепления)
режим с фиксированной пропорцией
режим с переменной пропорцией
интервальный режим
наказание
когнитивная карта
привыкание
сенсибилизация

Вопросы для размышления

1. Люди иногда говорят: «Он такой-то и такой-то в силу своей биологической натуры» или «потому что его так воспитали». При этом они не предполагают, что влияние оказывают оба фактора. Действительно ли существует дихотомия между биологией и научением?
2. Допустим, вы воспитываете восьмилетнего ребенка, который не убирает свою постель и, похоже, даже не знает, как это делается. Как с помощью техник оперантного обусловливания вы можете научить его убирать постель?
3. Иногда человек может бояться нейтральных объектов, например расстегнутых пуговиц, сам не зная почему. Как вы можете объяснить этот феномен с точки зрения принципов, изложенных в данной главе?
4. Считаете ли вы, что существуют различия между тем, как мы изучаем факты, и тем, как мы обучаемся моторным навыкам? Если да, каковы некоторые из этих различий?

Дополнительная литература

Основополагающая работа по классическому обусловливанию: Pavlov. Conditioned Reflexes (1927); соответствующий труд по оперантному обусловливанию: Skinner. The Behavior of Organisms (1938). Основные точки зрения об обусловливании и научении, представленные в их историческом аспекте, резюмированы в: Bower & Hilgard. Theories of Learning (5th ed., 1981).
Общие введения в научение: Schwartz. Psychology of Learning and Behavior (3rd ed., 1989) — особенно хорошо взвешенный обзор по обусловливанию, включая обсуждение этологического и когнитивного подходов; Gordon. Learning and Memory (1989); Schwartz & Reisberg. Learning and Memory (1991); Domjan & Burkhard. The Principles of Learning and Behaviour (1985). Для более глубокого изучения: Estes (ed.). Handbook of Learning and Cognitive Processes (1975-1978) — шеститомник, охватывающий большинство аспектов научения и обусловливания; Honig & Staddon (eds.). Handbook of Operant Behaviour (1977) — дает исчерпывающую трактовку оперантного обусловливания.
Ранние этапы когнитивного подхода описаны в двух классических работах: Tolman. Purposive Behavior in Animals and Men (1932, reprint ed. 1967) Koehler. The Mentality of Apes (1925, reprint ed. 1976). Более новое изложение когнитивного подхода к научению у животных: Roitblat. Introduction to Comparative Cognition (1986).

 

На переднем крае психологических исследований

Роль нейронных систем в обусловливании страха

Большинство недавно проведенных исследований, посвященных нейронным основам научения, было сосредоточено на нейроанатомических структурах (которые могут состоять из сотен или тысяч отдельных нейронов), а также на путях, соединяющих эти структуры. Хорошим примером таких исследований может послужить изучение нейронной основы обусловливания страха.
В течение более 60 лет ученые предполагали, что ключевой структурой мозга, участвующей в процессе научения страху, является миндалевидная железа — имеющая миндалевидную форму группа ядер, расположенная в глубинных слоях височной доли (Kluver & Bucy, 1937). В исследованиях последних лет были получены детальные данные, свидетельствующие о том, что миндалевидная железа играет важнейшую роль в научении и выражении страха.
У многих видов животных, начиная с крыс и заканчивая приматами, повреждение миндалевидной железы приводит к ослаблению реакций страха в целом, а также затрудняет обусловливание страха в частности. Крысы, у которых миндалевидная железа удалялась хирургическим путем, проявляли меньше признаков страха, то есть меньше таких реакций, основанных на страхе, как дрожь и сворачивание тела, при воздействии на них неприятными стимулами; у них также с трудом вырабатывались реакции страха в результате классического обусловливания (Aggleton & Passingham, 1981). У нормальных крыс с неповрежденной миндалевидной железой научение реакциям страха путем обусловливания сопровождалось увеличением количества высвобождаемых нейронов определенными участками миндалевидной железы (см., в частности: Quirk, Repa & LeDoux, 1995). А в тех случаях, когда в организм нормальных животных вводятся препараты, блокирующие функционирование миндалевидной железы, обусловливание страха становится невозможным (Maren & Fanselow, 1995). Взятые в совокупности, эти данные убедительно свидетельствуют в пользу предположения, что у млекопитающих миндалевидная железа является основной структурой мозга, ответственной за научение реакциям страха.
Одно из проведенных недавно исследований показывает, что эти факты относятся не только к животным, но распространяются и на людей (Bechara et al, 1995). Испытуемым в этом исследовании являлся пациент С. М., имеющий редко встречающееся нарушение (болезнь Урбах-Вьета), приводящее к дегенерации миндалевидной железы. С. М. подвергался воздействию ситуаций, используемых при обусловливании страха, в которых за нейтральным визуальным стимулом (условный стимул) предсказуемым образом следовал громкий звуковой сигнал (безусловный стимул). Несмотря на многочисленные попытки, С. М. не проявлял никаких признаков обусловливания страха, однако он без труда вспоминал ассоциирующиеся с обусловливанием страха события, включая связь условного и безусловного стимула. Другой пациент, не имевший повреждений миндалевидной железы, но страдавший от повреждения структуры мозга, ответственной за заучивание фактического материала, проявлял типичные реакции обусловливания страха, но не мог вспомнить события, связанные с обусловливанием. Таким образом, два пациента имели противоположные проблемы, что свидетельствует о том, что миндалевидная железа ответственна за обусловливание страха, но не за любые формы научения.
---

 

Современные голоса в психологии
Фобии: врожденная предрасположенность или условная реакция?

Обусловливание повышает чувствительность к уже существовавшим страхам
Н. Дж. Макинтош, Кембриджский университет

Джон Уотсон, отец бихевиоризма, полагал, что у младенцев есть лишь несколько врожденных страхов, и из них два важнейшие — это страх громкого шума и страх утраты заботы. Буквально все остальные страхи, по его мнению, приобретены в результате обусловливания. Чтобы доказать свою точку зрения, Уотсон и его студентка Розали Райнер продемонстрировали выработку условной реакции страха у 11-месячного младенца Альберта Б. (Watson & Rayner, 1920). Сначала Альберт радовался, когда дотягивался до любого поднесенного к нему маленького животного. Затем младенцу семь раз предъявляли белую крысу (условный стимул) и, когда он касался ее, позади него внезапно ударяли по стальному бруску (безусловный стимул). В результате при виде крысы Альберт начал плакать и отдергивать от нее руку. Условный рефлекс страха, выработанный на крысу, был обобщен им на другие стимулы — кролика, собаку и пальто из котика. С тех пор в сотнях лабораторных экспериментов было показано, что соединение случайно выбранных и первоначально нейтральных стимулов с вызывающим негативную реакцию событием, таким как краткий удар электрическим током или очень громкий шум, приводит к выработке условной реакции страха.
Исследование Уотсона и Райнер часто цитировалось (Harris, 1979) как свидетельство того, что фобии взрослых, будь то страх змей или пауков, открытых площадей или замкнутых пространств, основаны на одном или нескольких эпизодах обусловливания, в результате которых изначально нейтральный стимул, например, змея ассоциируется с каким-либо неприятным последствием. Столь прямое применение теории обусловливания не обходится без трудностей, одну из которых стоит отметить особо (хотя бы чтобы защитить Уотсона и Райнер от обвинения в жестокости): маленький Альберт лишь слегка волновался, даже когда крысе позволяли ползать по нему, и каков бы ни был уровень страха, экспериментаторы не обнаружили обобщения, проводя тестирование в другой комнате.
Исследования «викарного обусловливания» показали, что простое наблюдение за реакцией страха на специфический условный стимул может действовать как безусловный стимул, который достаточен, чтобы служить подкреплением для выработки условной реакции страха. Рожденные на воле макаки-резус обычно боятся змей. Это не врожденный страх, так как его не проявляли малыши макаки-резус, появившиеся на свет в лаборатории. Но детенышу макаки достаточно один раз увидеть, как реакцию страха на змею демонстрирует взрослая особь, чтобы страх змей возник и у него (Mineka, 1987). Это лишь один из способов, с помощью которого родители могут непреднамеренно влиять на поведение своих детей.
Традиционная точка зрения бихевиористов состояла в том, что любой стимул может быть ассоциирован с любым последствием. На первый взгляд, это делает еще более проблематичным объяснение фобий с позиций обусловливания, так как до сих пор наиболее распространенные фобии были связаны с социальными ситуациями или животными, а не с огромным числом других объектов или событий (электрические розетки, вид собственной крови), которые с большей вероятностью ассоциируются с болезненными последствиями. Значит ли это, что существует генетическая предрасположенность к фобиям? Нет, если помнить о том, что мы все с рождения боимся пауков, — однако отнюдь не все страдаем арахнофобией. Конечно, именно различия в индивидуальном опыте, по крайней мере отчасти, заставляют одного человека испытывать страх перед пауками, другого — бояться змей, а третьего — не бояться ни того ни другого. Но почему только пауков, змей и т. п.? Чтобы дать ответ на этот вопрос, был проведен ряд экспериментов по обусловливанию.
В серии исследований Охман и его коллеги показали, что возникающая у людей в результате обусловливания кожно-гальваническая реакция более устойчива к затуханию, если условный стимул — изображение змеи или паука, а не изображение цветов или грибов (Ohman, 1986). Кук и Минека (Cook & Mineka, 1990) получили доказательства существования подобного избирательного страха у обезьян. Младенцы обезьян пугались змей после просмотра видеозаписи, на которой взрослая обезьяна проявляла на змею реакцию страха, но не обнаруживали никакой реакции страха на цветы после наблюдения искусно отредактированной видеозаписи, на которой взрослая обезьяна демонстрировала состояние паники при виде цветка.
Подобные результаты были интерпретированы как свидетельство существования биологической предрасположенности к связыванию некоторых видов стимулов с определенными последствиями: в эволюционной истории ранних гоминид или других африканских приматов змеи и пауки были потенциально опасны, в то время как цветы и грибы не были. Есть и другие вопросы, остающиеся без ответа в рамках теорий научения. В экспериментах Охмана установлено, что страх перед змеями угасает медленнее, чем страх перед цветами, но приобретаются они с одинаковой скоростью. Другие эксперименты показали, что изображения змей так же легко воспринимаются в качестве безопасных сигналов, как и изображения цветов (McNally & Reiss, 1984). Детеныши обезьян в экспериментах Кука и Минеки, просмотрев видеозаписи, на которых взрослые обезьяны демонстрировали реакцию страха на цветы; а не на змей, все-таки проявляли существенный страх перед живой змеей (и никакого страха перед цветами). Можно сделать вывод, что если страх ранее существовал, то в условиях угрозы или стресса чувствительность к некоторым видам стимулов повышается, но более быстрая выработка условной реакции страха не происходит (Lovibond, Siddle & Bond, 1993).

Фобии — врожденный защитный механизм
Майкл С. Фанслоу, Калифорнийский университет, Лос-Анджелес

Эмоциональное переживание страха может быть очень сильным. Почему же страх существует? Причину нужно искать в том, что страх выполняет биологически важную функцию. Опасение перед лицом серьезной угрозы мобилизует наши ресурсы на защиту, и таким образом, страх превращается в поведенческую систему, охраняющую от опасностей окружающей среды. Для многих животных одна из наиболее серьезных угроз — стать пищей для представителей другого вида. Если животное не в состоянии защитить себя от хищника, его способность внести свой вклад в генотип вида равна нулю. Таким образом, неудивительно, что появились довольно эффективные системы для защиты от хищников. За реализацию этой функции ответственны определенные участки мозга, и они обеспечивают реакцию страха у различных видов — от мышей и крыс до обезьян и человека. Если естественный отбор ответствен за страх, кажется разумным, что это переживание формируется под влиянием генетических факторов.
Таким образом, страх отчасти обусловлен своей биологической функцией. Но для того чтобы этот вывод был полезным бихевиористу, при определении страха необходимо учесть два других аспекта. Должны быть определены условия, при которых возникает страх, то есть — что именно запускает защитную поведенческую систему. Кроме того, следует детализировать виды поведения, которые возникают в результате страха. Естественный отбор дал ответ на эти вопросы, закодировав на генетическом уровне, чего мы должны бояться с рождения, чего мы должны бояться в результате научения и как мы должны себя вести в состоянии страха.
Защита против хищников — дело срочное; необходимо быстро реагировать на опасность эффективным поведением. Медленное научение методом проб и ошибок в данном случае не подойдет. Виды, полагавшиеся на такой метод, скорее всего, стали предметом изучения палеонтолога, а не психолога. Сначала необходимо быстро распознать угрозу. Животные имеют невероятную способность распознавать своих естественных хищников. В одном исследовании по обе стороны Каскадных гор в штате Вашингтон были отловлены оленьи мыши. Змеи — это естественный враг восточной мыши, но не западной. Западные мыши должны противостоять ласкам. Потомки пойманных мышей были выращены в лабораторных условиях и проверены на реакцию страха на различных хищных и нехищных животных. Хотя эти мыши не имели никакого опыта вне лаборатории и никогда не сталкивались с хищником прежде, они обнаруживали защитные реакции именно на хищников из среды обитания своих предков. Эта врожденная «фобия» не была утрачена, когда давление естественного отбора ослабло; даже в значительной мере одомашненная лабораторная крыса демонстрирует страх при первом столкновении с котом. Хотя не представляется возможным провести такие эксперименты на людях, тот факт, что страх чаще вызывается одними стимулами, чем другими, предполагает, что у нас также есть подобная предрасположенность.
Это не означает, что страх на стимулы окружения не может возникать в результате научения. Но это научение генетически обусловлено и специализировано. Реакция страха довольно быстро возникает в результате научения, и для этого может оказаться достаточным единственного негативного опыта, что отражает эволюционное требование безотлагательности защиты. Несмотря на высокую скорость научения, набор стимулов, на которые возникает страх, строго ограничен. В известном «исследовании маленького Альберта», описанном доктором Макинтошем, Уотсон и Райнер вызывали у мальчика условную реакцию страха сопровождая громким шумом появление белой крысы. Но хотя страх перед крысой приобретается легко, те же самые методы не приводят к успеху при выработке условной реакции страха на многие другие стимулы. Подобная предрасположенность обнаружена и у других приматов, поскольку, как указывает доктор Макинтош, обезьяны легко приобретают реакцию страха на змей, но не на цветы. Даже когда используется одомашненная лабораторная крыса и произвольный стимул типа удара током, все равно, в формировании ассоциации проявляется избирательность. Крысы легче научаются бояться шума, чем огня, так как шум лучше подходит в качестве сигнала опасности.

Поскольку страх должен защитить нас от надвигающейся угрозы, мы вряд ли будем иметь возможность узнать, какие формы поведения эффективны, а какие — нет. Особь, полагающаяся на метод проб и ошибок, обречена. Скорее, специализированные защитные формы поведения уже запрограммированы на видовом уровне; они запускаются, как только возникает страх. Крыса замирает, когда впервые видит кота, — кота привлекают движущиеся объекты. Это реакция страха, поскольку крыса будет так же замирать на шум, который сопровождается ударом. Хотя крысы, как известно, специалисты по нажиманию рычага для получения пищи, они боятся проявить ту же самую реакцию, чтобы избежать удара. Конечно, манипуляции с маленькими объектами едва ли были нужны предкам крыс, когда они сталкивались с хищником. Подобным образом я допускаю, что я скорее решу сложную математическую задачу, если стимулом послужит прекрасное вино, а не спасение в случае вооруженного нападения.