Как правило, режим ВИ порождает более высокую скорость реагирования и большую сопротивляемость угасанию, чем режим ПИ.
Условное подкрепление.
Теоретики, занимающиеся научением, признавали два типа подкрепления - первичное и вторичное. Первичное подкрепление - это любое событие или объект, сами по себе обладающие подкрепляющими свойствами. Таким образом, они не требуют предварительной ассоциации с другими подкреплениями, чтобы удовлетворить биологическую потребность. Первичные подкрепляющие стимулы для людей - это пища, вода, физический комфорт и секс. Их ценностное значение для организма не зависит от научения. Вторичное, или условное подкрепление, с другой стороны, - это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма. Примерами общих вторичных подкрепляющих стимулов у людей являются деньги, внимание, привязанности и хорошие оценки.
Небольшое изменение в стандартной процедуре оперантного научения демонстрирует, как нейтральный стимул может приобрести подкрепляющую силу для поведения. Когда крыса научилась нажимать на рычаг в "ящике Скиннера", сразу же ввели звуковой сигнал (сразу после осуществления реакции), за которым следовал шарик еды. В этом случае звук действует как различительный стимул (то есть животное учится реагировать только при наличии звукового сигнала, так как он сообщает о пищевом вознаграждении). После того, как эта специфическая оперантная реакция устанавливается, начинается угасание: когда крыса нажимает на рычаг, не появляются ни пища, ни звуковой сигнал. Через какое-то время крыса перестает нажимать на рычаг. Затем звуковой сигнал повторяется каждый раз, когда животное нажимает на рычаг, но шарик пищи не появляется. Несмотря на отсутствие первоначального подкрепляющего стимула, животное понимает, что нажатие на рычаг вызывает звуковой сигнал, поэтому оно продолжает настойчиво реагировать, тем самым ослабляя угасание. Другими словами, установленная скорость нажатия на рычаг отражает тот факт, что звуковой сигнал теперь действует как условный подкрепляющий фактор. Точная скорость реагирования зависит от силы звукового сигнала как условного подкрепляющего стимула (то есть от числа случаев, когда звуковой сигнал ассоциировался с первичным подкрепляющим стимулом, пищей, в процессе научения). Скиннер доказывал, что фактически любой нейтральный стимул может стать подкрепляющим, если он ассоциируется с другими стимулами, ранее имевшими подкрепляющие свойства. Таким образом, феномен условного подкрепления в значительной степени увеличивает сферу возможного оперантного научения, особенно если это касается социального поведения человека. Иначе говоря, если бы все, чему мы научились, было пропорционально первичному подкреплению, то возможности для научения были бы очень ограничены, и деятельность человека не была бы столь разнообразна.
Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Деньги - особенно показательный пример. Очевидно, что деньги не могут удовлетворить какое-либо из наших первичных влечений. Все же благодаря системе культурного обмена деньги являются мощным и сильным фактором для получения множества удовольствий. Например, деньги позволяют нам иметь модную одежду, яркие машины, медицинскую помощь и образование. Иные виды генерализованных условных подкрепляющих стимулов - это лесть, похвала, привязанности и подчинение себе других. Эти так называемые социальные подкрепляющие стимулы (включающие в себя поведение других людей) часто действуют очень сложно и едва уловимо, но они существенны для нашего поведения в разнообразных ситуациях. Внимание - простой случай. Все знают, что ребенок может получить внимание, когда притворяется больным или плохо себя ведет. Часто дети назойливы, задают нелепые вопросы, вмешиваются в разговор взрослых, рисуются, поддразнивают младших сестер или братьев и мочатся в постель - и все это для привлечения внимания. Внимание значимого другого - родителей, учителя, возлюбленного - особенно эффективный генерализованный условный стимул, который может содействовать ярко выраженному поведению привлечения внимания.
Еще более сильный генерализованный условный стимул - это социальное одобрение. Например, многие люди проводят массу времени, прихорашиваясь перед зеркалом, в надежде получить одобряющий взгляд супруга или любовника. И женская, и мужская мода - это предмет одобрения, и она существует до тех пор, пока есть социальное одобрение. Студенты высшей школы соревнуются за место в университетской легкоатлетической команде или участвуют в мероприятиях вне учебного плана (драма, диспут, школьный ежегодник) для того, чтобы получить одобрение родителей, сверстников и соседей. Хорошие отметки в колледже - тоже позитивный подкрепляющий стимул, потому что ранее за это получали похвалу и одобрение родителей. Будучи мощным условным подкрепляющим стимулом, удовлетворительные оценки также способствуют поощрению учения и достижению более высокой академической успеваемости.
Скиннер полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека. Он также отмечал, что каждый человек проходит уникальную науку научения, и вряд ли всеми людьми управляют одни и те же подкрепляющие стимулы. Например, для кого-то очень сильным подкрепляющим стимулом является успех в качестве антрепренера; для других важно выражение нежности; а иные находят подкрепляющий стимул в спорте, академических или музыкальных занятиях. Возможные вариации в поведении, поддержанные условными подкрепляющими стимулами, бесконечны. Следовательно, понять условные подкрепляющие стимулы у человека намного сложнее, чем понять, почему крыса, лишенная пищи, нажимает рычаг, получая в качестве подкрепления только звуковой сигнал.
Контроль поведения посредством аверсивных стимулов.
С точки зрения Скиннера, в основном поведение человека контролируется аверсивными (неприятными или болевыми) стимулами. Два наиболее типичных метода аверсивного контроля - это наказание и негативное подкрепление. Эти термины часто используются как синонимы для описания концептуальных свойств и поведенческих эффектов аверсивного контроля. Скиннер предложил следующее определение: "Вы можете различать наказание, при котором происходит аверсивное событие, пропорциональное реакции, и негативное подкрепление, в котором подкреплением является устранение аверсивного стимула, условного или безусловного".
Наказание. Термин наказание относится к любому аверсивному стимулу или явлению, которое следует или которое зависит от появления какой-то оперантной реакции. Вместо того, чтобы усиливать реакцию, которую оно сопровождает, наказание уменьшает, по крайней мере временно, вероятность того, что реакция повторится. Предполагаемая цель наказания - побудить людей не вести себя данным образом. Скиннер заметил, что это наиболее общий метод контроля поведения в современной жизни.
По Скиннеру, наказание может быть осуществлено двумя различными способами, которые он называет позитивное наказание и негативное наказание.
Подкрепление |
Позитивное |
Негативное |
Предъявление положительного стимула |
Удаление аверсивного стимула |
|
Наказание |
Предъявление аверсивного стимула |
Удаление положительного стимула |
Как подкрепление, так и наказание могут выполняться двумя способами, это зависит от того, что следует за реакцией: предъявление или устранение приятного или неприятного стимула. Надо обратить внимание на то, что подкрепление усиливает реакцию; наказание - ослабляет ее. |
Позитивное наказание встречается всякий раз, когда поведение ведет к аверсивному исходу. Вот несколько примеров: если дети плохо себя ведут, их шлепают или бранят; если студенты пользуются шпаргалками на экзамене, их исключают из вуза или школы; если взрослых ловят на краже, их штрафуют или сажают в тюрьму. Негативное же наказание встречается всякий раз, когда за поведением следует устранение (возможного) позитивного подкрепляющего стимула. Например, детям запрещают смотреть телевизор из-за плохого поведения. Широко используемый подход к негативному наказанию - методика приостановки. В соответствии с этой методикой человека моментально удаляют из ситуации, в которой доступны определенные подкрепляющие стимулы. Например, непослушного ученика четвертого класса, мешающего занятиям, могут выгнать из кабинета.
Негативное подкрепление. В отличие от наказания, негативное подкрепление - это процесс, в котором организм ограничивает аверсивный стимул или избегает его. Любое поведение, которое препятствует аверсивному положению дел, таким образом чаще повторяется и является негативно подкрепленным. Поведение ухода - это тот самый случай. Скажем, человек, который прячется от палящего солнца, уходя в помещение, скорее всего снова пойдет туда, когда солнце вновь станет палящим. Следует заметить, что уход от аверсивного стимула не то же самое, что избегание его, поскольку аверсивный стимул, которого избегают, физически не представлен. Следовательно, другой способ бороться с неприятными условиями - научиться избегать их, то есть вести себя так, чтобы предотвратить их появление. Эта стратегия известна как научение избегания. Например, если учебный процесс позволяет ребенку избежать домашнего задания, негативное подкрепление используется для усиления интереса к обучению. Поведение избегания также имеет место, когда наркоманы разрабатывают искусные планы, с тем чтобы сохранить свои привычки, но не довести дело до аверсивных последствий - тюремного заключения.
Скиннер боролся с использованием всех форм контроля поведения, основанных на аверсивных стимулах. Он особо выделял наказание как неэффективное средство контроля поведения. Причина в том, что из-за своей угрожающей природы тактика наказания нежелательного поведения может вызвать отрицательные эмоциональные и социальные побочные эффекты. Тревога, страх, антисоциальные действия и потеря самоуважения и уверенности - это только некоторые возможные негативные побочные явления, связанные с использованием наказания. Угроза, внушаемая аверсивным контролем, может также подтолкнуть людей к моделям поведения даже более спорным, чем те, за которые их первоначально наказали. Рассмотрим, например, родителя, который наказывает ребенка за посредственную учебу. Позже, в отсутствии родителя, ребенок может вести себя еще хуже - прогуливать уроки, шататься по улицам, портить школьное имущество. Вне зависимости от исхода ясно, что наказание не принесло успеха в выработке желаемого поведения у ребенка. Так как наказание может временно подавлять нежелательное или неадекватное поведение, основным возражением Скиннера было то, что поведение, за которым последовало наказание, скорее всего вновь появится там, где отсутствует тот, кто может наказать. Ребенок, которого несколько раз наказали за сексуальную игру, совсем необязательно откажется от ее продолжения; человек, которого посадили в тюрьму за жестокое нападение, не обязательно будет меньше склонен к жестокости. Поведение, за которое наказали, может опять появиться после того, как исчезнет вероятность быть наказанным. Этому легко можно найти примеры в жизни. Ребенок, которого отшлепают за то, что он ругался в доме, может свободно это делать в другом месте. Водитель, оштрафованный за превышение скорости, может заплатить полицейскому и продолжать свободно превышать скорость, когда поблизости нет патруля с радаром.
Вместо аверсивного контроля поведения Скиннер рекомендовал позитивное подкрепление, как наиболее эффективный метод для устранения нежелательного поведения. Он доказывал, что, поскольку позитивные подкрепляющие стимулы не дают негативных побочных явлений, связанных с аверсивными стимулами, они более пригодны для формирования поведения человека. Очевидно, что большинство попыток реабилитировать преступников провалились, это подтверждает высокий уровень рецидивов или повторных нарушений закона. Применив подход Скиннера, можно было бы так урегулировать условия окружения в тюрьме, чтобы поведение, напоминающее поведение законопослушных граждан, позитивно подкреплялось (например, научение навыкам социальной адаптации, ценностям, отношениям). Подобная реформа потребует привлечения экспертов по поведению, имеющих знания о принципах научения, личности и психопатологии. С точки зрения Скиннера, такую реформу можно было бы успешно выполнить, используя уже имеющиеся ресурсы и психологов, обученных методам бихевиоральной психологии.
Скиннер показал возможности позитивного подкрепления, и это повлияло на стратегии поведения, используемые в воспитании детей, в образовании, бизнесе и промышленности. Во всех этих областях появилась тенденция к все большему поощрению желательного поведения, а не наказанию нежелательного.
Генерализация и различение стимулов.
Логическим расширением принципа подкрепления является то, что поведение, усиленное в одной ситуации, весьма вероятно повторится, когда организм столкнется с другими ситуациями, напоминающими ее. Если бы это было не так, то наш поведенческий набор был бы так сильно ограничен и хаотичен, что мы бы, возможно, проснувшись утром, долго размышляли над тем, как реагировать должным образом на каждую новую ситуацию. В теории Скиннера тенденция подкрепленного поведения распространяться на множество подобных положений называется генерализацией стимула. Этот феномен легко наблюдать в повседневной жизни. Например, ребенок, которого похвалили за утонченные хорошие манеры дома, будет обобщать это поведение в соответствующих ситуациях и вне дома, такого ребенка не нужно учить, как прилично вести себя в новой ситуации. Обобщение стимула также может быть результатом неприятного жизненного опыта. Молодая женщина, изнасилованная незнакомцем, может генерализировать свой стыд и враждебность по отношению ко всем лицам противоположного пола, так как они напоминают ей о физической и эмоциональной травме, нанесенной незнакомцем. Подобно этому, единственного случая испуга или аверсивного опыта, причиной которого явился человек, принадлежащий к определенной этнической группе (белый, черный, латиноамериканец, азиат), может быть достаточно для индивида, чтобы создать стереотип и таким образом избежать будущих социальных контактов со всеми представителями данной группы.
Хотя способность обобщать реакции - важный аспект многих наших повседневных социальных интеракций, все же очевидно, что при адаптивном поведении нужно обладать способностью делать различия в разных ситуациях. Различение стимула, составная часть обобщения, - это процесс научения реагировать адекватным образом в различных ситуациях окружения. Примеров множество. Автомобилист остается в живых в час пик благодаря тому, что различает красный и зеленый цвета светофора. Ребенок учится различать домашнюю собачку и злобного пса. Подросток учится различать поведение, находящее одобрение у сверстников, и поведение, раздражающее и отчуждающее других. Диабетик сразу обучается различать пищу, содержащую много и мало сахара. В самом деле, практически все разумное поведение человека зависит от способности делать различение.
Способность к различению приобретается через подкрепление реакций в присутствии одних стимулов и неподкрепление их в присутствии других стимулов. Различительные стимулы таким образом дают нам возможность предвидеть вероятные результаты, связанные с изъявлением особой оперантной реакции в различных социальных ситуациях. Соответственно, индивидуальные вариации различительной способности зависят от уникального прошлого опыта различных подкреплений. Скиннер предположил, что здоровое личностное развитие происходит в результате взаимодействия генерализирующей и различительной способностей, с помощью которых мы регулируем наше поведение так, чтобы максимизировать позитивное подкрепление и минимизировать наказание.
Последовательное приближение: как заставить гору прийти к Магомету.
Первые опыты Скиннера в области оперантного научения были сфокусированы на реакциях, обычно изъявляемых со средней или высокой частотой (например, клевок голубя по ключу, нажатие рычага крысой). Однако вскоре стало очевидным, что стандартная методика оперантного научения плохо подходила для большого числа сложных оперантных реакций, которые могли спонтанно встречаться с вероятностью, равной почти нулю. В сфере поведения человека, например, сомнительно, что с помощью общей стратегии оперантного научения можно было бы успешно научить пациентов психиатрического отделения приобретать соответствующие навыки межличностного общения. Для того, чтобы облегчить эту задачу, Скиннер придумал методику, при которой психологи могли эффективно и быстро уменьшить время, требуемое для обусловливания почти любого поведения в том наборе, которым располагал человек. Эта методика, названная методом успешного приближения, или формированием поведения, состоит из подкрепления поведения, наиболее близкого к желаемому оперантному поведению. К этому приближаются шаг за шагом, и поэтому одна реакция подкрепляется, а затем подменяется другой, более близкой к желаемому результату.
Скиннер установил, что процесс формирования поведения обусловливает развитие устной речи. Для него язык - это результат подкрепления высказываний ребенка, представленных первоначально вербальным общением с родителями, братьями и сестрами. Таким образом, начинаясь с довольно простых форм лепета в младенчестве, детское вербальное поведение постепенно развивается, пока не начинает напоминать язык взрослых. В "Вербальном поведении" Скиннер дает более подробное объяснение тому, как "законы языка", подобно любому другому поведению, постигаются с помощью тех же самых оперантных принципов. И, как можно было ожидать, другие исследователи поставили под сомнение утверждение Скиннера, что язык - это просто продукт вербальных высказываний, выборочно подкрепленных в течение первых лет жизни. Ноэм Хомский, один из наиболее строгих критиков Скиннера, утверждает, что большую скорость усвоения вербальных навыков в раннем детстве никак нельзя объяснить в терминах оперантного научения. С точки зрения Хомского, особенности, которыми обладает мозг при рождении, являются причиной того, что ребенок приобретает язык. Другими словами, существует врожденная способность усваивать сложные правила разговорного общения.
Скиннер не считал необходимым рассматривать внутренние силы или мотивационные состояния человека в качестве причинного фактора поведения. Скорее он сосредотачивался на взаимоотношениях между определенными явлениями окружения и открытым поведением. Далее, он придерживался мнения, что личность - это не что иное как определенные формы поведения, которые приобретаются посредством оперантного научения. Добавляют что-то эти рассуждения к всеобъемлющей теории личности или нет, но Скиннер имел глубокое влияние на наши представления о проблемах научения человека. Философские положения, лежащие в основе системы взглядов Скиннера на человека, четко отделяют его от большинства персонологов.
ОСНОВНЫЕ ПОЛОЖЕНИЯ СКИННЕРА ОТНОСИТЕЛЬНО ПРИРОДЫ ЧЕЛОВЕКА.
Так как Скиннер отрицал интрапсихическое объяснение поведения, его концепция человека радикально отличается от концепций большинства персонологов. Кроме того, его основные положения о человеческой природе четки и определенны. Позиция Скиннера, касающаяся этих положений, показана на рисунке.
Сильная |
Умеренная |
Слабая |
Средняя |
Слабая |
Умеренная |
Сильная |
Свобода |
Детерминизм |