Основы психологии поведения животных

модулей могут быть более жестко детерминированы генетически, чем конфигурации нейронных ансамблей (а тем более синаптических). Благодаря такому явлению и стало возможным анатомо-топографическое картирование коры мозга и выделение в коре у человека (и у животных) функциональных зон, различающихся по функциям. Зоны эти в значительной степени видоспецифичны.

В сущности, центры речи человека, расположенные в доминантном (обычно в левом) полушарии, являются врожденно-детерминированными упорядоченными скоплениями нейронов, образующих ансамбли модулей, без которых невозможно обучение и оперирование речевыми сигналами

Построение коры из множества локальных и, в определенном смысле, автономных функциональных модулей, вероятно и создает предпосылки для формирования «отраженной» дискретной картины действительности, то есть возможности для выделения неких свойств действительности, ее «признаков». Вместе с этим, появляются и предпосылки к произвольным операциям с дискретными «элементами» такого мира (например, к экстраполяции и сопоставлению). Поскольку принцип дискретности проекции мира распространяется и на проекцию в мозге некоторых собственных органов (моторные зоны), то возникает возможность к произвольной деятельности животного. Дискретная картина действительности, запомненная животным, позволяет легко ее декодировать, когда будет необходимо решить задачу с привлечением прошлого опыта.

Четвертое положение . Связано с формированием двух новых, по-видимому, взаимосвязанных свойств мозга, которые делают его по-настоящему способным не только к анализу, но и к синтезу:

1) Появлением особого механизма «сознания», механизма, который способствует оперативному отбору тех констелляций нейронов, которые необходимы для решения «логических» задач, имеющих биологическую значимость.

2) Способности к оценке значимости решаемой задачи, осуществляемой эмоциями.

Под сознанием нейрофизиологи подразумевают функцию восприятия мозгом текущих событий окружающей действительности, на основе которой происходит синтез всего пережитого индивидуального опыта (Этим достигается осознание окружающей действительности). Это есть то сознание, которое теряет человек и животное, например, во время наркоза и которое возвращается после его прекращения.

Таким образом, основы эволюции структур мозга, которые связаны с рассудочной деятельностью , определялись становлением трёх его морфо-функциональных комплексов:

а) комплекса «ствол мозга - передний отдел головного мозга». Видимо, это самый древний функциональный комплекс, и его характер весьма сходен у многих животных, а развитие выражено главным образом количественно;

б) конечного мозга. Развитие его у позвоночных животных шло разными путями. Но, кроме упоминавшихся новоприобретений мозга за счёт этой зоны, а именно - увеличения объёма мозга и усложнения системы синаптических контактов, увеличивается площадь так называемых ассоциативных зон, или зон взаимного перекрывания специализированных областей сенсорных центров в коре. Относительное прогрессивное увеличение ассоциативных зон, к которым относится лобная область, по отношению к специализированным отделам коры (обонятельной, зрительной, слуховой и других) отчётливо видно в сравнительном ряду мозга млекопитающих;

в) лимбической системы. Её филогенез находился в тесной связи с развитием новой коры. Старая кора (архикортекс), первоначально функционально связанная с дистальной (обонятельной) рецепцией, оказалась у млекопитающих оттеснённой на медиальную сторону и вошла в состав лимбической системы. У высших млекопитающих лимбическая система достигает наивысшей дифференциации. А у человека и шимпанзе задняя лимбическая система фактически неотличима от других структур новой коры и, по-видимому, входит в её состав. Некоторые исследователи находят, что такая прогрессивная структура новой коры, как префронтальная область, может быть отнесена к структурам лимбической системы.

6. Инструментальные условные рефлексы

Параллельно с работами И.П. Павлова, в США развивалось изучение сложных рефлексов, которые носят название инструментальных условных рефлексов. Основателем этого направления был Морган (Morgan, 1900).

Различия инструментальных рефлексов и классических павловских довольно велики.

В классических условных рефлексах условный сигнал — раздражитель — воздействует на органы чувств животных. Животное воспринимает условный сигнал как заменитель безусловного сигнала, что приводит к адекватной реакции. Классические рефлексы формируют связь между стимулом и результатом.

Инструментальный условный рефлекс - условный рефлекс, в котором выполнение определенной (двигательной) реакции в ответ на условный раздражитель является необходимым условием получения подкрепления (выработка по эффекту). Выработка инструментального условного рефлекса происходит при активации центра определенного драйва, вызывающего общую активацию, направленную на прекращение этого драйва. При повышенной активности (методом проб и ошибок) находится адекватная реакция, которая усиливается по закону эффекта.

Итак, классические и инструментальные рефлексы отличаются методикой выработки. Но внутренние процессы, лежащие в основе этих двух типов рефлексов, одинаковы. Выработка УР 1-го рода сопровождается УР 2-го рода. Укрепленной в станке Павлова собаке поднимали переднюю ногу, а затем давали порцию мясного порошка. После нескольких таких проб собака сама поднимала ногу, если ее помещали в станок голодной. С другой стороны, при инструментальном научении условным раздражителем можно считать обратную афферентацию от мускулатуры, которая сигнализирует о предстоящем подкреплении.

При инструментальном научении животное должно совершить некоторые действия или манипуляции с объектами, после чего получит подкрепление. В результате возникает связь между действиями животного и результатом. Иначе говоря, особь должна не просто услышать или увидеть сигнал, а должна что-то нажать, клюнуть или передвинуть. Такие действия носят название инструментального научения.

Б. Скиннер (1937), был одним из первых систематических исследователей поведения животных в строго воспроизводимых лабораторных условиях. Для получения надежных данных о поведении животных он разработал оригинальную технику и методологию эксперимента, которая привела к созданию знаменитых "Скиннеровских камер". В этих камерах животные выполняли единообразные инструментальные операции, которые строго контролировались, управлялись и регистрировались. Проведя огромное количество экспериментов, Б. Скиннер написал книгу "Поведение организмов", где на конкретном материале обсуждаются и описываются такие принципиальные зоопсихологические понятия, как положительное и отрицательное подкрепление, угашение, генерализация раздражителя, дифференцировка стимулов, дифференциация реакций, аутошейпинг и условное подкрепление. В системе Б. Скиннера раздражители классифицируются в связи с операциями, в которых они задействованы, и по их функциональным влияниям. Он создал целое направление в экспериментальной зоопсихологии. Теперь оно носит название "Экспериментального анализа поведения" (3).

7. Оперантное поведение

Б. Скиннер ввел в экспериментальную зоопсихологию методы изучения спонтанного поведения животных. Их суть сводится к тому, что животному позволяется совершать произвольные действия, а оператор, изменяя тактику подкрепления, пытается управлять поведением исследуемой особи. Для обозначения спонтанного поведения животного, которое происходит без очевидного стимула , существует специальное название - оперантное действие. Этот термин был введен Б. Скиннером для подчеркивания различий с так называемым реактивным поведением, которое проявляется в ответ на определенный стимул.

Примером оперантного поведения является обучение клевания "ключа" голубем. Голубя помещают в камеру с кормушкой с встроенной лампочкой и небольшим кружком на уровне головы. Кружок снабжен устройством для включения электрической цепи и носит название "ключа". Первоначально голубя приучают к сочетанию свет-корм. Когда загорается свет, то выдается пища. Голуби быстро привыкают к этому и запоминают последовательность событий. Затем оператор начинает подводить голубя к клеванию ключа. Для этого корм начинают давать только тогда, когда голубь подходит к ключу. Затем только после вытягивания шеи на уровень ключа. В конце концов возникает момент, когда голубь клюет ключ. После этого пища выдается исключительно за клеванием ключа. Поскольку ключ соединен с электрической цепью кормушки, то далее обучение происходит без участия оператора.

При таком подходе решающее значение имеет форма подачи подкрепления. В основном, Б. Скиннер заимствовал методы работы с подкреплением И.П. Павлова, хотя и модифицировал их формы. Например, награждением по постоянному соотношению называется подкрепление голубя при каждом третьем клевании ключа. Вариаций форм подкрепления Б. Скиннер ввел очень много, что позволило ему добиться выработки очень сложного оперантного поведения. Он считал, что у его методики подачи подкрепления вообще нет пределов влияния на поведение животных, а их оперантным действиям можно придавать любую форму. Впоследствии это не подтвердилось. Многих животных не удается научить даже простым действиям, поскольку оперантная задача вступает в конфликт с инстинктивным поведением (3).

8. Методика выработки оперантного условного рефлекса

Процедура инструментального научения состоит в том, что положительное или отрицательное подкрепление подается при определенной реакции животного - “правильной” или “неправильной” с точки зрения экспериментатора.

Инструментальное научение классифицируется в зависимости от применяемых методик.

а) “Пробы и ошибки” по-Торндайку. Методика разработана в 1898 году. Проблемная клетка (проблемный ящик) Торндайка представляет собой клетку, которую можно открыть изнутри, нажав на рычаг. Заключенные в клетке животное первоначально пытается убежать, хаотично и безостановочно двигаясь по клетке, но через некоторое время случайно нажимает на рычаг и открывает дверцу. Животное вновь возвращают в клетку. Вторая и третья попытки животного выйти из клетки могут быть случайным повторением, но постепенно животное сосредотачивает свое поведение около рычага. После ряда проб животное, как его только запирают в клетке, нажимает на рычаг и освобождается. Животное учится исключать из своего поведения все, что не ведет к подкреплению и увеличивает число двигательных реакций, которые при предыдущих попытках приводили к подкреплению. Но в начале опыта в поведении животного нет определенной системы - первое подкрепление животное получает случайно.

“Закон эффекта” Торндайка гласит: “Для реакции, за которой следует вознаграждение или состояние удовлетворения, вероятность повторения возрастает, а для реакции, вызывающей вредное или неприятное последствие, вероятность повторения снижается”.

Большинство современных психологов соглашаются с тем, что для объяснения поведения взрослого человека “закон эффекта” имеет ограниченную сферу применения.

б) Свободно-оперантная методика по Скиннеру. Это вариация методики, примененной Торндайком. Отличие от методики “проб и ошибок” в том, что животное подвергается не отдельным пробам, а может совершать любую реакцию в любое время. Обычно в инструментальной установке находится приспособление, например, рычаг, на которое животное должно воздействовать. В опытах, проведенных Скиннером в 1938 году, лабораторная крыса нажимает на рычаг и получает пищу. В начале опыта животное не совершает требуемую реакцию, но за поведение, приближающееся к реакции, которую хотят сформировать, подкрепление получит. Вначале подкрепляется нахождение крысы в той части клетки, где расположен рычаг. Затем подкрепляют поднимание лапы по направлению к рычагу. Постепенно требования к реакции, заслуживающей подкрепления, повышаются. В конечном итоге подкрепляют уже само нажатие на рычаг.

Интересные исследования по выработке оперантных реакций у дельфинов были проведены американской исследовательницей Прайер. В каждой серии проб подкреплялись различные реакции. После того, как какая-либо реакция подкреплялась, в последующих сериях эта реакция уже не позволяла животному получить подкрепление. Когда был исчерпан весь репертуар реакций, на которые способны дельфины, животные стали вырабатывать множество новых, “творческих” реакций.

в) Методики с отрицательным подкреплением. Животное должно вести себя так, как установлено экспериментатором, чтобы избежать болевых стимулов. В наиболее распространенном варианте этой методики используется челночная камера. Она состоит из двух отделений, окрашенных в разные цвета. Отделения сообщаются между собой проемом. Процедура начинается с ряда проб, сопровождающихся сигналом, например, зуммером. Животному дается несколько секунд, чтобы покинуть стартовую камеру и перейти в другую часть установки. Если животное этого не сделает, оно получит удар электротоком через электроды на полу камеры. По мере повторения ряда проб процент успешных избеганий растет. Было показано, что даже среди близкородственных видов животных успешнее обучаются те животные, которые в природе ведут более активный образ жизни.

г) Выработка дифференцировки. В этих опытах животному предлагают два или несколько стимулов и предоставляют возможность как-нибудь реагировать. Реакции на один из стимулов подкрепляются, на другие - нет. Научение состоит в повышении процента реакций на “правильный” стимул. Например, обезьяна будет всегда получать банан, если будет из двух предъявляемых стимулов выбирать стимул красного цвета. Существует очень много вариантов выработки дифференцировки. Некоторые задачи способны решить только животные с достаточно развитым интеллектом.

· Одновременная дифференцировка. Все стимулы предъявляются в одно и тоже время. Задача животного - выбрать правильный стимул.

· Последовательная дифференцировка. Стимулы предъявляются по одному. Животное должно тормозить реакцию в присутствии неправильного стимула.

· Переделка дифференцировки. Значение положительного стимула меняется от одной задачи к другой. Например, животное должно выбирать между красным и зеленым стимулом, причем красный - положительный. Через некоторое время, не информируя животное, начинают подкреплять зеленый стимул. Многие виды животных обнаруживают способность улучшать решение таких задач при их повторении, то есть вырабатывают установку на научение.

· Отсроченные реакции дифференцировки. Приманку на глазах у животного помещают под один из двух предметов. Через длительный промежуток времени животное должно выбрать стимул, который подкрепляется.

д) Научение в лабиринте. Это одна из форм дифференцировок. Первый лабиринт для крыс построил Уильям Смолл в 1900 году. Простейший лабиринт напоминает по форме буквы У или Т. Животное должно идти прямо до точки выбора. Сложные лабиринты имеют много точек выбора. Путь через лабиринт представляет чаще всего дорогу в гнездо крысы или, реже, дорогу к корму. Иногда нахождение “правильного” пути подкрепляется возможностью крысы убить мышь.

В опытах с лабиринтами фиксируются время решения задачи и число ошибок, то есть число тупиков, в которые заходила крыса. Была обнаружена интереснейшая закономерность - число ошибок начинает падать вначале обучения вблизи конца пути, у цели, и лишь затем - в начале лабиринта. Постепенно крысы научаются выбирать кратчайший путь к цели.

е) Научение решению задач на абстрактные понятия. Опыты проводятся на приматах. Под абстрактным понимается частичное свойство воспринимаемого, общее по крайней мере для двух объектов, различных по другим своим характеристикам. Абстрактное понятие люди обозначают словом, например: “больший” или “черный” или “квадрат”. У животных нет описательного языка, следовательно, у них нет понятий, тем не менее, многие приматы способны решать задачи на дифференцировку стимулов, отличающихся абстрактным признаком. Например, из серии предъявляемых стимулов, чтобы получить подкрепление, обезьяна должна выбирать стимул, больший по размеру, причем относительно больший.

Обезьян также научали выбирать стимул по признаку отличия. Животному предъявляли три стимул-объекта, два из которых одинаковы. Чтобы получить подкрепление, обезьяна должна была выбрать “третий лишний”. Ставились задачи на выбор по образцу. Наконец, давались задачи на чередование. Животное должно по очереди выбирать то один, то другой объект (например, то правый, то левый). Более сложными задачами, с которыми приматы все же справлялись, были задачи на двойное и тройное чередование, а также задачи чередования отсроченных реакций.

9. Режимы подкрепления

В контексте учения о высшей нервной деятельности подкреплением называется сочетание безусловного раздражителя, вызывающего биологически значимую реакцию, с предваряющим ее индифферентным стимулом, что приводит к формированию классического условного рефлекса . В качестве подкрепляющего рассматривают любой стимул, увеличивающий вероятность определенной реакции или формы поведения.

Ряд видов научения требует подкрепления. При инструментальном научении подкреплением служат награда или наказание. В отдельных видах научения человека подкреплением является просто информация о том, правильны или нет его действия.

Вторичное подкрепление. В ходе ассоциативного научения некоторые сигналы, которые изначально не имели никакой ценности или не говорили об опасности, соединяются в сознании с событиями, обладающими ценностью или связанными с опасностью. Если это происходит, сигналы или события, ранее носившие нейтральный характер, начинают сами действовать как поощрение или наказание; такой процесс носит название вторичного подкрепления. Классический пример вторичного подкрепления — деньги. Животные в ящике Скиннера готовы нажимать на рычаг, чтобы завладеть специальными жетонами, обмениваемыми на пищу, или добиться того, что начнет звонить звонок, со звуком которого они приучены отождествлять появление еды. Научение, приводящее к избеганию, иллюстрирует вариант вторичного подкрепления через наказание. Животное выполняет определенные действия при появлении сигнала, который, хотя сам и не является неприятным, постоянно сопровождает какое-то неприятное событие. Например, собака, которую часто бьют, съеживается и обращается в бегство, стоит ее хозяину поднять руку, хотя в самой по себе поднятой руке ничего опасного нет. При использовании для контроля за поведением положительного и отрицательного вторичного подкрепления нет необходимости в частом фактическом поощрении или наказании. Так, когда животных дрессируют по методу последовательных приближений, подкреплением при каждой попытке обычно служит лишь щелкающий звук, который до этого регулярно сопровождал появление пищи.

Поощрение или наказание. Одна из проблем научения — не только добиться нового, желательного поведения, но и избавиться от проявлений нежелательного. Главная цель наказания — устранить имеющее место поведение, а не заменить его новым. Часто, например, при воспитании детей или их обучении, возникает вопрос, что лучше: наказать за проступок или дождаться желательного поведения и поощрить ребенка. Наибольших результатов удается достичь, когда наказание сопровождает старое поведение, а награда — новое. Хотя это всего лишь общее правило, которое не может использоваться во всех случаях жизни, оно подчеркивает важный принцип: следует обращать внимание не только на само поведение — нежелательное, устраняемое при помощи наказания, и желательное, поощряемое наградой, — но и на наличие альтернативы данному типу поведения.

Частичное подкрепление. Инструментальное научение с использованием поощрения — например, приучение крысы в ящике Скиннера нажимать на рычаг ради получения пищи или похвала ребенку, когда он говорит "спасибо" и "пожалуйста", — предполагает несколько видов зависимости между поведением и поощрением. Самый обычный вид зависимости — постоянное подкрепление , при котором награда выдается за каждую правильную реакцию. Другой вариант — частичное подкрепление , предлагающее поощрение только при некоторых правильных реакциях, скажем в каждом третьем случае желаемого поведения, или в каждом десятом, или при его первом проявлении каждый час или каждый день. Воздействие частичного подкрепления важно и представляет большой интерес. При частичном подкреплении для освоения желаемого поведения требуется больше времени, но результаты


9-09-2015, 15:34


Страницы: 1 2 3 4
Разделы сайта