Методы для изучения инструментального обучения

10.09.2016
Для исследования инструментального обучения стали применять целый набор приемов, но мы рассмотрим только те из них, которые получили в дальнейшем развитие и применяются в современных лабораториях. К ним нужно отнести разного рода лабиринты (рис. 5.9). Самый простой среди них Т-образный лабиринт (Т-лабиринт), в котором животное должно сделать только один выбор (рис. 5.9, Б). Другой простой вариант лабиринта представлял собой дорожку (рис. 5.9, А): в одном конце находилось животное, поднималась дверка и путь к отсеку, где находилась пища, был открыт. Сложный лабиринт показан на рис. 5.9, В. Если в определенный отсек лабиринта положить приманку, то животные успешно выучиваются находить ее. Самыми популярными экспериментальными животными стали крысы. Дело в том, что лабиринт как среда обучения соответствует биологии этих животных, заселяющих норы.
Методы для изучения инструментального обучения

Большой популярностью до сих пор среди исследователей пользуются челночные камеры (shuttle box). Вариантом этого устройства является оперантная камера (рис. 5.10), куда помещают животное, например крысу. Если крыса любым способом нажимала на рычажок и это нажатие совпадало с зажиганием лампочки, например зеленого света, то она получала пищевое подкрепление. Зажигание красного света не подкреплялось. Этот метод стал особенно популярен вследствие простоты и хорошей воспроизводимости получаемых результатов.

Вариант оперантной камеры был усовершенствован Б. Скиннером в виде процедуры «свободного оперантного поведения» (free operant). Животное помещают на длительное время (1—2 ч) в описанную выше камеру — камеру Скиннера. Если этим животным является крыса, то она нажимает на рычажок, если голубь — он клюет освещенный диск. Животное совершает свои действия по своему «собственному выбору». Иногда эти реакции «правильные» (совпадают с зажиганием зеленого света) и подкрепляются, в других случаях они «неверные» (совпадают с зажиганием красного света) и не подкрепляются. Выученные ответы подчиняются всем тем закономерностям, которые мы уже рассматривали: в отсутствие подкрепления реакции затухали (угашались); с увеличением количества проб стимулов (зеленого и красного света) лучше дифференцировались, но на первой стадии обучения проявлялась генерализация ответов.
Методы для изучения инструментального обучения

Расширение этого метода привело бихевиористов к методике «вторичного подкрепления»: стимул может получить в данном эксперименте свойство подкрепления, если в предшествующих опытах этот стимул уже подкрепляли. Например, крысу предварительно обучали в простом лабиринте (см. рис. 5.9, А): если стены были окрашены в белый цвет, то крыса получала пищу, если в черный цвет — подкрепления не было. Если теперь крысу выпустить в сложный лабиринт и часть стенок в нем окрасить в черный цвет, а другую часть в белый, то крыса явно предпочтет «белые» отсеки. В данном случае белый цвет, по терминологии бихевиористов, был «вторичным подкреплением». Это, по-видимому, полностью соответствует явлению переноса, описанному в павловской школе. Эксперименты такого рода показали, что даже нейтральные, с точки зрения экспериментатора, сигналы могут в определенных условиях превратиться во вторичные подкрепители. Критическим моментом здесь выступали свойства вторично подкрепляющих стимулов — они должны были быть ассоциированы с первичным подкреплением.

Оказалось, что важную роль в образовании навыка играет величина временного интервала между ответом и подкреплением (роль этого фактора подчеркивалась и в павловской школе). Быстро выяснилось, что эффект подкрепления становился все слабее и слабее, если между подкреплением и ответом увеличивался временной интервал. Связь между задержкой и эффективностью подкрепления изучали на группе крыс, которых обучали нажимать на рычажок. Если ответ был правильным, рычажок сразу убирали из камеры. Пищевое подкрепление давали в интервале от 0 до 30 с после ответа. Обучение происходило тем эффективнее, чем короче было время задержки подкрепления. Эти данные суммированы на рис. 5.11. Из графика четко видно, что эффективность подкрепления снижается с возрастанием задержки подкрепления («градиент подкрепления»).
Методы для изучения инструментального обучения