Читать книгу Не рычите на собаку! Книга о дрессировке людей, животных и самого себя онлайн
Подкрепление – это не система наград и наказаний. Современные специалисты вообще не используют подобных слов. Концепция награды и наказания несет в себе огромный груз эмоциональных ассоциаций и интерпретаций – желание, страх, вина, долг, запрет. Например, мы вознаграждаем других за то, что сделали сами, – мы покупаем мороженое ребенку, чтобы помириться с ним после сердитого выговора. Мы думаем, что знаем, какой должна быть награда: мороженое или похвала. Но некоторые не любят мороженое, а похвала в неподходящий момент или от неподходящего человека может больно ранить. В некоторых случаях учительская похвала обязательно вызывает неприязнь со стороны других учеников.
Мы рассчитываем на то, что люди будут поступать правильно и без награды. Дочь-подросток должна мыть посуду, потому что это ее домашняя обязанность. Мы злимся, когда дети или коллеги что-то ломают, воруют, опаздывают, грубят и т. п., потому что эти люди должны были знать, что такое поведение недопустимо. Мы наказываем спустя длительное время после нежелательного поступка – великолепным примером этого может служить судебный приговор за преступление. И такое событие может не оказать никакого влияния на будущее поведение, а остаться обычным возмездием. Тем не менее мы рассматриваем подобные наказания как средство обучения. Люди часто говорят: «Я дал ему урок».
Современная дрессировка с помощью подкрепления основывается вовсе не на «всеобщих убеждениях», а на законах поведенческой науки.
Научно говоря, подкрепление – это событие, которое (а) происходит во время или сразу по завершении желательного поведения и (б) повышает вероятность повторения подобного поведения в будущем. Здесь можно выделить два ключевых элемента: два события связаны в реальном времени – поведение порождает подкрепление, – после чего желательное поведение повторяется гораздо чаще.
Подкрепление может быть положительным (то есть тем, что нравится ученику и чего он хочет: улыбка, поглаживание) или отрицательным (тем, чего ученик стремится избежать: рывок поводка или нахмуренное выражение лица). Самое важное – это временная связь между событиями: проявляется поведение, проявляется и подкрепление. Благодаря этому желательное поведение повторяется гораздо чаще, а нежелательное исчезает быстрее. Такой прием работает в обоих направлениях, как петля обратной связи.