Отрицательное подкрепление в обучении лошади: плюсы и минусы

10 сентября 2018 г.

Отрицательное подкрепление в обучении лошади: плюсы и минусы

Словосочетание «отрицательное подкрепление» часто вызывает недопонимание. Да, многие знают этот термин, но колеблются с тем, чтобы дать ему четкое определение.

Итак, давайте начнем с самого начала: отрицательное подкрепление – это инструмент обучения, при котором безболезненное давление применяется до тех пор, пока лошадь не ответит желаемым способом. Когда лошадь отвечает, давление снимается. Со временем лошадь связывает эту особую реакцию с надлежащим ответом.

В качестве простого примера отрицательного подкрепления можно привести неприятный звуковой сигнал, который появляется, если не пристегнуть в машине ремень безопасности. Он будет раздражать нас до тех пор, пока мы не пристегнемся. Если вы едете верхом, отрицательное подкрепление используется, когда вы прижимаете ноги к бокам лошади, а затем отпускаете это давление, когда она начинает рысить. Посредством ассоциации лошадь узнает, что равное давление шенкелей с обеих сторон ее корпуса означает «рысь».

Мозг лошади устроен так, что он ищет ассоциации, независимо от того, предоставляются ли они сознательно или нет. Поскольку лошади всегда стремятся создавать эти связи, мы должны давать им представление о том, что ожидается и что запрещено. Если человек не будет принимать такие решения, лошадь сделает это за него, но ее представления о правильном и неправильном возможно не будут соответствовать нашим.

Отрицательное подкрепление является наиболее распространенной формой ассоциативного обучения, используемого при обучении лошадей. Это наш естественный «режим» по умолчанию, мы «включаемся» в него с особой легкостью. Но давайте подробнее рассмотрим его сильные и слабые стороны.

Отрицательное подкрепление на практике

Отрицательное подкрепление лучше всего работает, когда оно применяется в форме, соответствующей природе лошади. Исследователи Эндрю Маклин и Джейн Кристенсен отмечают, что между собой в качестве отрицательного подкрепления лошади используют «перемещение». Доминирующей кобыле нужно только повернуть одно ухо, чтобы заставить низшее по рангу животной отойти от пищи. Лошадь вытесняет вас, размахивая головой, наступая на вас, толкая или пиная, - она знает, как переместить вас, если вы позволите ей это. Поскольку лошади используют естественное перемещение, мы можем использовать эту особенность в целях их тренинга.

Когда вы едете верхом, вы используете тип давления, который учитывает тенденцию лошади к перемещению. Возьмите, например, давление шенкеля. Почему мы не напряжение бицепса или слова вроде «быстрее», чтобы ускорить лошадь? Давление шенкеля подражает естественным средствам, которые «перемещают» лошадь, - лошадь уходит от давления, приложенного к ее бокам, независимо от того, кто его применяет. Если вы надавите на левую сторону лошади, она переместится вправо и наоборот. Равное давление с обеих сторон вызовет движение вперед – лошадь будет стремиться избежать давления. Теоретически, лошадь могла бы выбрать и движение назад (даже на свободном поводу), но обратное движение для нее не так естественно и, следовательно, такие проявления у зрелых лошадей встречаются достаточно редко.

Как только лошадь реагирует так, как требовалось всаднику (например, переходя от шага к рыси), он снимает давление, и лошадь воспринимает это положительно. Лошади не любят давление и будут работать так, чтобы избежать его. Если вы немедленно освободите лошадь от давления, ее мозг свяжет действие с результатом. В следующий раз, когда вы нажмете на ее бока обоими шенкелями, лошадь снова ускорится, надеясь достичь того же результата.

«Шарики и ролики»: как работает мозг лошади

Физиологически связь между давлением и освобождением от давления происходит, когда две нейронные сети становятся связанными одновременной активацией. Одна группа нейронов в мозгу лошади отвечает за ощущение давления. Вы нажимаете, она чувствует, и определенные мозговые клетки «загораются». Другой набор нейронов отвечает за движение вперед. Когда две сети срабатывают одновременно или рядом, они связываются процессом, который мы называем «долговременной потенциацией».

Долговременная потенциация - это форма запоминания. Активированные нейроны остаются более бодрствующими в течение нескольких секунд после первоначального «возбуждения». В этот короткий промежуток времени они запускаются быстрее и интенсивнее. Ослабление давления в этот момент заставляет две сети подключиться. Слишком рано – и первая сеть еще не активирована. Слишком поздно – и запоминание не сработало. Чтобы создать связь между вашим давлением и ответом лошади необходим правильный тайминг.

Тренеры используют отрицательное подкрепление, чтобы обучать молодых и (или) неопытных лошадей реагировать на любые возможные виды давления, инициируемые человеком. Первый галоп под седлом молодой лошади обычно смущает ее. Она двигалась шагом и рысью, изучая основы остановки, движения, поворота и т.д. Но подъем в галоп под всадником - это что-то новое... Внезапно тренер использует давление только одного шенкеля, но позиция его корпуса и легкая подсказка повода говорят лошади ускориться. Если бы лошадь думала, как человек, она могла бы задаться вопросом: «Хм, это отличается от обычной рыси. Что же это значит?»

Испытывая постоянное давление одного шенкеля и ощущая некоторое неудобство из-за движения быстрой рысью, молодая лошадь в конце концов попробует подняться в галоп. Представьте, что она говорит: «Хорошо, это не быстрая рысь, потому что его нога все еще нажимает только на один мой бок. Я могу попробовать поднять вверх голову; нет, снова не то. Как насчет остановки? Нет, он толкает обеими ногами, когда я это делаю. Ну, давайте попробуем немного галопа...» В тот момент, когда лошадь поднимается в галоп, тренер снимает давление шенкеля и начинает сопровождать лошадь. Теперь лошадь знает: «Ага! Вот что означает один шенкель». Ее мозг использует долговременную потенциацию для подключения двух сетей и усвоения урока. Со временем мы начнем обострять восприятие лошадью наших сигналов разными способами.

Более сложные этапы обучения и отрицательное подкрепление

Отрицательное подкрепление лучше всего работает на ранних этапах обучения лошади, но оно используется и на более сложных его этапах. Примером могут служить полуодержка и нисходящий переход. Предположим, вы хотите перевести лошадь из рыси в шаг. Вы используете седалище, замедляя лошадь, сопротивляясь седалищем движению вперед. Она чувствует это давление и реагирует на просьбу, замедляясь, чтобы соответствовать вашему ритму. Когда она переходит в шаг, вы снимаете давление седалища и снова двигаетесь вместе с ней. Так лошадь обучается полуодержке и она будет реагировать с большей готовностью с каждым разом, так как ее нейронные сети будут продолжать активироваться одновременно путем многочисленных повторений.

Седалище всадника является важнейшим источником давления. Грамотный всадник может применять давление седалища во множестве вариаций – с разной силой и в разных направлениях - вверх, вниз, влево, вправо, вперед, назад, по диагонали и по кругу. В конце концов, высококвалифицированная лошадь будет реагировать на изменения положения и силы воздействия седалища очень точно и тонко. В таком случае опытный всадник сможет разместить любую часть тела лошади в любом возможном положении только своим седалищем на шагу, рыси или галопе.

Работа - это еще одна форма давления на лошадь, а отдых - освобождение от него. Предположим, что лошадь изредка козлит под седлом. Если у вас есть навыки, позволяющие справится с ситуацией, не останавливайтесь и не замедляйтесь, когда начинаются козлы, - просто заставляйте лошадь работать. Как только она начнет козлить, вышлите ее в активную быструю рысь и двигайтесь ею в течение минуты. Когда лошадь легко пойдет вперед без козлов, похлопайте ее по шее и дайте прошагнуть на длинном поводу. Затем повторите первоначальный маневр. Каждый раз, когда лошадь начинает козлить, толкайте ее вперед, заставляя выполнять более тяжелую работу. Мы не пытаемся таким образом утомить лошадь. Мы показываем ей, что она будет освобождена от давления работы, как только перестанет козлить.

Недостатки отрицательного подкрепления

Отрицательное подкрепление полезно для лошадей, которые просто учатся нести всадника и интерпретировать его сигналы. Оно также полезно для лошадей, нуждающихся в исправлении тех или иных недостатков поведения. Многие лошади обучаются исключительно методом отрицательного подкрепления, и оно дает отличные результаты.

Но отрицательное подкрепление может создавать и проблемы.

Во-первых, его нужно использовать в конкретный момент. У многих всадников-любителей есть проблемы с координацией их движений с движениями лошади. Вспомните о своем первом галопе, о рыси, когда вы напоминали мешок с картошкой. «Прижмите левый шенкель за подпругой!» Многие из нас думали в такие моменты не о шенкеле, а о том, чтобы не упасть, а не о своевременности действий.

Во-вторых, координация становится еще более сложной задачей, когда нам нужно одновременно и применять, и снимать давление. Поскольку долговременная потенциация очень кратковременна, ваши действия должны четко следовать друг за другом во времени, успевая реагировать на ответы лошади. Представьте, что вы обучаете лошадь уступке шенкелю, когда она должна быть прямой от головы до хвоста, но движется по диагонали от давления ноги. Чтобы научить ее этому навыку, всадник создает давление внешним шенкелем во время фазы движения задней ноги лошади. «Фаза движения» - это тот микро-момент, когда лошадь уже подняла ногу от земли, но еще не опустила. Таким образом, вы применяете внешнее давление за подпругой, когда начинается фаза движения, и, если лошадь реагирует, перемещая внешнюю заднюю ногу по диагонали, вы снимаете давление до окончания фазы движения. Этот промежуток на средней рыси длится менее половины секунды!

Третью проблему может создать случайное непреднамеренное подкрепление. Вы едете галопом, и вам нужно слегка сработать левым поводом, чтобы начать большой круг. Но вы слишком сильно «срабатываете», лошадь резко разворачивается (соответственно вашей просьбе), и вот, вы уже сидите на земле. Упав, вы избавили лошадь от давления и преподали ей прекрасный, четкий урок. Если бы лошадь могла говорить, она могла бы сказать: «Ничего себе! Она сама хотела, чтобы я резко повернулась. Я сделала это, и она мгновенно убрала все давление. Я сделаю так и в следующий раз!»

Хорошие навыки езды препятствуют непреднамеренному подкреплению. Сидя в седле, опустив вес в пятки, выровняв корпус, не закрепощая рук, двигаясь седалищем и ногами вместе с лошадью, мы можем подавать ей четкие сигналы, последовательно повторяя их раз за разом.

В-четвертых, всадники иногда ошибочно путают «давление» и «наказание». Давление отрицательного подкрепления, возможно, должно сначала раздражать или сдвигать, но оно никогда не должно быть болезненным или травматичным! Наказание, как образовательный инструмент, может вызвать серьезные проблемы и должно использоваться только высококвалифицированными тренерами в редких случаях вопиющего поведения лошади. Наказание - это наименее эффективное средство обучения!

Возможно, самое важное заключается в том, что отрицательное подкрепление учит лошадь подчиняться и отвечать, но оно не создает доверия или привязанности между лошадью и всадником. Оно побуждает лошадь искать, идентифицировать и использовать сигналы всадника, но оно не дает такого бонуса, как создание доверительных отношений с лошадью.

Навык снятия давления

Снятие давления является наиболее важной составляющей отрицательного подкрепления. Техника будет использоваться неправильно, когда всадник оказывает давление, но не может его снять, когда лошадь отвечает. Эта ошибка, к сожалению, встречается довольно часто. Лошади не будут реагировать хорошо и правильно, если оказывать на них постоянное давление. Одни теряют всякую мотивацию, а другие становятся слишком нервными. Лошадь может начать козлить, свечить, осаживать, отбивать. В таком случае может помочь принцип «исправить и снять».

Воздействие «исправить и снять» используется во всех областях общения и взаимодействия с лошадью, начиная от ведения ее на чомбуре рядом с собой. Постоянное корректирующее давление (например, когда лошадь ложится в повод) препятствует обучению, раздражает или пугает лошадь, а также заставляет вас и лошадь соревноваться в перетягивании каната. Независимо от того, насколько вы сильны, вы никогда не перетянете 500-килограммовую лошадь. Вместо этого она станет тугоуздой, звездочетящей и не желающей сотрудничать с вами (у вас, правда, появятся отличные бицепсы).

Чтобы избежать постоянного давления, попробуйте использовать ряд нажатий, освобождая лошадь от этой серии, когда она ответит правильно. (Помните о сигнале ремня безопасности? Сигналу не нужно быть непрерывным, чтобы заставить нас пристегнуться, давление оказывается повторяющимися короткими гудками.) Добавьте другие способы замедления, чтобы помочь лошади расшифровать ваши сигналы: утяжеляйте седалище, согнув локти, смягчив ноги, облегчаясь медленнее, принимая более вертикальное положение.

Отрицательное подкрепление является наиболее распространенной формой ассоциативной тренировки лошадей, но, чтобы его использовать, требуется превосходная координация, своевременность и навыки верховой езды. Оно учит лошадь реагировать, как реагирует хороший солдат, но оно редко мотивирует лошадь сотрудничать и доверять всаднику.

Джэнет Л. Джонс (источник); перевод Валерии Смирновой.

Комментарии
Пожалуйста, авторизуйтесь или зарегистрируйтесь для комментирования