Kształtowanie slalomu fot. Agnieszka Prymaka
3.8. WPROWADZANIE KOMEND
W szkoleniu klikerowym komenda jest dodawana, gdy pies wykonuje już dane ćwiczenie. Komendę dodaje się gdy treser jest pewny, że szkolone zwierzę jest w stanie wykonać polecenie. Początkowo wypowiada ją w momencie, gdy pies zaczyna wykonywać zachowanie, stopniowo daje ją coraz wcześniej, aż stanie się ona sygnałem do wykonania ćwiczenia [Spector 1999].
komenda -> zachowanie -> klik -> nagrodaKomenda jest poleceniem, a równocześnie szansą na nagrodę. Jeżeli pies jej nie wykona, zaprzepaści możliwość otrzymania nagrody. W uczeniu metodą klikerową pies nie jest do niczego zmuszany. Jeżeli nie wykonuje polecenia znaczy to, że przewodnik za szybko podniósł kryteria i za dużo wymaga od psa. Musi więc wrócić do początków i uprościć ćwiczenie [Pryor 1985]. Komendy powinny być wypowiadane spokojnym głosem, nie należy krzyczeć. Im ciszej się mówi, tym bardziej pies koncentruje się na przewodniku. Nie należy też powtarzać komend kilkakrotnie, wtedy pies uczy się wykonywania poleceń dopiero po powtórzeniu komendy [Waldoch 2002].
Do komendy słownej można dodać komendę optyczną np. podniesienie ręki na siad. Jest to przydatne zwłaszcza w pracy na odległość. Pies jako drapieżnik bardzo dobrze reaguje na ruch, dlatego sygnał optyczny może być łatwiejszy do odebrania niż słowo [Waldoch 2002].
Czas pomiędzy wydaniem komendy, a reakcją psa powinien być prawie natychmiastowy. Często zdarza się, że pies wykonuje polecenie dopiero po pewnym czasie. Możliwe jest przyśpieszenie wykonywania komendy. Przewodnik wybiera jedno zachowanie, które pies dobrze zna i wykonuje na komendę i nad tym zachowaniem pracuje kilka dni. Ustala jaki powinien być średni czas reakcji i zaczyna ćwiczenie. Jeżeli pies wykona polecenie w ustalonym czasie to dostaje sygnał klikera i nagrodę. Jeżeli wykona z dużym opóźnieniem, przewodnik zaczyna od początku, może zmienić pozycje np. odejść kilka kroków, dąży do przyśpieszenia wykonywania ćwiczeń. Gdy zwierzę wykonuje polecenie w wymaganym czasie, trzeba podwyższyć kryteria i wymagać jeszcze szybszego wykonania ćwiczenia [Waldoch 2002].
Najlepszym sposobem na nauczenie szybkiego wykonywania komend jest uczenie tego razem z nauką zachowania i uważanie zachowania za wyuczone dopiero wtedy, gdy szybkość wykonania jest zadowalająca.
Komendy stają się dla psa bodźcami do zachowania i w zamian otrzymania nagrody. Jeżeli pies wykonuje polecenia komend znaczy to, że jest pod kontrolą bodźców.
Doskonała kontrola bodźców jest zdefiniowana przez cztery warunki:- Zachowanie pojawia się zawsze natychmiast w odpowiedzi na bodziec np. pies natychmiast siada na komendę "siad"
- Zachowanie nie pojawia się bez bodźca np. w czasie szkolenia pies nie siada jeśli przewodnik nie da takiego polecenia
- Zachowanie nie pojawia się w odpowiedzi na inny bodziec np. na komendę "waruj" pies nie siada
- Żadne inne zachowanie nie pojawia się w odpowiedzi na dany bodziec np. na komendę "siad" pies nie odpowiada podskokiem itp. [Pryor 1985].
3.9. ZASADY POMOCNE W SZYBSZEJ I LEPSZEJ NAUCE ZACHOWANIA
Dźwięk klikera jest mostem między zachowaniem a wzmocnieniem bezwarunkowym. Dokładne zaznaczenie zachowania pozwala na efektywne szkolenie. Dzięki klikerowi jest to możliwe. Wzmocnienie bezwarunkowe następuje zazwyczaj z pewnym opóźnieniem dlatego kliker rozwiązuje ten problem. Jednak Bob Bailey pisze, że im dłuższe opóźnienie między warunkowym a bezwarunkowym wzmocnieniem, tym mniej efektywne jest wzmocnienie warunkowe. Zwierzę kojarzy wzmocnienie bezwarunkowe z zachowaniem tak samo, jak kojarzy z zachowaniem wzmocnienie warunkowe. Aby pies uczył się skutecznie ważne jest dostarczenie podstawowego wzmocnienia tak szybko jak to tylko możliwe. W niektórych przypadkach zwierzęta uczą się radzić sobie z tym opóźnieniem np. w przypadku szkolenia na odległość. Jednak wzmocnienie warunkowe nie jest doskonałym mostem, łączy ono dwa różne momenty w czasie. Opóźnienie w podawaniu nagród jest niemożliwe do uniknięcia, ale powinno się je redukować.
W przeciwnym wypadku szkolenie będzie wolniejsze i trudniejsze. Poprzez duże opóźnienie w podawaniu nagród można nauczyć psa innego, przypadkowego zachowania, które przyczyni się do nauczenia całego łańcucha zachowań. Np. pies po usłyszeniu sygnału klikera podskakuje po nagrodę:
zachowanie -> klik -> podskok -> smakołykPies za każdym razem będzie podskakiwał do smakołyka, co stanie się ogniwem łańcucha, a jedzenie jako bodziec bezwarunkowy, będzie to zachowanie wzmacniał. Są to zachowania przesądne, które pies powtarza, ponieważ jest to, często nieświadomie, nagradzane [Spector 1999].
Bob Bailey zwraca też uwagę na nagradzanie w pozycji uczonego zachowania.
Nagradzanie warowania w pozycji warującej fot. Aneta Prymaka

To w jakiej pozycji jest podawany smakołyk może psu bardzo pomóc zrozumieć o co chodzi w danym ćwiczeniu. Kiedy i gdzie dostarczana jest nagroda może zaważyć na zachowaniu psa.
Są to zasady, które bardzo ułatwiają szkolenie zwierząt.
3.10. GENERALIZOWANIE ZACHOWAŃRozszerzenie reakcji na nowe bodźce jest nazywane generalizacją [Anderson 1998]. Jeżeli pies jest nauczony pewnego zachowania tylko w jednym miejscu, istnieje duże prawdopodobieństwo, że w innym miejscu pies tego ćwiczenia nie będzie wykonywał. Dzieje się tak dlatego, że zwierzę kojarzy dane zachowanie z miejscem gdzie było ono wzmacniane. Bardzo ważne jest więc generalizowanie, czyli uczenie psa tego samego zachowania w różnorodnych miejscach i sytuacjach. Uczy się on kojarzyć wykonywane ćwiczenie w zróżnicowanych okolicznościach [Spector 1999].
Na początkowym etapie szkolenia treser ćwiczy z psem w miejscu znanym dla psa, gdzie pies czuje się dobrze. Pies nie może dodatkowo stresować się nieznaną sytuacją i miejscem, najczęściej jest, więc to mieszkanie. Nie może być w nim za dużo rozproszeń, które odrywałyby zwierzę od szkolenia. Właściciel powinien zaczynać naukę, gdy jest sam ze swoim pupilem. Gdy pies nauczył się już zachowania i wykonuje je na komendę, treser zaczyna ćwiczyć z nim w różnych okolicznościach. Musi to robić stopniowo, we wszystkich pomieszczeniach mieszkania, w obecności domowników, na spacerze, ulicy itp. Musi także przy tym zmieniać pozycje swojego ciała, żeby pies nie skojarzył ćwiczenia tylko np. ze staniem właściciela [Waldoch 2002]. Nowe środowisko jest nowym kryterium, kryteria muszą być zwiększane "małymi kroczkami" [Spector 1999].
Nauka siadania w miejscu bezpiecznym dla psa fot. Aneta Prymaka

Nauka siadania z przedłużaniem odległości przewodnika od psa fot. Aneta Prymaka

Nauka siadania w obecności rozproszeń fot. Aneta Prymaka

Generalizowanie jest niezbędnym procesem szkoleniowym. Dzięki niemu pies buduje większe zaufanie do właściciela, który w każdej nowej sytuacji jest z psem i oczekuje od niego robienia rzeczy łatwych, a nie ryzykownych [Spector 1999]. Pies wie, że jeżeli nie wykona ćwiczenia nie spotka go kara, po prostu straci szansę do otrzymania nagrody. Najczęściej przyczyną nie wykonania zadania jest zbyt szybkie podniesienie kryteriów.
3.11. HARMONOGRAM WZMACNIANIALaboratoryjne doświadczenia Skinnera wykazały, że najlepsze wyniki otrzymuje się przy zastosowaniu zmiennego wzmacniania tzn. gdy wzmacniana jest nie każda reakcja zwierzęcia. Nie może ono wtedy przewidzieć, kiedy dostanie nagrodę. Takie zachowanie jest odporne na wygaszenie [Waldoch 2002]. Jednak w okresie nauki zachowania konieczne jest stałe wzmacnianie, czyli w proporcji 1:1, za jedno poprawne zachowanie zwierzę otrzymuje jedną nagrodę. Na początku nauki powinno się dostarczać jak najwięcej wzmocnień. Gdy zachowanie jest wyuczone nie należy wzmacniać go regularnie. Jak twierdzi Karen Pryor, żeby zachowanie utrzymać na dobrym poziomie, trzeba wzmacniać je jedynie od czasu do czasu w sposób trudny do przewidzenia. Zmienny schemat wzmocnień pozwala także kształtować perfekcję zachowania. Jeżeli nagradza się każdą reakcję, zwierzę nie stara się wykonywać zadań za każdym razem dokładnie, ponieważ wie, że zawsze otrzyma nagrodę. Natomiast zmienne nagradzanie sprawia, że za każdym razem stara się ono wykonać zadanie dobrze [Pryor 1985].
Używanie zmiennego rozkładu wzmocnień to praca na granicy wygaszenia i na granicy wybuchu przedeliminacyjnego. Pojęcie "wybuch przedeliminacyjny" określa zwiększony wysiłek psa w jakimś zachowaniu, zanim zacznie się ono wygaszać. Np. jeżeli pies był zawsze głaskany, gdy skakał na przewodnika, a w pewnym momencie przestał być głaskany, wówczas będzie on przez pewien okres skakał ze zdwojoną intensywnością, zanim zupełnie przestanie skakać. Wtedy nastąpi wygaszenie zachowania [Waldoch 2002]. Jeżeli jednak zachowanie zostanie czasami nagrodzone, to bardzo się ono umocni. Poprawne stosowanie zmiennego wzmacniania jest jednak bardzo trudne, ponieważ żeby móc je stosować, zachowanie musi być perfekcyjnie opanowane przez psa. Bob Bailey uważa, że praktycznie nie powinno się go stosować. Już ucząc zachowania wprowadza się pewien element zmienności, nagradzając tylko ćwiczenia dobre, przedłużając czas trwania zachowania, zwiększając odległość [Waldoch 2002]. Niepoprawne, niedokładne odpowiedzi psa będą wygasać, ponieważ nie będą nagradzane. Zachowanie musi być bardzo dobrze zgeneralizowane, żeby móc stosować zmienny harmonogram wzmocnień [Spector 1999]. Życie codzienne dostarcza również psu wiele zmienności, czasem przewodnik zapomni nagrodzić, czasem tylko pogłaszcze lub pochwali [Waldoch 2002].
Morgan Spector używa zmiennego wzmacniania tylko do zachowań długotrwałych. Treser twierdzi, że używając powyższego wzmacniania stawia się psa w dużym błędzie, jest to także skazane na niepowodzenie szkolenia. Jeżeli przewodnik nie wzmacnia dobrych zachowań psa, zachowanie to może wygasnąć, ponieważ ono nie jest wzmacniane tak samo jak złe zachowanie [Spector 1999]. Dla psa ważne jest informacja, że zrobił coś dobrze. Jeżeli takiego sygnału nie otrzyma, może próbować dalej. Za popełnienie błędu nie otrzyma kary fizycznej, karą dla niego będzie już sam brak nagrody. Skutkiem kary fizycznej, jak napisano w podrozdziale 2.4.9.: Nagrody i Kary, może być zaprzestanie pracy, pies będzie bał się popełniać błędy [Spector 1999]. Używanie stałego wzmacniania poprawnych zachowań jest więc bardziej precyzyjnym szkoleniem. Według Spector, wybór harmonogramu wzmocnień to indywidualna sprawa przewodnika w zależności od tego jaki stopień zachowania chce osiągnąć.
Zmiennego wzmacniania nie można stosować przy specjalistycznym szkoleniu psów do pracy węchowej. Są to psy tresowane do wykrywania zapachów narkotyków, zapachów materiałów wybuchowych oraz śladów zapachowych ludzi. Każdy poprawny wybór zapachu musi zostać nagrodzony [Pryor 1985].
3.12. KSZTAŁTOWANIE ZACHOWAŃ
Jednym ze sposobów uczenia zachowań jest ich kształtowanie. Dzięki kształtowaniu można nauczyć zwierzęta zupełnie nowych zachowań. Kształtowanie polega na wzmacnianiu reakcji pośrednich, które prowadzą do ostatecznego zachowania, choć początkowo w niewielkim stopniu przypominają końcowe zachowanie. W ten sposób można nauczyć trudnych, skomplikowanych reakcji, a także łańcuchów zachowań.
Procesem kształtowania rządzi dziesięć podstawowych zasad. Są to:1. Kryteria należy podnosić stopniowo, aby dać osobnikowi szansę na nagrodę. Jeżeli kryteria zostaną podniesione zbyt wysoko pies może przestać wykonywać to czego już się nauczył. Tempo podnoszenia wymagań powinno być uzależnione od możliwości danego psa.
2. Należy kształtować tylko jeden element zachowania w danej chwili. Można pracować nad kilkoma zachowaniami w jednej sesji, ale nie nad kilkoma aspektami jednego zachowania. Za pomocą jednego wzmocnienia nie da się przekazać psu dwóch informacji np. jeśli wzmacnia się w jednym momencie szybkie siadanie to nie można wzmacniać także prostych siadów. Początkowo trzeba nauczyć szybkiego siadania, a dopiero gdy pies to opanuje, można przejść do nauki prostego siadania.
3. Przed podniesieniem kryteriów należy zawsze wprowadzać zmienne wzmacnianie. Ma to na celu utrwalenie zachowania.
4. Podczas wprowadzania nowych kryteriów lub aspektów zachowania należy na pewien czas zmniejszyć oczekiwania. Nabyte wcześniej umiejętności ulegają chwilowemu zakłóceniu poprzez nowe okoliczności. Np. gdy pracuje się z psem nad odległością w siedzeniu i zostawaniu, należy zmniejszyć tymczasowo czas zostawania. Pies przyzwyczai się do nowej odległości i będzie zostawał na tą odległość tak samo długo, jak poprzednio na krótszą.
5. Kształtowanie pożądanego zachowania powinno być zaplanowane tak, żeby przewodnik wiedział jakie zachowania powinien nagrodzić. Gdy pies zrobi szybkie postępy treser musi być na to przygotowany, żeby nie zahamować zachowania.
6. Nie należy zmieniać przewodnika w trakcie nauki danego zachowania. Pies może mieć kilku przewodników, ale każdy z nich powinien uczyć innych zachowań. Gdy ćwiczenie jest już opanowane, wtedy inne osoby mogą je egzekwować.
7. Jeżeli jeden sposób kształtowania zachowania nie przynosi pożądanych rezultatów należy zastosować inny sposób. Każde zachowanie można kształtować na wiele sposobów. Każdy z nich może działać inaczej na poszczególne zwierzę, należy więc wybrać taki, który daje dobre wyniki.
8. Nie należy przerywać sesji szkoleniowej bez powodu. Podczas nauki cała uwaga przewodnika powinna być skupiona na psie. Nagłe przerwanie sesji stanowi dla zwierzęcia pewnego rodzaju karę i może doprowadzić do wygaszenia zachowania.
9. Jeżeli wyuczone zachowanie pogarsza się należy wrócić do początków czyli do poszczególnych etapów kształtowania. Trzeba przypomnieć psu całe zachowanie w szybszym tempie niż jego uczenie.
10. Sesje szkoleniowe należy zakończyć sukcesem psa. Zwierzę najlepiej zapamiętuje ostatnie zachowanie dlatego ważne jest, żeby zakończyć naukę pozytywnym akcentem. Jeżeli nie jest możliwe zakończenie sesji sukcesem psa w danym zachowaniu, należy ćwiczyć coś łatwego, co pies już dobrze umie [Pryor 2004].
Stosując się do opisanych powyżej zasad możliwe jest nauczenie psa bardzo różnorodnego repertuaru zachowań. Każdy, nawet najmniejszy ruch w kierunku pożądanego zachowania jest elementem ćwiczenia prowadzącym do końcowego rezultatu. Np. ćwiczenie podnoszenia łapy można ukształtować zaczynając od przeniesienia ciężaru ciała na jedną łapę, następnie każde oderwanie łapy do ziemi stanowi element do wzmocnienia. Stopniowo podnosząc kryteria przewodnik uzyska zamierzone ćwiczenie.
Dzięki kształtowaniu możliwe jest nauczenie łańcuchów zachowań, często skomplikowanych. Zachowania muszą być wykonywane w pewnej kolejności, jest to seria zachowań połączonych w całość. Aby możliwe było opanowanie przez psa całego łańcucha zachowań, każde zachowanie musi być uczone oddzielnie [Spector 1999]. Łańcuchem zachowań jest na przykład nauka aportowania:
Przewodnik trzyma koziołek w ręku. Każde spojrzenie w kierunku aportu powinno być wzmocnione, następnie kształtowane jest dotykanie koziołka nosem, lizanie, aż w końcu treser zacznie wzmacniać otwieranie pyska i branie aportu w zęby. Ważne jest, żeby dawać sygnał klikera dokładnie w momencie, kiedy pies bierze aport w zęby, nie kiedy puszcza, bo w ten sposób ukształtowane zostanie puszczanie. Ilość ćwiczeń i szybkość podnoszenia kryteriów zależy od każdego psa indywidualnie, od szybkości z jaką się uczy i angażuje w ćwiczenie. Jeżeli pies chwyta aport treser zaczyna pracować nad trzymaniem go w pysku. Stopniowo przedłuża czas trzymania aportu przez psa wydłużając czas o kilka sekund. Trzeba nauczyć zwierzę także brania aportu nie tylko z ręki właściciela, stopniowo zniżając trzymany koziołek do ziemi. Pies powinien nauczyć się podejmowanie go stamtąd. Gdy ma już ten etap opanowany, przewodnik kładzie aport coraz dalej od psa, tak żeby zwierzę musiało po niego odejść kilka kroków. Komenda dodawana jest w momencie, gdy pies dobiega do przedmiotu. Stopniowo przewodnik wypowiada komendę coraz wcześniej, aż do chwili, gdy będzie dawana zanim pies pobiegnie w stronę aportu. Gdy pies reaguje na wprowadzoną komendę należy ukształtować powrót z aportem. Nagradzane jest każde odwrócenie się w stronę tresera, następnie każdy krok z aportem w pysku. Stopniowo wzmacniany jest coraz dłuższy dystans pokonany z koziołkiem w stronę przewodnika [Waldoch 2002].
Przynoszenie aportu

Kolejnym etapem jest nauczenie psa oddawania aportu na komendę. Nagradzane jest puszczanie przedmiotu do ręki tresera. Na początku wzmacnia się podstawienie ręki pod aport, potem oczekuje się od psa trzymania go aż do chwili wydania komendy na oddanie [Waldoch 2002].
Oddawanie aportu fot. Agnieszka Prymaka

Trzymanie aportu

Kiedy zwierzę aportuje położony przedmiot, wprowadza się nowy element - wyrzucanie aportu. Początkowo nie można wymagać od niego siedzenia i czekania na komendę, gdy aport zostanie rzucony, pies może biec po niego. Dopiero, gdy aportuje bardzo dobrze, wprowadza się siadanie z przyniesionym przedmiotem przed przewodnikiem, a następnie oczekiwanie w pozycji siedzącej przy nodze przewodnika na komendę po wyrzuceniu aportu [Waldoch 2002].
Poprzez kształtowanie kolejnych etapów aportowania powstał cały łańcuch zachowania, który wygląda następująco: Pies znajduje się w pozycji zasadniczej przy nodze przewodnika.
Pozycja zasadnicza fot. J. Wiśniewska

Przewodnik rzuca koziołek i daje psu komendę, na którą pies biegnie po aport i wraca z nim siadając przed przewodnikiem. Na komendę pies oddaje aport.
► UWAGA!
Dalsza część pracy znajduje się w dziale szkolenie -
Przejdź do działu