kliker – Magiczne pudełko

Chcąc zrozumieć fenomen tego małego, plastikowego pudełeczka wydającego z siebie charakterystyczne „klik”, trzeba najpierw prześledzić proces nauki u psów. Przebiega on podobnie jak u innych zwierząt oraz jest bardzo zbliżony do ludzkiego. Właściwie różnica polega jedynie na sposobie motywacji. Pies, w odróżnieniu od człowieka, nie jest w stanie zrozumieć obietnicy nagrody czy też kary wymierzonej dawno po fakcie. Dlatego niewiele wskóramy zapewnieniem go, że dostanie w domu ciasteczko, gdy będzie grzeczny na spacerze oraz klaps za pogryzienie kapcia pod naszą nieobecność nie przyniesie zamierzonego efektu. Zresztą u ludzi podobne metody wychowawcze też raczej się nie sprawdzają.

IMG_1217

 

Wróćmy jednak do procesów uczenia się psów. Wyróżniamy dwa podstawowe – warunkowanie klasyczne i warunkowanie instrumentalne.

Warunkowanie klasyczne

Poprzez warunkowanie klasyczne zwierzęta uczą się tego, jak przewidywać pojawienie się ważnych dla nich wydarzeń w środowisku, takich jak pokarm czy ból, oraz jak się na te wydarzenia przygotowywać. Warunkowanie klasyczne jest procesem, w wyniku, którego początkowo obojętny dla psa bodziec w połączeniu z bodźcem wywołującym określoną, odruchową reakcję organizmu, nabiera zdolności do wywoływania tej reakcji.

Jako pierwszy eksperymenty nad warunkowaniem przeprowadził Iwan Pawłow (stąd warunkowanie klasyczne zwane jest również warunkowaniem Pawłowa). Odkrył on, że psy wydzielają ślinę nie tylko w trakcie spożywania pokarmu, ale także na dźwięk dzwonka, który ten pokarm zapowiada (po pewnym czasie psy śliniły się już na sam dźwięk dzwonka, nawet, jeżeli przestano podawać po nim jedzenie). W przebiegu procesu warunkowania wytwarzają się związki między bodźcami warunkowymi (S) i reakcjami warunkowymi (R) S – R. Pies uczy się kojarzyć i łączyć ze sobą określone fakty i reagować na pewne wydarzenia w sposób automatyczny (na przykład na dźwięk dzwonka). Ważnym czynnikiem wpływającym na przebieg warunkowania klasycznego są zależności czasowe między bodźcami warunkowymi i bezwarunkowymi.

W życiu codziennym mamy mnóstwo przykładów tego sposobu nauki. Pies szybko uczy się, że dźwięk dzwonka u drzwi zapowiada gości, zdjęcie smyczy z wieszaka jest równoznaczne ze spacerem, odgłos misek oznajmia porę karmienia. Warunkowanie klasyczne jest także wykorzystywane w trakcie szkoleń. Bardzo pomocne okazuje się stosowanie bodźca warunkowego (klikera lub innego rodzaju znacznika), który z biegiem czasu staje się dla psa zapowiedzią nagrody.

Warunkowanie instrumentalne

Pod wpływem warunkowania instrumentalnego (zwanego również sprawczym) jednostki dowiadują się, które z ich zachowań przynoszą (z ich punktu widzenia) korzystne, a które niekorzystne zmiany w środowisku. Uczą się, które czynności i reakcje należy i warto powtarzać, a których lepiej jest unikać, czyli mówiąc prościej – nabierają doświadczenia, co jest dla nich opłacalne, a co nie.

Silnie związane z warunkowaniem instrumentalnym jest pojęcie prawa efektu głoszące, że zachowanie, które w danej sytuacji wywołuje odczucie zadowolenia będzie kojarzone z tą sytuacja i w przyszłości prawdopodobnie powielane, (jeżeli okoliczności się powtórzą). Z kolei, gdy w określonej sytuacji zachowanie wywoła odczucie dyskomfortu, to prawdopodobieństwo powtórzenia się tego zachowania w przyszłości, w podobnych warunkach, spada.

W przeciwieństwie do warunkowania klasycznego, w warunkowaniu instrumentalnym zwierzę ma wpływ na to, co się wydarzy, ponieważ rezultat zależy od jego zachowania. Konsekwencje zachowania organizmu dzielimy na atrakcyjne i awersyjne. Konsekwencje atrakcyjne nazywamy nagrodami, zaś awersyjne-karami. O nagrodzie mówimy wtedy, gdy każda konsekwencja zachowania powoduje zwiększenie się prawdopodobieństwa jego powtórzenia w przyszłości. Z kolei kara jest każdą konsekwencją zachowania zmniejszającą prawdopodobieństwo powtórzenia się tego zachowania w podobnych warunkach w przyszłości.

Połączeniem tych dwóch procesów nauki psa jest… szkolenie klikerem. Jego dźwięk jest dla czworonoga zapowiedzią nagrody, a usłyszany w trakcie wykonywania danej czynności sprawia, że zwierzę chętnie ją powiela.

art_b441d398

Sposoby pracy z klikerem

Naprowadzanie, czyli pokazywanie zwierzęciu, czego od niego oczekujemy. Możemy do tego używać odpowiednio wprowadzonego wcześniej targetu lub po prostu dłoni ze smakołykiem. Za ich pomocą sprawiamy, że zwierzę wykonuje odpowiednią czynność(na przykład do siada czy chodzi przy nodze). Należy pamiętać, że naprowadzanie stosuje się tylko do momentu, aż zwierze zrozumie, o co od niego oczekujemy. Później stosujemy wyrobioną komendę gestem (ten sam ruch ręki, ale już bez smakołyka) lub oczekujemy od psa samodzielnego powtarzania danego zachowania. Oczywiście zachowanie to cały czas musi być przez nas wzmacniane. Stopniowo także wprowadzamy komendę słowną.

Wyłapywanie, polega na „wychwytywaniu” i nagradzaniu pożądanych przez nas zachowań, w chwilach, w których zwierzę wykonuje je spontanicznie. Wyłapywanie jest pomocne przy zachowaniach trudnych do nauczenia w jakikolwiek inny sposób. Przykładem może być tu nauka chodzenia na luźnej smyczy. Psu, który ciągnie na spacerach ciężko jest wytłumaczyć, czego tak na prawdę od niego oczekujemy, bo trudno w wyraźny sposób zaznaczyć właściwy moment. Chyba, że używamy klikera.

Kształtowanie jest najbardziej rozbudowaną techniką. Polega ono na wzmacnianiu zachowań coraz bliższych temu, które docelowo chcemy osiągnąć. Zaczynamy najpierw od wzmacniania zachowania, które pojawia się spontanicznie. Następnie, gdy jest ono już dostatecznie przez psa opanowane, zaczynamy wymagać coraz więcej i postępujemy tak do momentu, aż osiągniemy zamierzony cel. Naszą rolą jest tylko obserwowanie i wzmacnianie. Zwierzę za każdym razem jest „zmuszane do odgadywania”, czego od niego oczekujemy, aż osiągniemy wyznaczone zachowanie. Technikę tę możemy stosować do bardzo trudnych zadań lub za jej pomocą pracować nad pozornie prostymi elementami, które sprawiają czworonogowi problem. Wystarczy, że dane zachowanie rozłożymy na drobne etapy i każdy z nich „wyklinamy”.

art_a9ede4a7

Zalety klikera

Oczywiście można, jako znacznika używać dowolnego słowa, jednak „klikanie” jest bardziej precyzyjne. I to z kilku powodów:

– szybkość
Zanim wypowiem słowo-znacznik (np. dobry pies), na pewno zdążę kliknąć. Ma to bardzo duże znaczenie, przy wyłapywaniu zachowań, gdzie czas naszej reakcji decyduje o przyszłym sukcesie.

– precyzja
Szybkość klikera nie tylko pozwala zaznaczyć zachowanie, które trwa tylko chwilę, ale także wyłapać szczegóły (przydatne w poprawieniu techniki). Nawet, gdy pies jest oddalony od swojego opiekuna (liczy się moment kliknięcia, a nie pojawienia nagrody).

– niepowtarzalność
Charakterystyczne „klik” pies słyszy zazwyczaj tylko podczas szkolenia, dzięki czemu jest to precyzyjny znacznik, w odróżnieniu od formułek słownych, które zwierzę ma okazję słyszeć w życiu codziennym. Ponieważ nie są one zawsze poparte nagrodą, mogą przestać być czytelnym sygnałem.

– brak emocji
Głos bardzo wyraźnie sygnalizuje psu nasze emocje (zdenerwowanie, nadmierne pobudzenie), a kliker zawsze brzmi tak samo. Co jest szczególnie ważne przy psach nadpobudliwych lub lękliwych.

– różnorodność treningów
Trenując z klierem możemy wykorzystać klika technik. Dzięki temu przyspieszymy naukę stosując naprowadzanie, a w wypadku trudnych elementów, możemy podzielić ją na drobne etapy i z nich zbudować cale zachowanie.

IMG_9612
Zanim zaczniesz

Chcąc pracować z psem (lub innym zwierzęciem) za pomocą klikera, trzeba go najpierw odpowiednio wprowadzić. Wykorzystujemy tu warunkowanie klasyczne, gdzie bodźcem będzie „klik” a następstwem pojawienie się smakołyka. W tym celu klikamy i natychmiast podajemy przysmak. Taką sekwencję powtarzamy kilkakrotnie, po czym wprowadzamy tzw. opóźnienie nagrody, czyli uczymy czworonoga, że smaczny kąsek pojawi się zawsze po dźwięku klikera, jednak nie musi to nastąpić natychmiast. Wystarczy, że smakołyk nie będzie się znajdował w naszej ręce, a sięgniemy po niego kieszeni lub saszetki dopiero po kliknięciu. Pozwoli nam to pracować z psem poprzez wyłapywanie i kształtowanie (gdzie najczęściej nagroda jest podana z opóźnieniem), ale również pozwoli uniknąć frustracji podczas naprowadzania, kiedy zawieruszy się nam przysmak w kieszeni/saszetce.

IMG_8861

Pięć złotych zasad

Zawsze klikaj tylko jeden raz
Dźwięk klikera ma sygnalizować w dokładny sposób, co się nam podobało (czyli jakie zachowanie było przez nas pożądane), a wielokrotne klikanie z reguły dezorientuje psa. Jeżeli chcemy nagrodzić pupila za poprawne wykonanie trudnego polecenia, zamiast kilkakrotnie naciskać kliker, dajemy mu większą ilość drobnych nagród.

Najpierw klikaj, później nagradzaj
Ważny jest moment kliknięcia, a nie podania przysmaku. To klik jest zapowiedzią nagrody i on informuje psa, że właśnie zrobił coś, za co otrzyma smakołyk. Odwrotna kolejność zdezorientuje czworonoga oraz sprawi, że kliker przestanie być znacznikiem.

Klikaj, gdy pożądane zachowanie trwa
Kliker umożliwia nam w niezwykle precyzyjny sposób zaznaczyć moment zaznaczyć odpowiednie zachowanie. Oczywiście pod warunkiem, że klikniemy, gdy pies je wykonuje, a nie po fakcie. Przykładowo, gdy chcemy psa nauczyć cofania się, musimy kliknąć w momencie, gdy wykonuje ruch w tył, a nie, kiedy się zatrzyma. Inaczej nauczymy go stać, bo zaznaczyliśmy i efekcie nagrodziliśmy te zachowanie, zamiast oczekiwanego przez nas cofania.

Kliker nie służy do zachęty
Pamiętajmy, że klikerem zaznaczamy te zachowania, które chcemy, by pies powielał. Jeżeli klikniemy w momencie zawahania się, poinformujemy czworonoga, że warto się ociągać z wykonaniem zadania. Zawsze starajmy się wyłapać choćby najmniejszy postęp. Dzięki temu zwierzę szybciej nauczy się danej komendy.

Kliker nie służy do przywoływania psa, ani zwracania jego uwagi
W wypadku, gdy będziemy klikać, kiedy pies jest od nas daleko (wiedząc, że przybiegnie po nagrodę), zamiast nauczyć go przychodzenia na komendę, osiągniemy odwrotny efekt. Sprawiamy, że opłacalne dla niego jest przebywanie z dala od nas

IMG_9424

Kilka „dobrych rad”

Trenuj w krótkich sesjach
Zdecydowanie lepiej jest ćwiczyć krócej i częściej. Długie sesje szkoleniowe mogą skutecznie zniechęcić zarówno opiekuna jak i psa. Postaraj się zakończyć, gdy oboje macie jeszcze ochotę na więcej. Staraj się dłuższe treningi przeplatać wspólną zabawą. Pamiętaj, że stymulacja umysłowa jest dla twojego pupila bardzo męcząca.

Odpowiedni smakołyk
Wzmocnienie pozytywne (bo tym jest trening z kilkerem), jak sama nazwa wskazuje, jest nagrodzeniem pożądanego zachowania. Chcąc uzyskać szybkie postępy w nauce, należy pamiętać, by nagroda była odpowiednia. Nie chodzi tylko o jej atrakcyjność, czyli w przypadku jedzenia o smak, ale także o jej dostępność. Kiedy jest jej w nadmiarze, na pewno straci na znaczeniu. Istotna jest też wielkość oraz twardość, bo zbyt długie gryzienie spowalnia proces uczenia się (pies jest skoncentrowany na jedzeniu, nie nauce).

Nagradzaj, nie przekupuj
Smakołyk na być nagrodą za dobre zachowanie, dlatego, nawet przy szkoleniu z naprowadzaniem, należy do stosunkowo szybko wycofać się z trzymania go w ręce. Inaczej pies zacznie traktować smakołyk, jako przekupstwo, a nie nagrodę i bez przysmaku w dłoni opiekuna nie będzie chciał wykonać polecenia

Trenuj rozważnie
Zanim zaczniesz trening z psem zastanów się, co chcesz osiągnąć oraz w jaki sposób. Trudniejsze zadania rozłóż na etapy. Najpierw odpowiednio utrwal podstawy, poćwicz z bodźcami rozpraszającymi, a dopiero potem wymagaj od psa. Od tego, jak umiejętnie będziesz szkolił swojego pupila zależą jego wyniki.

Baw się dobrze
Pamiętaj, że trening z psem powinien być przede wszystkim dobrą zabawą.

IMG_9177

Na koniec trochę historii

Początkowo tą metodą szkolono tylko delfiny, (jako znacznika używając gwizdka), jednak szybko zauważono, że można ją wykorzystać również do nauki innych zwierząt (w tym nauki posłuszeństwa u psów). I chociaż już w latach sześćdziesiątych ubiegłego stulenia pan B.F Skinner propagował kliker, zyskał on aprobatę dopiero w 1992 roku podczas seminarium pod znaczącym tytułem „Zanim zastrzelisz bestię”, w którym uczestniczyło 250 szkoleniowców psów.

Pan Skinner, dzięki swoim eksperymentom na gołębiach, stał się także propagatorem nauki zachowań poprzez kształtowanie. Otóż uczył on ptaki ustalonych kroków tanecznych, ukłonów, kroku defiladowego lub dziobania postaci wybranej na zdjęciu. A wszystko w zaledwie kilka minut oraz pod czujnym okiem krytycznej i niedowierzającej publiczności. Wystarczyło, że w precyzyjny sposób zaznaczał i wzmacniał pożądane zachowania, które przybliżały gołębia do końcowego zadania.

Piotr Awencki
www.zuzik.pl

artykuł ukazał się w gazecie Dog&Sport (nr 2/2014)

 

Centrum Edukacji Kynologicznej