Smaczki – łapówka czy nagroda?

Czy da się  wyszkolić psa bez smaczków?

Mój pies słucha, jak mam smaczki w ręce. 

Jak tylko schowam smaczki, to pies robi, co chce. 

Bez smaczków nie istnieję dla mojego psa.  

Jak mam sprawić, żeby pies mnie słuchał bez smaczków

Jak nie mam przy sobie saszetki, to mój pies mnie olewa. 

Czy jest możliwe szkolenie bez smaczka?

To częste słowa opiekunów psów, może zresztą sam je już wypowiedziałeś. Dlaczego pies nie słucha opiekuna, gdy nie ma smaczków? Powodów jest kilka. Głównym jest to, że najprawdopodobniej używasz smaczków źle. Stosujesz je jako łapówkę dla psa, a nie jako nagrodę i wzmocnienie zachowania. Szkolenie to nie smaczki-łapówki. Łapówka i nagroda dla psa różnią się głównie intencją i kontekstem, w jakim są stosowane. 

Łapówka

Intencja: Łapówka jest zazwyczaj używana w kontekście manipulacji lub przekupstwa, aby uzyskać określone zachowanie od psa. Pokazujesz smaczki i pies dlatego chce ćwiczyć. Niekoniecznie musi być to świadome działanie, często pokazujemy na początku smaczkiem, co pies ma zrobić, ale zapominamy, żeby przestać, albo nie wiemy jak to zrobić.

Czasowość: Może być pokazana lub oferowana przed lub po (albo przed i po)  wykonaniu określonej czynności przez psa w nadziei, że skłoni go to do powtórzenia danego zachowania.

Nagroda

Intencja: Nagroda jest stosowana w celu pozytywnego wzmocnienia pożądanego zachowania psa.

Czasowość: Nagroda (smaczki) jest zazwyczaj oferowana natychmiast po wykonaniu pożądanego zachowania, aby zwiększyć prawdopodobieństwo powtórzenia tego zachowania.

W skrócie, choć łapówka i nagroda dla psa obejmują podawanie mu czegoś w zamian za określone zachowanie, kluczową różnicą jest zrozumienie, po co podajemy psu coś w zamian za zachowanie, czyli teoria uczenia się. Smaczki nie są jedynym wyborem.

Smaczki i naprowadzanie

Wszystkiemu “winne” jest uczenie metodą naprowadzania, a w zasadzie niezbyt umiejętne korzystanie z tej metody. Naprowadzanie to “ciągnięcie psa” za pomocą smaczka, żeby wykonał  wymaganą przez nas komendę. Na przykład – podnosząc smak nad pyskiem psa – prowokujemy go do siadania, oddalając rękę ze smaczkiem – uczymy psa podążania za nami. To jest ok, ale ważne jest, żeby to naprowadzenie smaczkiem wykonać kilka razy i natychmiast przejść do naprowadzania pustą ręką. Inaczej pies uczy się nie wykonywać komendę, ale podążać za smaczkiem.

Nie ma smaczka = nie ma wykonanej komendy. 

Tymczasem nagroda, żeby była wzmocnieniem musi być wydana po zadaniu, np. pies dostaje smakołyk w chwili przyniesienia nam danej rzeczy. Prawdopodobieństwo powtórzenia prezentacji danego zachowania przez psa zwiększa się. Konsekwencją zachowania psa jest wystąpienie przyjemnego bodźca (smakołyka). Takie postępowanie to stosowanie kawałka tak zwanego kwadratu wzmocnień – wzmocnienia pozytywnego. (R+)

Kwadrat wzmocnień

Kiedyś zamiast naprowadzania i wzmacniania pozytywnego, częściej korzystano ze wzmocnienia ujemnego, czyli zabrania czegoś nieprzyjemnego ze środowiska psa. Podczas uczenia psa siadania metodą tradycyjną: mówi się komendę “siad” przytrzymując smycz w taki sposób, by pies nie był w stanie pochylać głowy do przodu i  ręką naciska się na zad psa. Prawdopodobieństwo, że pies usiądzie zwiększa się. Konsekwencją takiego zachowania się psa jest usunięcie nieprzyjemnego czynnika (jednoczesnego ciągnięcia za smycz i naciskanie na zad psa). (R-)

KaranieWzmacnianie
P+
Positive Punishment = KARA

Dodajemy coś nieprzyjemnego do środowiska psa. (uderzenie)Prawdopodobieństwo powtórzenia zachowania maleje.
R+
Positive Reinforcement – Wzmocnienie pozytywne

Dodajemy coś przyjemnego do środowiska psa (np. smaczek). Prawdopodobieństwo powtórzenia zachowania rośnie.
P- 
Negative Pnishment – Kara negatywna

Odejmujemy ze środowiska psa coś przyjemnego. Prawdopodobieństwo powtórzenia zachowania maleje.
R-
Negative Reinforcement -Wzmocnienie negatywne

Zabieramy ze środowiska psa coś nieprzyjemnego. Prawdopodobieństwo powtórzenia zachowania rośnie.
Kwadrat wzmocnień

Gdy eliminujemy jakieś zachowanie poprzez zabranie czegoś przyjemnego (np.: podczas zabawy pies łapie za rękę i podgryza, wtedy krzyczymy “aaauu” zabieramy zabawkę i kończymy zabawę. Prawdopodobieństwo prezentacji takiego zachowania podczas następnej zabawy zmniejsza się. (P-).

P+ to po prostu kara za niewłaściwe wykonanie zadania – np szarpnięcie smyczą, gdy pies ciągnie, albo zastosowanie kolczatki, czy obroży elektrycznej.

Smaczki, a może coś jeszcze?

Nagroda wydawana jest po zrobieniu komendy i nagrodą może być nie tylko smaczek – może być pochwała, wspólne bieganie z opiekunem, zabawa (nagroda socjalna). Można dać psu zabawkę, pozwolić powęszyć, pójść pobawić się z innymi psami. Nagroda to coś, co ma w danym momencie wartość dla psa. Gdy pies jest po mięsnym posiłku, sucha chrupka nie będzie dla niego nagrodą. Rzadko natomiast używamy czegoś innego niż smaczki do naprowadzania. Zabawka w tej roli się średnio sprawdza. 

Inne metody szkolenia

Naprowadzanie i uczenie za pomocą negatywnego wzmocnienia to nie jedyne możliwości, żeby uzyskać jakieś psie zachowanie. Są po prostu najłatwiejsze, zwłaszcza dla początkującego opiekuna psa. Psa można też uczyć metodą kształtowania lub wyłapywania.

Kształtowanie

Kształtowanie często opiera się na stosowaniu klikera. Klikamy, gdy pies wykonuje ruch, który potencjalnie doprowadzi do pożądanego zachowania. Np, gdy uczymy psa siadać, “klikamy” uginanie łap, a nawet to, że pies się zatrzymał, bo wcześniej biegał. Kształtowanie wymaga od nas zaplanowania treningu – przewidzenia jakie ruchy pies może wykonywać i które doprowadzą go do pozycji “siad”. To trochę taka zabawa w ciepło-zimno. Ciepło, czyli klik pojawiają się po ruchach przybliżających do siad, brak kliku (zimno), gdy rezultat nie prowadzi do wykonania komendy. Po każdym klik psu wydaje się nagrodę. 

Wyłapywanie

Wyłapywanie to metoda, w której “polujemy” na zachowanie. Jak chcemy, żeby pies na nas spoglądał, to łapiemy moment, gdy to robi, dajemy sygnał i po nim nagrodę. Sygnałem też często jest kliker. Pies się bawi, biega, ale nagle podbiega do nas i sam z siebie spogląda. Wtedy klikamy i wydajemy nagrodę. 

W obu tych metodach na początku nie stosujemy w ogóle komend – ani słownych ani gestów. Dopiero, gdy pies chętnie przy nas zaczyna prezentować uczone zachowanie – siadanie lub patrzenie, to dodajemy komendę, nazywając tak naprawdę czynność, którą już pies wykonuje. Potem, gdy pies już wie, jak się nazywa to, co robi, wywołujemy to zachowanie komendą. 

Te dwie metody pokazuję jak używa się smaczka jako nagrody i jak ważne są odpowiednie momenty samego podania nagrody, ale też “zaznaczenia” zachowania. 

Klik, tak, sygnał, komenda, smaczki

Komenda to polecenie – mówi psu, co chcemy, żeby zrobił.

Sygnał “klik” lub tak – to potwierdzenie dla psa, że robi coś dobrze i za chwilę dostanie nagrodę. (sygnał do nagrody).

Sygnały mogą być różne. Może to być klik oznaczający nagrodę natychmiast, może to być słowo, np “dobrze”, które oznacza, że pies robi coś dobrze, ale ma jeszcze chwilę zaczekać na nagrodę. Może być to np klik i hasło “łap”, co oznacza, że pies zrobił coś dobrze i nagrodą będzie rzucenie szarpaka. To już jednak trochę wyższa szkoła jazdy. 

Na początek, pamiętaj o tym, żeby zaczynać trening jakimś hasłem (a nie braniem smaczka do ręki) mówić komendy, gdy pies słucha oraz po wykonaniu komendy pochwalić psa (nagrodzić w dowolny sposób) oraz  zwolnić psa, np “biegaj”. Wtedy pies wie, jak długo ma np siedzieć, albo leżeć. Zwolnienie też może być nagrodą. 🙂 

Dzięki jasnym komunikatom i Twojej wiedzy, jak uczy się pies, Twój czworonóg  będzie słuchać nawet gdy nie masz smaczka w ręce.

Nie oznacza to jednak, że masz w ogóle przestać nagradzać psa. Brak jakichkolwiek wzmocnień sprawi, że pies nie będzie powtarzał zachowań. Ale uwaga, czasem wzmocnieniem są rzeczy, których my nie planujemy – np uciekanie psa wzmacnia sam fakt, że swobodnie sobie biega i eksploruje.


Zapraszamy na darmowe szkolenie on-line: "Jak skutecznie szkolić psa, aby zajmowało to, jak najmniej czasu". KLIKNIJ TUTAJ i zapisz się za darmo. Za uczestnictwo w szkoleniu otrzymasz aż 3 darmowe e-booki!

You may also like...

Leave a Reply

Your email address will not be published. Required fields are marked *