Operantní podmiňování, pozitivní posilování, klikrtrénink…?

2. 11. 2023 | Nezařazené

Pokud brouzdáte po internetu a hledáte tajemství pejskařského světa, určitě jste na tyhle termíny už někde narazili. Co se za nimi ale skutečně skrývá? A není to jen halda důležitě znějících odborných termínů nebo rovnou snůška nesmyslů? Tak já vám to vše zkusím trochu vysvětlit.

Operantní podmiňování

Většina z vás má jistě alespoň malé znalosti klasického podmiňování – to jsou ti Pavlovovi psi, co slintali při světle žárovky v tušení, že už přichází krmení. Ve výcviku psů je tento způsob podmiňování stále hojně využívaný a rozšířený.

Zjednodušeně si můžete představit, že učíte psa povel sedni. Vydáte povel, jednou rukou zatáhnete vodítkem trochu nahoru, druhou rukou zatlačíte psovi na zadek a posadíte ho. Pak pochválíte a odměníte. Celá aktivita vychází především od vás a pes je pouze jakousi pasivní figurkou. Teprve postupně se učí předejít nepříjemným podnětům (tahání vodítkem, zatlačení na zadek) a získat odměnu tím, že sám začne tento pohyb aktivně vykonávat.

Podobné to je i při navádění za pamlskem. Dáte psu čuchnout lákavé dobrůtky ve vaší ruce a tu pak pomalu zvedáte nahoru. Nutíte ho tím zaklánět hlavu, až pro něj bude pohodlnější si sednout. Určitě se to psu bude líbit mnohem více, než tahání vodítkem nebo tlačení na zadek, ale zase ho vy aktivně vedete do určité polohy.

U operantního podmiňování je vše opačně. Aktivní je pes, nikoliv vy, a na psa není vyvíjen žádný tlak. Učí se pouze z následků svého vlastního chování. Tedy zda nakonec přijde odměna nebo trest.  

Pokud bychom se opět věnovali povelu sedni, bude to vypadat tak, že psovod stojí, má u sebe odměny a v klidu čeká. Pes přemýšlí, jak z páníčka odměny vydolovat. Nakonec to vzdá a bezradně si sedne. V tu chvíli přichází odměna a pes pomalu zjišťuje, že když si sedne, z páníčka nějaká ta dobrota vypadne. Později se přidává povel a pes se učí, že tento způsob získání odměny funguje pouze po daném povelu. Zní to zdlouhavě, ale ve skutečnosti je to mnohem rychlejší, než předchozí metoda.

Jestli vás zaráží, že zde není nic, co by psa nutilo povel splnit, máte pravdu. Nic a nikdo ho nenutí. On pouze získává příležitost vysloužit si odměnu, rozhodnutí je na něm. Napsala jsem „pouze“, ono je to ale daleko více, než si myslíte. Pes má totiž nad celým tím dějem kontrolu a to je to, co oceňuje.

Samozřejmě je třeba, aby měl psovod k dispozici patřičnou motivaci a z počátku klidné prostředí. Takto naučený povel, se pro psa stává zábavou a tím je už samotná možnost jeho splnění motivující. To je samozřejmě velice zkrácený a zjednodušený popis celé situace. Operantní podmiňování je sice jednoduchý a překvapivě rychlý způsob učení, má ale svá přesná pravidla, bez kterých se neobejdete. Na ty se podíváme v samostatném článku. Tyto pravidla jsou navíc velice důležitá také v klasickém podmiňování, kde se na ně ale často zapomíná.

Pozitivní posilování/upevňování

Jak už jsem říkala, pes se v případě operantního podmiňování učí z následků svého chování. Tedy posílení a trestů, které navíc dělíme na pozitivní a negativní.

Posílení posiluje, upevňuje požadované chování a pes ho bude příště zase opakovat. Naopak trest chování tlumí. To si nikdo zopakovat nechce. Pozitivní a negativní není něco dobrého a špatného, to by bylo příliš subjektivní hodnocení. Dívejte se na ně radši jako na matematiku, pozitivní je znaménko + (něco přidáváme) a negativní je – (něco ubíráme). Celá ta odborná terminologie pak vychází ze spojení těchto dvou prvků. Posílení a tresty, pozitivní a negativní.

Pozitivní posílení

Pes dostává něco navíc (znaménko +) a zároveň to posiluje jeho chování, odměňuje ho to.Třeba jako v tom příkladu s učením povelu sedni. Pamlsek je pozitivní posílení. Stejně tak to může být třeba podrbání, pochvala, ale i klobása ukradená ze stolu nebo podrbání, když chceme, aby v restauraci neštěkal a nekňučel.

Negativní posílení

Pes se zbavuje (znaménko -) něčeho nepříjemného. Tím je vlastně za své chování odměněn a bude ho opakovat. Třeba pokud na psa opakovaně křičíte, aby si sednul. On si konečně sedne, vy křičet přestanete a on se zbavil toho nepříjemného křiku a tím byl vlastně odměněn.I když tuhle metodu většinou vědomě moc nepoužíváme a cíleně s ní nepracujeme, v běžném životě se objevuje často a velmi často s naší obrovskou chybou. Pokud má správně fungovat, je potřeba, aby se pes správným chováním ihned zbavil toho nepříjemného. Ale co uděláme my? Křičíme na něj, aby slezl z gauče, a když to udělá, ještě mu jednu lískneme, ať si to pamatuje. Tím jsme ho mimochodem naučili jen to, že by příště z toho gauče určitě slézat neměl.

Pozitivní trest

Pes zase dostává něco navíc (znaménko +), ale tentokrát je to nepříjemné a jeho chování to trestá. To jsou tresty tak, jak o nich nejčastěji mluvíme – okřiknutí, plesknutí, trhnutí vodítkem. Může to ale být i třeba bouchnutí výfuku ve chvíli, kdy pes vyjde z domu. Snadno se pak stane, že opravdu nebude chtít vycházet z domu ven.

Negativní trest

Pes se přichází (znaménko -) o něco příjemného. Tohle se stává často, pokud třeba psa přivoláte, dáte na vodítko a jde se domů. Často se pak stává, že pes má sice dobré přivolání, hezky přijde, ale ve chvíli, kdy se přiblížíte ke konci procházky, nebo vyndáte z kapsy vodítko, najednou ohluchne. Protože už očekává, že se půjde domů a všechna zábava po přivolání skončí.

Ačkoliv se v tréninku používají všechny tyto metody, nejčastěji pracujeme s pozitivním posílením. Při učení je opravdu efektivní. Často ani nemusíme cíleně nic učit, stačí odměňovat to, co pes sám dělá. On to bude opakovat častěji a častěji a na to, co se nám nelíbí, mu nezbude čas.

Bez ohledu na to, který z následků chování použijeme, ať už vědomě nebo nevědomě, je tu ještě jedno důležité pravidlo pro to, aby to fungovalo a bylo pro psa srozumitelné. Následek musí přijít maximálně do 3 vteřin po daném chování. Ideálně do půl vteřiny. Cokoliv pozdějšího nemá smysl.

Klikr trénink

Dalším často používaným termínem je klikr trénink nebo trénink s klikrem. Co to je?

Já jsem před okamžikem říkala, že je důležité, aby posílení nebo trest přišli opravdu rychle po daném chování. Čím rychleji, tím lépe. My totiž nedokážeme psu říci, co vlastně odměňujeme. My si třeba myslíme, že dáváme odměnu za to, že si pes sednul. On se ale také nadechl, zamrkal, zamával ocasem a teď zrovna zaměřil pozornost na támhle toho holuba. Pokud v tu chvíli odměníme, dost možná si bude myslet, že odměňujeme právě tu jeho pozornost na holuba, na sednutí už zapomněl. A čím déle nám to trvá, tím více myšlenek prolítne tou psí hlavou a snáze si následek svého chování spojí s něčím úplně jiným.

Z toho důvodu je potřeba mu říkat co nejpřesněji, kdy udělal to správné chování. Tím celé učení velmi urychlíme a psu zjednodušíme. K tomu se používá něco, čemu říkáme označení správného chování. Zase další odborný termín? Ano. Ale skrývá se za ním přesně to, že když zašustíte pytlíkem v kapse, pes se na vás hned podívá, protože očekává odměnu. Už se naučil, že po zašustění, něco dostane. To zašustění se tak pro něj stalo už takovou předzvěstí odměny. Informací, že teď bude ňamka.

A to je skvělé využít ve výcviku. Tedy, nebývá dobré používat zašustění pytlíku v kapse. To se občas stane i při nějakém našem pohybu, který s odměnou nesouvisel, a těžko by se s tím pracovalo. Využívá se tento princip, že psu řeknete, že teď se blíží odměna. A tahle informace by měla ideálně přijít ve chvíli, kdy pes dělá to správné chování, nebo těsně po něm. Tím dokážeme efektivně psu říci, kdy dělá správné chování, i když nemá pamlsek u nosu a než mu ho podáme, chviličku to potrvá. Je to takový zjednodušovač komunikace.

Svou odměnu samozřejmě musí také dostat, ale toto označení nám pomůže s načasováním. A pokud jde o nějaký zvuk, což se využívá nejčastěji, pomůže nám to i s trénováním toho, aby se pes díval, kam má. Zkoušeli už jste svého psa naučit, aby se vám podíval do očí? A nedělal náhodou to, že koukal na jednu ruku, na druhou ruku, na jednu ruku, na druhou ruku, ale na vás ani nemrknul? To je právě proto, že je zvyklí, že první informací o odměně, je pohyb ruky vyndávající pamlsek z kapsy. Nechce to propásnout, proto kouká na ruce. Teprve když ho naučíte, že první informací bude nějaké vaše vědomé označení správného chování v podobě konkrétního zvuku, můžete ho učit pohled do očí. Už nebude potřebovat zírat na ruce, protože ještě dřív, než pohyb ruky, přijde nějaký zvuk. Třeba právě cvaknutí klikru.

Klikr a slovní označení.

Klikr je malá krabička s plíškem, který při promáčknutí vydává charakteristický zvuk. Tímto zvukem se označuje správné chování – tedy říkáte psu, že teď, přesně v tenhle okamžik udělal něco, co se vám líbilo a za co teď dostane odměnu. Místo klikru se dá použít i jiný signál – nejčastěji nějaké slovo, ale i gesto, bliknutí baterkou, nebo třeba cvaknutí propiskou.

Důvod, proč se ve výcviku zvířat tak často používá právě klikr je ten, že má charakteristický zvuk a pokud se s ním naučíte pracovat, je velmi rychlý. Mnohem rychlejší, než když k označení použijete slovo. Na druhou stranu, je to opravdu o tom, naučit se s ním pracovat. Při učení běžných dovedností se ale velmi dobře obejdete i bez něj. Stačí si určit slovo, které budete pro označení správného chování používat. Na rozdíl od slova, zvuk klikru je stále stejný, neovlivňují ho naše emoce nebo třeba nemoc.

V klikr tréninku se tedy pro označení správného chování používá klikr. Ve většině případů se ale dá nahradit i slovním označením. A typicky se pracuje s pozitivním posilováním, tedy s tím, že psu dáváte odměnu za správné chování. Ale nenavádíte ho do daného chování jako při navádění za pamlskem, necháváte to na něm.

Tvarování

Neodmyslitelnou součástí klikr tréninku i celého pozitivního posilování je tvarování (shaping). Tento proces používáme všude tam, kde chceme psa naučit něco, co by nám sám od sebe jen těžko nabídl. U nácviku povelu sedni, který jsme si naznačili na začátku, jde o metodu tzv. zachycení, kdy pouze označíme požadované chování, které pes dělá sám od sebe. Pokud ale učíte něco složitého, je třeba začít zachycením něčeho jednoduššího a postupným tvarováním se dopracovat až k požadovanému cviku.

Ukážu vám to v následujících videích, kde se má kříženka Bára učí pomocí tvarování zavírat dveře. K označení správného chování používám cvaknutí klikru.

Všimněte si, že se po celou dobu jakoby neúčastním. Nenutím ji udělat to či ono, nesnažím se jí přesvědčit, nebo to nějak urychlit. Já jí pouze nabízím možnost získat odměnu v podobě pamlsku. Jsem spíše takový automat na ňaminy. Jen místo zmáčknutí patřičného čuflíku musí nabídnout požadované chování. Pak se ozve kliknutí a přijde odměna.

Pro psa je tento způsob učení atraktivní především tím, že sám získává kontrolu nad situací. To je pro všechny živé tvory důležité a motivující. Snadno tak lze pracovat i se psy nejistými, či týranými, kteří se bojí fyzického i psychického tlaku ze strany člověka.

Začínáme něčím úplně jednoduchým – chci, aby se nosem dotkla papírku v mé ruce. Se zavíráním dveří to zatím nemá nic společného, ale je to právě ten jednoduchý začátek, od kterého se můžeme odpíchnout. Natáhnu v jejím směru papírek v ruce a ona jej se zájmem očichá. „Klik“ a odměna.

Párkrát to zopakujeme a jen co pochopí, že pro získání odměny se musí dotknout nosem papírku, zkusím ho přilepit na skříňku a později na dveře. V této fázi přecházím na videu na jiné dveře – dveře ven, se kterými jsem chtěla cvičit nejprve. Ty ale nabízely při pootevření venkovní prostor plný rozptylujících ruchů zahrady. Bára pak více poslouchala, co se venku děje, než aby se soustředila na cvičení. Proto jsem raději přešla na dveře mezi obývákem a kuchyní, kde měla více klidu na práci. Při tomto přechodu jsem se znova vrátila o krok zpět a chtěla nejprve dotknutí se papírku v mé ruce, abych jí přechod do jiného prostředí usnadnila.

Postupně jsme papír na dveřích zmenšíli na polovinu a pak odstranili úplně. Když už se dotýkala přímo dveří, přidávali jsme postupně silnější a silnější šťouchnutí, dokud dveře nezavřela úplně. Během 5 krátkých asi dvouminutových sekvencí se tak krásně naučila, co má udělat a plnila to s velkou radostí. Cvik se pro ni nestal povinností, ale zábavou.

Pokračování po roce a půl…

Samozřejmě už při úpravě videa jsem si všimla, že se mi toho nepovedlo natočit tolik, kolik bych chtěla. Bára se často točí ke kameře zády a není vidět, co přesně v okamžiku kliknutí dělá. A tak jsem se rozhodla to po čase natočit znova.

S Bárou jsem od natočení prvního videa už zavírání dveří neopakovala, nechtěla jsem, aby to dělala. Tak jsem si říkala, že to bude stejné, jako při prvním učení. Ale jak uvidíte sami, povedlo se to během jediné lekce. Pouze ke konci je udělaný střih, kdy se Báře pamlsek přilepil na zuby, a delší dobu jen pomlaskávala mimo záběr. Vše jsme natočili během jediné kratičké lekce. Bára si za chviličku na vše vzpomněla a ani po takové době neměla problém se ke cviku, který ani nikdy neměla pořádně zažitý, vrátit. I to je úžasné kouzlo operantního podmiňování – to, co se pes naučí, si opravdu dlouho pamatuje.

Zajímají vás další články, videa, podcasty a informace? Přihlaste se k odběru novinek, ať vám nic neunikne.

Autor článku

Šárka Ševčíková

Výcviku psů se věnuji více jak deset let. Kromě pomoci klientům s jejich psy, získávám zkušenosti i s těmi svými. Ujímám se psů bez domova a překonávám s nimi nejrůznější nástrahy jejich minulosti. Jak? Tak aby je to bavilo, aby to fungovalo, a abychom si to všichni užili. A tak to budu učit i vás.

Další články

5+1 důvod, proč se vám nedaří naučit svého psa přivolání

5+1 důvod, proč se vám nedaří naučit svého psa přivolání

Už jste unavení z toho, jak váš pes neposlouchá? Jak uvidí zvěř, cyklistu, jiného psa, letí za tím a je úplně jedno, co všechno jste před tím trénovali, nebo jaké odměny máte u sebe? Co když si to ale kazíte vy sami? Při učení přivolání děláme často chyby, které...

Socializace štěněte – neděláte v ní zbytečné chyby?

Socializace štěněte – neděláte v ní zbytečné chyby?

Socializace je jedním ze základních prvků výchovy štěněte a předcházení problémovému chování. Proto to většinou děláme – abychom se psem v budoucnu neměli problém. No jo, jenže co když si právě tou „socializací“ na problém zaděláme? Socializace totiž vůbec nemusí...

5 důvodů, proč se nebát online kurzu s Ozzoteamem

5 důvodů, proč se nebát online kurzu s Ozzoteamem

Když jsem díky zavřeným cvičákům v koronaviru přemýšlela, jestli zkusit “alespoň” online výcvik, zprvu jsem váhala. Neuměla jsem si představit, jak by to mohlo fungovat. Kontaktní výuka s trenérem, společné seznamování s ostatními pejsky jsem považovala za podstatné....