O výcviku psů toho dnes víme spoustu a operantní podmiňování a shaping nejsou výjimkou. Přesto nám často uniká, jak jednoduše se s tím dá pracovat. Hledáme složitosti – a shaping je pro mnoho lidí opravdu složitá záležitost – a jak se říká, pro stromy nevidíme les. Operantní podmiňování totiž vůbec nemusí být složité. Může být až triviálně jednoduché, když víme jak na to. Stačí pár jednoduchých pravidel, která zapojíme do běžného života a dostaví se zázrak.
Co to vlastně je operantní podmiňování (a proč by vás to mělo zajímat)
Především je to asi složité slovo, které si ani nemusíte pamatovat. Měli byste ale znát princip, který se za ním skrývá, protože ten vám může obrovskou měrou pomoci ve výcviku vašeho psa, ať už ho budete učit cokoliv.
My si, pokud přemýšlíme o výcviku psů, zpravidla představíme navádění pamlskem, vodítkem, možná zatlačení na zadek a podobně. Zkrátka situace, kdy my sami jsme hodně aktivní v tom, dostat psa do chování, které po něm chceme. Tomuto učení se říká klasické podmiňování. Vedle něj existují ale i další způsoby, jimiž se psi učí, a tím nejdůležitějším je právě operantní podmiňování. To můžete využít ve výcviku, ale pes se jím učí i mimo výcvik, ve svém každodenním životě. A co víc, nijak zvláště tyto způsoby nerozlišuje a mohou se neustále prolínat. Pokud tedy přemýšlíme pouze o klasickém podmiňování, přemýšlíme pouze o části toho, jak se pes učí a ignorujeme ten zbytek.
Jednoduše řečeno – jak se pes učí na základě důsledků
Co to tedy to operantní podmiňování je? Já už jsem řekla, že při klasickém podmiňování jsme my hodně aktivní v tom, abychom psa přesvědčili k požadovanému chování. V operantním podmiňování ho nikdo k ničemu nepřesvědčuje a on se učí z následků svého chování. Něco udělá, něco se stane a on se z toho poučí.
Takto to zní jednoduše, viďte? Přesto na to při spolupráci s našimi psy často zapomínáme. Zkusme si to na příkladu. Jste na se svým psem na cvičáku a učíte třeba sednutí. Ukážete psu pamlsek, dáte mu čuchnout a zvednete pamlsek trochu výš. Pes zakloní hlavu a aby mu to bylo pohodlnější, sedne si. Vy ho odměníte. A pomocí navádění ho takto učíte dál.
Pak vám ale trenér začne něco vysvětlovat, vy odměňovat přestanete a soustředíte se na výklad. Pes chvíli sedí, čeká na další odměnu, a když se nic neděje, vyštěkne. Vy mu na to řeknete NE, ale vzpomenete si přitom, že stále máte odměňovat klidné sezení. Tak ho odměníte. A on odmění vás chvilkou ticha. Po pár vteřinách ale znova štěkne, kde že má ten další pamlsek, a vy si vzpomenete na odměňování a také nechcete, aby štěkotem rušil výklad trenéra, tak mu rychle zacpete tlamičku pamlskem. A pak znova a znova a znova. A pes se naučil, že za štěknutí získá trochu vaší pozornosti a dost možná i ten dobrý pamlsek.
Zatím co při učení sednutí jste byli aktivní a cíleně něco trénovali, při učení štěkání jste byli pasivní. Vlastně jste věnovali daleko víc pozornosti trenérovi, než samotnému psu. To on byl aktivní a učil se. První štěknutí byl jen projev frustrace z toho, že skončil přísun pamlsků. Pouze vyjádřil své emoce. Vaše následná pozornost a pamlsek byly tím následkem, ze kterého se poučil a důvod, proč to zkusil znova.

Co znamená „pozitivní“ a „negativní“ – a proč to neznamená „dobrý“ a „špatný“
Ne všechny následky ale fungují tak, že pes bude chtít dané chování opakovat. Jsou i ty, které dělají přesný opak. Nebo je možnost, že nepřijde následek žádný, například byste štěkot svého psa ignorovali. I z těch se pes může poučit, ale ne vždy tak předvídatelně, jak bychom chtěli. Jaké jsou tedy následky, které mění chování psa?
Posílení a tresty. Posílení znamená, že chování bylo tak zvaně posíleno a bude se opakovat s větší pravděpodobností. Tresty naopak pravděpodobnost opakování snižují. Posílení i tresty navíc dál dělíme na pozitivní a negativní.
Tady pozor! Pozitivní a negativní v operantním podmiňování neznamená dobrý a špatný! To by bylo příliš subjektivní hodnocení. Vy můžete něco považovat za „dobré“ a pes to samé vyhodnotí jako „špatné“.
Pozitivní a negativní si představte jako znaménka v matematice. Pozitivní je plus. Něco přidáváme, nebo pes získává něco navíc za své chování. Negativní je mínus, pes o něco přichází, nebo mu něco ubíráme. Tím nám vznikají čtyři možné následky chování:
- pozitivní posílení (Possitive reinforcement, můžete vidět také značku R+),
- negativní posílení (negative reinforcement, R-),
- pozitivní trest (possitive punishment, P+) a
- negativní trest (negative punishment, P-).
Pozitivní posílení
Chování bylo posíleno, bude se tedy opakovat s větší pravděpodobností, a bylo to pozitivní – pes dostal něco navíc, co se mu pravděpodobně líbilo, proto to bude chtít opakovat. Sem patří klasické odměny – pamlsky, společná hra, ale třeba i získání pozornosti, ukradení řízku ze stolu apod.
Negativní posílení
Chování bylo posíleno a pes ho bude chtít opakovat, ale bylo to negativní, tedy něco jsme odebrali, nebo o něco přišel. To něco tedy muselo být nepříjemné, aby byl rád, že o to přišel. Například jste mu několikrát hodně důrazně řekli, aby si sedl, a když si konečně sedl, křičet jste přestali. Sednutím se zbavil vašeho nepříjemného křiku a tím bylo chování posíleno.
Tohle ukončení trestu – nepříjemného křiku – je strašně důležitou součástí správného použití trestu. (Vidíte, jak se tady tresty a posílení vzájemně doplňují?) Když jsem se přestěhovala z města do chatové osady, nechali mi tu předchozí majitelé společně s domem i kříženku ovčáka Báru. 4 roky byla zvyklá na všechny a na všechno za plotem štěkat a stejně tak sousedé byli naučení houknout na ni „Jdi do boudy“ a ona šla, nebo alespoň štěkat přestala.
Fungovalo to skvěle, pouze na jednoho souseda pořád štěkala a štěkala a já nemohla přijít na to proč. Ukázalo se to až časem. Když si myslel, že nejsem doma, nebo to nevidím, nedodržoval pravidla. Fena začala štěkat, on na ni houknul, ať jde do boudy, ona přestala a on si ještě přisadil. Tím pádem ale nepřišlo ono negativní posílení za ukončení štěkání, ale jeho další nadávání byl už naopak pozitivní trest – o těch si víc řekneme za chviličku. Tím pádem se fena naučila, že na něj neplatí, když štěkat přestane, a štěkala dál. On ji na to konto poléval vodou z hadice a další nesmysly a celý problém se stupňoval. Přitom stačilo jediné, včas ukončit trest a dát jí tak negativní posílení.
Pozitivní trest
Tresty trestají chování, snižují pravděpodobnost jeho opakování. Pozitivní tresty jsou takové, kde pes dostane něco navíc. Musí to být tedy něco nepříjemného, co pes nechce, aby to vnímal jako trest. Sem spadá většina toho, co si jako trest představujeme: okřiknutí, trhnutí vodítkem, plesknutí, rána elektronickým výcvikovým obojkem apod. Stejně tak to ale může být třeba i hlasitá rána, nebo jiná nepříjemnost.
Negativní trest
I negativní trest snižuje pravděpodobnost opakování, ale pes při něm o něco přichází, je tam znaménko mínus. V tomto případě to musí být něco příjemného, o co přijít nechce. Často třeba máte psa na volno, on hezky chodí na přivolání, ale pak se přiblížíte k domovu, nebo vyndáte z kapsy vodítko a pes jako by ohluchl. Připnutí na vodítko a odchod z procházky domů je pro něj negativní trest. Přichází o možnost běhat si na volno. Vy mu při tom sice možná nabízíte odměnu stejně jako u předchozích přivolání, ale tady už tuší konec procházky a raději se vyhne tomuto trestu, než aby přijal vaši odměnu.
I konec výcviku může pes vnímat jako negativní trest. Pokud ho cvičení baví, je motivovaný, chce pokračovat a vy najednou uděláte konec a už si ho nevšímáte, může to být pro psa hodně nepříjemné. V takovém případě je lepší ukončit lekci tzv. do ztracena. Přejít na jinou zábavnou aktivitu – jít na procházku, vysypat na zem hrst pamlsků, aby si je hledal, česání, pokud má rád, dát mu něco na žvýkání apod.
Stejně tak odebrání hračky na konci hry je negativní trest. Pokud byste vždy po povelu Pusť psu hračku odebrali, brzy by se naučil nepouštět, i když to na počátku dobře uměl. Lepší je dělat povel Pusť častěji a odebrání hračky střídat s tím, kdy po puštění budete znova pokračovat ve hře.
A teď to nejdůležitější, ale často i nejtěžší. Všechny tyto následky musí přijít do maximálně 3 vteřin, ale ideálně do 0,5 vteřiny po daném chování. Jinak už pes není schopen si chování a následek spojit dohromady. A zároveň není důležité, co si o daném posílení a trestu myslíte vy, ale co si myslí pes.
Nezřídka se stává, že to, co my psu dáváme jako posílení, on vnímá v daný okamžik jako trest. Pak nám to ale ve výcviku samozřejmě nebude fungovat. Například drbání a hlazení. Je možné, že máte doma mazla, který si tento typ kontaktu moc rád užívá. Ale raději ho má v klidu večer na gauči, kde trvá i několik minut. Pokud ho po přivolání poplácáte po hlavě, nebo jen lehce podrbete, může to vnímat jako trest. Podobně jako kdyby vám partner začal masírovat ramena při čtení tohoto článku a skončil už ve chvíli, kdy se začínáte uvolňovat a chcete mu říci, jak se vám to líbí. To spíše naštve, než potěší. Nebo pokračuje, ale vás to bolí. On vás chtěl potěšit, ale vám je to nepříjemné.
Co je a není posílení nebo trest tak může rozhodnout vždy jen pes. Může se to měnit, že v jednu chvíli to vnímá tak a za chvíli jinak. Nebo že jeden z vašich psů to vnímá jinak, než druhý. Vám nezbývá, než sledovat, jak to funguje, jak na to pes reaguje a jak se jeho chování mění. Teprve podle toho můžete dělat závěry.

Operantní vs. klasické podmiňování
Teď se na chvíli vraťme ke klasickému podmiňování, které už asi znáte. Já jsem na začátku psala, že sem patří navádění pamlskem, vodítkem, tlačení na zadek a podobné metody, kde jste hodně aktivní vy. Při tomto způsobu učení na psa působí nějaké vnější síly (tlak, pamlsek), které ho vedou do požadovaného chování a on se učí, že když uslyší konkrétní povel, bude veden do konkrétního chování a jde tomu naproti tím, že už to chování vykonává sám. Na začátku to tedy znamená více naší aktivity a naopak více pasivity ze strany psa. Navíc v ideálním případě vytváří klasické podmiňování vůlí neovlivnitelný reflex. Pavlovovo slintající psi, vzpomínáte? Pokaždé, než dostali krmení, slyšeli zacinkat zvoneček. Následně už po zacinkání zvonečku, ještě než dostali krmení, začínali slintat. Ne proto, že by se tak sami rozhodli, ale protože vznikl nový reflex.
Vy si můžete sami u sebe představit podvědomou reakci na pach desinfekce v lékařském zařízení. Pokud sami nepracujete ve zdravotnictví, pravděpodobně vám tento pach není příjemný, byť sám o sobě není nijak nepříjemný. My ho máme ale spojený s bolestí. Nebo zvuk zubní vrtačky. Když toto přirovnání používám na cvičáku, na řadě lidí vidím okamžitě, jak nepříjemná jim tato slova jsou. A to jsem to jen řekla, žádná vrtačka, nebo bolavý zub tam nejsou.
U operantního podmiňování se pes naopak od začátku sám vědomě rozhoduje, zda bude chování opakovat nebo ne. To vytváří další výrazný rozdíl mezi oběma metodami. Učení operantním podmiňováním probíhá mnohem rychleji a naučení chování si pes daleko lépe pamatuje, než to, co se naučil přes klasické podmiňování.
Klasické podmiňování – kde děláme chyby
Zpátky ale k Pavlovovo slintajícím psům. Stalo se vám někdy, že byste něco učili pomocí navádění za pamlskem a vznikl vůlí neovlivnitelný reflex? Tedy, že by pes okamžitě reagoval a nepřidával do toho své rozhodování? Hádám, že ne. Tohle totiž vyžaduje opravdu velikou, velikánskou spoustu opakování v jednoduchých podmínkách, kde pes opravdu nepřemýšlí, ale bez váhání plní. A tady narážím na velký výcvikový nešvar.
Chvátáme. Chceme příliš rychle odstranit navádění pamlskem, velkou spolehlivost, ale přitom nedostatečně trénujeme. Pokud něco učíte třeba tím naváděním za pamlskem, řekněme chůzi u nohy, na začátku opravdu pes jde pouze pamlskem a nepřemýšlí nad tím, co dělá. To spoustě lidí připadá sprosté a špatné. Ale tak to u této metody prostě je. Pokud chcete, aby pes od začátku věděl, co dělá, učte ho to přes operantní podmiňování, ale garantuji vám, že jestli s tím nemáte zkušenosti, bude to pro vás samotné mnohem těžší, než navádění za pamlskem. A pokud přeci jen zvolíte navádění za pamlskem, nedivte se, že pes jde skutečně jen za pamlskem.
Při tomto typu tréninku potřebujete spoustu opakování v jednoduchých situacích, než budete moci začít navádění odbourávat. To je v pořádku, nespěchejte. Viděli jste někdy ty psy ve sportovní kynologii, kteří jdou celou chůzi u nohy se vzorově zvednutou hlavou a nikdy tuto pozici nepřeruší? To se nenaučili za pár týdnů. Na druhou stranu čím více různých cviků psa pomocí navádění naučíte a pak z nich navádění odeberete, tím snazší to bude u těch dalších. Pes se totiž učí ne jen cvik samotný, ale ten systém, že se navádění pamlskem bude postupně odstraňovat. Proto ráda učím nejrůznější triky. U řady z nich použiji navádění, které později postupně odbourávám. A když pak učím něco pro mě důležitějšího, už nám to jde mnohem snáz, protože už pes odstranění navádění zná.
Jestli se o navádění a především jeho odbourávání chcete dozvědět více, podívejte se na mé video Navádění za pamlskem.
Kromě spěchu při odstraňování navádění, chvátáme i při přenášení trénování do složitějšího prostředí. Vzpomínáte? Na vytvoření vůlí neovlivnitelného reflexu, nebo něčeho, co se tomu alespoň přibližuje, potřebujete velké množství opakování v jednoduchých podmínkách, kde si pes zažívá automatickou reakci. Oproti operantnímu podmiňování je to klasické v některých věcech pomalejší a trvá delší dobu, než psa něco naučíte. Na druhou stranu, už od začátku pes většinou chování nějak provádí – vedete ho za pamlskem a on jde u nohy třeba přes přechod. Ještě to neumí bez pamlsku, ale s pamlskem to můžete poměrně brzy využívat i v běžném životě. A navíc o tom moc nepřemýšlí. Zní to jako nevýhoda, ale vážně chcete, aby třeba u přivolání přemýšlel?

Shaping – jak z malých krůčků udělat velkou změnu
A jak tedy operantní podmiňování využít v tréninku? Nejčastěji se v tomto směru setkáte se slovem shaping, nebo-li tvarování. To je způsob učení, který se původně objevil v humánní psychologii a postupně se rozšířil do trénování zvířat. V knihkupectví lze sehnat knihu Svého psa nestřílejte od Karen Pryor, která byla průkopnicí používání shapingu u psů. A za zmínku určitě stojí i její kniha S klikrem do zvířecího nitra, ve které zkoumá velmi podrobně, jak tento způsob trénování u psů i lidí skutečně feunguje z hlediska fyziologie.
Při tvarování – shapingu – tvarujete z běžného chování, něco nového. Třeba na začátku ukážete psu dřevěnou podložku. On si k ní čichne a vy pomocí slova nebo klikru označíte toto správné chování a odměníte. A párkrát zopakujete. Za chviličku už pes ví, že to dřívko je vlastně kouzelné tlačítko, do kterého stačí strčit nosem a z vás vypadne odměna. Tohle mimochodem působí jako skvělý motivační prvek, když pes jen získává, ale nikdo po něm vlastně nic nechce. Pouze dostal příležitost něco získat.
Když začne tušit, jak to funguje, položíte dřevnou podložku na zem a i tam odměníte přičichnutí. To na začátku bylo úplně přirozené chování, které pes sám ze zvědavosti udělal. My jsme ho jen pomocí odměny naučili to opakovat. Teď to ale odměňovat přestaneme. Pes k prkýnku čichne a nic. Znova a nic. Tak aby nás upozornil, že: „Hele já už k tomu čichám, odměň mě,“ škrábne do destičky packou. My označíme a odměníme. A on: „Aha, takže čumákem ne, packou. Dobře.“ A začne se prkýnka dotýkat packou.
Teď už jste začali s tvarováním. Původní přirozené zvědavé přičichnutí jste změnili na škrábnutí packou. Za chvíli už vám ani to stačit nebude a počkáte si, dokud pes na prkýnku nešlápne. Nejprve alespoň jednou přední, pak oběma. Pak ho díky tomu můžete učit chodit na konkrétní místo, nebo se třeba točit kolem tak, že přední má na prkýnku a zadními otáčí kolečko kolem prkýnka. Pak byste mohli, když se točí, mu zastoupit cestu, postavit se vedle prkýnka a nechat ho se takto přitočit těsně k vaší noze a dokonce si pak i sednout. A ejhle, máte psa, který umí přijít k vaší noze a sednout si.
Pak už můžete zkoušet to samé ale bez prkýnka, a až to bude umět, můžete zkusit i krok dopředu a jestli zvládne udržet pozici po vašem boku a začít takto trénovat chůzi u nohy. To je shaping, nebo-li tvarování.
Jestli byste shaping raději viděli na živo, mrkněte na můj starší článek Operantní podmiňování, pozitivní posilování klikertrénink…? Na konci najdete video, kde pomocí jednoduchého tvarování učím svou fenu Báru zavírat dveře.
Zní to složitě? Tak si připomeňme, že pes se pomocí této metody vlastně učí velmi rychle, protože od začátku přemýšlí o tom, co přesně dělá a za co získává odměnu. A jen tak to nezapomene. Určitě tohle vše nezvládnete během jednoho nebo dvou tréninků, ale možná byste se divili, jak to může být rychlé, když pracujete správně. Při navádění pamlskem na druhou stranu pes nepřemýšlí, ale jak už jsem psala, je to jednodušší pro vás a byť jde pes z počátku jen za pamlskem, dokážete s ním hned od začátku jít u nohy třeba přes přechod. Zkrátka operantní i klasické podmiňování má své plusy a mínusy.
Za pomocí těchto malých krůčků a postupného tvarování, můžete vytvářet i velmi složitá chování, kde by navádění pamlskem nebo nucení vodítkem nebylo možné použít, nebo kde potřebujete velkou samostatnost, které se těmito metodami těžko budují. Chce to ale už od vás určité dovednosti. Někdy ale s operantním posilováním pracujeme, ani o tom nevíme.

Skryté kouzlo operantního podmiňování
My jsme si už říkali, že pokud pes udělá nějaké chování a do maximálně 3 vteřin přijde následek, dokáže se velmi rychle naučit, zda dané chování chce opakovat nebo ne. A jestli vám shaping připadal jako něco neřešitelně složitého, tohle je naopak fantasticky jednoduché a mnohem více efektivní, než byste čekali. Stačí si prostě počkat na jakékoliv správné chování svého psa a to odměnit! A můžete buď pracovat jen na jednom konkrétním chování a chvíli věnovat pozornost pouze jemu, nebo pracovat s jakýmkoliv správným chováním.
Máte například doma štěně, které – světe div se – právě nekouše ani nábytek, ani vás, ani koberec, ale svoji vlastní hračku. Tak ho za to odměňte pochvalou a chvilkou společné hry. Tím výrazně zvýšíte pravděpodobnost, že si tu hračku zkusí najít i příště. Čím častěji toto uděláte, tím více času bude věnovat tomu, aby žvýkalo své hračky a tím méně času mu zbude na žvýkání věcí, které žvýkat nemá.
Nebo máte už staršího psa, který v dálce uvidí jiného psa/srnu/cyklistu, chvíli se na to dívá a pak tomu přestane věnovat pozornost. Pochvala a odměna! Vždyť to je to, co po něm chcete, aby si těchto věcí nevšímal. Tohle jednoduché odměnění chování, které pes sám dělá, je opravdu velmi efektivní a vy už jste to dost možná i sami zažili. Jen asi jinak, než byste chtěli.
Možná jste šli se svým psem, když byl to nejrozkošnější štěňátko na světě, po ulici a potkávali lidi, kteří si ho chtěli pohladit. Dovolili jste jim to a štěňátko si zvyklo, že je super běhat k lidem, protože ti ho odmění pomazlením. Alespoň než povyroste a začne je to spíše obtěžovat. Nebo jste nijak nereagovali na to, když si žvýkalo svou hračku. Byli jste rádi, že konečně žvýká něco, co mu nemusíte brát a neřešili to. Ale když vám sebralo botu, začali jste ho honit. A štěně se naučilo, že vás může velmi snadno vyprovokovat ke hře na honěnou.
Tohle učení z následků vlastního chování je jako oheň: Skvělý sluha ale zlý pán. Děje se pořád, ať chceme nebo ne. Proto je dobré naučit se ho využívat pro sebe, ale zároveň si i dát pozor na to, kde se pes učí něco, co nechceme. Sledujte, co chování vašeho psa posilujte a co ho trestá, naučte se odměňovat správné chování a pokud pes často dělá něco, co nechcete, zkuste se zamyslet, jestli tam není nějaké posílení, nebo trest, které ho to učí. Možná budete překvapeni, jak často tam něco takového je a vy jste si to do teď neuvědomili.
Hledáte další informace z trénování a výchovy psů?
Napište mi svou e-mailovou adresu a já se vám ozvu s pravidelnými novinkami.




