fbpx

Operantní podmiňování, pozitivní posilování, klikrtrénink

30. 11. 2020 | Nezařazené

Možná už jste někdy při čtení různých článků narazili na pojmy jako je operantní podmiňování, pozitivní upevňování, tvarování či klikr trénink. Ty bych vám teď ráda představila.

Operantní podmiňování

Většina z vás má jistě alespoň malé znalosti klasického podmiňování – to jsou ti Pavlovovi psi, co slintali při světle žárovky v tušení, že už přichází krmení. Ve výcviku psů je tento způsob podmiňování stále hojně využívaný a rozšířený. 

Zjednodušeně si můžete představit, že učíte psa povel sedni. Vydáte povel, jednou rukou trhnete vodítkem nahoru, druhou rukou zatlačíte na záď psa a donutíte jej zaujmout správnou pozici. Pak pochválíte a odměníte. Celá aktivita vychází tedy především od vás a pes je pouze jakousi pasivní figurkou. Teprve postupně se učí předejít nepříjemným podnětům (trhnutí vodítkem, zatlačení na záď) a získat odměnu tím, že sám začne tento pohyb aktivně vykonávat. 

Podobné to je ale i při navádění za pamlskem- Dáte psu čuchnout lákavé dobrůtky ve vaší ruce a tu pak pomalu zvedáte nahoru, nutíte ho tím zaklánět hlavu, až si konečně sedne. Určitě se to psu bude líbit mnohem více, než trhání vodítkem nebo tlačení na zadek, ale zase ho aktivně vedete do určité polohy.

U operantního podmiňování je vše opačně. Aktivní je pes, nikoliv vy, a na psa není vyvíjen žádný tlak. Učí se pouze z následků svého vlastního chování. Tedy zda nakonec přijde odměna případně trest. 

Pokud bychom se opět věnovali povelu sedni, bude to vypadat tak, že psovod stojí, má u sebe odměny a v klidu čeká. Pes přemýšlí, jak z páníčka odměny vydolovat. Nakonec to vzdá a bezradně si sedne. V tu chvíli přichází odměna a pes pomalu zjišťuje, že když si sedne, z páníčka nějaká ta dobrota vypadne. Později se přidává povel a pes se učí, že tento způsob získání odměny funguje pouze po daném povelu. 

Jestli vás zaráží, že zde není nic, co by psa nutilo povel splnit, máte pravdu. Nic a nikdo ho nenutí. On pouze získává příležitost vysloužit si odměnu, rozhodnutí je na něm. Napsala jsem „pouze“, ono je to ale daleko více, než si myslíte. Pes má totiž nad celým tím dějem kontrolu a to je to, co oceňuje. 

Samozřejmě je třeba, aby měl psovod k dispozici patřičnou motivaci a z počátku klidné prostředí. Takto naučený povel, se pro psa stává zábavou a tím je už samotná možnost jeho splnění motivující. To je samozřejmě velice zkrácený a zjednodušený popis celé situace. Operantní podmiňování je sice jednoduchý a překvapivě rychlý způsob učení, má ale svá přesná pravidla, bez kterých se neobejdete. Na ty se podíváme v samostatném článku. Tyto pravidla jsou navíc velice důležitá také v klasickém podmiňování, kde se na ně ale často zapomíná. 

Pozitivní upevňování/posilování

Jak už jsem uvedla výše, pes se v případě operantního podmiňování učí z následků svého chování. Tedy posílení a trestů, které navíc dělíme na pozitivní a negativní. 

Posílení posiluje požadované chování, trest ho tlumí. Pozitivní a negativní jsou zde vnímány jako v matematice, tedy jako znaménka + (něco přidáváme) a – (něco ubíráme).

Při pozitivním posílení pes získává něco, co chce. Například pamlsek, nebo klobásu ukradenou ze stolu.

Negativní posílení ho naopak zbavuje něčeho nepříjemného – třeba našeho opakovaného křiku, když mu pořád dokola opakujeme jeden povel, dokud ho nesplní.

Při pozitivním trestu dostane pes něco nepříjemného, jako je okřiknutí nebo plesknutí přes čumák.

A negativní trest mu něco příjemného odebírá. Třeba ho po přivolání připneme na vodítko a odvedeme domu.

Vyjma kočky snad všechna domestikovaná zvířata byla šlechtěna k tomu, aby se dobře učila metodou negativního posilování. Tedy aby se dobře podvolovala určitému nepříjemnému tlaku z naší strany.

Pokud jde kůň doprava a vy chcete doleva, zatáhnete za levou otěž. Pomocí udidla mu způsobíte nepříjemný pocit, který ustane, pouze pokud zatočí v požadovaném směru. Ovce se snaží vyhnout nepříjemnému tlaku ze strany ovčáka či ovčáckých psů tím, že ustupují požadovaným směrem. Na noc se tak dostanou do bezpečí ovčína a nehrozí, že je sní vlci. Čím více se snažil člověk pracovat s nějakým zvířetem, tím více jej mimoděk šlechtil také na to, aby se s ním dobře pracovalo pomocí negativního upevňování. 

Jediným domácím zvířetem, které se tomuto vyhnulo, je kočka. Není divu, po ní se vlastně nikdy nic nechtělo. Je spíše jakýmsi symbiontem žijícím s námi v oboustranně výhodném svazku, než klasicky domestikovaným zvířetem. To je také jeden z důvodů, proč kočku nenaučíte chodit na vodítku tak jako psa. Buď půjdete tam, kam chce jít ona, nebo nepůjdete nikam. Nebo ji musíte přesvědčit zcela jinak, než je tlak ve vodítku. Na veškerý tlak z vaší strany bude reagovat protitlakem. Stejné je to u divokých zvířat. Pokud budete chtít přehnat delfína z jedné nádrže do druhé a zkusíte natáhnout síť, před níž by měl delfín ustupovat, daleko spíše se vám schová na dně, do sítě se zamotá, až jí přitáhnete až k němu, a riskujete jeho utopení. A právě delfínům a dalším divokým zvířatům a jejich cvičitelům vděčíme za objevení a rozvoj metody výcviku pomocí operantního podmiňování.

Ačkoliv se v tréninku dají použít všechny ze čtyř možných následků pro změnu chování, pozitivní posílení určitě vede. Je velmi efektivní, velmi rychlé na učení, buduje vzájemný vztah, zlepšuje ochotu ke spolupráci a dá se použít téměř na vše.

Klikr trénink

Svůj název dostal podle tzv. klikru, malé krabičky s plíškem, který při promáčknutí vydává charakteristický zvuk. Tímto zvukem se označuje správné chování – tedy říkáte psu, že teď, přesně v tenhle okamžik udělal něco, co se vám líbilo a za co teď dostane odměnu. Místo klikru se dá samozřejmě použít také jiný signál – bliknutí baterky, písknutí píšťalky, gesto či pochvala. 

Důvod, proč se často používá právě klikr, je, že jeho zvuk je velice charakteristický a nezaměnitelný, není zabarvený vašimi emocemi a snáze se s ním označení správného chování načasuje, než běžnou pochvalou. Jestli ale použijete slovo, zvuk, či vizuální vjem, není v důsledku podstatné. Důležité je, aby pes věděl, co tento vjem znamená, a vy jste jej dokázali správně použít. 

Vše se pak úzce váže právě s pozitivním posilováním, při kterém se klikr nejčastěji používá. Pomocí něj říkáte psu, že právě teď si vysloužil své pozitivní posílení v podobě pamlsku, hračky, či něčeho jiného.

Tvarování

Neodmyslitelnou součástí Klikr tréninku i celého pozitivního posilování je tvarování (shaping). Tento proces používáme všude tam, kde chceme psa naučit něco, co by nám sám od sebe jen těžko nabídl. U nácviku povelu sedni, který jsme si naznačili na začátku, jde o metodu tzv. zachycení, kdy pouze označíme požadované chování. Pokud ale učíte něco složitého, je třeba začít zachycením něčeho jednoduššího a postupným tvarováním se dopracovat až k požadovanému cviku. 

Tím už se konečně dostáváme ke slibovanému videu. Na něm vám ukáži, jak se má kříženka Bára učí pomocí tvarování zavírat dveře. K označení správného chování je zde použito cvaknutí klikru. 

Všimněte si, že se po celou dobu jakoby neúčastním. Nenutím ji udělat to či ono, nesnažím se jí přesvědčit. Já jí pouze nabízím možnost získat odměnu v podobě pamlsku. Jsem spíše takový automat na ňaminy. Jen místo zmáčknutí patřičného čuflíku musí nabídnout požadované chování. Pak se ozve kliknutí a přijde odměna. 

Pro psa je tento způsob učení atraktivní především tím, že sám získává kontrolu nad situací. To je pro všechny živé tvory důležité a motivující. Snadno tak lze pracovat také se psy nejistými, či týranými. Ti se velice často bojí fyzického i psychického tlaku ze strany člověka. 

Začínáme něčím zcela jednoduchým – chci, aby se nosem dotkla papírku v mé ruce. Se zavíráním dveří to zatím nemá nic společného, ale je to právě ten jednoduchý začátek, od kterého se můžeme odpíchnout. Natáhnu v jejím směru papírek v ruce a ona jej se zájmem očichá. „Klik“ a odměna. 

Jen co pochopí, že pro získání odměny se musí dotknout nosem papírku, zkusím jej přilepit na skříňku a později na dveře. V této fázi přecházím na videu na jiné dveře – dveře ven, se kterými jsem chtěla cvičit nejprve, nabízely při pootevření venkovní prostor plný rozptylujících ruchů. Bára pak více poslouchala, co se venku děje, než aby se soustředila na cvičení. Proto jsem raději přešla na dveře mezi obývákem a kuchyní, kde měla více klidu na práci. 

Při tomto přechodu jsem se znova vrátila o krok zpět a chtěla nejprve dotknutí se papírku v mé ruce, abych jí přechod do jiného prostředí usnadnila. Postupně jsme papír na dveřích zmenšíli na polovinu a pak odstranili úplně. Když už se dotýkala přímo dveří, přidávali jsme postupně silnější a silnější šťouchnutí, dokud dveře nezavřela úplně. Během 5 krátkých asi dvouminutových sekvencí se tak krásně naučila, co má udělat a plnila to s velkou radostí. Cvik se pro ni nestal povinností, ale zábavou a pokud jej budu dál rozvíjet, bude jej plnit vždy velice ochotně a ráda.

https://www.youtube.com/watch?v=rM4ug6xyufA

Pokračování po roce a půl…

Samozřejmě už při úpravě videa jsem si všimla, že se mi toho nepovedlo natočit tolik, kolik bych chtěla. Bára se často točí ke kameře zády a není vidět, co přesně v okamžiku kliknutí dělá. Nemám ale bohužel kameramana  a s kamerou na stativu to hold občas dopadne takto. Pro představu k tomuto článku mi to ale přišlo dostačující. Teď ale připravuji trošku jinou věc, kde jsem potřebovala podobné video. A tak jsem si říkala, že rovnou natočím toto znova  a lépe. 

S Bárou jsem od natočení prvního videa už zavírání dveří neopakovala a tak jsem si říkala, že to bude stejné, jako při prvním učení. Ale jak uvidíte sami, povedlo se to během jediné lekce. Pouze ke konci je udělaný střih, kdy se Báře pamlsek přilepil na zuby, a delší dobu jen pomlaskávala mimo záběr. Vše jsme natočili během jediné kratičké lekce. Bára si za chviličku na vše vzpomněla a ani po takové době neměla problém se ke cviku, který ani nikdy neměla pořádně zažitý, vrátit. I to je úžasné kouzlo operantního podmiňování – mnohem déle se vše pamatuje.

https://www.youtube.com/watch?v=0w1fN6uXpbg

O autorce

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.