Den godbid er IKKE en belønning!

Men hvad er den så? Under hestetræning er den en forstærker. Men er det ikke det samme? Ja, og nej.. men nok mest nej, for at undgå misforståelser!

Der er måske nogen, der undrer sig over, hvorfor jeg ikke kalder det en belønning, når jeg træner med godbidder. Jeg ved, at mange, der underviser i hestetræning bruger ordet belønning, fordi det er et ord alle kender og det er nemmere at forstå end forstærkning, men jeg mener, at ordet belønning skaber nogle lidt forkerte associationer i forbindelse med træning af dyr og derfor synes jeg, at det er bedre at holde sig ordet forstærkning. Når vi bruger ordet belønning og vi i virkeligheden mener positiv forstærkning, kan det give anledning til misforståelser, som kan blive svære at udrede bagefter eller i værste fald gør, at vi griber en opgave forkert an fra starten. Derfor synes jeg, at det er vigtigt at bruge præcise termer, også selvom det måske tager lidt ekstra tid, at for
klare hvad det er.

IMG_0102Nogle hestemennesker ønsker overhovedet ikke at bruge belønning/godbidder i træningen. Måske fordi de oplever, at hesten lærer unoder. Min påstand vil være, at
det er fordi, godbidderne ikke bliver anvendt korrekt. Jeg skal ikke kunne sige, om der findes heste, der bare ikke kan finde ud af det der med godbidder. Jeg har bare ikke mødt en endnu, der ikke med noget tilvænning kan blive ret god til det med godbidder. Min egen lille bandit Sovs, som er et kæmpe madøre, har lært manerer i brugen af godbidder og hvis han kan, så tror jeg, at de fleste kan 😉

Forstærkning er en term indenfor indlæringspsykologien der betyder: At tilføre eller fjerne noget for at øge sandsynligheden for at en adfærd forekommer igen. Når vi tilfører en godbid, kalder vi godbidden en positiv forstærker. Der findes også negative forstærkere, men det er ikke dem, det handler om her. Hvis man vil vide mere om positiv og negativ forstærkning, kan man kigge her.

Belønning

“påskønnelse af en bestemt indsats i form af ros eller penge” (ordbogen.com)

Synonymer: Bonus, dusør, erkendtlighed, gratiale, gengæld, påskøndelse, tak, præmie, vederlag.

En belønning og en forstærker er hyppigt den samme genstand. For mennesker kan det være ros, anerkendelse, ære, penge, gaver, lækker mad, eller hvad som helst andet en person vil blive glad for. I træning med dyr bruger vi hyppigt godbidder, nus eller ros. Selve genstanden kan altså være det samme, hvad enten vi belønner eller forstærker, men de anvendes på forskellige måder og med forskellige resultater. Der er – måske uskrevne – regler for, hvordan vi bruger belønninger i al almindelighed og de svarer ikke særligt godt til de meget konkrete og velbeskrevede regler, der er for anvendelsen af forstærkere.

En belønning er ofte noget, vi giver et stykke tid efter, en eller anden har gjort noget belønningsværdigt. Vi giver belønninger for en samlet præstation. F.eks. hvis vi har gjort det særligt godt med et projekt på arbejdet eller vi har vundet en konkurrence eller noget lignende. Vi får en bonus, en gave, en præmie eller æren som belønning for vores indsats. Det er sådan vi typisk forstår belønninger, tror jeg. Problemet med dem er, at belønning ikke knytter sig til nogen særlig del af præstationen. Hvis jeg f.eks. får ros på arbejdet efter et projekt, aner jeg ikke om det var rapporten, udførelsen, planlægning, samarbejdet eller noget helt andet, der var særlig godt til at udløse ros. Jeg kan måske få det beskrevet, men vi har det med at efterrationalisere, generalisere og desværre glemmer vi deltaljer i et længere forløb, så rosen vil ikke være særlig præcis og dermed heller ikke nødvendigvis give mig noget, der kan understøtte, hvad jeg gør fremover.

Det forholder sig anderledes med forstærkere.

Positiv forstærker (eng: positive reinforcer):

Any stimulus which, when presented following a behavior, increases or maintains the strength of that behavior” (Chance 2014, side 397)

(dansk: en hvilken som helst stimulus (påvirkning), som når den præsenteres efterfølgende en adfærd, øger eller vedligeholder styrken af den pågældende adfærd.

Eller med Pryors ord:

A reinforcer in anything that, occurring in conjunction with an act, tends to increase the probability that the act will occur again” (Pryor 2009, side 1)

(dansk: En forstærker er hvad som helst der, når det forekommer i sammenhæng med en handling, øger sandsynligheden for at denne handling vil forekomme igen.)

Det man skal lægge mærke til i ovenstående citater er, at en forstærker forekommer i direkte sammenhæng med en konkret handling. Timingen er afgørende. Der må ikke gå for lang tid mellem adfærden og forstærkningen. Vi taler om få sekunder, hvis det skal  have den ønskede effekt. Hvis en forstærker skal virke forstærkende på det hesten gør- dvs. øge sandsynligheden for at hesten gør det igen – er vi nødt til at give forstærkeren (godbidden) i det øjeblik hesten udfører handlingen – gerne samtidig med adfærden og allersenest et par sekunder efter. Tidsaspektet er centralt her og det er måske den væsentligste forskel på forstærkere og belønninger, sådan som jeg opfatter det.

Belønning vs. forstærkning – Timing

En forstærker gives i løbet af træningen, for at kommunikere til hesten, at det den gjorde, i det øjeblik den fik godbidden, er noget vi meget gerne vil se mere af.

Hvis vi venter med at levere godbidden til efter træningen er overstået, har den ingen indvirkning på noget af det, hesten gjorde under træningen. Hvis vi eksempelvis øver os på Side Pass fra jorden og hesten har gjort det godt, stikker vi den måske et par godbidder bagefter, mens den bliver striglet. Tanken er sød og vi vil gerne være gode ved vores heste, men godbidden fortæller ikke hesten, at det var det, den gjorde ude i ridehuset, der var godt. Den laver slet ikke den kobling. Hesten kobler godbidden med det, den gør i det sekund, den får godbidden og det kan jo være alt muligt. Det uheldige er, hvis vi ikke er opmærksomme på, hvad hesten gør, når den får godbidden – så kan vi komme til at forstærke en adfærd, vi ikke ønsker. Hvis den f.eks. stod stille og slappede af, så er det afslapningen vil forstærker og ikke den superlækre Side Pass den udførte i ridehuset. Man kan vel sige, at belønningen mere er for vores egen skyld, fordi vi gerne vil forkæle hesten. Hesten bliver selvfølgelig også glad, men den forstår ikke sammenhængen mellem godbidden og det den gjorde for 10 minutter siden. Uanset om vi opfatter godbidden som en belønning eller en forstærker, så virker den enkelte godbid forstærkende på noget. Nemlig det hesten gjorde, da den fik godbidden.

Hvis godbidden skal have nogen som helst effekt den adfærd, vi træner hen imod, er vi nødt til at anvende den på en anden måde, nemlig som en forstærker. Når vi bruger godbidden som forstærker, leverer vi den som sagt i det samme øjeblik, som hesten udfører adfærden. På den måde ville hesten forbinde godbidden med selve øvelsen. (Denne beskrivelse er faktisk for grov. Egentlig er det mindre dele af den samlede Side Pass bevægelse, vi forstærker til at begynde med – læs om Shaping her.)

Pryor giver et eksempel med atleter. Det virker meget bedre for en gymnasts fremtidige præstation, når træneren spontant råber “godt” eller “fantastisk” i det øjeblik gymnasten gør noget rigtig godt, end hvis han ventede til bagefter i en gennemgang af dagens træning. Vi oplever det måske også, når vi får undervisning til hest. Det har større effekt, når træneren siger “godt” eller “flot” i det øjeblik, hvor vi føler i det kroppen. Det er da dejligt at få ros bagefter, men det er ikke sikkert, det har den store indflydelse på detaljerne i præstationen næste gang. Det at forstærkningen kommer lige nu og her i direkte tidsmæssig forbindelse med adfærden, gør det nemmere for os at føle og vide, hvad der var godt og dermed hjælpe os til bedre at forstå, hvad vi skal gøre for at opnå samme tilstand igen. Vi vil også have mere lyst til at gøre det igen. Det gør noget ekstra for motivationen.

Et eksempel fra min egen verden er mine børns dans. De danser standarddans og latin og går til turneringer. Især min søn vinder ret ofte. Han er rigtig glad for medaljerne, men jeg er sikker på, at det er den øjeblikkelige forstærkning, når tilskuerne kigger på ham og klapper, når han danser forbi, der giver den største effekt og dermed er mest forstærkende på hans adfærd/bevægelser. Under træning hører jeg ofte træneren råbe “GODT” eller “FLOT” og selvom jeg ikke kan se, hvad der foregår, ved jeg, at det virker fantastisk forstærkende og motiverende på det børnene gør og at det skærper deres opmærksomhed på lige præcis de bevægelser de udførte, da han råbte “GODT”..

Hvis vi vender tilbage til sammenligningen mellem belønning og forstærkning: Groft sagt kan man vel godt sige, at det er to sider af samme sag, selvom de anvendes på forskellig måde, men ville vi opfatte spontane ytringer som “FLOT” og “Fantastisk!” som en belønning? Det tror jeg ikke. De ville snarere blive opfattet som en opmuntring: “JA, gør det der igen!” og det er den opmuntring, vi er ude efter, når vi anvender positiv forstærkning med heste. Så hvis vi absolut skal sammenligne den positive forstærker med noget, vil jeg næsten heller kalde det opmuntring eller anerkendelse af en handling end belønning.

Der er nok flere forklaringer på, hvorfor positive forstærkere virker bedre end belønninger. En af dem kan være, at hestens korttidshukommelse er begrænset (- det er menneskets i øvrigt også). Information i korttidshukommelsen holdes ikke mere end nogle sekunder, inden de skiftes ud med nye informationer. En anden forklaring er muligvis, at hesten ikke kan ræsonnere på samme måde, som mennesker kan. Den del af hjernen, som er i stand til at abstrahere, planlægge, ræsonnere osv er ikke særlig udviklet hos hesten i forhold til mennesket. Mennesker kan sagtens sidde bagefter og analysere nogle hændelser og tale om, hvad der er gået godt og skidt og tilpasse fremtidige handlinger ud fra det. Eller vi kan gætte os frem eller regne det ud, ved at tænke over det, der er sket. Det kan hesten ikke. Den analyserer sig ikke frem til ret meget eller reflekterer over alt muligt bagefter. Den lærer i øjeblikket vha. trial and error. Dvs. den prøver noget og afhængig af reaktionen eller konsekvensen, gør den det enten igen eller ikke.

Eksempel på misforståelse…

Jeg var med til en lidt voldsom trailerlæsning engang. Jeg havde ikke den store indflydelse på forløbet. Det var ikke min hest, ikke min trailer og ikke mig, der skulle noget med hesten. Jeg var bare tilfældigvis på stedet på tidspunktet. Det endte med 4 mennesker, der omringede hesten, som panikslagen hoppede til siden og på alle mulige måder prøvede at undgå traileren. Men jo mere den prøvede, jo mere pres fik den. Den endte med at være viklet ind i snore rundt om bagdelen og personer, der pressede den fra alle vinkler. Såvel hesten som de mennesker, der var med (inklusive mig selv) kunne være kommet til skade, men det skete heldigvis ikke.

På et tidspunkt forsøgte jeg mig med, at få hesten til at tage et skridt frem, så jeg kunne forstærke det ene skridt og måske øge sandsynligheden for, at den ville tage et skridt til, som jeg så kunne forstærke osv. Ejeren var irriteret og sur over forløbet og orienterede mig om “at han da ikke skulle belønnes for noget som helst nu, sådan som han opførte sig”. Jeg kan godt se, hvordan hun har tænkt det. Fandme nej om han skal have belønning/godbidder for at opføre sig sådan! Problemet er bare, at det ikke var en belønning i sådan traditionel forstand, jeg ville forsøge mig med. Det var en forstærkning. Hvis jeg var skarp i min timing og leverede en godbid i det sekund hesten gjorde bare den mindste bevægelse i den rigtige retning, ville han måske forsøge at bevæge sig i den retning igen. Med tiden ville han måske endda bevæge sig mere og mere i den rigtige retning, fordi han lærte, at det havde gode konsekvenser, at gå hen imod traileren. Som sagt: hesten knytter forstærkningen, til det den gør lige nu og her i dette øjeblik og ikke til dens samlede handlinger indenfor de sidste 5 minutter.

MEN i bagklogskabens lys ved jeg nu, at min ide med godbidderne helt sikkert ikke ville have virket i det tilfælde. Det var hesten alt for stresset til. Når hesten er for stresset og har adrenalinen susende rundt i kroppen, så tænker den kun på at overleve – enten ved at prøve at komme væk eller ved at angribe – og i det tilfælde er det for sent at hive godbidderne frem! Jeg tror, at det er de færreste, der tænker på en sandwich, når de føler sig truet på livet ;-). Man er nok ikke så sulten i det tilfælde. Hvis det skulle have virket, skulle vi fra starten af have sørget for, at hesten slet ikke nåede det stressniveau. Men jeg var helt grøn udi indlæringspsykologien og hesteadfærd og jeg var presset, for det var både farligt for menneskerne og hesten, så jeg tænkte ikke klart. Eksemplet fungerer som eksempel på, hvordan vi typisk forstår belønninger og hvordan de bruges og hvordan den opfattelse gør, at misforståelser opstår pga. noget som simpelt som betydninger af ord.

Forstærkeren er et redskab man bla. bruger indenfor træningen af dyr og man bruger den på en helt bestemt måde, for at opnå noget helt konkret. At forstå forstærkeren, som man typisk forstår belønning, kan give anledning til misforståelser, at det ikke lykkes os, at forstærke den ønskede adfærd og måske endda, at vi kommer til at forstærke en uønsket adfærd eller slet ikke når nogen vegne med træningen med godbidder.

Kilder

Chance, Paul (2014): Learning and Behavior. International Edition, 7th edition, Wadsworth Cengage Learning.

Pryor, Karen (2009): Don’t Shoot the Dog! The New Art of Teaching and Training. Revised Edition, Ringpress Books Ltd.

 

Reklamer

Stimuluskontrol

5 cases:

  1. Engang faldt jeg over en tråd et eller andet sted, der omhandlede en piges desperate råb om hjælp med hensyn til en hest, der stejlede. Hun havde lært den at stejle fra jorden, men nu gjorde den det altså også under ridning.
  2. Laaaang tid efter var jeg ude at undervise en i træning fra jorden og da jeg spurgte, hvad hun havde lyst til at lave med hesten, sagde hun bl.a. at hun IKKE ville lære den at lægge sig ned, for så var hun bange for, at den ville gøre det i tide og utide. Fornuftig tanke, synes jeg.
  3. I begyndelsen, når jeg skulle rense hove på Sovs tog jeg fat i venstre forben, sådan som man jo gør, når man renser hove. Hans reaktion var at forsøge at komme ned og ligge på benet, for han har nemlig lært at “neje” eller bukke. Lidt upraktisk, at han forsøger at gøre det, hver gang jeg løfter venstre forben.
  4. Jeg så en video engang med en pige, der havde lært sin hest at stå og vippe op og ned med hovedet til musik. Hun og hendes veninder synes selvfølgelig, at det var vildt sjovt. Gad vide om den hest senere får problemer, når den står og væver i boksen, fordi det har den lært at gøre?
  5. Da jeg lærte Surfer at bakke via. ren oprant betingning, begyndte han også at bakke i alle mulige andre situationer i tide og utide. Det kan være, at det er nuttet, når han moon walker rundt på træningsbanen helt uopfordret, men det kan blive et problem, når han gør det på staldgangen.

Find selv eksempler på en hest der gør noget, der er hensigtsmæssigt i en sitation, men helt uhensigmæssigt i en anden. Det er nok ikke svært.

Hestene i alle disse cases gør præcis, hvad vi har lært dem. I virkeligheden er de rigtig gode elever, der viser, at de har forstået, hvad det er, vi gerne vil have og nu vil de gerne vise det så meget som muligt – måske for at opnå forstærkning. De er endda ekstra seje, fordi de har lært at udføre den indlærte adfærd i en helt anden kontekst – dvs. de viser, at de kan gøre noget i stalden, som de ellers havde lært ude i ridehuset.. det kan heste ellers i andre tilfælde have lidt svært ved. Nogle gange har vi brug for, at de skal overføre det, de har lært et sted til et andet og vi er nogle gange nødt til at træne det forskellige steder og andre gange ikke så meget.

Men hvordan undgår vi, at hesten begynder at udføre en adfærd, der er indlært i en situation til den anden eller at den gør det på de forkerte tidspunkter? Det kan vi gøre ved at sætte adfærden under stimuluskontrol.

Hvad er stimuluskontrol?

En stimulus er noget hesten udsættes for af os eller dens omgivelser. Alle stimuli bliver efterfulgt af en respons, som er den reaktion eller adfærd, hesten udviser, når den påvirkes af en stimulus. En sulten hest, der finder noget græs (stimulus), vil begynde at æde (respons). Når jeg trykker hesten på bagparten (stimulus), flytter hesten rumpen (respons). Når jeg tager let i tøjlen (stimulus), stopper hesten (respons). Når hesten ser en farlig dims (stimulus), løber den væk (respons). I en træningssituation forventer vi en bestemt respons på en bestemt stimulus.

Når vi træner med hesten, lærer vi den at knytte bestemte typer adfærd med bestemte stimuli. Dvs. jeg lærer hesten, at når jeg vifter med pegefingrene i luften (stimulus), skal den bakke (respons). Stimulus er i dette tilfælde et indlært signal.

Det vi nogle gange glemmer er at sikre, at adfærden er under stimuluskontrol. Dvs. sikre at den pågældende adfærd kun opstår, når vi viser et bestemt signal og ikke i nogen andre tilfælde. Hvis vi sætter adfærden under stimuluskontrol, undgår vi, at hesten begynder at udføre adfærden i utide. Det skal dog lige nævnes, at det selvfølgelig kun gælder under træning. Hvis hesten skulle få lyst til at bakke, når den er ude på folden, så er den selvfølgelig velkommen til det. Men i træningssituationer er det vigtigt, at den her lært at skelne mellem forskellige signaler og at den udfører de typer adfærd, der passer til.

Det der sker i stimuluskontrol er, at hesten lærer at genkende (diskriminere) bestemte stimuli/signaler. Det kan spare den for en masse frustrationer. Paul Chance skriver i Learning and Behavior, at stimuluskontrol kan give individet en form for kontrol, over det der sker. Hans eksempel er en rotte, der har lært at tykke på en knap, når en lampe lyser (fordi den får mad) og at undlade at trykke på den, når lampen ikke lyser (fordi den ikke får mad). Her kan man tale om, at adfærden er under stimuluskontrol. Det sparer rotten for at trykke på knappen i alle de tilfælde, hvor lampen er slukket. Den skal altså ikke bruge energi på noget, der ikke har nogen gavnlig konsekvens for den.

Fra menneskeverdenen er et hyppigt brugt eksempel trafiklys. Den røde lampe ved vi alle, hvad betyder og vi stopper ved rødt lys (forhåbentligt). Når den gule lampe lyser, løfter vi måske foden over til speederen og når den grønne lyser, træder vi på speederen. Det er et godt eksempel på adfærd, som er under stimuluskontrol og som øger sikkerheden på vejene, fordi vi ikke behøver at spekulere over, hvad lamperne betyder eller hvad vi skal gøre, når de lyser.

Med Chances ord:

When a discrimination has been well established, the behavior is said to be under stimulus control. Generally that means that the behavior is orderly and efficient, that it enables us to obtain desirable consequences and avoid undesirable ones. Stimulus control can work agains us, but we can also use it to our advantage” (Chance 2014, side 329)

Men det at en adfærd er konsekvent, effektiv og under stimuluskontrol, som Chance siger i citatet, kommer ikke af sig selv!

Reglerne for stimuluskontrol

  1. Adfærden opstår aldrig på et andet indlært signal – dvs. at hesten ikke bakker, hvis du giver et “stå” signal.
  2. Hesten skal ikke udføre nogen andre former for adfærd på signalet – dvs. hesten skal ikke lægge sig ned, når du giver bakkesignalet.
  3. Hesten skal udføre adfærden umiddelbart efter signalet er givet – dvs. den skal gøre det med det samme, når den bliver bedt om det og ikke 5 minutter efter.
  4. Hesten skal aldrig udføre adfærden uden at signalet er givet først – den skal altså ikke bakke rundt efter forgodtbefindende, men kun gøre det, når signalet er givet. 

(frit efter Karen Pryor: Don’t Shoot the Dog, side 73)

Først når de 4 punkter gør sig gældende, kan man tale om, at en adfærd er under stimuluskontrol.

Hvordan gør man?

hvis vi holder fast i eksemplet med bakke adfærden. Med Ciara viftede jeg med pegefingrene i luften, når hun skulle bakke. Hvis jeg skulle sikre mig, at det var under stimuluskontrol, kunne jeg gøre følgende:

  • Vise et andet signal af og til og tilbageholde forstærkningen, hvis hun bakker
  • Ikke forstærke, hvis hun bakker uden at signalet er givet først
  • Ikke forstærke andre former for adfærd på signalet
  • Kun forstærke, når hun udfører adfærden umiddelbart efter signalet
  • Tilbageholde signalet i et stykke tid og kun forstærke, hvis hun afventer signalet

På en af mine yndlingsblogs horse tricks 101 viser hun, hvordan hun gør det. Hendes hest har lært at bukke. Hesten bukker derfor hele tiden, men hun vil naturligvis gerne have, at den kun bukker, når den får besked på det. På videoen forstærker hun, når hesten ikke gør noget. En gang i mellem giver hun signalet og hesten får en godbid, hvis den bukker lige efter signalet. Hesten får intet, hvis den bukker, uden at hun har givet signalet først. Hun træner på den måde meget bevidst, at den ikke skal bukke på eget initiativ. Hun har gang i flere ting på en gang. For det første positivt forstærker hun, at hesten står roligt med hovedet væk (den vinder en godbid på det), for det andet negativt straffer hun, når hesten bukker, uden at signalet er givet først (her tilbageholder hun godbidden = negativ straf). Og for det tredie positivt forstærker hun adfærden, når den forekommer på signalet. Jeg synes, at det er en blid måde at gøre det på! Jeg vil helt sikkert integrere hendes måde at gøre det på mere i min træning.

 

Vær opmærksom på: 

Jeg har været inde på det i afsnittet ovenfor: at tilbageholdelse af godbidden er det samme som negativ straf og det kan hesten blive irriteret over. Den bryder sig ikke om, at noget der før resulterede i en godbid, nu pludselig ikke gør det længere. Den bliver straffet for noget, den før blev forstærket for og indtil den har fundet ud af, at det har noget med signalet at gøre, er det naturligvis meget frustrerende. Det hjælper dog, når hesten har erfaring med denne måde at træne på. Ciara blev f.eks. utrolig mobset til at begynde med, når jeg tilbageholdt godbidderne. Nu har hun lært, hvordan træningen foregår og hun bliver derfor ikke sur på samme måde mere, når jeg ændrer på tingene. Læg også mærke til, at hesten i videoen ikke virker synderligt irriteret over, at den ikke får en godbid, når den bukker på eget initiativ. Det kan måske have noget at gøre med, at den også er vant til at træne på den måde og måske, at der ikke går for lang tid mellem godbidderne, fordi hun også forstærker det, at hesten står stille.

Jeg synes, at det er vigtigt at sørge for, at hesten hele tiden har mulighed for succes. Hvis jeg tøver lidt med at give signalet, så tøver jeg til at begynde med ikke for længe men udvider gradvist tiden lidt efter lidt. Når jeg begynder at vise andre signaler, skal jeg tænke over, hvor meget de ligner det oprindelige. Det er ikke fair overfor hesten, hvis de ligner for meget til at begynde med. Det skal være nemt for den at se, at det ikke er det samme signal. Så kan man altid øge sværhedsgraden med tiden. Hvis jeg kan mærke, at jeg i et stykke tid har presset for meget på, uden at hesten har haft succes, kan jeg godt finde på at kaste en øvelse ind midt i det hele, som jeg ved hesten har styr på, så den lynhurtigt kan få et par succesoplevelser, inden vi fortsætter.

heste er meget lærenemme dyr og de forstår ret hurtigt, hvad vi er ude efter. Nogle gange glemmer vi bare at føre lærdommen til dørs og det ender jo desværre ofte med at hesten får skæld ud, bliver kaldt fræk eller uartig. Det er ikke fair, vel?

Kilder

Chance, Paul (2014): Learning and Behavior. International Edition, 7th edition, Wadsworth Cengage Learning.

Pryor, Karen (2009): Don’t Shoot the Dog! The New Art of Teaching and Training. Revised Edition, Ringpress Books Ltd.

Tampen brænder – kommunikation og shaping

Der er nok forskellige varianter af tampen brænder, men for mig er det en leg, hvor en person forlader et rum og dem, der er tilbage i rummet, gemmer en genstand, som den fraværende person skal finde. Når finderen kommer ind igen, begynder hun at bevæge sig rundt i rummet. De andre må kun sige “koldere”, når finderen bevæger sig væk fra genstanden og “varmere”, når vedkommende nærmere sig genstanden. Hvor hurtigt genstanden bliver fundet afhænger af, hvor dygtige de er til at sige “varmere” og “koldere” på de rigtige tidspunkter og hvor eksperimenterende finderen er.

Denne form for kommunikation minder om kommunikationen med heste. Der er grundlæggende kun mulighed for at kommunikere 2 ting til hesten:

  1. Ja tak, det er det, jeg gerne vil have“, når den gør noget rigtigt
  2. Nej tak, det var ikke det, jeg ønskede, at du skulle gøre“, når den gør noget forkert.

Med disse to budskaber kan hesten lære ret komplekse handlingssekvenser.

Forskellen på at lege tampen brænder med heste er, at hesten ikke har den fjerneste anelse om, at den er med i en leg (læs: træning eller læringsproces). Den ved ikke, hvad vi er i gang med eller, at der i det hele taget er et mål. Den kan kun forholde sig til det, der sker lige nu i øjeblikket. Når man leger det med mennesker ved alle, at legen skal føre frem til noget bestemt. Vi kender reglerne på forhånd og kan analysere os frem til, hvad det er vi tror, IMG_4194det skal lede frem til og tilpasse vores bevægelser til det. Vi kan tænke meget langt frem, det kan hesten ikke.

Men hesten er kvik og har nogle andre fordele i forhold til mennesker. Den kan ikke regne ud, hvad det er vi vil, ved at tænke sig frem til det, men den kan prøve sig frem og bygge videre på det den lærer efterhånden. Når den finder ud af, at en bevægelse er rigtig, vil den gøre det samme igen med større intensitet. Den meget opmærksom på alle visuelle og kropslige signaler. Hvis træneren har god timing og stor opmærksomhed på sin egen og hestens adfærd, er der mulighed for succes.

Desværre er mange mennesker ikke særligt opmærksomme på deres eget og andres kropslige signaler. Det kan gøre det svært at kommunikere præcist med hesten og gøre kommunikationen rodet. Vores timing er ofte også et problem. Hvis vi ikke er søde at fortælle hesten, om den gør noget rigtigt i det nøjagtige øjeblik, hvor den gør det, har den ikke en jordisk chance for at finde ud af, hvad vi vi frem til.

Det sker også, at vi kræver for meget af hesten på en gang. Dvs. at vi ikke leder den frem til målet i små veltilpassede skridt, men forventer at hesten skal nå målet, uden at vi har vist den vejen først. Det svarer til at forvente, at en person skal kunne danse vals, uden at vedkommende først har lært grundtrinnene og uden at få det demonstreret. Forestil dig at stå på dansegulvet. Du kender ikke valsen. Du ved måske ikke engang, at det er en dans, du skal lære. Det kunne lige så godt være, at du skulle lave yoga. Hvad har du brug for, for at kunne lære det? Forestil dig så, at danselæreren ikke har mulighed for at vise dig, hvordan man gør, men kun har mulighed for at fortælle dig, når du gør noget rigtigt eller forkert, ved at sige “ja” eller “nej”. Hvad skulle der så til, for at du kunne lære det?

Det kan også svare til, at forvente at et barn skal kunne læse ord, uden først at have lært at genkende bogstaverne og knytte lyde til dem. Eller at de skal kunne skrive, uden først at have øvet sig på at tegne bogstaverne. Hvis vi springer for mange skridt i processen over, eller går for hurtigt frem, har barnet ikke en chance og hvad værre er, kan vi risikere at barnet bliver demotiveret eller frustreret. En hest kan også blive frustreret og demotiveret.

Vi kan ikke rigtig sætte os i hestens sted. Den opfatter verden på en anden måde, end vi gør – selvfølgelig – den ser jo slet ikke ud som os, er ikke motiveret for de samme ting, gør sig heller ikke de samme erfaringer. Men måske kan vi få et lille indblik i, hvordan kommunikationen mellem hest og menneske føles fra hestens synspunkt, når vi leger tampen brænder, gæt eller grimasser eller f.eks. klikkerlegen. Det kan give os en større følsomhed overfor, hvad hesten har brug for.

Klikkerlegen for mennesker

Legen kræver mindst to personer og den kan sagtens leges uden en klikker.

klikkerEn person udstyres med en klikker og en anden sendes udenfor døren. Personen udenfor døren må ikke kunne se eller høre, hvad der foregår. Dem der er tilbage i rummet aftaler en bevægelse eller lignende, som personen skal udføre, når hun kommer ind. I denne leg er der kun mulighed for at signalere, at noget er rigtigt vha. klikkeren – alternativt kan man vælge et ord, f.eks. “rigtig” eller “dygtig”. Forkerte bevægelser signaleres ved at undlade at klikke/sige noget. Man må ikke sige “nej” eller ryste på hovedet eller nikke eller andre ting, som kan lede i den rigtige retning. Hvis det er meningen, at personen skal hoppe på et ben, er personen med klikkeren nødt til at klikke, hver gang, der kommer den mindste bevægelse i retning af målet. Det kræver rigtig god timing med klikkeren og et overblik over, hvilke bevægelser der kan klikkes på, for gradvist at nå frem til målet.

Det kræver også, at personen der skal udføre bevægelsen er god til at prøve sig frem. Det er et samarbejde. Sådan som det også er med hesten.

Tampen brænder og indlæringspsykologien

Den form for indlæring, der kommer tættest på tampen brænder indenfor træning med dyr er nok fri operant betingning. Det kaldes også ren operant betingning eller frishaping. Min allerførste øvelse med en klikker var at lære Surfer at bakke vha. denne metode. I fri operant betingning forsøger man at lære hesten noget, uden at lede den ved f.eks. at trække i et tov eller skubbe hesten i den rigtige retning. Min eneste mulighed for at kommunikere med hesten var at vente og holde øje med, hvad den gjorde af egen fri vilje og når den gjorde noget, som gav mening i forhold til øvelsen, kunne jeg klikke.

Det foregik nogenlunde sådan her: Jeg stillede mig overfor Surfer med en klikker i hånden og en masse godbidder i lommen. Klikkeren var allerede betinget (læs om hvordan man lærer en hest at forstå en klikker her). Mit mål var, som sagt, at han skulle bakke, men jeg måtte ikke skubbe til ham eller lignende. Så jeg ventede på en bevægelse. En hvilken som helst bevægelse. Jeg klikkede på alle bevægelser, men ikke på den samme bevægelse mere end tre gange i træk. Bevægelsen kunne f.eks. være, at han skiftede vægten fra et ben til et andet. Eller at han bevægende den ene forhov en lille smule fremad, eller noget helt andet. Min opgave var at klikke, når han gjorde noget og hensigten var som udgangspunkt at få ham til at tilbyde adfærd, så jeg med tiden kunne få en mulighed for at klikke på bakkeadfærd.

Et klik betyder “Ja tak, det er helt korrekt“. De første par klik skærpede hans opmærksomhed. Han blev mere aktiv og det gav mig mulighed for at klikke på flere bevægelser. Da jeg jo ikke klikkede på den samme bevægelse mere end tre gange i træk til at begynde med, begyndte han at eksperimentere. Han kunne ikke regne ud, hvad det præcis var, der udløste godbidder, så derfor prøvede han sig frem. Han tilbød altså mere og mere forskellig adfærd med større intensitet – dvs. bevægelserne blev større.

Surfer havde jo lige lært det med klikkeren og godbidden og han ville derfor meget gerne i lommerne på mig. Dvs. at mange af hans bevægelser var frem mod min lomme. Det blev hurtigt irriterende, så jeg besluttede at holde op med at klikke på den slags bevægelser. Det gjorde, at han ret hurtigt opfattede, at han ikke fik noget ud af, at gå frem mod lommen. Så han prøvede andre typer bevægelser. Både til siden og bagud. Efterhånden fik jeg mulighed for at klikke mere og mere på bagudbevægelser. På den måde nærmede vi os gradvis noget, der ligende “bakke” mere og mere, indtil vi nåede målet.

Hvordan det skred fremad afhang bl.a. af, hvor god jeg var til at aflæse hans adfærd og hvor god jeg var til at klikke på de rigtige tidspunkter.

Shaping

I stedet for at kalde det tampen brænder kan vi kalde det en variant af Shaping. Shaping betyder at forme – i dette tilfælde er det adfærd, vi former. Jeg formede eller shapede Surfers adfærd ved gradvist at skærpe kriterierne til det han gjorde, sådan at han nærmede sig den adfærd, som jeg var ude efter.

For at kunne gøre dette var jeg nødt til at have en klar ide om, hvad det egentlig var, jeg ønskede af Surfer og hvilke skridt der skulle til for at komme derhen. Bakke er måske ikke den mest komplekse adfærd, men hvis man bryder den ned i små skridt, der fører frem til målet, bliver det alligevel til en del skridt. Det kan godt være svært at definere et klart mål, men det er afgørende for et godt indlæringsforløb. Alexandra Kurlands (Kurland 2007) bog giver gode vejledninger til, hvordan man kan gribe det an.

Forudsætningen for en god shapingproces er, at målet er klart defineret og at forløbet er gennemtænkt, sådan at træneren har en ret detaljeret beskrivelse af, hvilke skridt der skal til for at opnå målet.

I bakkeøvelsen kunne shaping proceduren se nogenlunde sådan ud:

  • trin 1. Der klikkes for enhver bevægelse men ikke på samme bevægelse mere end 3 gange i træk. Kriteriet for at gå videre til næste trin er, at Surfer bevæger sig aktivt rundt og afprøver handlinger.
  • trin. 2: Der klikkes IKKE for bevægelser fremad mod lommen. Alle andre bevægelser forstærkes (dvs. der klikkes, gives godbid eller lign.). Kriteriet for at kunne gå videre til næste trin er, at Surfer primært udfører bevægelser i alle andre retninger end lommen.
  • trin 3. Der klikkes kun på baglænsbevægelser eller til siden. Kriteriet for at gå videre til næste trin er, at Surfer primært bevæger sig til siden eller baglæns.
  • trin 4. Der klikkes kun på bevægelser bagud. Om det er skråt bagud eller hvad det er, er lige meget. Kriteriet for at gå videre til næste trin er, at Surfer primært bevæger sig bagud.
  • trin 5. Der klikkes på mere ligeudrettede bagudbevægelser. Målet er nået, når Surfer bevæger sig lige bagud det meste af tiden.
  • Målet: trin 6. Der klikkes kun på lige bagudrettede bevægelser og der indføres variabel forstærkning (forklaring følger længere nede)

Man kan forestille sig en trappe, hvor hvert trin leder tættere på målet. På første trin lærer Surfer, at han kan opnå forstærkning (klik + godbid) ved at bevæge sig, men der er ikke stillet nogen krav til bevægelserne. På næste trin redefinerer jeg reglerne for vores leg. Nu får han pludselig ikke forstærkning, når han bevæger sig i en bestemt retning, men dog stadig ved alle mulige andre bevægelser. Jeg har ændret reglerne, men ikke så meget, at han slet ikke kan genkende spillet. En del af den adfærd, som han præsterede på det forudgående trin, indgår på næste trin. Hvis jeg pludselig lavede så meget om på reglerne, at det slet ikke lignede det, han allerede havde lært, ville jeg få problemer. Han ville ikke have særlig stor chance for at opnå forstærkning og han ville måske blive frustreret eller give helt op. For eksempel: lad os antage, at han havde lært, at reglerne for at få en godbid var, at bevæge sig i alle mulige retninger (trin 1) og jeg lavede reglerne om, så han kun fik forstærkninger, når hans adfærd svarede til trin 5. Der ville gå meget lang tid og mange forsøg, før han ramte den rigtige adfærd. Han ville måske begynde at gøre noget, der overhovedet ikke havde noget at gøre med øvelsen og til sidst ville han give op. Lidt mere om det længere nede i reglerne for shaping.

Der er naturligvis rigtig mange måder, at lære en hest at bakke på. F.eks. kunne man lede hesten i den rigtige retning ved f.eks. at læne sig frem mod den eller lægge en hånd på bringen – det hedder operant betingning på ledende signal. I det tilfælde ville shapingproceduren se anderledes ud.

Shapingens 10 regler

Der er nogle regler i shaping, som det kan være gavnligt at tænke over (Pryor 2009, pp. 38-52):

  • Hesten altid skal have mulighed for at opnå forstærkning. Jeg har allerede været inde på denne regel, der drejer sig om at de enkelte trin på shapingtrappen skal være veldefineret og små nok til at hesten har en chance for at gør det rigtige. Hvis det er for svært, vil hesten aldrig finde ud af, at den er på vej i den rigtige retning. På hvert trin lægger træneren grundlaget for at komme op på det næste trin, hvor kravene skærpes en smule. Man kan tænke på hvert trin som et sæt regler. Når hesten har lært reglerne for at opnå forstærkning på et trin, ændrer vi dem en smule på næste trin. Vi skærper kravene for at opnå forstærkning. Det er vigtigt, at hesten kan genkende nogle af reglerne fra det forudgående trin.
  • Det kan også ske, at træningsforløbet slet ikke fungerer. Der er ingen fremgang. I det tilfælde er det hensigtsmæssigt at kigge sin procedure efter igen. Måske er det nødvendigt at lave nogle flere trin, redefinere dem eller lave det hele om. Reglen lyder, at hvis noget ikke virker, må vi finde på noget andet.
  • Hesten kan nogle gange se ud til helt at have glemt, hvad den har lært, dvs. den indlærte adfærd er brudt sammen. I det tilfælde er reglen, at man går tilbage til trin 1 og løber alle trinene igennem forfra. Det er en slags repetition af de forudgående trin, hvor hesten hurtigt og let kan opnå en masse forstærkninger. Eftersom hesten allerede har været igennem disse trin, går det som regel ret hurtigt at genopfriske dem.
  • Når shapingproceduren er ordentligt gennemtænkt, bliver det muligt for træneren at tænke forud for hesten. Hvis hesten pludselig springer et par trin op ad trappen, skal træneren være klar til at forstærke og tage den derfra – dvs. træneren skal hele tiden være på forkant. Det er svært at være på forkant, hvis man ikke har tænkt det ordentligt igennem fra starten. Så igen: planlægningen er afgørende.
  • En anden regel er, kun at træne ét aspekt af en adfærd af gangen. I bakkeøvelsen kunne det måske være, at jeg forsøgte at lære hesten at gå baglæns OG tage et bestemt antal skridt. Jeg ville starte med at indøve at gå baglæns og være ligeglad med antallet af skridt. Når bakningen fungerede, ville jeg begynde at arbejde med at tage et bestemt antal skridt. Min første regel på trin et ville være at bakke et skridt. På næste trin ville jeg ændre reglen og bede om to skridt, før jeg forstærkede. På tredie trin ville jeg bede om 3 skridt osv. Et andet eksempel kunne være, at lære hesten at tage hovedet ned, for at give trense på. Der er (mindst) to dele af den adfærd: 1) tage hovedet ned til en bestemt højde og 2) blive stående med hovedet i den pågældende højde i længere tid. I en shaping procedure kunne vi begynde med at få hovedet i den rigtige højde og først bagefter træne, at hovedet blev i den ønskede højde i længere tid. Man kan ikke både træne højden og tiden samtidig.
  • Det leder frem til den næste regel indenfor shaping, som drejer sig om, at når man begynder at arbejde på et nyt aspekt af adfærden, slækker man midlertidigt kravene til det tidligere aspekt. Det kan være, at vi har trænet hesten i at tage hovedet ned til en bestemt højde og at det fungerer. Når vi begynder at træne tiden den holder hovedet stille, slækker vi for en stund på kravene til højden.
  • Når adfærden er indlært på det enkelte trin sættes den på variabel forstærkning. Det betyder, at vi forstærker i et uforudsigeligt mønster. Den får altså ikke en godbid hver gang, den udfører adfærden. Det er en effektiv måde at vedligeholde og styrke en indlært adfærd. Det svarer lidt til det der sker, når mennesker spiller på enarmede tyveknægte. Når der ikke er gevinst hver gang forstærker det, at personen vil blive ved med at hive i håndtaget. Man ved jo aldrig, hvornår den store gevinst kommer – det kunne være næste gang – derfor må man lige prøve igen! Hvis gevinsten kom fuldstændig regelmæssigt og forudsigeligt, ville motivationen med tiden falde. Det er det samme, man har fundet ud af i forbindelse med ledelsesteorier om bonusordninger. Man har fundet ud af, at en forudsigelig bonus måske virker motiverende til at begynde med, men over tid har den ingen indflydelse på motivationen. Hvis bonussen derimod kommer helt overraskende og uforudsigeligt, kan det booste motivationen.
  • Skift ikke træner midt i processen. Det kan selvfølgelig blive nødvendigt, men som en generel regel bør det undgås. Det betyder ikke, at en hest altid skal have den samme træner. Den kan godt have mange, men der skal helst kun være én træner til ét indlæringsforløb.
  • Afbryd ikke træningen tilfældigt. Hvis du gør det, vil hesten opfatte det som en straf. Lad f.eks. være med at tale i telefon eller have for meget hyggesnak med andre, imens du træner. Reglen kunne også lyde: koncentrér dig om hesten og det du laver! 
  • Den sidste regel er, at man skal stoppe mens legen er god. Der er dog forskning der peger på, at det ikke betyder så meget for hesten. For mennesker kan det have betydning, at vi slutter efter et par succesoplevelser, men hesten er efter alt at dømme ligeglad. Reglen har jeg taget med alligevel, fordi den er en del af shapingens regelsæt.

Yderligere viden og inspiration til shaping kan findes i bøgerne nedenfor.

Mine udfordringer

Der er nogle af reglerne, som jeg har betydeligt sværere ved end andre. F.eks. synes jeg, at det med variabel forstærkning er ret udfordrende. Det kan også være svært at planlægge en god proces. Det er meget nemmere bare at gå i gang, men det kan aldrig betale sig i praksis! Pludselig står jeg med problemer, som måske kunne være undgået, hvis jeg havde tænkt det ordentlig igennem fra starten.

Jeg arbejder med en øvelse lige nu, hvor jeg har sprunget over, hvor gærdet er lavest! Det har givet problemer. Heldigvis er der jo ingen skade sket, udover at jeg har tabt noget tid. Jeg må tage mig sammen og få det ordenligt planlagt 🙂 .

Kilde

Kurland, Alexandra (2007): Clicker Training for Your Horse. Sunshine Books, Inc. (First published 1999)

Pryor, Karen (2009): Dont Shoot the Dog – The New Art of Teaching and Training. Revised edition. Ringpress Books Ltd.

Bog: Don’t Shoot the Dog – The New Art of Teaching and Training

DontShootTheDog

Titel: Don’t Shoot the Dog: The New Art of Teaching and Training. Revised edition (2009). Includes a new chapter on clicker training

Forfatter: Karen Pryor

Forlag: Interpet Publishing

Kan bl.a. købes her bl.a:

http://www.saxo.com

http://www.amazon.co.uk

Bogen handler om indlæring og træning generelt og altså ikke kun om hundetræning, som titlen ellers kunne narre en til at tro. Er du hesteinteresseret eller vil du gerne træne din kylling, kan denne bog bruges (hun lover faktisk, at du vil blive i stand til at træne din kylling, når du har læst bogen og det må da være det ultimative incitament for at læse den!).

Bogen kan hjælpe dig med at komme igang med at træne din hest, f.eks. at lære den triks eller at stå stille på staldgangen eller hvad du end kunne ønske dig. Men den kan også hjælpe dig til at analysere og forstå din egen adfærd, når du er sammen med hesten; hvorfor der er noget af det, du gør, der bare ikke ser ud til at virke eller hvorfor hesten reagerer underligt i bestemte situationer.

Karen Pryor er biolog og adfærdstræner og en af pionererne indenfor klikkertræning, som især hundeejere verden over har taget til sig, men som også vinder udbredelse hos hestefolk. Karen pryor har arbejdet professionelt med at træne f.eks. delfiner, fisk i sit eget akvarium, hunde, heste osv. Hun underviser også hundeejere og professionelle i f.eks. zoologiske haver. Karen Pryor beskriver principperne bag denne form for træning og hvorfor den er så effektiv (og sjov) (og du behøver slet ikke at bruge en klikker!)

Find mere information om Karen Pryor her.

Bogen er på engelsk, men den er ikke svær at læse, hvis man har nogenlunde styr på sproget. Det kan dog måske være svært at finde gode oversættelser på nogle af termerne. Jeg har forsøgt at oversætte og definere nogle af termerne nedenfor (ud fra det der står i bogen).

Det er en af den slags bøger, man sagtens kan læse flere gange.. jeg har læst den 2 gange indtil videre.

Hvad indeholder bogen?

På baggrund af teoretisk viden og praktisk erfaring med dyrs og menneskers adfærd beskriver Karen Pryor, hvordan man kan ændre adfærd vha. positiv (og negativ) forstærkning (reinforcement). Hun har mange års erfaring med at træne dyr uden straf, skæld ud, tvang osv og hun har erfaret, at man langt hurtigere kan opnå resultater ved at skifte de gammeldags læringsmetoder, der i højere grad bygger på dominans, straf og irettesættelse, ud med positiv forstærkning. Det bliver oven i købet sjovere for både eleven (hesten f.eks.) og træneren. Desuden synes jeg, at det er en god pointe, når hun skriver, at læringsprocessen går begge veje – både eleven og træneren lærer af processen.

Positiv forstærkning drejer bl.a. om at belønne den “rigtige” adfærd og dermed øge hyppigheden af adfærden og at adfærden opstår på et signal. Der er ikke noget hokus pokus i positiv forstærkning. Vi bruger alle principperne og metoderne dagligt både når vi er sammen med mennesker og dyr, måske uden at være særligt bevidste om det. Når vi ser mennesker opnå imponerende resultater med f.eks. dyretræning – som f.eks. forskellige varianter af horsemanship eller hestehviskere – så er det ikke mystiske eller magiske egenskaber hos træneren eller dyret, der er på spil, men måske snarere en intuitiv forståelse for og succesfuld anvendelse af de pricipper, som Karen Pryor lægger frem.

Foruden at beskrive, hvordan man i praksis kan gribe træningen an, giver hun en masse gode eksempler fra både menneske- og dyreverdenen. Hun beskriver det også som en kreativ process, som stiller store krav til træneren, som skal planlægge undervisningsforløbene.

Du får bl.a. værktøjer til, hvordan du:

  • forstærker adfærd, du gerne vil have
  • lærer dyrerne ny adfærd
  • leger ‘træningslegen’
  • Du får 8 metoder til at komme af med adfærd du ikke ønsker. Hun giver dagligdagseksempler på alle 8 metoder.
  • Hun beskriver 10 love for at forme adfærd (Shaping)

Psykologiske begreber bliver gjort lette at forstå og omsat til praksis, f.eks.:

  • Forstærkning – positiv og negativ forstærkning, betinget forstærkning, timing af forstærkning, type, størrelse, mængde og hyppighed af forstærkning,
  • Shaping: Herunder bl.a. Targeting, Mimicry og Modeling
  • m.m.

Sidst men ikke mindst diskuterer hun nogle af de kritikpunkter, som ofte kommer op:

  • f.eks. hvorvidt man hænger på klikkeren for evigt, når man først er begyndt at bruge den
  • hvorvidt denne type træning kan opfattes som manipulation
  • hvorfor klikkertræning er blevet så populært (især bland hundeejere)
  • at denne type træning ikke udelukker, at bruge ordet “NEJ” når det er nødvendigt

Hvad har jeg lært bogen?

Jeg har lært meget. Har kun plads til at nævne nogle af de væsentligste ting her.

  • Hvis jeg arbejder med det her, får jeg en ny mulighed for at kommunikere med hesten på en mere direkte måde og uden alt for mange misforståelser og tvetydigheder. I min fortolkning burde det være til gavn for både mig og hesten, som ikke behøver i samme omfang at blive forvirret og frustreret over, hvad det egentlig er, det tossede menneske ønsker af den.
  • Principperne er ligetil at forstå. Men det kræver erfaring og kreativitet af træneren.
  • Positiv forstærkning er information. Det fortæller dyret, præcis hvad det er jeg ønsker, at det skal gøre. At skælde ud og råbe nej, giver information om, hvad jeg ikke vil have, men fortæller altså ikke dyret noget som helst om, hvad det rigtige ville være at gøre!
  • Det drejer sig grundlæggende om, at øge hyppigheden af adfærd vi gerne vil have, ved at forstærke den, når den forekommer (heri ligger også, at man ikke kan forstærke adfærd, der IKKE forekommer!). Dette gøres ved at give en forstærker (dvs. en godbid eller en anden type belønning), når adfærden opstår.
  • Timing er afgørende. Belønning skal falde, NÅR adfærden forekommer. Hverken for tidligt eller for sent. Hvis forstærkeren falder for sent, forstærker man bare den adfærd, der kommer efter den ønskede adfærd. Så timing er altså altafgørende for at have succes med denne type træning.
  • I situationer, hvor man ikke har mulighed for at give en godbid, mens dyret udfører handlingen (måske kan du ikke nå dyret) kan det være en fordel af have trænet en betinget forstærker. En betinget forstærker er et meningsløst signal (et ord, et klik, en bevægelse el lign.) som bliver præsenteret lige før eller samtidig med den primære forstærker, således at dyret begynder at knytte de to sammen og dermed til sidst opfatter den betingede forstærker som en slags belønning i sig selv og godt kan vente på den primære forstærker.
  • Det er vigtigt at den betingede forstærker kun bruges i situationer, hvor dyret gør noget, som man ønsker i en træningssituation. Vælg altså et ord eller andet signal, som ikke bliver brugt i flæng, så ordet ikke går hen og bliver meningsløst. F.eks. tror jeg, at ville vælge at bruge ordet “rigtig” med min hest. Så kan jeg rose hesten på alle mulige andre måder også. F.eks. siger jeg ofte “dygtig” eller “godt” eller lignende, men disse ord er mere bare til hygge-ros.  “Rigtig” kunne blive det utvetydige signal, som hesten kender som “nu gør jeg noget, der er helt rigtig og det skal jeg helst gøre igen eller gøre mere af, så kommer der en godbid snart”.
  • “Nej” kan være på sin plads i nogle situationer!

Hvad savner jeg i bogen?

Jeg kunne godt bruge lidt flere eksempler på, hvordan man håndterer situationer, hvor det ikke går helt som forventet.

F.eks. har hun et eksempel med en hoppe, der skal lære at vende ørerne frem og se opmærksom ud vha. en klikker. Hensigten er, at hun skal tage sig godt ud til shows. Eksemplet starter på det tidspunkt, hvor hoppen har forstået, at hun skal gøre noget med ørerne og prøver sig frem ved at vende ørerne i alle mulige retninger, indtil hun rammer den rigtige position og får klikket. Men hvordan når man til, at hun ved at det præcis er ørerne det hele handler om? Hvad nu, hvis hun slet ikke have forstået det som udgangspunkt? Hvordan har de signaleret, at det er ørerne og ikke hovedbevægelsen eller kropspositionen som helhed, hun skulle arbejde med?

Det kommer sandsynligvis med erfaringen og afhænger af hvor kreativ træneren er, men det er alligevel lidt frustrerende, for det er lige præcis det, der er svært for mig at forstå på nuværende tidspunkt.

Teorien

Fundamentet til denne type træning kommer fra den del af psykologien der hedder behaviorismen. Nærmere bestemt B. F. Skinners arbejde med operant betingning (Operant conditioning). Hvis der skulle sidde en enkelt humanistisk psykolog derude og få udslæt af at høre Skinners navn, så tag det roligt og giv det en chance. Det giver god mening og fratager ikke mennesket sin frie vilje ;o).

Jeg vil ikke bruge energi på teorien. Bogen giver en introduktion til teorien, ved at beskrive teoriens anvendelse i praksis. I tabellen nedenfor findes nogle få af de primære termer, som hun bruger i bogen. Jeg har forsøgt at oversætte termerne til dansk, der hvor jeg har kunne finde en god oversættelse og at give en definition på termen ud fra Don’t Shoot the Dog. Jeg er klar over, at andre måske beskriver dem anderledes, men jeg vil forsøge at holde fokus på bogen her.

Dansk Engelsk Betydning
Positiv forstærkning Positive Reinforcement Processen at påvirke adfærd ved at gøre noget eleven opfatter som rart og behageligt og som han/hun gerne vil gøre noget for at opnå.
Negativ forstærkning Negative Reinforcement Processen at påvirke adfærd ved at gøre noget som eleven opfatter som ubehageligt og vil gøre noget for at undgå.
(primær) Forstærker Reinforcer Positiv forstærker = Belønningen. F.eks. mad, kærtegn, ros eller positiv erkendelse. Forstærkeren skal komme, når adfærden opstår – hverken før eller efter.Definitionen fra Karen Pryor er: “En forstærker er hvad som helst der, når det forekommer i forbindelse med en handling, øger sandsynligheden for, at den handling vil forkomme igen” (frit oversat, side 1).

Forstærkere er relative. Dvs. at forstærkeren skal være noget, som eleven ønsker. Det nytter f.eks. ikke at give hesten bananer, hvis den ikke kan lide dem. Hvad forstærkeren er afhænger altså af det enkelte individ.

Negativ forstærker: En påvirkning som eleven vil gøre noget for at undgå og som kan forstærke den korrekte adfærd. For eksempel: når du som rytter trækker i tøjlen for at få hesten til at runde sig eller dreje, så vil hesten gøre det du ønsker, fordi den har lært, at det kan få dig til at holde op med at trække i tøjlen. Dette er ikke det samme som straf, selvom der ligger et element af straf i al negativ forstærkning. Derfor må denne form for forstærkning ikke misbruges. Læs bogen for uddybning..

Betinget forstærker Conditioned reinforcer Et meningsløst signal (en lyd, en bevægelse, lys el. lign) som bliver præsenteret lige før eller samtidig med den primære forstærker og som med tiden bliver knyttet til den betingede forstærker. Dvs. dyret (eller mennesket) forventer, at den primære forstærker (godbidden) kommer lige om lidt, når den hører eller ser den betingede forstærker.En betinget forstærker kan både være positiv og negativ og “lige om lidt” kan være relativt, dvs. nogle dyr vil arbejde længe kun med betingede forstærkere (altså tålmodigt vente på den primære forstærker – gulerod)En forstærker kan knyttes til forskellige slags adfærd eller til kun en slags adfærd og omvendt kan samme adfærd have flere forskellige forstærkere.
At forme adfærd Shaping Når man vil skabe ny adfærd, mere kompleks adfærd eller sekvenser af adfærd i rækkefølge.