Tag Archives: indlæringspsykologi

Den godbid er IKKE en belønning!

Men hvad er den så? Under hestetræning er den en forstærker. Men er det ikke det samme? Ja, og nej.. men nok mest nej, for at undgå misforståelser!

Der er måske nogen, der undrer sig over, hvorfor jeg ikke kalder det en belønning, når jeg træner med godbidder. Jeg ved, at mange, der underviser i hestetræning bruger ordet belønning, fordi det er et ord alle kender og det er nemmere at forstå end forstærkning, men jeg mener, at ordet belønning skaber nogle lidt forkerte associationer i forbindelse med træning af dyr og derfor synes jeg, at det er bedre at holde sig ordet forstærkning. Når vi bruger ordet belønning og vi i virkeligheden mener positiv forstærkning, kan det give anledning til misforståelser, som kan blive svære at udrede bagefter eller i værste fald gør, at vi griber en opgave forkert an fra starten. Derfor synes jeg, at det er vigtigt at bruge præcise termer, også selvom det måske tager lidt ekstra tid, at for
klare hvad det er.

IMG_0102Nogle hestemennesker ønsker overhovedet ikke at bruge belønning/godbidder i træningen. Måske fordi de oplever, at hesten lærer unoder. Min påstand vil være, at
det er fordi, godbidderne ikke bliver anvendt korrekt. Jeg skal ikke kunne sige, om der findes heste, der bare ikke kan finde ud af det der med godbidder. Jeg har bare ikke mødt en endnu, der ikke med noget tilvænning kan blive ret god til det med godbidder. Min egen lille bandit Sovs, som er et kæmpe madøre, har lært manerer i brugen af godbidder og hvis han kan, så tror jeg, at de fleste kan 😉

Forstærkning er en term indenfor indlæringspsykologien der betyder: At tilføre eller fjerne noget for at øge sandsynligheden for at en adfærd forekommer igen. Når vi tilfører en godbid, kalder vi godbidden en positiv forstærker. Der findes også negative forstærkere, men det er ikke dem, det handler om her. Hvis man vil vide mere om positiv og negativ forstærkning, kan man kigge her.

Belønning

“påskønnelse af en bestemt indsats i form af ros eller penge” (ordbogen.com)

Synonymer: Bonus, dusør, erkendtlighed, gratiale, gengæld, påskøndelse, tak, præmie, vederlag.

En belønning og en forstærker er hyppigt den samme genstand. For mennesker kan det være ros, anerkendelse, ære, penge, gaver, lækker mad, eller hvad som helst andet en person vil blive glad for. I træning med dyr bruger vi hyppigt godbidder, nus eller ros. Selve genstanden kan altså være det samme, hvad enten vi belønner eller forstærker, men de anvendes på forskellige måder og med forskellige resultater. Der er – måske uskrevne – regler for, hvordan vi bruger belønninger i al almindelighed og de svarer ikke særligt godt til de meget konkrete og velbeskrevede regler, der er for anvendelsen af forstærkere.

En belønning er ofte noget, vi giver et stykke tid efter, en eller anden har gjort noget belønningsværdigt. Vi giver belønninger for en samlet præstation. F.eks. hvis vi har gjort det særligt godt med et projekt på arbejdet eller vi har vundet en konkurrence eller noget lignende. Vi får en bonus, en gave, en præmie eller æren som belønning for vores indsats. Det er sådan vi typisk forstår belønninger, tror jeg. Problemet med dem er, at belønning ikke knytter sig til nogen særlig del af præstationen. Hvis jeg f.eks. får ros på arbejdet efter et projekt, aner jeg ikke om det var rapporten, udførelsen, planlægning, samarbejdet eller noget helt andet, der var særlig godt til at udløse ros. Jeg kan måske få det beskrevet, men vi har det med at efterrationalisere, generalisere og desværre glemmer vi deltaljer i et længere forløb, så rosen vil ikke være særlig præcis og dermed heller ikke nødvendigvis give mig noget, der kan understøtte, hvad jeg gør fremover.

Det forholder sig anderledes med forstærkere.

Positiv forstærker (eng: positive reinforcer):

Any stimulus which, when presented following a behavior, increases or maintains the strength of that behavior” (Chance 2014, side 397)

(dansk: en hvilken som helst stimulus (påvirkning), som når den præsenteres efterfølgende en adfærd, øger eller vedligeholder styrken af den pågældende adfærd.

Eller med Pryors ord:

A reinforcer in anything that, occurring in conjunction with an act, tends to increase the probability that the act will occur again” (Pryor 2009, side 1)

(dansk: En forstærker er hvad som helst der, når det forekommer i sammenhæng med en handling, øger sandsynligheden for at denne handling vil forekomme igen.)

Det man skal lægge mærke til i ovenstående citater er, at en forstærker forekommer i direkte sammenhæng med en konkret handling. Timingen er afgørende. Der må ikke gå for lang tid mellem adfærden og forstærkningen. Vi taler om få sekunder, hvis det skal  have den ønskede effekt. Hvis en forstærker skal virke forstærkende på det hesten gør- dvs. øge sandsynligheden for at hesten gør det igen – er vi nødt til at give forstærkeren (godbidden) i det øjeblik hesten udfører handlingen – gerne samtidig med adfærden og allersenest et par sekunder efter. Tidsaspektet er centralt her og det er måske den væsentligste forskel på forstærkere og belønninger, sådan som jeg opfatter det.

Belønning vs. forstærkning – Timing

En forstærker gives i løbet af træningen, for at kommunikere til hesten, at det den gjorde, i det øjeblik den fik godbidden, er noget vi meget gerne vil se mere af.

Hvis vi venter med at levere godbidden til efter træningen er overstået, har den ingen indvirkning på noget af det, hesten gjorde under træningen. Hvis vi eksempelvis øver os på Side Pass fra jorden og hesten har gjort det godt, stikker vi den måske et par godbidder bagefter, mens den bliver striglet. Tanken er sød og vi vil gerne være gode ved vores heste, men godbidden fortæller ikke hesten, at det var det, den gjorde ude i ridehuset, der var godt. Den laver slet ikke den kobling. Hesten kobler godbidden med det, den gør i det sekund, den får godbidden og det kan jo være alt muligt. Det uheldige er, hvis vi ikke er opmærksomme på, hvad hesten gør, når den får godbidden – så kan vi komme til at forstærke en adfærd, vi ikke ønsker. Hvis den f.eks. stod stille og slappede af, så er det afslapningen vil forstærker og ikke den superlækre Side Pass den udførte i ridehuset. Man kan vel sige, at belønningen mere er for vores egen skyld, fordi vi gerne vil forkæle hesten. Hesten bliver selvfølgelig også glad, men den forstår ikke sammenhængen mellem godbidden og det den gjorde for 10 minutter siden. Uanset om vi opfatter godbidden som en belønning eller en forstærker, så virker den enkelte godbid forstærkende på noget. Nemlig det hesten gjorde, da den fik godbidden.

Hvis godbidden skal have nogen som helst effekt den adfærd, vi træner hen imod, er vi nødt til at anvende den på en anden måde, nemlig som en forstærker. Når vi bruger godbidden som forstærker, leverer vi den som sagt i det samme øjeblik, som hesten udfører adfærden. På den måde ville hesten forbinde godbidden med selve øvelsen. (Denne beskrivelse er faktisk for grov. Egentlig er det mindre dele af den samlede Side Pass bevægelse, vi forstærker til at begynde med – læs om Shaping her.)

Pryor giver et eksempel med atleter. Det virker meget bedre for en gymnasts fremtidige præstation, når træneren spontant råber “godt” eller “fantastisk” i det øjeblik gymnasten gør noget rigtig godt, end hvis han ventede til bagefter i en gennemgang af dagens træning. Vi oplever det måske også, når vi får undervisning til hest. Det har større effekt, når træneren siger “godt” eller “flot” i det øjeblik, hvor vi føler i det kroppen. Det er da dejligt at få ros bagefter, men det er ikke sikkert, det har den store indflydelse på detaljerne i præstationen næste gang. Det at forstærkningen kommer lige nu og her i direkte tidsmæssig forbindelse med adfærden, gør det nemmere for os at føle og vide, hvad der var godt og dermed hjælpe os til bedre at forstå, hvad vi skal gøre for at opnå samme tilstand igen. Vi vil også have mere lyst til at gøre det igen. Det gør noget ekstra for motivationen.

Et eksempel fra min egen verden er mine børns dans. De danser standarddans og latin og går til turneringer. Især min søn vinder ret ofte. Han er rigtig glad for medaljerne, men jeg er sikker på, at det er den øjeblikkelige forstærkning, når tilskuerne kigger på ham og klapper, når han danser forbi, der giver den største effekt og dermed er mest forstærkende på hans adfærd/bevægelser. Under træning hører jeg ofte træneren råbe “GODT” eller “FLOT” og selvom jeg ikke kan se, hvad der foregår, ved jeg, at det virker fantastisk forstærkende og motiverende på det børnene gør og at det skærper deres opmærksomhed på lige præcis de bevægelser de udførte, da han råbte “GODT”..

Hvis vi vender tilbage til sammenligningen mellem belønning og forstærkning: Groft sagt kan man vel godt sige, at det er to sider af samme sag, selvom de anvendes på forskellig måde, men ville vi opfatte spontane ytringer som “FLOT” og “Fantastisk!” som en belønning? Det tror jeg ikke. De ville snarere blive opfattet som en opmuntring: “JA, gør det der igen!” og det er den opmuntring, vi er ude efter, når vi anvender positiv forstærkning med heste. Så hvis vi absolut skal sammenligne den positive forstærker med noget, vil jeg næsten heller kalde det opmuntring eller anerkendelse af en handling end belønning.

Der er nok flere forklaringer på, hvorfor positive forstærkere virker bedre end belønninger. En af dem kan være, at hestens korttidshukommelse er begrænset (- det er menneskets i øvrigt også). Information i korttidshukommelsen holdes ikke mere end nogle sekunder, inden de skiftes ud med nye informationer. En anden forklaring er muligvis, at hesten ikke kan ræsonnere på samme måde, som mennesker kan. Den del af hjernen, som er i stand til at abstrahere, planlægge, ræsonnere osv er ikke særlig udviklet hos hesten i forhold til mennesket. Mennesker kan sagtens sidde bagefter og analysere nogle hændelser og tale om, hvad der er gået godt og skidt og tilpasse fremtidige handlinger ud fra det. Eller vi kan gætte os frem eller regne det ud, ved at tænke over det, der er sket. Det kan hesten ikke. Den analyserer sig ikke frem til ret meget eller reflekterer over alt muligt bagefter. Den lærer i øjeblikket vha. trial and error. Dvs. den prøver noget og afhængig af reaktionen eller konsekvensen, gør den det enten igen eller ikke.

Eksempel på misforståelse…

Jeg var med til en lidt voldsom trailerlæsning engang. Jeg havde ikke den store indflydelse på forløbet. Det var ikke min hest, ikke min trailer og ikke mig, der skulle noget med hesten. Jeg var bare tilfældigvis på stedet på tidspunktet. Det endte med 4 mennesker, der omringede hesten, som panikslagen hoppede til siden og på alle mulige måder prøvede at undgå traileren. Men jo mere den prøvede, jo mere pres fik den. Den endte med at være viklet ind i snore rundt om bagdelen og personer, der pressede den fra alle vinkler. Såvel hesten som de mennesker, der var med (inklusive mig selv) kunne være kommet til skade, men det skete heldigvis ikke.

På et tidspunkt forsøgte jeg mig med, at få hesten til at tage et skridt frem, så jeg kunne forstærke det ene skridt og måske øge sandsynligheden for, at den ville tage et skridt til, som jeg så kunne forstærke osv. Ejeren var irriteret og sur over forløbet og orienterede mig om “at han da ikke skulle belønnes for noget som helst nu, sådan som han opførte sig”. Jeg kan godt se, hvordan hun har tænkt det. Fandme nej om han skal have belønning/godbidder for at opføre sig sådan! Problemet er bare, at det ikke var en belønning i sådan traditionel forstand, jeg ville forsøge mig med. Det var en forstærkning. Hvis jeg var skarp i min timing og leverede en godbid i det sekund hesten gjorde bare den mindste bevægelse i den rigtige retning, ville han måske forsøge at bevæge sig i den retning igen. Med tiden ville han måske endda bevæge sig mere og mere i den rigtige retning, fordi han lærte, at det havde gode konsekvenser, at gå hen imod traileren. Som sagt: hesten knytter forstærkningen, til det den gør lige nu og her i dette øjeblik og ikke til dens samlede handlinger indenfor de sidste 5 minutter.

MEN i bagklogskabens lys ved jeg nu, at min ide med godbidderne helt sikkert ikke ville have virket i det tilfælde. Det var hesten alt for stresset til. Når hesten er for stresset og har adrenalinen susende rundt i kroppen, så tænker den kun på at overleve – enten ved at prøve at komme væk eller ved at angribe – og i det tilfælde er det for sent at hive godbidderne frem! Jeg tror, at det er de færreste, der tænker på en sandwich, når de føler sig truet på livet ;-). Man er nok ikke så sulten i det tilfælde. Hvis det skulle have virket, skulle vi fra starten af have sørget for, at hesten slet ikke nåede det stressniveau. Men jeg var helt grøn udi indlæringspsykologien og hesteadfærd og jeg var presset, for det var både farligt for menneskerne og hesten, så jeg tænkte ikke klart. Eksemplet fungerer som eksempel på, hvordan vi typisk forstår belønninger og hvordan de bruges og hvordan den opfattelse gør, at misforståelser opstår pga. noget som simpelt som betydninger af ord.

Forstærkeren er et redskab man bla. bruger indenfor træningen af dyr og man bruger den på en helt bestemt måde, for at opnå noget helt konkret. At forstå forstærkeren, som man typisk forstår belønning, kan give anledning til misforståelser, at det ikke lykkes os, at forstærke den ønskede adfærd og måske endda, at vi kommer til at forstærke en uønsket adfærd eller slet ikke når nogen vegne med træningen med godbidder.

Kilder

Chance, Paul (2014): Learning and Behavior. International Edition, 7th edition, Wadsworth Cengage Learning.

Pryor, Karen (2009): Don’t Shoot the Dog! The New Art of Teaching and Training. Revised Edition, Ringpress Books Ltd.

 

Reklamer

Stimuluskontrol

5 cases:

 1. Engang faldt jeg over en tråd et eller andet sted, der omhandlede en piges desperate råb om hjælp med hensyn til en hest, der stejlede. Hun havde lært den at stejle fra jorden, men nu gjorde den det altså også under ridning.
 2. Laaaang tid efter var jeg ude at undervise en i træning fra jorden og da jeg spurgte, hvad hun havde lyst til at lave med hesten, sagde hun bl.a. at hun IKKE ville lære den at lægge sig ned, for så var hun bange for, at den ville gøre det i tide og utide. Fornuftig tanke, synes jeg.
 3. I begyndelsen, når jeg skulle rense hove på Sovs tog jeg fat i venstre forben, sådan som man jo gør, når man renser hove. Hans reaktion var at forsøge at komme ned og ligge på benet, for han har nemlig lært at “neje” eller bukke. Lidt upraktisk, at han forsøger at gøre det, hver gang jeg løfter venstre forben.
 4. Jeg så en video engang med en pige, der havde lært sin hest at stå og vippe op og ned med hovedet til musik. Hun og hendes veninder synes selvfølgelig, at det var vildt sjovt. Gad vide om den hest senere får problemer, når den står og væver i boksen, fordi det har den lært at gøre?
 5. Da jeg lærte Surfer at bakke via. ren oprant betingning, begyndte han også at bakke i alle mulige andre situationer i tide og utide. Det kan være, at det er nuttet, når han moon walker rundt på træningsbanen helt uopfordret, men det kan blive et problem, når han gør det på staldgangen.

Find selv eksempler på en hest der gør noget, der er hensigtsmæssigt i en sitation, men helt uhensigmæssigt i en anden. Det er nok ikke svært.

Hestene i alle disse cases gør præcis, hvad vi har lært dem. I virkeligheden er de rigtig gode elever, der viser, at de har forstået, hvad det er, vi gerne vil have og nu vil de gerne vise det så meget som muligt – måske for at opnå forstærkning. De er endda ekstra seje, fordi de har lært at udføre den indlærte adfærd i en helt anden kontekst – dvs. de viser, at de kan gøre noget i stalden, som de ellers havde lært ude i ridehuset.. det kan heste ellers i andre tilfælde have lidt svært ved. Nogle gange har vi brug for, at de skal overføre det, de har lært et sted til et andet og vi er nogle gange nødt til at træne det forskellige steder og andre gange ikke så meget.

Men hvordan undgår vi, at hesten begynder at udføre en adfærd, der er indlært i en situation til den anden eller at den gør det på de forkerte tidspunkter? Det kan vi gøre ved at sætte adfærden under stimuluskontrol.

Hvad er stimuluskontrol?

En stimulus er noget hesten udsættes for af os eller dens omgivelser. Alle stimuli bliver efterfulgt af en respons, som er den reaktion eller adfærd, hesten udviser, når den påvirkes af en stimulus. En sulten hest, der finder noget græs (stimulus), vil begynde at æde (respons). Når jeg trykker hesten på bagparten (stimulus), flytter hesten rumpen (respons). Når jeg tager let i tøjlen (stimulus), stopper hesten (respons). Når hesten ser en farlig dims (stimulus), løber den væk (respons). I en træningssituation forventer vi en bestemt respons på en bestemt stimulus.

Når vi træner med hesten, lærer vi den at knytte bestemte typer adfærd med bestemte stimuli. Dvs. jeg lærer hesten, at når jeg vifter med pegefingrene i luften (stimulus), skal den bakke (respons). Stimulus er i dette tilfælde et indlært signal.

Det vi nogle gange glemmer er at sikre, at adfærden er under stimuluskontrol. Dvs. sikre at den pågældende adfærd kun opstår, når vi viser et bestemt signal og ikke i nogen andre tilfælde. Hvis vi sætter adfærden under stimuluskontrol, undgår vi, at hesten begynder at udføre adfærden i utide. Det skal dog lige nævnes, at det selvfølgelig kun gælder under træning. Hvis hesten skulle få lyst til at bakke, når den er ude på folden, så er den selvfølgelig velkommen til det. Men i træningssituationer er det vigtigt, at den her lært at skelne mellem forskellige signaler og at den udfører de typer adfærd, der passer til.

Det der sker i stimuluskontrol er, at hesten lærer at genkende (diskriminere) bestemte stimuli/signaler. Det kan spare den for en masse frustrationer. Paul Chance skriver i Learning and Behavior, at stimuluskontrol kan give individet en form for kontrol, over det der sker. Hans eksempel er en rotte, der har lært at tykke på en knap, når en lampe lyser (fordi den får mad) og at undlade at trykke på den, når lampen ikke lyser (fordi den ikke får mad). Her kan man tale om, at adfærden er under stimuluskontrol. Det sparer rotten for at trykke på knappen i alle de tilfælde, hvor lampen er slukket. Den skal altså ikke bruge energi på noget, der ikke har nogen gavnlig konsekvens for den.

Fra menneskeverdenen er et hyppigt brugt eksempel trafiklys. Den røde lampe ved vi alle, hvad betyder og vi stopper ved rødt lys (forhåbentligt). Når den gule lampe lyser, løfter vi måske foden over til speederen og når den grønne lyser, træder vi på speederen. Det er et godt eksempel på adfærd, som er under stimuluskontrol og som øger sikkerheden på vejene, fordi vi ikke behøver at spekulere over, hvad lamperne betyder eller hvad vi skal gøre, når de lyser.

Med Chances ord:

When a discrimination has been well established, the behavior is said to be under stimulus control. Generally that means that the behavior is orderly and efficient, that it enables us to obtain desirable consequences and avoid undesirable ones. Stimulus control can work agains us, but we can also use it to our advantage” (Chance 2014, side 329)

Men det at en adfærd er konsekvent, effektiv og under stimuluskontrol, som Chance siger i citatet, kommer ikke af sig selv!

Reglerne for stimuluskontrol

 1. Adfærden opstår aldrig på et andet indlært signal – dvs. at hesten ikke bakker, hvis du giver et “stå” signal.
 2. Hesten skal ikke udføre nogen andre former for adfærd på signalet – dvs. hesten skal ikke lægge sig ned, når du giver bakkesignalet.
 3. Hesten skal udføre adfærden umiddelbart efter signalet er givet – dvs. den skal gøre det med det samme, når den bliver bedt om det og ikke 5 minutter efter.
 4. Hesten skal aldrig udføre adfærden uden at signalet er givet først – den skal altså ikke bakke rundt efter forgodtbefindende, men kun gøre det, når signalet er givet. 

(frit efter Karen Pryor: Don’t Shoot the Dog, side 73)

Først når de 4 punkter gør sig gældende, kan man tale om, at en adfærd er under stimuluskontrol.

Hvordan gør man?

hvis vi holder fast i eksemplet med bakke adfærden. Med Ciara viftede jeg med pegefingrene i luften, når hun skulle bakke. Hvis jeg skulle sikre mig, at det var under stimuluskontrol, kunne jeg gøre følgende:

 • Vise et andet signal af og til og tilbageholde forstærkningen, hvis hun bakker
 • Ikke forstærke, hvis hun bakker uden at signalet er givet først
 • Ikke forstærke andre former for adfærd på signalet
 • Kun forstærke, når hun udfører adfærden umiddelbart efter signalet
 • Tilbageholde signalet i et stykke tid og kun forstærke, hvis hun afventer signalet

På en af mine yndlingsblogs horse tricks 101 viser hun, hvordan hun gør det. Hendes hest har lært at bukke. Hesten bukker derfor hele tiden, men hun vil naturligvis gerne have, at den kun bukker, når den får besked på det. På videoen forstærker hun, når hesten ikke gør noget. En gang i mellem giver hun signalet og hesten får en godbid, hvis den bukker lige efter signalet. Hesten får intet, hvis den bukker, uden at hun har givet signalet først. Hun træner på den måde meget bevidst, at den ikke skal bukke på eget initiativ. Hun har gang i flere ting på en gang. For det første positivt forstærker hun, at hesten står roligt med hovedet væk (den vinder en godbid på det), for det andet negativt straffer hun, når hesten bukker, uden at signalet er givet først (her tilbageholder hun godbidden = negativ straf). Og for det tredie positivt forstærker hun adfærden, når den forekommer på signalet. Jeg synes, at det er en blid måde at gøre det på! Jeg vil helt sikkert integrere hendes måde at gøre det på mere i min træning.

 

Vær opmærksom på: 

Jeg har været inde på det i afsnittet ovenfor: at tilbageholdelse af godbidden er det samme som negativ straf og det kan hesten blive irriteret over. Den bryder sig ikke om, at noget der før resulterede i en godbid, nu pludselig ikke gør det længere. Den bliver straffet for noget, den før blev forstærket for og indtil den har fundet ud af, at det har noget med signalet at gøre, er det naturligvis meget frustrerende. Det hjælper dog, når hesten har erfaring med denne måde at træne på. Ciara blev f.eks. utrolig mobset til at begynde med, når jeg tilbageholdt godbidderne. Nu har hun lært, hvordan træningen foregår og hun bliver derfor ikke sur på samme måde mere, når jeg ændrer på tingene. Læg også mærke til, at hesten i videoen ikke virker synderligt irriteret over, at den ikke får en godbid, når den bukker på eget initiativ. Det kan måske have noget at gøre med, at den også er vant til at træne på den måde og måske, at der ikke går for lang tid mellem godbidderne, fordi hun også forstærker det, at hesten står stille.

Jeg synes, at det er vigtigt at sørge for, at hesten hele tiden har mulighed for succes. Hvis jeg tøver lidt med at give signalet, så tøver jeg til at begynde med ikke for længe men udvider gradvist tiden lidt efter lidt. Når jeg begynder at vise andre signaler, skal jeg tænke over, hvor meget de ligner det oprindelige. Det er ikke fair overfor hesten, hvis de ligner for meget til at begynde med. Det skal være nemt for den at se, at det ikke er det samme signal. Så kan man altid øge sværhedsgraden med tiden. Hvis jeg kan mærke, at jeg i et stykke tid har presset for meget på, uden at hesten har haft succes, kan jeg godt finde på at kaste en øvelse ind midt i det hele, som jeg ved hesten har styr på, så den lynhurtigt kan få et par succesoplevelser, inden vi fortsætter.

heste er meget lærenemme dyr og de forstår ret hurtigt, hvad vi er ude efter. Nogle gange glemmer vi bare at føre lærdommen til dørs og det ender jo desværre ofte med at hesten får skæld ud, bliver kaldt fræk eller uartig. Det er ikke fair, vel?

Kilder

Chance, Paul (2014): Learning and Behavior. International Edition, 7th edition, Wadsworth Cengage Learning.

Pryor, Karen (2009): Don’t Shoot the Dog! The New Art of Teaching and Training. Revised Edition, Ringpress Books Ltd.

Negativ og positiv forstærkning.. hvad er det nu lige det er?

Når jeg fortæller, hvad det er for en uddannelse, jeg er ved at tage, så får jeg 99% af gangene følgende spørgsmål: “skal du være sådan en hestehvisker?”. Med hestehvisker menes der ofte en person, som har et usynligt og næsten magisk bånd til hesten og som kan hviske til den – sådan lidt tankeoverførings-agtigt. Hvis det er sådan hestehvisker skal forståes, er svaret klart “NEJ, jeg er ikke ved at uddanne mig til hestehvisker”. Men hvis man forstår en hestehvisker, som en person, der bringer indlæringspsykologien i spil, uden selv at være klar over det og som har eminent timing og opmærksomhed og som har en umiddelbar forståelse for hesten, så kan der godt være noget om det – bortset altså lige fra, at jeg forsøger at være meget opmærksom på det! Det hestehviskerne gør er, efter min mening, nemlig overhovedet ikke mystisk eller magisk, men kan forklares indenfor de indlæringsteoretiske og adfærdsbiologiske rammer.

Jeg synes, at viden om indlæringspsykologien har stor betydning for, hvad man kan gøre med sin hest og hvordan man gør det. Viden om indlæring kombineret med viden om hestens natur og adfærd kan forklare en masse af de problemer, mange hesteejere oplever til hverdag og give ideer til, hvordan problemerne kan håndteres. Men det handler ikke kun om problemer. Det handler om, hvordan hesten lærer i det hele taget – i ridningen, i longen, på staldgangen og i alle andre situationer. Det her oplæg handler om en af de mest prominente indlæringspsykologiske teorier, som bliver brugt indenfor mange typer træning af dyr. Den er ikke den eneste, men en af de vigtigste.

Negativ og positiv forstærkning er to varianter af en type indlæring, der hedder operant betingning. Der er to mere: negativ og positiv straf. NB: Her skal straf ikke forståes som afstrafning eller vold, men det kommer jeg tilbage til.

Lad os lige først få beskrevet hvad operant betingning er.

Operant betingning

Operant betingning er en form for indlæring, hvor indlæringen foregår som en konsekvens af en adfærd. Vi lærer altså af konsekvenserne af det vi gør. Sagt på en anden måde: du gør noget (adfærd) og det du gør har en konsekvens. Konsekvensen påvirker, hvorvidt du er mere eller mindre tilbøjelig til at gøre det samme igen. Hvis du synes konsekvensen var behagelig, vil du sandsynligvis gøre det igen, hvis konsekvensen var ubehagelig, vil du nok ikke forsøge det igen lige med det samme.

OperantBetingningEksempel: Du siger noget sødt til en person (adfærd) og personen bliver glad og smiler til dig (konsekvens). Hvis det, at personen smiler, får dig til at føle noget godt, så er sandsynligheden for, at du siger noget sødt en anden gang større. Hvis personen ikke smiler, men ser sur ud som en konsekvens af dine søde ord, er sandsynligheden for, at du vil sige noget sødt en anden gang mindre. På den måde har konsekvenserne af alt, hvad du gør indflydelse på, hvad du gør senere.

Det samme gælder for heste. Alt hvad du gør virker tilbage på det hesten gør. Og alle dine reaktioner, på det hesten foretager sig, påvirker dens fremtidige handlinger.

Det her gælder altid – også når du ikke træner og ikke er bevidst om det.

Positiv & negativ forstærkning / positiv & negativ straf.

Vi har 4 processer i operant betingning, to af dem – positiv og negativ forstærkning – er processer, der begge øger sandsynligheden for at en given adfærd forekommer igen. Positiv og negativ straf er begge processer, der sænker sandsynligheden for at en adfærd forekommer igen.

Positiv og negativ er et udtryk for om noget er til stede eller ej. Det har ikke noget at gøre med om noget er godt eller skidt. F.eks. enten giver du en godbid eller også tilbageholder du den. Enten er godbidden til stede eller også er den ikke. Positiv og negativ svarer til plus og minus, ikke til godt og skidt.

Her kommer et par eksempler:

postiv forstærkning det at vi tilfører noget for at øge hyppigheden eller styrken af en adfærd Her tilfører vi noget behageligt. Vi giver f.eks. en godbid, når hesten gør noget ønsket. Eller klør den på yndlingskløstedet el. lign. Dermed er sandsynligheden større for, at den kommer til at gøre det igen
negativ forstærkning det at vi fjerner eller tilbageholder noget for at øge hyppigheden eller styrken af en adfærd Her fjerner vi noget, som hesten synes er ubehageligt – f.eks. pres. Når vi fjerner presset øger det sandsynligheden for, at hesten vil gøre det igen, som fik ubehaget til at forsvinde.
positiv straf det at vi tilfører noget for at begrænse eller sænke hyppigheden eller styrken af en adfærd Det der bliver tilført her er noget som hesten opfatter som ubehageligt. Heste vil gøre meget for at undgå fysisk pres, derfor kan man tilføre et pres, når hesten gør noget uønsket. Bare lige huske, at man ikke behøver at slå eller nive. For hesten kan en berøring være nok.
negativ straf det at vi fjerner eller tilbageholder noget for at sænke hyppigheden eller styrken af en adfærd Hvor vi i negativ forstærkning fjernede noget ubehageligt, så fjerner vi her noget, som hesten finder behageligt eller noget den gerne vil have. Det er altså en negativ straf at tilbageholde mad eller godbidder f.eks.

Forstærkere og straffere

 • Det vi tilfører i positiv forstærkning, kaldes en forstærker og er altså noget, som hesten vil arbejde for at opnå.
 • Det vil tilfører i positiv straf kaldes en straffer og er noget som hesten vil arbejde for at undgå.

Hvad der virker som forstærker og straffer afhænger af den enkelte hest. Det er ikke sikkert, at det helt de samme ting, der vil virke forstærkende eller straffende for alle heste.

Heste er nok ikke de mest kræsne dyr og vil gøre meget for at opnå en godbid, men det er alligevel værd at tænke lidt over, hvad den pågældende hest allerbedst kan lide. Jeg har endnu ikke hørt om en hest, der ikke vil arbejde for godbidder, men der kan godt være nogle typer godbidder, som virker mere motiverende end andre. Jeg hørte et eksempel fra hundeverdenen på et af kurserne. En mand kunne ikke finde noget mad, som hunden ville arbejde for. Han kunne altså ikke finde en velegnet forstærker til træningen. Det viste sig, at makrel i tomat virkede! Prøv lige at have det med i lommen til træning ;-).

Men hvad med det der straf? Når jeg skriver “pres” alle mulige steder, så mener jeg berøring, ikke slag. I mange tilfælde er let eller moderat berøring nok til at få en reaktion fra hesten. Da jeg trænede bakke på signal, behøvede jeg ikke engang at røre. Bare det at stå foran hesten og læne mig frem, var nok til at få ham til at bevæge sig lidt bagud.

Der er ingen tvivl om, at slag og andre former for vold også ville virke. Jeg går ikke ind for det overhovedet. Dels fordi jeg synes, at det i alle tilfælde er helt unødvendigt og uetisk, men også fordi, at i det øjeblik, man begynder at anvende vold, bliver der blandet stresshormoner ind i situationen. Dvs. at hesten bliver angst. Hvis du er uheldig, kan du få skabt en stressrelateret reaktion på det, som hesten havde sin opmærksomhed rettet mod, da straffen faldt. Stress virker desuden hæmmende på indlæring.

Case 1 – Hovedsky hest

Negativ forstærkning / positiv straf

Lad os antage, at jeg har en hest, der er hovedsky. Jeg kan ikke komme til at røre den på hovedet, uden, at den flytter hovedet væk. Det kan give problemer, når jeg skal strigle eller lægge trense på.

Der kan være mange forklaringer på, at den er blevet hovedsky. En kunne være, at den har lært, at  berøringen forsvinder, når den bevæger hovedet. Den er på den måde, blevet negativt forstærket i at flytte hovedet. Hvis jeg gerne ville lære den at acceptere berøring og stå stille med hovedet, når jeg rør ved den, kan jeg prøve negativ forstærkning. Altså den samme proces som skabte problemet i første omgang. Det jeg skal gøre er, at røre hestens hoved og når den forsøger at flytte hovedet, bliver jeg ved med at røre (positiv straf). Berøringen behøver ikke at være særlig kraftig. Det er ofte nok med en meget let berøring. Jeg slipper ikke, før den holder hovedet roligt – altså igen negativ forstærkning, men denne gang på at være rolig med hovedet. I begyndelsen vil den forsøge at slippe for berøringen og måske blive mere urolig med hovedet, men hvis jeg er stædig nok og følger med bevægelserne, vil der komme et tidspunkt, hvor den vil være rolig i et øjeblik. I det ganske korte øjeblik skal jeg være hurtig og fjerne hånden. Så lægger jeg hånden på igen og det hele vil gentage sig. Jeg holder ved, sålænge hesten er urolig med hovedet og slipper i det sekund hovedet er roligt. Efter nogle gentagelser vil hesten have lært, at den ikke kan få hånden til at forsvinde ved at kaste sit hoved alle mulige steder hen. Hånden forsvinder kun når den er rolig. Timingen er selvfølgelig vigtig, for at det skal virke. Hvis jeg flytter hånden for tidligt, dvs. mens den stadig er urolig, får jeg forstærket den urolige adfærd.

Positiv forstærkning / negativ forstærkning / positiv straf

Jeg kunne også vælge en anden strategi – positiv forstærkning. Hvor jeg før tilførte noget ubehageligt (berøringen/positiv straf), mens den var urolig og fjernede det ubehagelige, når den blev rolig (negativ forstærkning), kan jeg med positiv forstærkning tilføre noget behagelig, når den er rolig. Jeg kan f.eks. røre hovedet og når den bliver rolig, giver jeg den en godbid – positiv forstærkning. Jeg kan eventuelt kombinere det, så jeg både fjerner berøringen og giver en godbid, når hesten er rolig.

Case 2 – Hesten tigger

Negativ straf / positiv forstærkning

I dette tilfælde tigger hesten. Det gør den ofte, fordi vi har forstærket tiggeadfærden uden at tænke over det. Tiggeadfærden kan være rettet mod f.eks. at den gerne vil have en mad eller godbid, men det kan også være, at den er ude efter opmærksomhed. Lad os antage, at det er opmærksomhed den er ude efter. Dvs. at den f.eks. skraber med forbenet på staldgangen og det vil jeg rigtig gerne have den til at holde op med. Tidligere har jeg måske råbt af hesten eller på andre måder givet den opmærksomhed (positiv forstærkning), når den tiggede og dermed forstærket den uhensigtsmæssige adfærd (skæld-ud er også en form for opmærksomhed). Nu hvor jeg ved, at det er opmærksomheden, den er ude efter, kan jeg begrænse tiggeriet ved at tilbageholde den (negativ straf). Med andre ord tilbageholder jeg min opmærksomhed, mens den tigger, for at få den til at lade være med at tigge. Det øjeblik den ikke tigger, sørger jeg for at rose, nusse eller give godbid for at (positivt) forstærke, at den ikke tigger. Den lærer, at for at få opmærksomheden, må den forholde sig i ro.

Der er en lille krølle på den her. Når jeg begynder at ignorere tiggeadfærden (hvor jeg måske før havde råbt af den eller noget andet), vil tiggeadfærden i en periode blive kraftigere, inden den bliver svagere og forhåbentligt forsvinder. Det kaldes udslettelsesudbrud og kan sammenlignes med det vi gør, når batteriet i fjernbetjeningen er løbet tør. Først trykker vi på en knap, som vi plejer, men der sker jo ikke noget, så vi trykker måske en gang til og så et par gange til lidt hårdere, indtil vi til sidst giver op og erkender, at det altså ikke hjælper. Hvor hurtigt man når til den erkendelse, afhænger nok af personen og det samme gælder sandsynligvis også for heste – nogle er måske hurtigere end andre til at opdage, at det der plejer at virke, ikke virker mere.

Hvilken type forstærkning eller straf er bedst at bruge?

Det afhænger helt af hesten, træneren og situationen! Meget uklart svar. Sagen er, at jeg ikke har nogen særlige præferencer. Det der virker godt i en situation, virker måske ikke så godt i en anden. På et tidspunkt arbejdede jeg med en ismule, som blev ved med at gå i lommerne på mig. Jeg brugte godbidder til positiv forstærkning, men måtte på et tidspunkt opgive og gå over til negativ forstærkning, da den ikke kunne koncentrere sig om andet end godbidderne i lommen. Jeg havde desværre ikke så meget tid, derfor valgte jeg at ændre strategi. Hvis jeg havde haft æren af hesten i længere tid eller over flere gange, havde jeg arbejdet med at få den positive forstærkning til at fungere, uden at hesten pressede på for at få godbid. Positiv forstærkning er mere intuitivt for mig end negativ forstærkning, og lige nøjagtig derfor øver jeg mig mere på negativ forstærkning. Med min egen part måtte jeg også ændre strategi på et tidspunkt, da han fik spiserørsforstoppelse og jeg måtte droppe godbidderne i en periode.

Teoriernes ophav

Det er desværre ikke mig, der har fundet på det her. Det var Edvard Thorndike, der undersøgte og beskrev teorien om, at enhver adfærd, der havde behagelige konsekvenser med stor sandsynlighed ville forekomme igen og enhver adfærd med ubehagelige konsekvenser med stor sandsynlighed ville blive begrænset. Den teori bliver omtalt som “Law of Effect”. En anden herre ved navn B. F. Skinner arbejdede videre med Thorndikes teori og han bliver tilskrevet æren for Operant betingning, herunder positiv og negativ forstærkning og straf. Det er nemt at finde noget om disse herre på internettet og i bøger.

Det er komplekse teorier, med en kæmpe mængde forskning, der ligger til grund. Her har jeg kun beskrevet de allermest basale elementer, som man ofte hører omtalt indenfor træningen af dyr.

Eksemplerne tager jeg selv skylden for.

Mine primære kilder er:
Chance, Paul (2014): Learning and Behavior. 7th Edition. International Edition. Wadsworth, Cengage Learning.
Hvidemose, Bettina (2010): Indlæringspsykologi for hest og rytter. Lær din hest at forstå dig!

Oversigt

Jeg har forsøgt at skrue en lille oversigt sammen:

Klik her for at se oversigten som pdf:
OperantBetingningTheBasics

OperantBetingningTheBasics