Stimuluskontrol

5 cases:

  1. Engang faldt jeg over en tråd et eller andet sted, der omhandlede en piges desperate råb om hjælp med hensyn til en hest, der stejlede. Hun havde lært den at stejle fra jorden, men nu gjorde den det altså også under ridning.
  2. Laaaang tid efter var jeg ude at undervise en i træning fra jorden og da jeg spurgte, hvad hun havde lyst til at lave med hesten, sagde hun bl.a. at hun IKKE ville lære den at lægge sig ned, for så var hun bange for, at den ville gøre det i tide og utide. Fornuftig tanke, synes jeg.
  3. I begyndelsen, når jeg skulle rense hove på Sovs tog jeg fat i venstre forben, sådan som man jo gør, når man renser hove. Hans reaktion var at forsøge at komme ned og ligge på benet, for han har nemlig lært at “neje” eller bukke. Lidt upraktisk, at han forsøger at gøre det, hver gang jeg løfter venstre forben.
  4. Jeg så en video engang med en pige, der havde lært sin hest at stå og vippe op og ned med hovedet til musik. Hun og hendes veninder synes selvfølgelig, at det var vildt sjovt. Gad vide om den hest senere får problemer, når den står og væver i boksen, fordi det har den lært at gøre?
  5. Da jeg lærte Surfer at bakke via. ren oprant betingning, begyndte han også at bakke i alle mulige andre situationer i tide og utide. Det kan være, at det er nuttet, når han moon walker rundt på træningsbanen helt uopfordret, men det kan blive et problem, når han gør det på staldgangen.

Find selv eksempler på en hest der gør noget, der er hensigtsmæssigt i en sitation, men helt uhensigmæssigt i en anden. Det er nok ikke svært.

Hestene i alle disse cases gør præcis, hvad vi har lært dem. I virkeligheden er de rigtig gode elever, der viser, at de har forstået, hvad det er, vi gerne vil have og nu vil de gerne vise det så meget som muligt – måske for at opnå forstærkning. De er endda ekstra seje, fordi de har lært at udføre den indlærte adfærd i en helt anden kontekst – dvs. de viser, at de kan gøre noget i stalden, som de ellers havde lært ude i ridehuset.. det kan heste ellers i andre tilfælde have lidt svært ved. Nogle gange har vi brug for, at de skal overføre det, de har lært et sted til et andet og vi er nogle gange nødt til at træne det forskellige steder og andre gange ikke så meget.

Men hvordan undgår vi, at hesten begynder at udføre en adfærd, der er indlært i en situation til den anden eller at den gør det på de forkerte tidspunkter? Det kan vi gøre ved at sætte adfærden under stimuluskontrol.

Hvad er stimuluskontrol?

En stimulus er noget hesten udsættes for af os eller dens omgivelser. Alle stimuli bliver efterfulgt af en respons, som er den reaktion eller adfærd, hesten udviser, når den påvirkes af en stimulus. En sulten hest, der finder noget græs (stimulus), vil begynde at æde (respons). Når jeg trykker hesten på bagparten (stimulus), flytter hesten rumpen (respons). Når jeg tager let i tøjlen (stimulus), stopper hesten (respons). Når hesten ser en farlig dims (stimulus), løber den væk (respons). I en træningssituation forventer vi en bestemt respons på en bestemt stimulus.

Når vi træner med hesten, lærer vi den at knytte bestemte typer adfærd med bestemte stimuli. Dvs. jeg lærer hesten, at når jeg vifter med pegefingrene i luften (stimulus), skal den bakke (respons). Stimulus er i dette tilfælde et indlært signal.

Det vi nogle gange glemmer er at sikre, at adfærden er under stimuluskontrol. Dvs. sikre at den pågældende adfærd kun opstår, når vi viser et bestemt signal og ikke i nogen andre tilfælde. Hvis vi sætter adfærden under stimuluskontrol, undgår vi, at hesten begynder at udføre adfærden i utide. Det skal dog lige nævnes, at det selvfølgelig kun gælder under træning. Hvis hesten skulle få lyst til at bakke, når den er ude på folden, så er den selvfølgelig velkommen til det. Men i træningssituationer er det vigtigt, at den her lært at skelne mellem forskellige signaler og at den udfører de typer adfærd, der passer til.

Det der sker i stimuluskontrol er, at hesten lærer at genkende (diskriminere) bestemte stimuli/signaler. Det kan spare den for en masse frustrationer. Paul Chance skriver i Learning and Behavior, at stimuluskontrol kan give individet en form for kontrol, over det der sker. Hans eksempel er en rotte, der har lært at tykke på en knap, når en lampe lyser (fordi den får mad) og at undlade at trykke på den, når lampen ikke lyser (fordi den ikke får mad). Her kan man tale om, at adfærden er under stimuluskontrol. Det sparer rotten for at trykke på knappen i alle de tilfælde, hvor lampen er slukket. Den skal altså ikke bruge energi på noget, der ikke har nogen gavnlig konsekvens for den.

Fra menneskeverdenen er et hyppigt brugt eksempel trafiklys. Den røde lampe ved vi alle, hvad betyder og vi stopper ved rødt lys (forhåbentligt). Når den gule lampe lyser, løfter vi måske foden over til speederen og når den grønne lyser, træder vi på speederen. Det er et godt eksempel på adfærd, som er under stimuluskontrol og som øger sikkerheden på vejene, fordi vi ikke behøver at spekulere over, hvad lamperne betyder eller hvad vi skal gøre, når de lyser.

Med Chances ord:

When a discrimination has been well established, the behavior is said to be under stimulus control. Generally that means that the behavior is orderly and efficient, that it enables us to obtain desirable consequences and avoid undesirable ones. Stimulus control can work agains us, but we can also use it to our advantage” (Chance 2014, side 329)

Men det at en adfærd er konsekvent, effektiv og under stimuluskontrol, som Chance siger i citatet, kommer ikke af sig selv!

Reglerne for stimuluskontrol

  1. Adfærden opstår aldrig på et andet indlært signal – dvs. at hesten ikke bakker, hvis du giver et “stå” signal.
  2. Hesten skal ikke udføre nogen andre former for adfærd på signalet – dvs. hesten skal ikke lægge sig ned, når du giver bakkesignalet.
  3. Hesten skal udføre adfærden umiddelbart efter signalet er givet – dvs. den skal gøre det med det samme, når den bliver bedt om det og ikke 5 minutter efter.
  4. Hesten skal aldrig udføre adfærden uden at signalet er givet først – den skal altså ikke bakke rundt efter forgodtbefindende, men kun gøre det, når signalet er givet. 

(frit efter Karen Pryor: Don’t Shoot the Dog, side 73)

Først når de 4 punkter gør sig gældende, kan man tale om, at en adfærd er under stimuluskontrol.

Hvordan gør man?

hvis vi holder fast i eksemplet med bakke adfærden. Med Ciara viftede jeg med pegefingrene i luften, når hun skulle bakke. Hvis jeg skulle sikre mig, at det var under stimuluskontrol, kunne jeg gøre følgende:

  • Vise et andet signal af og til og tilbageholde forstærkningen, hvis hun bakker
  • Ikke forstærke, hvis hun bakker uden at signalet er givet først
  • Ikke forstærke andre former for adfærd på signalet
  • Kun forstærke, når hun udfører adfærden umiddelbart efter signalet
  • Tilbageholde signalet i et stykke tid og kun forstærke, hvis hun afventer signalet

På en af mine yndlingsblogs horse tricks 101 viser hun, hvordan hun gør det. Hendes hest har lært at bukke. Hesten bukker derfor hele tiden, men hun vil naturligvis gerne have, at den kun bukker, når den får besked på det. På videoen forstærker hun, når hesten ikke gør noget. En gang i mellem giver hun signalet og hesten får en godbid, hvis den bukker lige efter signalet. Hesten får intet, hvis den bukker, uden at hun har givet signalet først. Hun træner på den måde meget bevidst, at den ikke skal bukke på eget initiativ. Hun har gang i flere ting på en gang. For det første positivt forstærker hun, at hesten står roligt med hovedet væk (den vinder en godbid på det), for det andet negativt straffer hun, når hesten bukker, uden at signalet er givet først (her tilbageholder hun godbidden = negativ straf). Og for det tredie positivt forstærker hun adfærden, når den forekommer på signalet. Jeg synes, at det er en blid måde at gøre det på! Jeg vil helt sikkert integrere hendes måde at gøre det på mere i min træning.

 

Vær opmærksom på: 

Jeg har været inde på det i afsnittet ovenfor: at tilbageholdelse af godbidden er det samme som negativ straf og det kan hesten blive irriteret over. Den bryder sig ikke om, at noget der før resulterede i en godbid, nu pludselig ikke gør det længere. Den bliver straffet for noget, den før blev forstærket for og indtil den har fundet ud af, at det har noget med signalet at gøre, er det naturligvis meget frustrerende. Det hjælper dog, når hesten har erfaring med denne måde at træne på. Ciara blev f.eks. utrolig mobset til at begynde med, når jeg tilbageholdt godbidderne. Nu har hun lært, hvordan træningen foregår og hun bliver derfor ikke sur på samme måde mere, når jeg ændrer på tingene. Læg også mærke til, at hesten i videoen ikke virker synderligt irriteret over, at den ikke får en godbid, når den bukker på eget initiativ. Det kan måske have noget at gøre med, at den også er vant til at træne på den måde og måske, at der ikke går for lang tid mellem godbidderne, fordi hun også forstærker det, at hesten står stille.

Jeg synes, at det er vigtigt at sørge for, at hesten hele tiden har mulighed for succes. Hvis jeg tøver lidt med at give signalet, så tøver jeg til at begynde med ikke for længe men udvider gradvist tiden lidt efter lidt. Når jeg begynder at vise andre signaler, skal jeg tænke over, hvor meget de ligner det oprindelige. Det er ikke fair overfor hesten, hvis de ligner for meget til at begynde med. Det skal være nemt for den at se, at det ikke er det samme signal. Så kan man altid øge sværhedsgraden med tiden. Hvis jeg kan mærke, at jeg i et stykke tid har presset for meget på, uden at hesten har haft succes, kan jeg godt finde på at kaste en øvelse ind midt i det hele, som jeg ved hesten har styr på, så den lynhurtigt kan få et par succesoplevelser, inden vi fortsætter.

heste er meget lærenemme dyr og de forstår ret hurtigt, hvad vi er ude efter. Nogle gange glemmer vi bare at føre lærdommen til dørs og det ender jo desværre ofte med at hesten får skæld ud, bliver kaldt fræk eller uartig. Det er ikke fair, vel?

Kilder

Chance, Paul (2014): Learning and Behavior. International Edition, 7th edition, Wadsworth Cengage Learning.

Pryor, Karen (2009): Don’t Shoot the Dog! The New Art of Teaching and Training. Revised Edition, Ringpress Books Ltd.

Reklamer

Nørdehjørnet: Hvad virker bedst ved trailerlæsning – pisk eller gulerod?

Nørdehjørnet handler om videnskab og forskning. Ikke at jeg selv bedriver nogen form for forskning i forbindelse med heste, men har tidligere gjort det i forbindelse med andre fagområder. Derfor er jeg særligt interesseret i forskningsartikler og jeg har fået fingrene i en del af slagsen, der handler om hestetræning.

Her i huset er kattene meget kloge :-)
Katten gør mig her opmærksom på, de interessante konklusioner i artiklen 😉

Det interessante ved at læse forskningsartikler er ikke kun resultaterne. Det er mindst lige så interessant, hvordan forskerne er nået frem til resultaterne – deres metode. Man kan få en masse inspiration til hestetræning ved at læse, hvordan de har bygget deres forsøg op. Derudover beskriver forskerne som regel anden relevant forskning samt perspektiverer og diskuterer deres resultater til sidst. Det er sådan en typisk forskningsartikel er bygget op.

En af artiklerne sammenligner anvendelsen af positiv forstærkning (guleroden) og negativ forstærkning (pisken – altså bare til at tappe med!) i forbindelse med trailerlæsning af heste. Mere om den længere nede og referencen til artiklen findes i bunden af indlægget.

Trailerlæsning er et stort problem for mange, hvilket egentligt er lidt sært, eftersom heste jo beviseligt sagtens kan gå ind i en trailer, når bare de har lært det først. Desværre er læsningsmetoderne ofte besværlige og deciderede farlige for både hesten og mennesket. Jeg har selv været med til en, der var alt andet end rolig og hensigtsmæssig. Det var et mirakel, at hverken hesten eller nogle personer kom til skade og jeg kan helt ærligt sige, at havde det været min hest, så havde jeg aflyst det, den skulle (noget undervisning) og brugt et par dage på at træne trailerlæsning stille og roligt, inden jeg tog nogle steder igen.

Det var ikke alene synd for hesten, det var også uansvarligt overfor såvel menneskene som dyret. Jeg tror egentlig ikke, at de personer, der besluttede, at det skulle foregå på den måde var onde. Det beroede primært på en misforståelse og manglende viden om hestens natur. Den blev opfattet som fræk og stædig og derfor blev det et spørgsmål om, at den skulle lære, at den ikke kunne løbe om hjørner med nogen. Fra mit perspektiv var hesten hverken fræk eller stædig. Den havde brug for vejledning og hjælp til at komme op i traileren, da den var usikker. Den havde brug for, at det foregik i et tempo, hvor den kunne følge med og hvor den følte sig tryg. I stedet blev det en kamp, hvor hestens usikkerhed blev større efterhånden som presset på den blev større. Den endte med at komme op i traileren, men det var nok fordi, den blev træt og til sidst gav op. På det tidspunkt var den også viklet ind i alle mulige reb og 4 mennesker, der trak og masede fra alle sider. Jeg tror, at forløbet kunne have været meget anderledes, hvis man havde tænkt, at hesten skulle hjælpes fremfor at tvinges.

Jeg beskrev positiv og negativ forstærkning her og vil derfor ikke komme så meget i deltaljer med det. Blot ganske kort nævne, at i negativ forstærkning anvendes ikke godbidder, men forskellige former for pres – f.eks. at trække i grimen. Tricket er at stoppe presset, når hesten gør noget rigtigt. Dermed lærer den, at når den gør det, så forsvinder presset og den vil være mere opsat på at gøre det igen. Ved positiv forstærkning giver man hesten noget, den godt kan lide – f.eks. en godbid – når den gør noget rigtigt. Godbidden bruges altså ikke til at lokke med, men til at vise hesten, at det den gjorde lige nu var helt rigtigt. Den lærer på den måde, at hvis den gør noget bestemt, så får den en gave :-). Begge metoder øger sandsynligheden for, at den vil udføre den pågældende adfærd igen – altså forstærkning af adfærden. Positiv og negativ forstærkning er indlæringspsykologiske begreber indenfor den teori, der hedder operant betingning.

Og hold nu fast. Nu bliver det lidt nørdet men forhåbentligt også lærerigt.

Undersøgelsen sammenlignede positiv og negativ forstærkning ved trailerlæsning. 12 heste var med i undersøgelsen. Hestene var forskellige i både race, alder og køn og de var alle heste, der ikke ville læsses af deres ejere. Hestene udviste alle et højt angstniveau ved trailerlæsning – det var betingelsen for, at de kunne være med i forsøget. 6 af hestene blev trænet med positiv forstærkning og 6 med negativ forstærkning.

Inden selve trailerlæsningen, lærte hestene at gå over et stykke plastik vha. den metode, de skulle udsættes for i trailerlæsningen. De lærte alså metoden at kende først.

Metoden i den positive forstærkning var target træning. Target var en stav med en bold i enden, som hesten blev trænet i at røre og følge. De anvendte en klikker, som sekundær forstærker og den primære forstærker var æble- og gulerodsbidder. Når hesten rørte ved target, fik den et klik og en godbid. I den negative forstærkning var redskaberne en pisk. I plastikøvelsen lærte hestene at reagere på pres fra rebet og hvis de ikke reagerede blev presset intensiveret ved at tappe hesten på skulderen med pisken. Når hesten reagerede, fjernede man øjeblikkeligt presset. I begge træningsmetoder var hestene iført en grime + et 150 cm reb.

Det var den samme træner hele vejen igennem og der blev anvendt følgende shapingprocedure i 7 faser:

  1. en forhov på rampen
  2. to forhove på rampen
  3. et skridt med en forhov på rampen
  4. en baghov på rampen
  5. to baghove på rampen
  6. et skridt med en baghov på rampen
  7. hele hesten inde i traileren

Når en hest var i stand til at udføre en fase 5 gange på signal fra træneren, gik træneren videre til næste fase. Målet var nået, når hesten kunne gå helt ind i traileren 5 gange på signal fra træneren og blive derinde i 10 sekunder.

Hestene blev trænet 3 gange om ugen med mindst en fridag imellem hver træningssession. En træningssession varede maksimalt 18 minutter. Træningen fandt altid sted umiddelbart inden fodringstid. En træningsession stoppede, når hesten blev uopmærksom men altid efter, at hesten havde reageret korrekt på et signal. Der var sat 15 sessioner af til hver hest – inklusive de indledende gå-over-plastik øvelser, som tog 2-4 sessioner.

En hest blev taget ud af forsøget pga. sygdom. Der indgik således 6 heste i negativ forstærkning og 5 i positiv forstærkning. En hest kom ikke helt op i traileren i løbet af de 15 træningssessioner.

Mål

Det overordnede målepunkter var hjertefrekvens, ubehag/stress, undvigelse, tid og antal sessioner.

  • Hjertefrekvens: hestens hjertefrekvens blev målt med faste intervaller
  • Ubehag blev vurderet ud fra følgende tydelige fysiske udtryk:
    • Udvidelse af øjenene: det hvide i øjnene bliver synligt
    • Udvidelse af næsebor: vejrtræning bliver tydelig både visuelt og auditivt
    • Halepisken: halen svinges kraftig nogle gange
  • Undvigelse: hver gang hesten ikke udviste korrekt adfærd på signalet
  • Tid (pr session)
  • Antal træningssessioner (dog maksimalt 15)

Konklusioner

Hestene trænet med positiv forstærkning, lærte hurtigere (gennemsnitligt pr session) at gå op i en trailer og gjorde det med færre tegn på ubehag og færre undvigeforsøg end dem, der lærte det vha. negativ forstærkning. Forskellene var signifikante.

Med hensyn til hjertefrekvens og antallet af træningsessioner fandt de ingen forskel på de to træningsmetoder.

Iflg. denne undersøgelse er positiv forstærkning ikke alene mere effektiv, men også mindre stressende/ubehagelig end negativ forstærkning. Med andre ord virker guleroden bedre end pisken i dette tilfælde. Der er altså noget, der kunne tyde på, at træning med positiv forstærkning er hensigtsmæssig i tilfælde, hvor angst spiller en rolle.

Diskussion

Det jeg tager med fra denne artikel er:

  • At man ikke behøver at slås med hesten for at få den op i en trailer.
  • At brugen af godbidder og positiv forstærkning er mere effektiv og skånsom for hesten, hvis de anvendes korrekt (dvs. ikke til at lokke med men til at forstærke korrekt adfærd).
  • At hesten kan lære at gå op i en trailer gradvist over flere dage, hvor man hver gang når lidt længere i processen.
  • At man skal tage sig god tid til at lære en hest noget – især hvis det er noget, den er usikker på eller bange for.
  • At man kan splitte hele processen op i meget små skridt, der i sidste ende fører op i traileren. Faktisk var jeg lidt overrasket over, at shapingproceduren ikke havde flere skridt i undersøgelsen. Jeg ville nok have delt den op i endnu mindre skridt.
  • At viden om hestens natur og indlæringspsykologi kan give mange redskaber og muligheder i hestetræning.

Reference

Hendriksen, Payana; Elmgreen, Katrine & Ladewig, Jan (2011): Trailer-loading of horses: Is there a difference between positive and negative reinforcement concerning effectiveness ans stress-related signs? Journal of Veterinary Behavior – Clinical Applications and Research, Vol. 6, No. 5, September/October, pp. 261-266.

Nørdehjørnet: Hvad er bedst – positiv eller negativ forstærkning?

Jeg har endelig fået adgang til en database, hvor jeg kan finde spændende forskning. Efter 3 dage intens søgning, har jeg fundet en del forskningsartikler, som på den ene eller den anden måde berører emner, som jeg går og spekulerer over dagligt.

F.eks.:

  • Er der mon en forskel på om man bruger positiv eller negativ forstærkning? Kan man sige, at den ene form for træning generelt er bedre end den anden? Eller er der nogle situationer, hvor den ene form for træning er bedre end den anden?

Dette emne optager mig, fordi jeg oplever forskelle, når jeg træner, men også fordi jeg ofte hører forskellige holdninger til, hvad der er godt eller skidt. Disse holdninger er dog ofte kun holdninger. De bliver ikke bakket op af viden og derfor synes jeg, at det er svært at forholde sig til. F.eks. er der nogle former for Horsemanship, som ikke kunne drømme om at anvende positiv forstærkning. De holder sig udelukkende til den negative. Jeg har aldrig rigtig fundet ud af hvorfor.

Det er også ofte, at jeg hører nogle give udtryk for, at det at bruge godbidder i træningen er noget skidt, da hesten bare begynder at tigge. Også det undrer mig, for det er slet ikke min oplevelse. Det er rigtigt, at når hesten opdager, at jeg har godbidder, så vil den til at begynde med være påtrængende for at få fat i dem, men hvis jeg er konsistent og KUN giver godbidder under træning, så holder den op med at kanøfle mig. Den skal lige finde ud af, at den ikke får godbidderne gratis, men at den skal gøre noget for dem.

Der er argumenter som: “hvis man bruger godbidder, så er hestens interesse i dig ikke reel. Den gider kun være sammen med dig, fordi du har godbidder.” Det er muligt, at det er rigtigt, men jeg forstår ikke, hvorfor dens interesse i mig skulle være mere reel, hvis jeg ikke bruger godbidder? Den kommer vel ikke til at gide mig mere af, at jeg ikke bruger godbidder?

Og så er der det med opmærksomheden under træning. Jeg har oplevet, at der sker noget med den, når godbidderne indføres i træningen. Både Surfer og Ciara har været mere opmærksomme og motiveret, når jeg bruger godbidder. Og samtidig mindre irriteret. Det synes jeg, må være positive elementer i alle former for indlæring.

Men går det mon langsommere eller hurtigere for hesten at lære noget, afhængig af om du bruger positiv eller negativ forstærkning? Det kan jo godt være, at hesten er mindre stresset og mere fornøjet med positiv forstærkning, men måske går det langsommere at komme fra A til B?

Sidst har jeg tænkt over den rolle stress kan spille. For meget stress er hæmmende for indlæring, men en let form for stress kan måske have den modsatte effekt – altså virke fremmende på indlæringen – fordi stresshormoner skærper sanserne og gør kroppen klar til at præstere? Stress involverer adrenalin, men godbidder udløser dopamin, som modvirker adrenalin. Så måske er positiv forstærkning hensigtsmæssig ved let stress? Jeg ved det ikke.

Men det er noget jeg vil undersøge. Jeg vil forsøge at beskrive, hvad de forskellige forskningsresultater peger på i kommende indlæg.

Negativ og positiv forstærkning.. hvad er det nu lige det er?

Når jeg fortæller, hvad det er for en uddannelse, jeg er ved at tage, så får jeg 99% af gangene følgende spørgsmål: “skal du være sådan en hestehvisker?”. Med hestehvisker menes der ofte en person, som har et usynligt og næsten magisk bånd til hesten og som kan hviske til den – sådan lidt tankeoverførings-agtigt. Hvis det er sådan hestehvisker skal forståes, er svaret klart “NEJ, jeg er ikke ved at uddanne mig til hestehvisker”. Men hvis man forstår en hestehvisker, som en person, der bringer indlæringspsykologien i spil, uden selv at være klar over det og som har eminent timing og opmærksomhed og som har en umiddelbar forståelse for hesten, så kan der godt være noget om det – bortset altså lige fra, at jeg forsøger at være meget opmærksom på det! Det hestehviskerne gør er, efter min mening, nemlig overhovedet ikke mystisk eller magisk, men kan forklares indenfor de indlæringsteoretiske og adfærdsbiologiske rammer.

Jeg synes, at viden om indlæringspsykologien har stor betydning for, hvad man kan gøre med sin hest og hvordan man gør det. Viden om indlæring kombineret med viden om hestens natur og adfærd kan forklare en masse af de problemer, mange hesteejere oplever til hverdag og give ideer til, hvordan problemerne kan håndteres. Men det handler ikke kun om problemer. Det handler om, hvordan hesten lærer i det hele taget – i ridningen, i longen, på staldgangen og i alle andre situationer. Det her oplæg handler om en af de mest prominente indlæringspsykologiske teorier, som bliver brugt indenfor mange typer træning af dyr. Den er ikke den eneste, men en af de vigtigste.

Negativ og positiv forstærkning er to varianter af en type indlæring, der hedder operant betingning. Der er to mere: negativ og positiv straf. NB: Her skal straf ikke forståes som afstrafning eller vold, men det kommer jeg tilbage til.

Lad os lige først få beskrevet hvad operant betingning er.

Operant betingning

Operant betingning er en form for indlæring, hvor indlæringen foregår som en konsekvens af en adfærd. Vi lærer altså af konsekvenserne af det vi gør. Sagt på en anden måde: du gør noget (adfærd) og det du gør har en konsekvens. Konsekvensen påvirker, hvorvidt du er mere eller mindre tilbøjelig til at gøre det samme igen. Hvis du synes konsekvensen var behagelig, vil du sandsynligvis gøre det igen, hvis konsekvensen var ubehagelig, vil du nok ikke forsøge det igen lige med det samme.

OperantBetingningEksempel: Du siger noget sødt til en person (adfærd) og personen bliver glad og smiler til dig (konsekvens). Hvis det, at personen smiler, får dig til at føle noget godt, så er sandsynligheden for, at du siger noget sødt en anden gang større. Hvis personen ikke smiler, men ser sur ud som en konsekvens af dine søde ord, er sandsynligheden for, at du vil sige noget sødt en anden gang mindre. På den måde har konsekvenserne af alt, hvad du gør indflydelse på, hvad du gør senere.

Det samme gælder for heste. Alt hvad du gør virker tilbage på det hesten gør. Og alle dine reaktioner, på det hesten foretager sig, påvirker dens fremtidige handlinger.

Det her gælder altid – også når du ikke træner og ikke er bevidst om det.

Positiv & negativ forstærkning / positiv & negativ straf.

Vi har 4 processer i operant betingning, to af dem – positiv og negativ forstærkning – er processer, der begge øger sandsynligheden for at en given adfærd forekommer igen. Positiv og negativ straf er begge processer, der sænker sandsynligheden for at en adfærd forekommer igen.

Positiv og negativ er et udtryk for om noget er til stede eller ej. Det har ikke noget at gøre med om noget er godt eller skidt. F.eks. enten giver du en godbid eller også tilbageholder du den. Enten er godbidden til stede eller også er den ikke. Positiv og negativ svarer til plus og minus, ikke til godt og skidt.

Her kommer et par eksempler:

postiv forstærkning det at vi tilfører noget for at øge hyppigheden eller styrken af en adfærd Her tilfører vi noget behageligt. Vi giver f.eks. en godbid, når hesten gør noget ønsket. Eller klør den på yndlingskløstedet el. lign. Dermed er sandsynligheden større for, at den kommer til at gøre det igen
negativ forstærkning det at vi fjerner eller tilbageholder noget for at øge hyppigheden eller styrken af en adfærd Her fjerner vi noget, som hesten synes er ubehageligt – f.eks. pres. Når vi fjerner presset øger det sandsynligheden for, at hesten vil gøre det igen, som fik ubehaget til at forsvinde.
positiv straf det at vi tilfører noget for at begrænse eller sænke hyppigheden eller styrken af en adfærd Det der bliver tilført her er noget som hesten opfatter som ubehageligt. Heste vil gøre meget for at undgå fysisk pres, derfor kan man tilføre et pres, når hesten gør noget uønsket. Bare lige huske, at man ikke behøver at slå eller nive. For hesten kan en berøring være nok.
negativ straf det at vi fjerner eller tilbageholder noget for at sænke hyppigheden eller styrken af en adfærd Hvor vi i negativ forstærkning fjernede noget ubehageligt, så fjerner vi her noget, som hesten finder behageligt eller noget den gerne vil have. Det er altså en negativ straf at tilbageholde mad eller godbidder f.eks.

Forstærkere og straffere

  • Det vi tilfører i positiv forstærkning, kaldes en forstærker og er altså noget, som hesten vil arbejde for at opnå.
  • Det vil tilfører i positiv straf kaldes en straffer og er noget som hesten vil arbejde for at undgå.

Hvad der virker som forstærker og straffer afhænger af den enkelte hest. Det er ikke sikkert, at det helt de samme ting, der vil virke forstærkende eller straffende for alle heste.

Heste er nok ikke de mest kræsne dyr og vil gøre meget for at opnå en godbid, men det er alligevel værd at tænke lidt over, hvad den pågældende hest allerbedst kan lide. Jeg har endnu ikke hørt om en hest, der ikke vil arbejde for godbidder, men der kan godt være nogle typer godbidder, som virker mere motiverende end andre. Jeg hørte et eksempel fra hundeverdenen på et af kurserne. En mand kunne ikke finde noget mad, som hunden ville arbejde for. Han kunne altså ikke finde en velegnet forstærker til træningen. Det viste sig, at makrel i tomat virkede! Prøv lige at have det med i lommen til træning ;-).

Men hvad med det der straf? Når jeg skriver “pres” alle mulige steder, så mener jeg berøring, ikke slag. I mange tilfælde er let eller moderat berøring nok til at få en reaktion fra hesten. Da jeg trænede bakke på signal, behøvede jeg ikke engang at røre. Bare det at stå foran hesten og læne mig frem, var nok til at få ham til at bevæge sig lidt bagud.

Der er ingen tvivl om, at slag og andre former for vold også ville virke. Jeg går ikke ind for det overhovedet. Dels fordi jeg synes, at det i alle tilfælde er helt unødvendigt og uetisk, men også fordi, at i det øjeblik, man begynder at anvende vold, bliver der blandet stresshormoner ind i situationen. Dvs. at hesten bliver angst. Hvis du er uheldig, kan du få skabt en stressrelateret reaktion på det, som hesten havde sin opmærksomhed rettet mod, da straffen faldt. Stress virker desuden hæmmende på indlæring.

Case 1 – Hovedsky hest

Negativ forstærkning / positiv straf

Lad os antage, at jeg har en hest, der er hovedsky. Jeg kan ikke komme til at røre den på hovedet, uden, at den flytter hovedet væk. Det kan give problemer, når jeg skal strigle eller lægge trense på.

Der kan være mange forklaringer på, at den er blevet hovedsky. En kunne være, at den har lært, at  berøringen forsvinder, når den bevæger hovedet. Den er på den måde, blevet negativt forstærket i at flytte hovedet. Hvis jeg gerne ville lære den at acceptere berøring og stå stille med hovedet, når jeg rør ved den, kan jeg prøve negativ forstærkning. Altså den samme proces som skabte problemet i første omgang. Det jeg skal gøre er, at røre hestens hoved og når den forsøger at flytte hovedet, bliver jeg ved med at røre (positiv straf). Berøringen behøver ikke at være særlig kraftig. Det er ofte nok med en meget let berøring. Jeg slipper ikke, før den holder hovedet roligt – altså igen negativ forstærkning, men denne gang på at være rolig med hovedet. I begyndelsen vil den forsøge at slippe for berøringen og måske blive mere urolig med hovedet, men hvis jeg er stædig nok og følger med bevægelserne, vil der komme et tidspunkt, hvor den vil være rolig i et øjeblik. I det ganske korte øjeblik skal jeg være hurtig og fjerne hånden. Så lægger jeg hånden på igen og det hele vil gentage sig. Jeg holder ved, sålænge hesten er urolig med hovedet og slipper i det sekund hovedet er roligt. Efter nogle gentagelser vil hesten have lært, at den ikke kan få hånden til at forsvinde ved at kaste sit hoved alle mulige steder hen. Hånden forsvinder kun når den er rolig. Timingen er selvfølgelig vigtig, for at det skal virke. Hvis jeg flytter hånden for tidligt, dvs. mens den stadig er urolig, får jeg forstærket den urolige adfærd.

Positiv forstærkning / negativ forstærkning / positiv straf

Jeg kunne også vælge en anden strategi – positiv forstærkning. Hvor jeg før tilførte noget ubehageligt (berøringen/positiv straf), mens den var urolig og fjernede det ubehagelige, når den blev rolig (negativ forstærkning), kan jeg med positiv forstærkning tilføre noget behagelig, når den er rolig. Jeg kan f.eks. røre hovedet og når den bliver rolig, giver jeg den en godbid – positiv forstærkning. Jeg kan eventuelt kombinere det, så jeg både fjerner berøringen og giver en godbid, når hesten er rolig.

Case 2 – Hesten tigger

Negativ straf / positiv forstærkning

I dette tilfælde tigger hesten. Det gør den ofte, fordi vi har forstærket tiggeadfærden uden at tænke over det. Tiggeadfærden kan være rettet mod f.eks. at den gerne vil have en mad eller godbid, men det kan også være, at den er ude efter opmærksomhed. Lad os antage, at det er opmærksomhed den er ude efter. Dvs. at den f.eks. skraber med forbenet på staldgangen og det vil jeg rigtig gerne have den til at holde op med. Tidligere har jeg måske råbt af hesten eller på andre måder givet den opmærksomhed (positiv forstærkning), når den tiggede og dermed forstærket den uhensigtsmæssige adfærd (skæld-ud er også en form for opmærksomhed). Nu hvor jeg ved, at det er opmærksomheden, den er ude efter, kan jeg begrænse tiggeriet ved at tilbageholde den (negativ straf). Med andre ord tilbageholder jeg min opmærksomhed, mens den tigger, for at få den til at lade være med at tigge. Det øjeblik den ikke tigger, sørger jeg for at rose, nusse eller give godbid for at (positivt) forstærke, at den ikke tigger. Den lærer, at for at få opmærksomheden, må den forholde sig i ro.

Der er en lille krølle på den her. Når jeg begynder at ignorere tiggeadfærden (hvor jeg måske før havde råbt af den eller noget andet), vil tiggeadfærden i en periode blive kraftigere, inden den bliver svagere og forhåbentligt forsvinder. Det kaldes udslettelsesudbrud og kan sammenlignes med det vi gør, når batteriet i fjernbetjeningen er løbet tør. Først trykker vi på en knap, som vi plejer, men der sker jo ikke noget, så vi trykker måske en gang til og så et par gange til lidt hårdere, indtil vi til sidst giver op og erkender, at det altså ikke hjælper. Hvor hurtigt man når til den erkendelse, afhænger nok af personen og det samme gælder sandsynligvis også for heste – nogle er måske hurtigere end andre til at opdage, at det der plejer at virke, ikke virker mere.

Hvilken type forstærkning eller straf er bedst at bruge?

Det afhænger helt af hesten, træneren og situationen! Meget uklart svar. Sagen er, at jeg ikke har nogen særlige præferencer. Det der virker godt i en situation, virker måske ikke så godt i en anden. På et tidspunkt arbejdede jeg med en ismule, som blev ved med at gå i lommerne på mig. Jeg brugte godbidder til positiv forstærkning, men måtte på et tidspunkt opgive og gå over til negativ forstærkning, da den ikke kunne koncentrere sig om andet end godbidderne i lommen. Jeg havde desværre ikke så meget tid, derfor valgte jeg at ændre strategi. Hvis jeg havde haft æren af hesten i længere tid eller over flere gange, havde jeg arbejdet med at få den positive forstærkning til at fungere, uden at hesten pressede på for at få godbid. Positiv forstærkning er mere intuitivt for mig end negativ forstærkning, og lige nøjagtig derfor øver jeg mig mere på negativ forstærkning. Med min egen part måtte jeg også ændre strategi på et tidspunkt, da han fik spiserørsforstoppelse og jeg måtte droppe godbidderne i en periode.

Teoriernes ophav

Det er desværre ikke mig, der har fundet på det her. Det var Edvard Thorndike, der undersøgte og beskrev teorien om, at enhver adfærd, der havde behagelige konsekvenser med stor sandsynlighed ville forekomme igen og enhver adfærd med ubehagelige konsekvenser med stor sandsynlighed ville blive begrænset. Den teori bliver omtalt som “Law of Effect”. En anden herre ved navn B. F. Skinner arbejdede videre med Thorndikes teori og han bliver tilskrevet æren for Operant betingning, herunder positiv og negativ forstærkning og straf. Det er nemt at finde noget om disse herre på internettet og i bøger.

Det er komplekse teorier, med en kæmpe mængde forskning, der ligger til grund. Her har jeg kun beskrevet de allermest basale elementer, som man ofte hører omtalt indenfor træningen af dyr.

Eksemplerne tager jeg selv skylden for.

Mine primære kilder er:
Chance, Paul (2014): Learning and Behavior. 7th Edition. International Edition. Wadsworth, Cengage Learning.
Hvidemose, Bettina (2010): Indlæringspsykologi for hest og rytter. Lær din hest at forstå dig!

Oversigt

Jeg har forsøgt at skrue en lille oversigt sammen:

Klik her for at se oversigten som pdf:
OperantBetingningTheBasics

OperantBetingningTheBasics

Teori møder praksis – for begyndere :-)

IndlæringIpraksis1En ting er, hvad der står på papiret, en helt anden ting er, når det der står på papiret møder praksis. Heste er ikke ens og det er mennesker heller ikke og det der giver mening i teorien kan vise sig at kræve lidt tilpasning i praksis. Teorien og planlægningen er afgørende at have på plads inden en træningssession, for at have et klart mål med træningen og en plan for, hvordan målet nås – men samtidig er det vigtigt, at planen kan tilpasses konteksten. Dette gælder naturligvis i de fleste af livets forhold og især når man har med levende væsener at gøre.

Det fik jeg konkrete erfaringer med i sidste weekend på 4. kursusgang i Hesteadfærd og indlæringspsykologi, hvor vi havde mulighed for at øve os på noget af alt det, vi havde lært på de teoretiske kursusgange.

Jeg endte med at have fingrene i 4 islændere og 1 oldenborger i løbet af weekenden. Der var en del heste og vi skulle skifte mellem at være træner og supervisor. Træneren skulle arbejde med hesten og supervisoren skulle observere og komme med input til træneren. Det var lærerigt at arbejde med heste, jeg ikke kendte i forvejen og se hvordan de andre studerende greb opgaverne an.

Vi arbejdede f.eks. med grounding (stå øvelser), omgængelighed (berøring over hele kroppen), tryk (vige forpart og bagpart), stå-bak-kom og diverse habitueringsøvelser med redskaber som bomme, vipper, podier osv.

Jeg lærte bl.a. noget om:

  • at lære en hest at kende
  • at observere og give feedback til andre trænere
  • at formidle mine hensigter og planer overfor andre
  • at ændre planer efterhånden som træningen skrider frem
  • at tilpasse redskaber og teknikker til den enkelte hest og træningssituation
  • timing
  • pauser og variation
  • tålmodighed og at ‘tro på det’
  • analyse af træning – før og efter sessionen

Jeg vil ikke skrive om det hele, men trække et par hovedpunkter frem..

At lære en ny hest at kende

Den første udfordring var at finde ud af, hvad det var for en hest, der stod overfor mig, hvad den kunne i forvejen og hvordan den lærte bedst. Det aktiverede mit sanseapparat og krævede al min viden om adfærd. Det var ikke særlig hensigtsmæssigt, at jeg ikke på forhånd havde gennemtænkt og lagt en plan for, hvad jeg præcist ville lære hesten og hvordan. Det er en udfordring at stå overfor en ny hest og ikke vide præcist hvad det er, man ønsker, den skal gøre. Det skabte en del forvirring for mig og dermed også for hesten.

Det stod lynhurtigt klart for mig, at jeg ikke kunne bruge de samme redskaber på helt den samme måde, som jeg er vant til med Surfer. Jeg måtte lede efter alternativer i værktøjskassen.

Tilpasse redskaber og teknikker til den enkelte hest og kontekst

En af islænderne stod ikke stille overhovedet. Hun myldrede rundt og jeg havde planlagt at arbejde med omgængelighed. Det kunne ikke lade sig gøre, uden at hun stod stille først og den første øvelse blev derfor stå-øvelsen.

Næste udfordring var, at jeg ikke kunne bruge klikker og godbidder. Islænderen var så fokuseret på godbidderne, at den ikke kunne fokusere på noget andet. Klikker og godbidder, kom i vejen for indlæringen. Tiden var ikke til at se, om jeg kunne få klikker og godbidder til at fungere, så jeg måtte finde en anden metode. Den metode endte med at blive ‘pres’, dvs. jeg lagde et mildt pres på hende, mens hun bevægede sig og fjernede straks presset, når hun stod stille. Vi endte med at bevæge os rundt i alle mulige retninger i hallen. Jeg klæbede til hende hele tiden uden at slippe presset, mens hun bevægede sig. Lige så snart hun stod stille fjernede jeg hænderne helt og genoptog presset, når hun bevægede sig igen.

Med oldenborgeren vendte jeg tilbage til primære og sekundære forstærkere (også kaldet henholdvis ubetinget og betinget forstærker). Ny hest, nye betingelser 🙂 . I stedet for en klikker, havde denne hest lært at forstå ordet “tak” som den sekundære forstærker og hun fik gulerødder som primær forstærker. Hun var desuden vant til denne type træning. Jeg prøvede alt muligt med hende: vi gik på madrasser, presenning, podie, og vippe. Vi arbejdede en del på vippen, som hun vist nok dagen forinden var blevet lidt nervøs over. I starten skulle hun bare snuse til den for at få “tak” og godbid, derpå øgede jeg kravene gradvist, så hun skulle røre den med en hov, sætte en hov på den, så to hove, tre hove osv. Hun var en fornøjelse at arbejde med pga. hendes temperament og opmærksomhed. Vi nåede igennem en masse øvelser.

Lidt sammenhæng med teorien

Fra adfærdsteorien har jeg lært, at heste søger at være frie og uden pres til hver en tid og det kan man bruge aktivt i træningen. Ved at påføre pres, f.eks. med hænderne, gør jeg noget, som den vil prøve at undgå. I starten vil den blive ved med at bevæge sig, for at komme væk fra presset, men den vil lære hen ad vejen, at presset kun forsvinder, når den står stille. På den måde kan man arbejde med påførelse af pres for at IndlæringIpraksis2begrænse en adfærd (i dette tilfælde bevægelse) og fjernelse af pres for at øge en adfærd (i dette tilfælde at stå stille). På indlæringspsykologisk hedder det henholdsvis: positiv straf og negativ forstærkning. Positiv straf i indlæringspsykologisk sammenhæng har ikke noget at gøre med at slå eller være ond ved dyret. Det er blot et udtryk for, at man tilfører noget ‘ubehageligt’ (en såkaldt aversiv) for at mindske hyppigheden af en adfærd. Det er f.eks. det samme vi gør, når vi tager i tøjlerne for at få hesten til at dreje eller lægger et pres med schenklerne. Postiv straf hænger sammen med negativ forstærkning. Positiv straf: vi lægger et pres i tøjlen for at begrænse eller stoppe en adfærd (f.eks. at hesten går lige ud, når vi gerne vil dreje). Negativ forstærkning: vi fjerner presset igen, når hesten gør, hvad vi ønsker (den drejer). Når vi fjerner presset (aversiven), fortæller vi hesten “ja, det er præcis det, jeg gerne vil have, at du gør lige nu”.

Timing

Timingen er afgørende! Islænderen er et godt eksempel. Hvis jeg fjerner presset for tidligt, lærer hesten, at hvis den bare bevæger sig nok, så slipper den for presset og jeg vil ende med at have forstærket bevægelsen væk fra presset i stedet for at stå stille. Det samme gælder, hvis jeg fjerner presset for sent – altså fastholder presset, når den står stille – så lærer den nemlig, at det ikke kan betale sig at stå stille. Det kræver lidt tålmodighed, men det lykkedes mig at nå frem til, at islænderen gik fra mest at bevæge sig til mest at stå stille, inden jeg måtte stoppe pga. tid. På det tidspunkt havde jeg armene over hovedet af stolthed over, at jeg var nået dertil – man skal fejre sine succeer, hvor små de end måtte være. :-). Jeg nåede også kort at øve stop signal, men det fungerede overhovedet ikke, da jeg måtte stoppe.

Timing er nok en af de vigtigste ting, jeg er blevet opmærksom på gennem kurset. Der så meget at sige om det, både mht. træning fra jorden og ridning. Surfer er f.eks. lidt døv overfor mine signaler med schenklerne på den ene volte og jeg er klar over nu, at det er min timing den har været og stadig er gal med. Jeg har, helt uden at ville det, lært ham, at lige meget hvad han gør, så kan han ikke slippe for presset og derfor har han på en måde givet op og er holdt op med at lytte til mig. Den erkendelse giver mig mulighed for at arbejde målrettet med det, så han igen kan se en mening med at lytte til mig. Jeg skal blive bedre til at slippe presset i det øjeblik, han gør, hvad jeg beder ham om.

Pauser og variation i træningen

En anden vigtig erfaring var pauser – både for mig og for hesten. Det er vigtigt at holde øje med, hvornår hesten er træt og har brug for en pause eller hvornår man skal stoppe helt. En pause kan f.eks. være at stoppe øvelsen og gå lidt rundt, uden noget særligt formål. Hensigten er, at få hesten til at koble fra et øjeblik. Heste er forskellige mht. hvor meget og i hvor lang tid de kan koncentrere sig og hvor hurtigt de bliver trætte. F.eks. var den ene islænder meget flyvsk. Det var svært at holde dens opmærksomhed fanget. Oldenborgeren var derimod helt på, opmærksom og vågen i op mod en hel halv time med ganske få pauser. Jeg blev nok træt og ukoncentreret før den!

Det kan være en god ide at skifte mellem forskellige øvelser i løbet af en træningssession. Variation i øvelser kan skabe lidt ny energi for både træner og hest.