Negativ og positiv forstærkning.. hvad er det nu lige det er?

Når jeg fortæller, hvad det er for en uddannelse, jeg er ved at tage, så får jeg 99% af gangene følgende spørgsmål: “skal du være sådan en hestehvisker?”. Med hestehvisker menes der ofte en person, som har et usynligt og næsten magisk bånd til hesten og som kan hviske til den – sådan lidt tankeoverførings-agtigt. Hvis det er sådan hestehvisker skal forståes, er svaret klart “NEJ, jeg er ikke ved at uddanne mig til hestehvisker”. Men hvis man forstår en hestehvisker, som en person, der bringer indlæringspsykologien i spil, uden selv at være klar over det og som har eminent timing og opmærksomhed og som har en umiddelbar forståelse for hesten, så kan der godt være noget om det – bortset altså lige fra, at jeg forsøger at være meget opmærksom på det! Det hestehviskerne gør er, efter min mening, nemlig overhovedet ikke mystisk eller magisk, men kan forklares indenfor de indlæringsteoretiske og adfærdsbiologiske rammer.

Jeg synes, at viden om indlæringspsykologien har stor betydning for, hvad man kan gøre med sin hest og hvordan man gør det. Viden om indlæring kombineret med viden om hestens natur og adfærd kan forklare en masse af de problemer, mange hesteejere oplever til hverdag og give ideer til, hvordan problemerne kan håndteres. Men det handler ikke kun om problemer. Det handler om, hvordan hesten lærer i det hele taget – i ridningen, i longen, på staldgangen og i alle andre situationer. Det her oplæg handler om en af de mest prominente indlæringspsykologiske teorier, som bliver brugt indenfor mange typer træning af dyr. Den er ikke den eneste, men en af de vigtigste.

Negativ og positiv forstærkning er to varianter af en type indlæring, der hedder operant betingning. Der er to mere: negativ og positiv straf. NB: Her skal straf ikke forståes som afstrafning eller vold, men det kommer jeg tilbage til.

Lad os lige først få beskrevet hvad operant betingning er.

Operant betingning

Operant betingning er en form for indlæring, hvor indlæringen foregår som en konsekvens af en adfærd. Vi lærer altså af konsekvenserne af det vi gør. Sagt på en anden måde: du gør noget (adfærd) og det du gør har en konsekvens. Konsekvensen påvirker, hvorvidt du er mere eller mindre tilbøjelig til at gøre det samme igen. Hvis du synes konsekvensen var behagelig, vil du sandsynligvis gøre det igen, hvis konsekvensen var ubehagelig, vil du nok ikke forsøge det igen lige med det samme.

OperantBetingningEksempel: Du siger noget sødt til en person (adfærd) og personen bliver glad og smiler til dig (konsekvens). Hvis det, at personen smiler, får dig til at føle noget godt, så er sandsynligheden for, at du siger noget sødt en anden gang større. Hvis personen ikke smiler, men ser sur ud som en konsekvens af dine søde ord, er sandsynligheden for, at du vil sige noget sødt en anden gang mindre. På den måde har konsekvenserne af alt, hvad du gør indflydelse på, hvad du gør senere.

Det samme gælder for heste. Alt hvad du gør virker tilbage på det hesten gør. Og alle dine reaktioner, på det hesten foretager sig, påvirker dens fremtidige handlinger.

Det her gælder altid – også når du ikke træner og ikke er bevidst om det.

Positiv & negativ forstærkning / positiv & negativ straf.

Vi har 4 processer i operant betingning, to af dem – positiv og negativ forstærkning – er processer, der begge øger sandsynligheden for at en given adfærd forekommer igen. Positiv og negativ straf er begge processer, der sænker sandsynligheden for at en adfærd forekommer igen.

Positiv og negativ er et udtryk for om noget er til stede eller ej. Det har ikke noget at gøre med om noget er godt eller skidt. F.eks. enten giver du en godbid eller også tilbageholder du den. Enten er godbidden til stede eller også er den ikke. Positiv og negativ svarer til plus og minus, ikke til godt og skidt.

Her kommer et par eksempler:

postiv forstærkning det at vi tilfører noget for at øge hyppigheden eller styrken af en adfærd Her tilfører vi noget behageligt. Vi giver f.eks. en godbid, når hesten gør noget ønsket. Eller klør den på yndlingskløstedet el. lign. Dermed er sandsynligheden større for, at den kommer til at gøre det igen
negativ forstærkning det at vi fjerner eller tilbageholder noget for at øge hyppigheden eller styrken af en adfærd Her fjerner vi noget, som hesten synes er ubehageligt – f.eks. pres. Når vi fjerner presset øger det sandsynligheden for, at hesten vil gøre det igen, som fik ubehaget til at forsvinde.
positiv straf det at vi tilfører noget for at begrænse eller sænke hyppigheden eller styrken af en adfærd Det der bliver tilført her er noget som hesten opfatter som ubehageligt. Heste vil gøre meget for at undgå fysisk pres, derfor kan man tilføre et pres, når hesten gør noget uønsket. Bare lige huske, at man ikke behøver at slå eller nive. For hesten kan en berøring være nok.
negativ straf det at vi fjerner eller tilbageholder noget for at sænke hyppigheden eller styrken af en adfærd Hvor vi i negativ forstærkning fjernede noget ubehageligt, så fjerner vi her noget, som hesten finder behageligt eller noget den gerne vil have. Det er altså en negativ straf at tilbageholde mad eller godbidder f.eks.

Forstærkere og straffere

  • Det vi tilfører i positiv forstærkning, kaldes en forstærker og er altså noget, som hesten vil arbejde for at opnå.
  • Det vil tilfører i positiv straf kaldes en straffer og er noget som hesten vil arbejde for at undgå.

Hvad der virker som forstærker og straffer afhænger af den enkelte hest. Det er ikke sikkert, at det helt de samme ting, der vil virke forstærkende eller straffende for alle heste.

Heste er nok ikke de mest kræsne dyr og vil gøre meget for at opnå en godbid, men det er alligevel værd at tænke lidt over, hvad den pågældende hest allerbedst kan lide. Jeg har endnu ikke hørt om en hest, der ikke vil arbejde for godbidder, men der kan godt være nogle typer godbidder, som virker mere motiverende end andre. Jeg hørte et eksempel fra hundeverdenen på et af kurserne. En mand kunne ikke finde noget mad, som hunden ville arbejde for. Han kunne altså ikke finde en velegnet forstærker til træningen. Det viste sig, at makrel i tomat virkede! Prøv lige at have det med i lommen til træning ;-).

Men hvad med det der straf? Når jeg skriver “pres” alle mulige steder, så mener jeg berøring, ikke slag. I mange tilfælde er let eller moderat berøring nok til at få en reaktion fra hesten. Da jeg trænede bakke på signal, behøvede jeg ikke engang at røre. Bare det at stå foran hesten og læne mig frem, var nok til at få ham til at bevæge sig lidt bagud.

Der er ingen tvivl om, at slag og andre former for vold også ville virke. Jeg går ikke ind for det overhovedet. Dels fordi jeg synes, at det i alle tilfælde er helt unødvendigt og uetisk, men også fordi, at i det øjeblik, man begynder at anvende vold, bliver der blandet stresshormoner ind i situationen. Dvs. at hesten bliver angst. Hvis du er uheldig, kan du få skabt en stressrelateret reaktion på det, som hesten havde sin opmærksomhed rettet mod, da straffen faldt. Stress virker desuden hæmmende på indlæring.

Case 1 – Hovedsky hest

Negativ forstærkning / positiv straf

Lad os antage, at jeg har en hest, der er hovedsky. Jeg kan ikke komme til at røre den på hovedet, uden, at den flytter hovedet væk. Det kan give problemer, når jeg skal strigle eller lægge trense på.

Der kan være mange forklaringer på, at den er blevet hovedsky. En kunne være, at den har lært, at  berøringen forsvinder, når den bevæger hovedet. Den er på den måde, blevet negativt forstærket i at flytte hovedet. Hvis jeg gerne ville lære den at acceptere berøring og stå stille med hovedet, når jeg rør ved den, kan jeg prøve negativ forstærkning. Altså den samme proces som skabte problemet i første omgang. Det jeg skal gøre er, at røre hestens hoved og når den forsøger at flytte hovedet, bliver jeg ved med at røre (positiv straf). Berøringen behøver ikke at være særlig kraftig. Det er ofte nok med en meget let berøring. Jeg slipper ikke, før den holder hovedet roligt – altså igen negativ forstærkning, men denne gang på at være rolig med hovedet. I begyndelsen vil den forsøge at slippe for berøringen og måske blive mere urolig med hovedet, men hvis jeg er stædig nok og følger med bevægelserne, vil der komme et tidspunkt, hvor den vil være rolig i et øjeblik. I det ganske korte øjeblik skal jeg være hurtig og fjerne hånden. Så lægger jeg hånden på igen og det hele vil gentage sig. Jeg holder ved, sålænge hesten er urolig med hovedet og slipper i det sekund hovedet er roligt. Efter nogle gentagelser vil hesten have lært, at den ikke kan få hånden til at forsvinde ved at kaste sit hoved alle mulige steder hen. Hånden forsvinder kun når den er rolig. Timingen er selvfølgelig vigtig, for at det skal virke. Hvis jeg flytter hånden for tidligt, dvs. mens den stadig er urolig, får jeg forstærket den urolige adfærd.

Positiv forstærkning / negativ forstærkning / positiv straf

Jeg kunne også vælge en anden strategi – positiv forstærkning. Hvor jeg før tilførte noget ubehageligt (berøringen/positiv straf), mens den var urolig og fjernede det ubehagelige, når den blev rolig (negativ forstærkning), kan jeg med positiv forstærkning tilføre noget behagelig, når den er rolig. Jeg kan f.eks. røre hovedet og når den bliver rolig, giver jeg den en godbid – positiv forstærkning. Jeg kan eventuelt kombinere det, så jeg både fjerner berøringen og giver en godbid, når hesten er rolig.

Case 2 – Hesten tigger

Negativ straf / positiv forstærkning

I dette tilfælde tigger hesten. Det gør den ofte, fordi vi har forstærket tiggeadfærden uden at tænke over det. Tiggeadfærden kan være rettet mod f.eks. at den gerne vil have en mad eller godbid, men det kan også være, at den er ude efter opmærksomhed. Lad os antage, at det er opmærksomhed den er ude efter. Dvs. at den f.eks. skraber med forbenet på staldgangen og det vil jeg rigtig gerne have den til at holde op med. Tidligere har jeg måske råbt af hesten eller på andre måder givet den opmærksomhed (positiv forstærkning), når den tiggede og dermed forstærket den uhensigtsmæssige adfærd (skæld-ud er også en form for opmærksomhed). Nu hvor jeg ved, at det er opmærksomheden, den er ude efter, kan jeg begrænse tiggeriet ved at tilbageholde den (negativ straf). Med andre ord tilbageholder jeg min opmærksomhed, mens den tigger, for at få den til at lade være med at tigge. Det øjeblik den ikke tigger, sørger jeg for at rose, nusse eller give godbid for at (positivt) forstærke, at den ikke tigger. Den lærer, at for at få opmærksomheden, må den forholde sig i ro.

Der er en lille krølle på den her. Når jeg begynder at ignorere tiggeadfærden (hvor jeg måske før havde råbt af den eller noget andet), vil tiggeadfærden i en periode blive kraftigere, inden den bliver svagere og forhåbentligt forsvinder. Det kaldes udslettelsesudbrud og kan sammenlignes med det vi gør, når batteriet i fjernbetjeningen er løbet tør. Først trykker vi på en knap, som vi plejer, men der sker jo ikke noget, så vi trykker måske en gang til og så et par gange til lidt hårdere, indtil vi til sidst giver op og erkender, at det altså ikke hjælper. Hvor hurtigt man når til den erkendelse, afhænger nok af personen og det samme gælder sandsynligvis også for heste – nogle er måske hurtigere end andre til at opdage, at det der plejer at virke, ikke virker mere.

Hvilken type forstærkning eller straf er bedst at bruge?

Det afhænger helt af hesten, træneren og situationen! Meget uklart svar. Sagen er, at jeg ikke har nogen særlige præferencer. Det der virker godt i en situation, virker måske ikke så godt i en anden. På et tidspunkt arbejdede jeg med en ismule, som blev ved med at gå i lommerne på mig. Jeg brugte godbidder til positiv forstærkning, men måtte på et tidspunkt opgive og gå over til negativ forstærkning, da den ikke kunne koncentrere sig om andet end godbidderne i lommen. Jeg havde desværre ikke så meget tid, derfor valgte jeg at ændre strategi. Hvis jeg havde haft æren af hesten i længere tid eller over flere gange, havde jeg arbejdet med at få den positive forstærkning til at fungere, uden at hesten pressede på for at få godbid. Positiv forstærkning er mere intuitivt for mig end negativ forstærkning, og lige nøjagtig derfor øver jeg mig mere på negativ forstærkning. Med min egen part måtte jeg også ændre strategi på et tidspunkt, da han fik spiserørsforstoppelse og jeg måtte droppe godbidderne i en periode.

Teoriernes ophav

Det er desværre ikke mig, der har fundet på det her. Det var Edvard Thorndike, der undersøgte og beskrev teorien om, at enhver adfærd, der havde behagelige konsekvenser med stor sandsynlighed ville forekomme igen og enhver adfærd med ubehagelige konsekvenser med stor sandsynlighed ville blive begrænset. Den teori bliver omtalt som “Law of Effect”. En anden herre ved navn B. F. Skinner arbejdede videre med Thorndikes teori og han bliver tilskrevet æren for Operant betingning, herunder positiv og negativ forstærkning og straf. Det er nemt at finde noget om disse herre på internettet og i bøger.

Det er komplekse teorier, med en kæmpe mængde forskning, der ligger til grund. Her har jeg kun beskrevet de allermest basale elementer, som man ofte hører omtalt indenfor træningen af dyr.

Eksemplerne tager jeg selv skylden for.

Mine primære kilder er:
Chance, Paul (2014): Learning and Behavior. 7th Edition. International Edition. Wadsworth, Cengage Learning.
Hvidemose, Bettina (2010): Indlæringspsykologi for hest og rytter. Lær din hest at forstå dig!

Oversigt

Jeg har forsøgt at skrue en lille oversigt sammen:

Klik her for at se oversigten som pdf:
OperantBetingningTheBasics

OperantBetingningTheBasics

Advertisements

3 thoughts on “Negativ og positiv forstærkning.. hvad er det nu lige det er?

  1. Pingback: Ciara uge 1 | Hest

Skriv kommentar

Udfyld dine oplysninger nedenfor eller klik på et ikon for at logge ind:

WordPress.com Logo

Du kommenterer med din WordPress.com konto. Log Out / Skift )

Twitter picture

Du kommenterer med din Twitter konto. Log Out / Skift )

Facebook photo

Du kommenterer med din Facebook konto. Log Out / Skift )

Google+ photo

Du kommenterer med din Google+ konto. Log Out / Skift )

Connecting to %s