7) Måste man belöna hela tiden?

Detta är en av de vanligaste frågorna som brukar dyka upp om den belöningsbaserade träningen. När man börjar att träna in en ny övning så gäller det som tränare att belöna VÄLDIGT ofta och det kan se ut som att träningen bara består av upphackade små korta repetitioner av samma sak. Vi kan inte sluta helt med att förstärka ett beteende vi vill se, för i sådana fall skulle beteendet försvinna (detta kallas för utsläckning). Men allt eftersom träningen av övningen fortskrider kan vi glesa ut t.ex. matbelöningarna/kliandet. Jag ska berätta lite kort om olika sätt att göra detta på.

Jobba längre för varje klick

När vi tränar på att hästen ska öka hur länge han/hon utför ett visst beteende så kallas det för att vi jobbar med durationen av beteendet.

Låt säga att vi t.ex. tränar på ryggning. Till att börja med så nöjer vi oss med att förstärka ett steg bakåt eller kanske till och med bara att hästen gör en liten bakåtvägning. Men när detta fungerar så vill vi sedan troligen öka antalet steg bakåt som hästen gör innan vi förstärker.

Ett annat exempel är att ett par galoppsprång i taget som vi börjar med så småningom blir hela varv på ridbanan i galopp.

När vi successivt ökar durationen på det här sättet så glesar vi ju automatiskt ut belöningarna.

Här nedan ser vi en film från Carolina Fransson med stationsträning i olika stadier. Hästarna tränas att stå stilla självständigt på en matta. En väldigt användbar övning där mattan blir som en ”parkeringsplats”. I början av filmen ser vi tidiga stadier av träningen där hästarna bekräftas väldigt högfrekvent för att förstå vad som lönar sig och ha lätt att göra rätt. På det sättet så kommer vi snabbast till det läge där hästarna kan stå längre tid utan att ”göra fel” som att kliva runt, skrapa eller gå iväg från mattan. Den sista hästen i filmen har kommit längre i träningen och där vi kan se hur övningen är tänkt att kunna användas.

Sekvenser av flera beteenden efter varandra

Ett annat sätt som gör att vi inte behöver belöna lika ofta när övningarna är väl inlärda är att vi kan sätta ihop dem med varandra. Då utför hästen en sekvens av flera beteenden efter varandra innan vi belönar.

Här ser vi ett exempel på en liten beteendesekvens där hästen får matbelöningen efter hela sekvensen: 1) Hästen “går fot” bredvid sin matte 2) Hästen stannar när matte stannar 3) Hästen står stilla när matte sitter upp

Byte av förstärkare

I vissa situationer dyker det upp förstärkare i miljön som kan ersätta de som vi tränat in beteendet med. Vi kanske till exempel har tränat hästen att gå fint bredvid oss med hjälp av klick och matbelöning men kan ta bort klickandet och maten för gåendet helt i de situationer då vi går med hästen på väg till ridbanan. Eftersom en belöningsbaserat tränad häst efter ett tag ofta älskar sin ridbana så kan det vara tillräckligt förstärkande att få gå just dit.

Bara förstärka då och då

Många verkar tro att det vanligaste sättet att glesa ut belöningen på är att man bara förstärker ett beteende lite då och då när det väl är inlärt. Denna oregelbundna förstärkning är absolut en möjlighet men kräver en hel del kunskap för att lyckas bra med och är någonting som jag personligen gör väldigt sällan (av skäl som kräver en lite för avancerad förklaring för att platsa i just den här korta kursen). Jag föredrar helt enkelt de tidigare varianterna (förlänga durationen, träna in sekvenser och eventuellt byta förstärkare).

En kort introduktion till belöningsbaserad hästträning

Läroplan

7) Måste man belöna hela tiden?

Jobba längre för varje klick

Sekvenser av flera beteenden efter varandra

Byte av förstärkare

Bara förstärka då och då

Modal title