02-12-2012    

Beloningen goed gebruiken
Laatst bijgewerkt op zondag 08 januari 2012 12:37 Geschreven door Sandra Hurkmans
 
Wilt u werkelijk het gedrag van uw hond begrijpen, weten hoe het is ontstaan en hoe u het kunt aanpassen, dan moet u begrijpen hoe versterking -oftewel effectief gebruikte beloning- werkt.
 
Versterking is een term afkomstig uit het "operant conditioneren", een leermodel dat algemeen van toepassing is op alle diersoorten, behalve misschien de allerprimitiefste. Zelfs met regenwormen bleek operant conditioneren te werken! Om te kunnen overleven is het voor dieren namelijk noodzakelijk hun gedrag steeds aan te passen aan nieuwe situaties in hun omgeving - zij moeten dus leren. Volgens het "operant conditioneren" wordt het gedrag van een dier bepaald door de consequenties die dat gedrag heeft voor het dier.
 
Zo zal het dier een gedrag vaker gaan vertonen, als het gevolgd wordt door versterking. Bijvoorbeeld iets dat de hond prettig vindt. Dan heet het "positieve versterking", "positief" omdat er iets aan de situatie wordt toegevoegd. "Negatieve versterking" bestaat ook. Dat betekent dat er iets dat de hond onaangenaam vindt (bijv. een correctie), ophoudt of wordt weggenomen. Zoals u in een volgende artikel - Straf: een nuttig middel met veel valkuilen - duidelijk zal worden, heeft deze negatieve versterking een keerzijde. Deze keer concentreren we ons echter op positieve versterking.

Waarschijnlijk gebruikt u positieve versterking al jaren in uw voordeel: als de hond doet wat u wilt, beloont u hem, bijvoorbeeld met een koekje of een spelletje, zodat hij dat gedrag zal willen herhalen. Hoe leuker de hond uw beloning vindt, hoe sneller hij leert te doen wat u wilt.
 
Het kan echter zijn dat u deze methodiek daarnaast onbewust verkeerd toepast bij gedrag dat u niet zo prettig vindt: u duwt uw hond steeds weg als hij tegen u opspringt, toch komt hij steeds weer omhoog. Dan ziet het ernaar uit dat uw hond uw duwen heel erg prettig vindt! Of misschien schreeuwt u tegen hem als hij weer eens hardnekkig jankt. Het feit dat het hardnekkig is, wijst erop dat hij uw geschreeuw belonend vindt! Waarschijnlijk gaat het uw hond puur om de aandacht, en of die nu positief of negatief is, maakt hem even niet uit.
 
Bij positieve versterking is het dus belangrijk wat de hond als leuk, prettig of anderszins belonend ervaart, niet wat denkt dat hij fijn vindt.
 

Vesterking allesbepalend voor gedrag 
Niets benvloedt het gedrag van een hond zo grondig als versterking. Als pup vertoont de hond allerlei gedrag. Feitelijk probeert hij uit welk gedrag wel of niet in zijn voordeel is: dus welk gedrag wel of niet wordt versterkt. De versterking gebeurt soms bewust (beloning) of onbewust door uzelf, maar soms ook 'toevallig' door de omgeving. Bijvoorbeeld een omgevallen vuilnisbak, waaruit allerlei lekkers - voor uw hond dan - uit is komen rollen. De hond leert hiermee dat vuilnisbakken zeer interessante voorwerpen zijn, die ook in de toekomst nadere aandacht blijven verdienen. Gedrag dat niet wordt versterkt, verdwijnt vanzelf: het levert de hond namelijk niets op en is dus een verspilling van energie. Na ongeveer een jaar vertoont een hond bijna uitsluitend dt gedrag dat versterkt werd, bewust of onbewust, door uzelf of door de omgeving.
 
Bijna alles wat een hond doet, doet hij omdat hij daarvoor in het verleden versterkt werd!
 

Machtig middel 
Het is mogelijk dat de hond een bepaald gedrag al herhaalt, terwijl het slechts n keer beloond is. Sterker nog, het moeilijkst af te leren is gedrag dat uiterst zelden wordt versterkt, maar waarvoor de beloning, ls deze dan eindelijk bemachtigd wordt, heel groot is. Dat is ook het grote geheim van de aantrekkingskracht van gokautomaten.
 
Versterking is dus een heel machtig middel, als u het maar naar uw hand weet te zetten.
 

Timing 
Het moment van beloning is zeer belangrijk. Het dier moet namelijk een verband kunnen leggen tussen zijn gedrag en de beloning. Als de beloning vr het gedrag komt, of vijf minuten erna, zal de hond nooit een verband zien. Onderzoek heeft aangetoond dat het beste moment van beloning 4/10 seconde na het vertonen van een gedrag is. Dat is ook logisch, want honden zijn over het algemeen erg actieve dieren. Een paar seconden na het gedrag dat u wilt belonen, heeft uw hond misschien al vijf andere gedragingen vertoond. Als u bijvoorbeeld bij het aanleren van de zit de beloning 5 seconden n het moment waarop de hond ging zitten toedient, is de hond inmiddels al opgestaan, heeft hij ergens aan gesnuffeld, naar andere honden gekeken en tot slot een bijtje nagejaagd. Dan hebt u dus niet het zitten versterkt, maar het najagen van het bijtje!
 
Een beloning moet dus tijdens of direct n het gewenste gedrag worden toegediend, wilt u dat gedrag versterken.
 

Geconditioneerde versterker 
Het is niet altijd mogelijk de beloning op precies het goede moment te geven. Een koekje in uw zak hebt u niet binnen 4/10 seconde in de mond van uw viervoeter. Om deze en andere redenen kan het erg handig zijn een zgn. 'geconditioneerde versterker' te gebruiken, een signaaltje dat de hond vertelt: "wat je n doet is goed en daarvoor krijg je een beloning". Dit signaal wordt steeds gevolgd door een beloning. Het signaal kan een woord zijn, bijvoorbeeld "braaf", maar ook een klikgeluidje zoals van de clicker, een verbeterde versie van het vroegere kikkertje. Een dergelijk kort en betrekkelijk uniek geluid heeft bepaalde voordelen, o.a. dat het goed te timen is en dat het beter tot de hond doordringt dan de stem, waardoor het gewenste gedrag beter gemarkeerd wordt. Naar de clicker is een speciale trainingsmethode genoemd, de zgn. clicker-training. Over deze trainingsvorm kunt u meer lezen in Clicker-training: dolfijntraining voor uw hond, Veelgestelde clicker-vragen en Clicker-tips.
 

Gedrag afleren
 Het zal inmiddels duidelijk zijn dat versterking de enige manier is om een hond iets aan te leren. Maar soms wil je een hond juist iets fleren. Ook daarvoor is positieve versterking geschikt.

En manier om een hond iets af te leren, is ervoor te zorgen dat het gedrag niet meer versterkt wordt. Dan sterft het op den duur uit. Dit heet met een mooi woord "extinctie". Als het gedrag in het verleden vaker is beloond, zal het echter enige tijd duren voordat het ophoudt. Sterker nog, het gedrag zal in eerste instantie heviger worden!
 
Bijvoorbeeld, een hond jankt om aandacht. De baas reageerde soms iets eerder, soms iets later, soms vriendelijk (wat is er jongen, moet je uit?), soms boos. Dan reageert de baas een keertje helemaal niet. De hond zal dan in eerste instantie steeds harder gaan janken, omdat dat in het verleden meestal toch nog de gewenste aandacht opleverde. Hij zal dit ook enige tijd volhouden en zelfs gaan blaffen, want de baas reageerde in het verleden ook niet altijd meteen. Maar op een gegeven moment houdt het gedrag toch op, meestal na een laatste, ergste verheviging van zijn ongewenste gedrag. De eerstvolgende keer zal de hond het weer proberen, maar zal hij minder lang aanhouden. En zo verder, totdat de hond het tenslotte helemaal opgeeft. Bij deze methode schuilt een addertje onder het gras. Als de baas namelijk niet volhoudt en toch een keer aandacht schenkt aan het gejank, zal de hond het de volgende keer ng hardnekkiger volhouden: hij heeft nu namelijk geleerd dat de aanhouder wint! Hierbij is dus heel consequent gedrag van de baas vereist.
 
Deze eerste verheviging van gedrag bij het uitblijven van een versterking die de hond gewend is te krijgen, kunt u ook in uw voordeel gebruiken bij het uitbouwen van gewenst gedrag en het afbouwen van de beloning. Dit wordt veel toegepast bij clicker-training.
 
Een andere manier om middels versterking een gedrag af te leren is de afwezigheid van het gedrag te belonen, terwijl u het gedrag zelf negeert. Dit werkt iets sneller dan de vorige methode, omdat u de hond een duidelijk alternatief gedrag biedt, dat direct iets oplevert. Als een hond bijvoorbeeld tegen u opspringt, negeert u hem terwijl hij springt (waardoor dit gedrag "uitsterft"), maar versterkt u hem zodra hij vier poten op de grond heeft. Zodra hij dit wat door heeft, versterkt u hem geregeld zolang hij vier poten op de grond houdt. Vervolgens bouwt u de beloningsfrequentie af.
 
Een derde veelgebruikte manier is het aanleren van een gedrag dat de hond niet kan combineren met het ongewenste gedrag. Zo is in de mand liggen tijdens het eten niet tegelijk mogelijk met aan tafel zitten bedelen. Een hond kan ook niet tegelijk tegen iemand opspringen en zitten of liggen. Soms vergt het bedenken van een dergelijk onverenigbaar gedrag enige moeite, maar het is vaak een uitstekende om ongewenst gedrag af te leren.
 
Wilt u een hond die graag traint en enthousiast werkt? Die altijd vol aandacht voor u is? Wilt u een wereldhond die u een wereldbaas vindt? Achterhaal dan wat uw hond in welke situaties geweldig vindt, en gebruik dit in uw voordeel. Train bewust met veel, liefst uitsluitend, positieve versterking. Want positieve versterking is een oneindig veel krachtiger gereedschap dan de meesten van u denken. Bovendien is het ook voor jezelf veel leuker om continu te letten op wat je hond allemaal goed doet. Het is weliswaar allemaal gemakkelijker gezegd dan gedaan en vergt soms veel denkwerk. Maar dan gebruiken we juist datgene wat wij als mens wel hebben en de hond niet: ons verstand!
 

Met dank aan: Sandra Hurkmans
Website: www.kc-delft.nl
Datum: 02-12-2012