20-01-2013    

STRAF: een nuttig middel met veel valkuilen

In het artikel Beloningen goed gebruiken kon u lezen hoe volgens het "operant conditioneren" het gedrag van een dier wordt bepaald door de gevolgen die dat gedrag heeft voor het dier.

 
Een dier zal zijn gedrag vaker herhalen als het direct gevolgd wordt door een "versterking", veelal iets dat het dier prettig vindt (positieve versterking) of beŽindiging van iets dat het dier onplezierig vindt (negatieve versterking, negatief omdat er iets - in dit geval iets onplezierigs - wordt weggenomen). Ook straf (de Engelse term is "punishment") is een onderdeel van het operant conditioneren.
 
Als het gedrag van een dier iets onaangenaams tot gevolg heeft, zal het dier in het vervolg minder geneigd zijn dat gedrag te herhalen. Ook bij straf bestaat een positieve en een negatieve variant. Bij positieve straf krijgt de hond een onlustgevoel toegediend (als dit door de baas gebeurt, noemt men dit in de hondenwereld een "correctie"), bij negatieve straf verdwijnt of stopt er iets dat de hond prettig vindt. Een voorbeeld van negatieve straf is als de hond jankt om aandacht, direct de kamer uit te lopen. De hond is een sociaal dier dat op aandacht en gezelschap is gesteld. Direct de kamer verlaten als hij om aandacht jankt is voor hem dus het verdwijnen van de kans op iets leuks, iets waar hij bovendien op uit was.

In dit stukje heb ik het verder voornamelijk over positieve straf, dus het toedienen van een onaangenaam iets.
 

Negatieve effecten
 Het effect van goed toegepaste straf is dus dat een bepaald gedrag niet meer of minder zal voorkomen. Het heeft zeker zijn plaats binnen de hondenopvoeding, maar helaas wordt het veel misbruikt, en erg vaak verkeerd en ondoordacht toegepast. Het gebruik van straf heeft namelijk een aantal nadelen:
 
1. Het effect van straf is vaak tijdelijk. Dat is vooral het geval als de gebruikte straf te mild is, zeker als de hond in het verleden al heeft meegemaakt dat een bepaald gedrag soms een (grote) beloning oplevert. 

2. Straf is niet zo'n duidelijke bron van informatie voor het dier als versterking. Het vertelt het dier alleen wat het niet meer moet doen, niet wat het wel moet doen. Dat is eigenlijk hetzelfde als wanneer u een taxichauffeur duidelijk wilt maken waar u naartoe wilt, door hem te vertellen waar u allemaal niet moet zijn! Oftewel, als u de hond wilt leren zitten, zou u de hond moeten corrigeren voor alles wat niet zitten is: spelen met andere honden, staan, lopen, honden uitdagen met spelhouding, rollen, tegen mensen opspringen, enz. U zult het met me eens zijn dat dit niet erg effectief is. Met versterking kunt u de hond echter direct duidelijk maken dat 'zitvlak op de grond en de voorpoten gestrekt onder me' voor hem wat oplevert, en dus voor herhaling vatbaar is!
 
3. Straf kan het ongewenste gedrag versterken. Op de hond mopperen, naar hem schreeuwen, hem wegduwen of zelfs hem meesleuren zijn allemaal vormen van aandacht. Negatieve aandacht weliswaar, maar als een hond verveeld is, is alle aandacht welkom, negatief of positief. Het kan dus goed zijn dat de baas het gedrag van de hond volkomen onbedoeld steeds weer beloont, terwijl hij denkt dat hij de hond straft.

4. Straf leidt tot negatieve emotionele reacties. Overigens kunnen deze reacties na een paar herhalingen van de straf leiden tot associatie van de straf met de baas, waardoor de aanwezigheid van de baas, altijd danwel alleen in bepaalde situaties, uiteindelijk zelf al een straf wordt.

Dergelijk negatieve emotionele reacties kunnen bijvoorbeeld zijn:
• Verstarring. Als een hond verstijft is dat een duidelijk teken van stress. Als de baas vervolgens doorzet met de straf, kan het uitlopen op een van de twee volgende punten: vlucht of agressie. 

• Het ontvluchten of vermijden. Dit zijn twee verschillende reacties, maar niet altijd even duidelijk uit elkaar te houden. Een zeer bekend voorbeeld: hond is eens of vaker gestraft toen hij op bevel van de baas bij de baas kwam - weliswaar vijf minuten na het eerste bevel, maar hij kwam. Als de baas hem weer roept, zal de hond Úf de situatie in zijn geheel ontvluchten door niet te komen, Úf na veel aarzeling heel langzaam en met omtrekkende bewegingen komen, veelal in een onderdanige houding om straf te vermijden, waarbij hij op het laatst alsnog voor vlucht kan kiezen. Ander voorbeeld: de baas komt thuis en ziet de hond 'schuldig' rondkruipen. En jawel, na even zoeken vindt hij een afgekloven schoen. "Ha!", denkt de baas, "hij voelt zich schuldig, dus hij weet wat hij fout heeft gedaan. Ik zal hem eens flink op zijn donder geven!" Het 'schuldig' rondkruipen is echter geen teken dat de hond tijdens het vernielen begreep dat wat hij deed fout was. Deze hond heeft gewoon al een aantal van dergelijke thuiskomstscŤnes meegemaakt en inmiddels had hij wŤl geleerd dat : thuiskomst baas + vernield voorwerp op de grond = straf. En hij wil de straf vermijden door zich onderdanig te gedragen. Zoals iedereen genoegzaam bekend zal zijn, 'straft' een normale hond een onderdanige hond nooit af. Dat sommige mensen juist door die houding de hond wŤl straffen, is voor de hond volkomen onbegrijpelijk en zou, aangezien vlucht en vermijding niet mogelijk zijn, heel gemakkelijk kunnen leiden tot het volgende punt.

• Agressie. Als de baas te veel of te hard corrigeert, loopt hij grote kans op zeker moment met agressie te worden geconfronteerd. Dat kan al heel snel gebeuren bij een dominante hond, maar zeker ook bij een onderdanige of angstige hond. Deze agressie kan zich op de baas richten, maar ook op de omgeving, bijvoorbeeld op andere honden. 

• Beperking van het leervermogen. Door de stress van zeker een harde positieve straf kan het voorkomen dat een dier gedurende een bepaalde periode na de straf niet goed kan leren, ook niet via positieve versterking. Ook de verwachting gestraft te kunnen worden, blokkeert het leervermogen.
 
Een hond is een hond, en is zeker geen mens. Maar om u een beetje in te leven in de emoties die een hond ervaart als gevolg van straf, hoeft u maar na te gaan hoe u zich zelf voelt en hoe u reageert als u iets onaangenaams overkomt. Mogelijk bent u bang of boos of een combinatie van beide emoties. Misschien zint u op wraak (iets wat een hond overigens absoluut niet kan, al zijn velen stellig overtuigd van wel). Als u vreest tegen eenzelfde situatie een volgende keer niet opgewassen te zijn, zult u deze willen vermijden of ontvluchten. En als u zich tot het uiterste getergd voelt, zult u misschien uw zelfbeheersing verliezen en klappen uitdelen.
 
Wat het laatste punt in bovenstaande opsomming betreft, is het ook bij mensen een welbekend verschijnsel dat zij vlak na het vernemen van iets onaangenaams dat henzelf hard treft, een tijd lang niet meer horen of zien wat er om hen heen gebeurt. Deze toestand kan 5 minuten, maar ook een aantal dagen duren. In feite zijn de hierboven opgesomde reacties dus allemaal heel herkenbaar, en komen ze in een groot deel van het dierenrijk voor.
 
Het associŽren met de baas van een onaangename gebeurtenis komt ook heel sterk bij mensen voor. In vroeger tijden werd de boodschapper die slecht nieuws bracht zelfs vaak omgebracht, ook al had hij zelf niets met het slechte bericht te maken.
 
Straf heeft dus de nodige, ernstige keerzijden. 
Overigens heeft 'negatieve versterking', dat ik in het artikel Beloningen goed gebruiken even zijdelings heb genoemd, dezelfde negatieve emotionele gevolgen als positieve straf. Dat is eenvoudig te verklaren: het dier moet eerst de onaangenaamheid van de positieve straf een (paar) keer hebben meegemaakt om het ontbreken of wegnemen van die onaangename sensatie te kunnen waarderen.
 
En zo heeft 'negatieve straf', het wegnemen van iets aangenaams, een minder sterk negatief emotioneel effect op de hond. De hond baalt wel van de gemiste kans op beloning, maar kent geen angst. Toch is ook negatieve straf erg effectief.
 

Effectieve toepassing 
Bij effectief gebruik van straf is het niet nodig om het vaak toe te passen. Een aantal principes voor correcte toepassing zijn de volgende:
 
• Timing - Het moet bij de aanzet tot, of uiterlijk tegelijk met, het ongewenste gedrag worden toegepast, de al vaker genoemde en alheilige 'timing'.

• Consequent - Het moet iedere keer dat het ongewenste gedrag voorkomt, worden toegepast (dus ook als de baas even niet kijkt!).

• Ander gedrag - De hond moet een alternatief gedrag worden aangeboden, iets dat hij kan doen in plaats van het foute gedrag en waarvoor hij wordt versterkt (= beloond). Dus niet "doe dat niet", maar "doe dit in plaats van dat". Het beste kan dit alternatieve gedrag van tevoren al getraind zijn, zodat de hond begrijpt wat er van hem wordt gevraagd. Hierdoor valt het bezwaar weg dat straf voor de hond veel minder eenduidige informatie geeft dan versterking.

• Gebruik een "geconditioneerde straffer". Dat is een woord (nee, foei, uh), geluid, frons en/of ander signaal dat de hond vertelt dat straf onmiddellijk zal volgen als hij doorgaat met zijn huidige, verkeerde gedrag. Dit signaal zal op den duur de noodzaak voor eigenlijke straf sterk verminderen, al zal het toch soms weer met een, uiteraard effectief uitgevoerde, straf moeten worden gecombineerd wil het signaal zijn effect blijven houden.
 
Door toepassing van deze principes zal de hond heel snel door hebben welk gedrag hij niet moet tonen en welk gedrag wel goed is in die situatie. Wat die snelheid betreft, hanteren gedragsdeskundigen de stelling dat als een straf na drie keer (!)het ongewenste gedrag nog niet heeft beŽindigd of heel sterk heeft teruggebracht, de betreffende straf voor die hond in die situatie niet bruikbaar is. Er moet dan naar een andere methode worden gezocht.
 

Valkuilen 
Om op een perfecte manier te leren straffen is echter veel oefening nodig. Daarnaast maken zelfs de meest ervaren mensen geregeld fouten bij het toedienen van straf. En fouten bij het straffen hebben als gevolg dat er (veel) vaker moet worden gestraft. Bijvoorbeeld:
 
• De baas straft te laat (bijvoorbeeld bij thuiskomst na vernieling; maar ook een aantal seconden na een vergrijp is al te laat) of te vroeg. Verkeerde timing heeft tot gevolg dat de baas een ander gedrag straft dan hij op het oog heeft. De hond begrijpt de straf dus niet en zal, vanwege de - in zijn ogen - onvoorspelbaarheid van de baas, snel vertrouwen in de baas verliezen. Bovendien is vaker straf nodig om het juiste' verkeerde gedrag te corrigeren.

• De baas straft niet iedere keer dat de ongewenste gedraging voorkomt. Hierdoor zal de hond minder snel begrijpen wat hij fout doet, en tot overmaat van ramp misschien zelfs voor zijn foute gedrag versterkt worden vanuit de omgeving!

• De baas combineert de straf niet met beloning voor goed gedrag. Hierdoor zal de hond daadwerkelijk moeten leren wat hij wel moet doen, door eerst voor alle gedragingen gecorrigeerd te worden die hij niet moet doen. Het voorbeeld hierboven leek misschien vergezocht, maar komt in de praktijk geregeld voor.
 
Daarnaast is ook de mens gevoelig voor operant conditioneren. De baas zal dan ook af en toe worden versterkt voor straffen, omdat de hond daardoor even "rustig" is (hij is verstard of, zoals dat ook wel genoemd wordt, "onder de indruk"). En zoals we vorige keer zagen, is niets zo bemoedigend als "af en toe" een beloning. Hierdoor zal de baas steeds gemakkelijker straf gebruiken als oplossing voor problemen, waardoor voor hem de volgende valkuilen dreigen:
 
• De baas corrigeert zo veel, dat hij van pure vermoeidheid en/of irritatie vergeet het goede gedrag te belonen.

• Correctie verwordt tot een ondoordacht gebruikt automatisme. Correct, effectief gebruik is geen overweging meer, en aan andere opties denkt men al helemaal niet meer.

• Uit irritatie of misschien een gevoel van machteloosheid, gebruikt de baas correctie puur als vergelding voor 'ongehoorzaamheid', niet als goed toegepaste straf om gedrag in toekomst te voorkomen.
 

'Hondse' straffen 
Een argument dat veel wordt gebruikt voor het al dan niet veelvuldig toepassen van correcties, bijvoorbeeld de slipketting (die de nekbeet van een soortgenoot zou nabootsen), is dat "wolven het onderling ook zo regelen". Slipkettingcorrecties accepteren wolven echter niet, getuige de lezing van Theo van Hilst, van Stichting Wolvenopvang Nederland, op onze club. Daarin stelde dhr. Van Hilst dat zijn wolven na een slipkettingcorrectie steevast in zijn been beten, terwijl hijzelf toch de ranghoogste, de alpha, in die roedel was. Blijkbaar is de hond in de loop der tijden door de mens geselecteerd op een grotere tolerantie voor straf.

Daarnaast geldt dat wolven elkaar onderling niet proberen te leren zitten, liggen en volgen op commando. Ook stellen wolven onderling geen eisen die volledig tegengesteld zijn aan de eigenschappen ze in de loop van de evolutie hebben ontwikkeld voor overleving. Bijvoorbeeld de jachtdrift (hondje mag niet achter poesje aanrennen, en hem zeker niet met een korte schudbeweging doden), het knagen (hond mag lederen bankstel niet opeten) en het huilen om soortgenoten te roepen (hond moet alleen kunnen zijn). Maar ŗls wolven elkaar onderling corrigeren, gebeurt dat altijd (consequent), direct (goede timing) en hard (duidelijk) - en duseffectief!
 
Wij mensen stellen dus enerzijds veel meer eisen dan wolven (en honden) onderling - zowel in wat we wel willen (een gehoorzame hond die keurig op commando allerlei gedragingen vertoont) als in wat we niet willen (allerlei voor de hond natuurlijke gedragingen). Daarbij zijn wij bovendien meestal veel minder effectief in ons gebruik van straf dan wolven onderling en gebruiken we, ook geen voor de hond natuurlijke middelen. Een tweetal overwegingen om een al te vanzelfsprekend gebruik van straf, ook van wat men 'hondse' straffen noemt, te relativeren.
 

Conclusie 
Samenvattend is positieve straf zeker een geldig en bruikbaar hulpmiddel bij de opvoeding van de hond. Gezien de vele ernstige nadelen, bijwerkingen en valkuilen, is het echter ook een hulpmiddel waarvan het gebruik tot een absoluut minimum beperkt moet worden.
 
Toepassing moet altijd weldoordacht en correct gebeuren, en er moet ook steeds heel goed worden bekeken of de gekozen straf daadwerkelijk (nog) effect heeft. Een goede leidraad is dan ook om altijd eerst het gewenste gedrag door gebruik van positieve versterking op te bouwen, en pas over te gaan op straf als er op die manier geen vordering meer wordt gemaakt. Een uitstekende vuistregel bij probleemsituaties is dat beloning minimaal 75% en, zeker positieve, straf hooguit 25% van de aanpak moet bepalen. Bij normale training gelden natuurlijk veel hogere percentages beloning t.o.v. lagere percentages straf. Hoe hoger het percentage positieve versterking, hoe enthousiaster een hond zal willen deelnemen aan de training.
 
Sandra Hurkmans
 

Met dank aan: Sandra Hurkmans
Website: www.kc-delft.nl
Datum: 20-01-2013