Zirkuslektionen und Clickertraining – mit positiver Verstärkung zu einem partnerschaftlichen Miteinander

Ist Training nur mit positiver Verstärkung möglich?

Ein häufiges Argument in der Kritik gegenüber dem Training mit positiver Verstärkung ist, dass Training nur mit positiver Verstärkung nicht möglich sei, da das Training immer auch einen Anteil negativer Strafe enthält. Diese Behauptung ist zwar korrekt, ganz so einfach ist es allerdings nicht! Schließlich arbeitet jeder, der mit negativer Verstärkung trainiert, zu einem nicht unerheblichen Teil ebenfalls mit positiver Strafe, was in diesem Zusammenhang gerne unter den Tisch fällt. 

Operante Konditionierung

Das Erlernen von Verhaltensweisen findet zu einem großen Teil mittels operanter Konditionierung statt, welche auch als Lernen durch Konsequenzen bekannt ist. Manchmal wird dies auch als "Try and Error" bzw. "Versuch und Irrtum" bezeichnet, da das Tier hierbei durch Ausprobieren lernt, welches Verhalten sich am meisten lohnt. Das Pferd lernt hierbei durch ein Verhalten eine Konsequenz herbeizuführen und erhält dadurch eine gewisse Kontrolle über seine Umgebung. Es "operiert" also mit seiner Umwelt, woher auch die Bezeichnung operante Konditionierung kommt.

Im diesem System existieren 4 Konsequenzen, die als Quadranten der operanten Konditionierung bezeichnet werden: Positive und Negative Verstärkung, sowie positive und negative Strafe. Führt eine Konsequenz dazu, dass ein Verhalten häufiger gezeigt wird, spricht man von einer Verstärkung. Eine Konsequenz, die dazu führt, dass ein Verhalten weniger häufig auftritt, nennt man Strafe. Bei der Beschreibung von positiv und negativ geht es, anders als häufig angenommen, ausschließlich darum, ob als Konsequenz etwas hinzugefügt oder entfernt wird. Bei einer positiven Verstärkung wird also etwas (Angenehmes) Hinzugefügt, bei einer negativen Verstärkung etwas (Unangenehmes) entfernt - in beiden Fällen wird das Verhalten verstärkt und wird zukünftig häufiger auftreten. Bei einer positiven Strafe, führt das Hinzufügen von etwas Unangenehmen dazu, dass das Verhalten weniger wird, bei einer negativen Strafe entfernt man etwas Angenehmes als Konsequenz.

Die vier Quadranten der operanten Konditionierung

Verstärkung und Strafe sind voneinander abhängig

Beim Lernen sind in der Regel zwei der so genannten Quadranten der operanten Konditionierung beteiligt. Das bedeutet, dass im Training mit positiver Verstärkung tatsächlich auch negativ bestraft wird. Schließlich wird nur Verhalten belohnt, welches auch tatsächlich verstärkt werden und damit häufiger auftreten soll. Erfüllt das Pferd das gewünschte Kriterium nicht, wird es also auch nicht belohnt. Möchte ich beispielsweise, dass das Pferd rückwärts geht, das Pferd bleibt jedoch stattdessen stehen, erhält es nicht den gewünschten Verstärker. Zeigt es im nächsten Durchgang ein anderes Verhalten als Stillstehen, im Idealfall natürlich Rückwärtsgehen, so ist das Nicht-Belohnen gleichzusetzen mit einer negativen Strafe. 

Training mit positiver Verstärkung

Es kann auch durchaus vorkommen, dass nicht nur eine Belohnung ausbleibt, sondern auch noch aktiv etwas aus der Umgebung des Pferdes entfernt wird: Der Mensch, der den Trainingsbereich verlässt, kann eine solche Strafe sein, wenn die Anwesenheit des Menschen für das Pferd etwas Erstrebenswertes ist. Ebenso eine verordnete "Zwangspause", in der das Pferd stillstehen soll, weil das Arbeiten mit positiver Verstärkung etwas Angenehmes ist, von dem das Pferd gerne mehr hätte.

Diese "Abhängigkeit" von positiver Verstärkung und negativer Strafe gibt es im übrigen auch im Training mit negativer Verstärkung. Beruft sich ein Trainer also darauf, in seiner Ausbildung auf Strafe zu verzichten, nutzt aber negative Verstärkung, kann man davon ausgehen, dass er sich nicht mit der Lerntheorie auseinandergesetzt hat. Schließlich muss, damit als negative Verstärkung etwas Unangenehmes entfernt werden kann, zunächst etwas Unangenehmes hinzugefügt werden. Möchte ich zum Beispiel, dass das Pferd rückwärts geht und übe Druck an der Brust aus, bis das Pferd rückwärts geht, habe ich zuerst das Stillstehen bestraft und durch das Entfernen des Druckes das Rückwärts gehen negativ verstärkt. Zukünftig wird das Pferd in diesem Kontext - der Mensch steht vor dem Pferd und übt Druck an der Pferdebrust aus - weniger Stillstehen und mehr Rückwärtsgehen. Auch im späteren Verlauf wird das Verhalten weiterhin mit negativer Verstärkung aufrecht erhalten, schließlich beinhaltet jedes Kommando auch eine - im besten Falle - minimale Androhung von unangenehmen Konsequenzen und bei der richtigen Reaktion des Pferdes wird zunächst erstmal etwas entfernt. Veranlasst also zukünftig bereits ein Blick auf die Hinterhand oder ein Mehr an Körperspannung das Pferd dazu, ein Verhalten zu zeigen, so wird der Mensch diese Reize entfernen, wenn das Pferd wie gewünscht reagiert - selbst wenn er danach oder dabei überschwänglich belohnt. 

Im Training mit positiver Verstärkung "vermehren" wir Verhalten

Training mit positiver Verstärkung

In der Ausbildung mit positiver Verstärkung geht es darum, durch positive Verstärkung Verhalten zu vermehren. Negative Strafe wird also vor allen Dingen eingesetzt, wenn dadurch verhindert werden soll, dass ein Verhalten unbeabsichtigt verstärkt wird. Steigt das Pferd zum Beispiel auf das Podest und trommelt wie wild mit seinen Hufen darauf herum, belohnt man das Pferd sinnvollerweise in einem solchen Moment nicht. Hat das Pferd jedoch durch positive Verstärkung gelernt, dass das auf dem Podest stehen etwas Angenehmes ist, wodurch das schon Stehen auf dem Podest ein Verstärker ist oder empfindet es das Scharren und Klopfen als selbstbelohnend, ist es eine schlaue Entscheidung, das Pferd vom Podest herunterzuführen. Da man dem Pferd hier das Podest "wegnimmt" und damit auch die Möglichkeit, hierauf belohnt zu werden, stellt dies eine negative Strafe dar. Würde man das Pferd einfach weitermachen lassen, würde sich dieses Verhalten möglicherweise weiterhin lohnen und häufiger auftreten. Um nun zukünftig zu verhindern, dass das Pferd auf dem Podest "herumkaspert", wird man sich nun überlegen, wie man ein ruhiges Stehen bekommt, statt das Pferd immer wieder zu bestrafen, indem man es in den Fehler hereinrennen lässt. Eine Möglichkeit wäre zum Beispiel früher oder häufiger zu belohnen, so lange das Pferd stillsteht, so dass das Pferd gar nicht erst scharrt oder klopft oder das Pferd nicht so lange auf dem Podest stehen lassen. Wir stützen uns also auch hier wieder auf die positive Verstärkung um Verhalten zu vermehren, statt unerwünschtes Verhalten durch Strafen zu verringern.

Auch im Training neuer Verhaltensweisen ist es wichtig, dass das Pferd vor allen Dingen durch Belohnung lernt und nicht durch ausbleibende Belohnung angetrieben wird. Natürlich kann es für das Pferd sehr stressig sein, wenn die Aufgabe nicht klar genug gestellt ist und so eine erwartete Belohnung immer und immer wieder ausbleibt. Daher ist es wirklich wichtig, einen guten Plan im Kopf (und manchmal auch auf dem Papier) zu haben, damit das Pferd im besten fall fehlerfrei lernt. Denn Fehler bestrafen stets den Lerner für seine Bemühung. 

Negative Verstärkung und positive Strafe im "positiven Training"

Natürlich können wir in der Ausbildung nicht immer alle Ereignisse voraussehen und sorgfältig planen, so dass selbstverständlich auch Pferde positiv arbeitender Trainer in ihrem Alltag ab und an negative Verstärkung und positive Strafe erfahren. Bleibt das Pferd zum Beispiel überraschend stehen, während der Mensch weiterläuft, kann ein unangenehmer und unbeabsichtigter Ruck am Seil durchaus so unangenehm sein, dass das Pferd zukünftig vermeidet, stehen zu bleiben. Durch umsichtiges und vorausschauendes Handeln kann man dies jedoch auf ein Minimum reduzieren.

Training mit positiver Verstärkung

Das bewusste Anwenden positiver Strafe ist bei der Ausbildung mit positiver Verstärkung im Regelfall nicht notwendig. Der Umstand, dass wir durch erstrebenswerte Konsequenzen und damit verbundene positive Emotionen Verhalten "vermehren", führt dazu, dass die Pferde gerne mitarbeiten und keinen Grund haben zu hinterfragen, ob etwas wirklich sein muss, schließlich lohnt es sich ja. Ein mit positiver Verstärkung trainiertes Pferd ist also auf der ständigen Suche nach Signalen, die eine angenehme Konsequenz bedeuten und liest somit seinem Menschen buchstäblich die Wünsche von den Augen ab - vorausgesetzt natürlich, dass das Training entsprechend gut ist. Auch Abwehr- oder Fluchtversuche und Aggressionspotential werden deutlich verringert, da man sich gründlich überlegt, ob das Pferd einer Aufgabe gewachsen ist oder man es einer bestimmten Situation aussetzt. Im Falle einer Überforderung oder Verweigerung gilt es der Ursache auf den Grund zu gehen statt mit einem "Mach es trotzdem!" zu reagieren. Das Pferd hat keinen Vorteil davon, ein Verhalten nicht zu zeigen, da dies auch das Ausbleiben einer Verstärkung bedeutet, daher stellt selbst ein solcher Übungsabbruch kein Problem für das weitere Training da.

Im Falle einer lebensbedrohlichen Situation kann es allerdings durchaus sein, dass auch ein positiv verstärkt arbeitender Trainer bewusst positiv bestraft, weil er keine andere Möglichkeit sieht, um Schlimmeres zu verhindern - hier geht es zunächst um Deeskalation und das Verhalten zu beenden und nicht darum, durch die Strafe einen Lerneffekt zu erzielen. Glücklicherweise muss ein Lebewesen nicht lernen, auf einen aversiven Reiz zu reagieren, denn diese Fähigkeit ist angeboren und funktioniert auch ohne vorangegangene Erklärung. Danach muss man jedoch überlegen, wie es zu dieser Situation gekommen ist um eventuelle Trainingsdefiziete - positiv verstärkt - ausgleichen zu können. 

Ein Trainer, der sich in seiner Ausbildung auf positive Verstärkung beruft, meint also in der Regel, dass er auf die bewusste Anwendung von negativer Verstärkung und positiver Strafe aus Trainingszwecken verzichtet und überwiegend positive Verstärkung nutzt, um Verhalten zu trainieren. 

Hat Dir der Artikel gefallen?
2 Kommentare

Schreibe einen Kommentar


*

Newsletter abonnieren und kostenloses E-Book erhalten!


Survival Guide für den Umgang mit Futterlob
Webinare - Lernen von Zuhause
Bücher von Sylvia Czarnecki
Kurstermine und Seminare mit Sylvia Czarnecki