Die Kommunikation zwischen Pferd und Mensch ist erlernt und nicht angeboren, da Pferd und Mensch weder der gleichen Art angehören, noch die gleichen Ressourcen teilen. Pferde zeigen, sowohl im Umgang als auch im Training demnach Verhalten, welches sie durch Konditionierung gelernt haben. Entscheidend hierfür sind die Konsequenzen, die der Mensch im Training schafft. Lohnt sich ein Verhalten, so wird dieses häufiger gezeigt, lohnt es sich nicht, wird es weniger gezeigt. Die Lerntheorie ist hierbei keine Theorie, so wie oft angenommen, sondern lediglich eine Beschreibung der natürlichen, biologischen Vorgänge, die beim Lernen bei jedem Lebewesen stattfinden. Sie wurde also nicht vom Menschen „erfunden“ sondern ist lediglich in Worte gefasstes Naturgesetz.
Operante Konditionierung
Im Training spricht man von positiver und negativer Verstärkung und von positiver und negativer Strafe. Positiv und negativ sind hierbei mathematisch zu sehen und stehen dafür, etwas hinzuzufügen (positiv) oder zu entfernen (negativ). Verstärkung bedeutet, dass ein Verhalten häufiger gezeigt wird und Strafe, dass ein Verhalten weniger häufig gezeigt wird. Diese Definitionen unterliegen keiner persönlichen Meinung, sondern sind wissenschaftliche Definitionen, die einer einheitlichen Beschreibung dienen.
Positive Verstärkung / Freude – Ein Verhalten wird mehr, weil darauf eine angenehme Konsequenz erfolgt mit etwas, was das Pferd als Verstärker versteht (Futter, Kraulen). Achtung: Wird zuvor Druck ausgeübt, z. B. durch Körpersprache und dieser bei richtiger Reaktion wieder entfernt, handelt es sich um negative Verstärkung, auch wenn im Anschluss belohnt wird.
Negative Verstärkung / Erleichterung – Ein Verhalten wird mehr, weil etwas Unangenehmes nachlässt oder vermieden wird. Hierzu muss jedoch zunächst etwas Unangenehmes hinzugefügt werden, dass das Pferd vermeiden oder „abstellen“ will.
Positive Strafe / Furcht – Ein Verhalten wird weniger, weil als Konsequenz etwas Unangenehmes hinzugefügt wird (Ein Klaps, Touchieren, oder auch ein lautes Wort oder eine Körperbewegung auf das Pferd zu).
Negative Strafe, Löschung / Frustration – Ein Verhalten wird weniger, weil als Konsequenz etwas entfernt oder vorenthalten wird.
Negative Verstärkung und positive Strafe stehen hierbei in Wechselwirkung, da ohne positive Strafe negative Verstärkung im Training nicht möglich ist. Denn ohne die Aussicht auf etwas Unangenehmes oder das vorherige Hinzufügen von etwas Unangenehmen, entsteht nicht der Wunsch, dieses zu vermeiden oder zu beenden. Ebenso wird im Training mit positiver Verstärkung auch negative Strafe zum Einsatz kommen, da nicht jedes Verhalten belohnt wird, sondern nur erwünschtes.
Emotionen im Training – Warum ist das wichtig?
An jedes Verhalten ist auch eine entsprechende Emotion gekoppelt, je nachdem welche Konsequenz, also welcher Quadrant „am Werk“ ist. Dies geschieht über so genannte klassische Konditionierung, also unbewusst und ist demnach nicht steuerbar. Hat das Pferd beim Hängertraining z. B. viel Stress, weil es z. B. viel Druck bekommt, so wird dieses Gefühl unmittelbar mit dem Verhalten “auf den Hänger” gehen und schon der Anblick des Hängers kann diese Emotion auslösen, selbst wenn es am Ende gelernt hat, auf den Hänger zu gehen und dort zu stehen. Ebenso kann auch ein Pferd, dass z. B. im Training mit Futterlob durch viele Fehlentscheidungen oft frustriert ist, eine bestimmte Übung bereits als “unangenehm” abspeichern, so dass hier schon beim Geben des Signals eine gewisse “Angst” vor dem Entzug von etwas angenehmen ensteht und das Pferd gestresst ist. Daher ist es wichtig, das Training möglichst angenehm und lohnenswert zu gestalten und unangenehme Empfindungen zu vermeiden. Dies ist vor allen Dingen von einem guten, kleinschrittigen und für das Pferd nachvollziehbaren Trainingsaufbau abhängig.
Signale und Konsequenzen
Signale, mit denen wir mit dem Pferd kommunizieren, sind demnach an zuverlässige Konsequenzen geknüpft und funktionieren nur so lange für das Pferd (und damit auch für den Menschen), wie auch eine zuverlässige Konsequenz besteht, da Verhalten nur gezeigt wird, wenn es sich für das Pferd lohnt. Das gilt auch, wenn man Signale und Konsequenzen kaum noch wahrnehmen kann, weil Pferd und Mensch bereits gut aufeinander abgestimmt sind. So ist auch ein Einatmen und Anspannen noch ein negativ verstärktes Signal, wenn bei Nichtreaktion eine Steigerung stattfindet oder der Reiz aufrecht erhalten wird, bis das Pferd entsprechend reagiert und und sich der Mensch bei richtiger Reaktion wieder entspannt. Gibt es keine Konsequenz, gibt es auch kein Verhalten und demnach kein Signal mehr.
“Mischen” von positiver und negativer Verstärkung
Häufig wird angegeben, dass im Training sowohl positive als auch negative Verstärkung angewandt wird. Dies wird häufig als „ausbalanciert“ bezeichnet und von den Anwendern auch so empfunden. Dies trifft vor allen Dingen dann zu, wenn nicht konsequent mit positiver Verstärkung trainiert werden möchte und/oder das Wissen hierfür nicht vorhanden ist. In der Regel wird davon gesprochen, dass zu Beginn zunächst Druck in geringer Abstufung angewandt wird bzw. dieser nicht verstärkt wird und nach richtiger Reaktion Lob erfolgt. Das Loben nach Druckaufbau/Nachlassen von Druck ist keine positive Verstärkung, da das Pferd zunächst zum einen keine Option hat, nicht auf das Signal zu reagieren und zum anderen bei richtiger Reaktion eine Wegnahme oder Vermeidung des (unangenehmen) Reizes erfolgt. Daran ändert auch eine Belohnung nichts, welche sich in erster Linie auf das nachfolgende Verhalten auswirkt, was weitere Probleme verursachen kann (Da man in der Regel im Stehen belohnt, könnte beispielsweise das Stehen für das Pferd lohnenswerter sein und dadurch mehr Druck für die Bewegung benötigt werden).
Das Belohnen von Verhalten, insbesondere durch Futterlob, welche über Druckaufbau erarbeitet oder aufrecht erhalten werden, birgt zusätzlich das Risiko, dass der Druck vom Pferd als nicht mehr so unangenehm empfunden wird oder aber die Belohnung als nicht mehr so lohnenswert, da hier eine Gegenkonditionierung vorgenommen wird. Außerdem bedeutet dies, dass die Konsequenzen für das Pferd nicht mehr so klar sind, was zusätzlichen Stress und eine Schwächung des Signals bedeuten kann.
Mögliche* Konsequenzen für das Training:
- Es wird mehr Druck benötigt, weil der Druck durch die Belohnung nicht mehr als so unangenehm empfunden wird und die Druckwegnahme deshalb nicht mehr so verstärkend ist. Da das Verhalten jedoch über Druckaufbau erarbeitet ist und die Belohnung mit Druck kombiniert wird, kommt auch keine positive Verstärkung für das gewünschte Verhalten zum Tragen und der generelle Wert der Belohnung wird herabgesetzt.
- Das Pferd bekommt Stress, insbesondere bei der Arbeit mit Futterlob, da es nie sicher ist, ob bei richtiger Reaktion eine Belohnung erfolgt oder eine Drucksteigerung (Strafe). Dies kann sich in extrovertiertem Streß (Übersprungshandlungen, Hektik, Aggressivität) oder introvertiertem Stress (Einfrieren, weniger Reaktion, “Ausklingen” im Training) äußern und wird häufig fehlinterpretiert, was dann oftmals zu mehr Druck führt und das Problem verschlimmert (Pferd wird als “stur” oder “dominant” bezeichnet).
- Das Pferd “testet” häufiger. Da die wichtigste Konsequenz für das Pferd bei dieser Trainingsform das Nachlassen von Druck ist, dieser aber durch Belohnung ggf. abgeschwächt wird oder nicht konsequent erfolgt, das Verhalten zudem auch vom Pferd eher vermieden werden möchte, sucht es “die Lücke im System” und versucht sich zu entziehen.
- Die Probleme, die durch das Mischen und die Anwendung von negativer Verstärkung entstehen, lassen beim Anwender häufig die Illusion entstehen, Training über positive Verstärkung sei mit ihrem Pferd nicht möglich, da es immer wieder zu Druckspitzen im Training kommt und Verhalten vom Pferd “nicht freiwillig” ausgeführt wird. Dieses Problem ist ohne Umstellung des Verhaltens auf reine positive Verstärkung oder aber durch das Reduzieren Mischen nicht zu beheben. Die Umstellung auf positive Verstärkung ist bei dieser Vorgehensweise jedoch schwierig und langwierig.
* Hierbei handelt es sich um mögliche Konsequenzen. Da die Konsequenzen für das Training von vielen Faktoren abhängig und beim “Mischen” kaum kalkulierbar/dokumentierbar sind, lassen sich die Folgen unmöglich vorhersehen. Es ist jedoch davon auszugehen, dass sich das Mischen demnach in irgendeiner Form negativ auf das Training und eine oder mehrere der genannten Konsequenzen auftreten. Das bedeutet allerdings nicht, dass es nicht „funktioniert“, zu mischen, es kann aber eben das ein oder andere Problem vor allen Dingen zu Lasten des Pferdes geben. (Persönliche Anmerkung: Ich persönlich habe noch nie jemanden gesehen, der „mischt“ und bei dem dieses aus meiner Sicht mehr Vor- als Nachteile gehabt hätte. Es ist allerdings natürlich stets davon abhängig, welche Prioritäten man im Training setzt.)
Modernes Pferdetraining sollte überwiegend auf positiver Verstärkung aufbauen. Grundsätzlich kann jedes Pferd mit positiver Verstärkung trainiert werden. Dies ist keine Frage eines bestimmten Pferdetyps oder -charakters, denn aufgrund seiner Biologie verfügt jedes Pferd – wie auch jedes andere Säugetier – über die Fähigkeit, ganz natürlich auf die 4 Quadranten (positive und negative Verstärkung und Strafe) zu reagieren. Selbstverständlich sollte die Persönlichkeit des Pferdes im Training Berücksichtigung, dies sollte jedoch nicht zu Lasten einer pferdegerechten Ausbildung gehen. Sicherlich erfordert es jedoch entsprechende Trainerfähigkeiten, positive Verstärkung ganz unabhängig von Aufgabe und Pferd anwenden zu können. Eine Entscheidung gegen das Training mit positiver Verstärkung ist immer eine Entscheidung von Seiten des Menschen, denn schon evolutionär gesehen macht es für ein Individuum Sinn, sich gegen Strafe und aversive Reize und für positive Verstärkung zu entscheiden.
[…] verwirrend und frustrierend sein.Sylvia Czarnecki hat das wunderbar in ihrem Blogpost beschrieben:Lerntheorie im modernen Pferdetraining (Scroll runter zum Punkt […]
[…] Eine Belohnung ist nur dann eine Belohnung im Sinne einer Bestärkung, wenn sie dazu führt, dass das Verhalten häufiger auftritt (sich verbessert). Damit dies der Fall ist, muss zunächst einmal ein Bedürfnis bestehen. Dies ist bei Futter als Belohnung nahezu immer der Fall, da unsere domestizierten Hauspferde fast immer Hunger haben – und sei es nur auf Abwechslung oder „hochwertigere“ Kost. „Komfort“ als Belohnung kann jedoch nur dann funktionieren, wenn unmittelbar davor „Diskomfort“ bestand. Umgangssprachlich könnte man Diskomfort auch mit Unwohlsein bezeichnen. In den meisten Fällen wird das Unwohlsein durch das Hinzufügen von Druck entstehen. Führt das Pferd die Übung aus, tut es das, weil es weiß, dass der Druck aufrechterhalten oder erhöht wird, wenn es das nicht tut. Das eigentliche Bedürfnis des Pferdes ist hier nicht das Erlangen von Komfort/Pause, sondern das „Loswerden“ des Diskomfort oder das Vermeiden/Entfernen eines aversiven Reizes. Auch ein Streicheln oder mit Futter belohnen kann den Umstand nicht ändern, dass das Pferd zunächst reagiert, um seinen unwohlen Zustand zu ändern. Sicherlich kann man die „Pause“ nach dem erwünschten Verhalten hierdurch etwas aufwerten, doch solange ich bereit bin, Druck anzuwenden und aufrecht zu erhalten oder zu erhöhen, bis das Pferd das gewünschte Verhalten zeigt, bleibt es eine negative VerstärkungNach einem Verhalten wird ein unangenehmer (aversiver) Reiz (z. B. in Form von physischem Druck wie „antippen“ mit der Gerte) entfernt und bewirkt, dass das zuvor gezeigte Verhalten häufiger auftritt. Im schlimmsten Fall bringen wir das Pferd in eine emotionale Zwickmühle, weil es zum einen unangenehme Folgen befürchtet, wenn es nicht reagiert, zum anderen aber am Ende eine Belohnung lockt, in Form von Futter oder Kraulen. In diesem Fall kann es dazu führen, dass Druck nicht mehr als so negativ empfunden wird und die Belohnung durch die Vermengung an Wert verliert (Siehe auch Artikel zum „Mischen“ von positiver und negativer Verstärkung) […]