Modernes Training beruft sich auf lerntheoretische Grundlagen. Eine der wichtigsten Grundlagen ist hierbei das Verständnis der operanten Konditionierung, also das Lernen durch Konsequenzen, die ein wichtiges Fundament für die Kommunikation zwischen Pferd und Mensch darstellt. Für Schwierigkeiten zwischenmenschlicher Art sorgen hierbei immer wieder die Begrifflichkeiten positive und negative Verstärkung und Strafe, da diese nicht immer entsprechender ihrer Definition verwandt werden. Dabei sind die Begrifflichkeiten fest definiert und bedürfen keiner Interpretation. Dies führt zu Missverständnissen und macht Diskussionen und Austausch schwierig, da zwar die gleichen Begriffe verwendet , aber unterschiedliche Definitionen zu Grunde  gelegt werden. In diesem Artikel erläutere ich in zusammengefaster Form die lerntheoretische Grundlage für das Training mit dem Pferd, um euch einen Überblick zu verschaffen.

Die Kommunikation zwischen Pferd und Mensch ist erlernt und nicht angeboren, da Pferd und Mensch weder der gleichen Art angehören, noch die gleichen Ressourcen teilen. Pferde zeigen, sowohl im Umgang als auch im Training demnach Verhalten, welches sie durch Konditionierung gelernt haben. Entscheidend hierfür sind die Konsequenzen, die der Mensch im Training schafft. Lohnt sich ein Verhalten, so wird dieses häufiger gezeigt, lohnt es sich nicht, wird es weniger gezeigt. Die Lerntheorie ist hierbei keine Theorie, so wie oft angenommen, sondern lediglich eine Beschreibung der natürlichen, biologischen Vorgänge, die beim Lernen bei jedem Lebewesen stattfinden. Sie wurde also nicht vom Menschen „erfunden“ sondern ist lediglich in Worte gefasstes Naturgesetz.

Operante Konditionierung

Im Training spricht man von positiver und negativer Verstärkung und von positiver und negativer Strafe. Positiv und negativ sind hierbei mathematisch zu sehen und stehen dafür, etwas hinzuzufügen (positiv) oder zu entfernen (negativ). Verstärkung bedeutet, dass ein Verhalten häufiger gezeigt wird und Strafe, dass ein Verhalten weniger häufig gezeigt wird. Diese Definitionen unterliegen keiner persönlichen Meinung, sondern sind wissenschaftliche Definitionen, die einer einheitlichen Beschreibung dienen.

Positive Verstärkung / Freude – Ein Verhalten wird mehr, weil darauf eine angenehme Konsequenz erfolgt mit etwas, was das Pferd als Verstärker versteht (Futter, Kraulen). Achtung: Wird zuvor Druck ausgeübt, z. B. durch Körpersprache und dieser bei richtiger Reaktion wieder entfernt, handelt es sich um negative Verstärkung, auch wenn im Anschluss belohnt wird.

Negative Verstärkung / Erleichterung – Ein Verhalten wird mehr, weil etwas Unangenehmes nachlässt oder vermieden wird. Hierzu muss jedoch zunächst etwas Unangenehmes hinzugefügt werden, dass das Pferd vermeiden oder „abstellen“ will.

Positive Strafe / Furcht – Ein Verhalten wird weniger, weil als Konsequenz etwas Unangenehmes hinzugefügt wird (Ein Klaps, Touchieren, oder auch ein lautes Wort oder eine Körperbewegung auf das Pferd zu).

Negative Strafe, Löschung / Frustration – Ein Verhalten wird weniger, weil als Konsequenz etwas entfernt oder vorenthalten wird.

Negative Verstärkung und positive Strafe stehen hierbei in Wechselwirkung, da ohne positive Strafe negative Verstärkung im Training nicht möglich ist. Denn ohne die Aussicht auf etwas Unangenehmes oder das vorherige Hinzufügen von etwas Unangenehmen, entsteht nicht der Wunsch, dieses zu vermeiden oder zu beenden. Ebenso wird im Training mit positiver Verstärkung auch negative Strafe zum Einsatz kommen, da nicht jedes Verhalten belohnt wird, sondern nur erwünschtes.

Emotionen im Training – Warum ist das wichtig? 

An jedes Verhalten ist auch eine entsprechende Emotion gekoppelt, je nachdem welche Konsequenz, also welcher Quadrant „am Werk“ ist. Dies geschieht über so genannte klassische Konditionierung, also unbewusst und ist demnach nicht steuerbar. Hat das Pferd beim Hängertraining z. B. viel Stress, weil es z. B. viel Druck bekommt, so wird dieses Gefühl unmittelbar mit dem Verhalten “auf den Hänger” gehen und schon der Anblick des Hängers kann diese Emotion auslösen, selbst wenn es am Ende gelernt hat, auf den Hänger zu gehen und dort zu stehen. Ebenso kann auch ein Pferd, dass z. B. im Training mit Futterlob durch viele Fehlentscheidungen oft frustriert ist, eine bestimmte Übung bereits als “unangenehm” abspeichern, so dass hier schon beim Geben des Signals eine gewisse “Angst” vor dem Entzug von etwas angenehmen ensteht und das Pferd gestresst ist. Daher ist es wichtig, das Training möglichst angenehm und lohnenswert zu gestalten und unangenehme Empfindungen zu vermeiden. Dies ist vor allen Dingen von einem guten, kleinschrittigen und für das Pferd nachvollziehbaren Trainingsaufbau abhängig.

Clickertraining

Signale und Konsequenzen

Signale, mit denen wir mit dem Pferd kommunizieren, sind demnach an zuverlässige Konsequenzen geknüpft und funktionieren nur so lange für das Pferd (und damit auch für den Menschen), wie auch eine zuverlässige Konsequenz besteht, da Verhalten nur gezeigt wird, wenn es sich für das Pferd lohnt. Das gilt auch, wenn man Signale und Konsequenzen kaum noch wahrnehmen kann, weil Pferd und Mensch bereits gut aufeinander abgestimmt sind. So ist auch ein Einatmen und Anspannen noch ein negativ verstärktes Signal, wenn bei Nichtreaktion eine Steigerung stattfindet oder der Reiz aufrecht erhalten wird, bis das Pferd entsprechend reagiert und und sich der Mensch bei richtiger Reaktion wieder entspannt. Gibt es keine Konsequenz, gibt es auch kein Verhalten und demnach kein Signal mehr. 

“Mischen” von positiver und negativer Verstärkung 

Häufig wird angegeben, dass im Training sowohl positive als auch negative Verstärkung angewandt wird. Dies wird häufig als „ausbalanciert“ bezeichnet und von den Anwendern auch so empfunden. Dies trifft vor allen Dingen dann zu, wenn nicht konsequent mit positiver Verstärkung trainiert werden möchte und/oder das Wissen hierfür nicht vorhanden ist. In der Regel wird davon gesprochen, dass zu Beginn zunächst Druck in geringer Abstufung angewandt wird bzw. dieser nicht verstärkt wird und nach richtiger Reaktion Lob erfolgt. Das Loben nach Druckaufbau/Nachlassen von Druck ist keine positive Verstärkung, da das Pferd zunächst zum einen keine Option hat, nicht auf das Signal zu reagieren und zum anderen bei richtiger Reaktion eine Wegnahme oder Vermeidung des (unangenehmen) Reizes erfolgt. Daran ändert auch eine Belohnung nichts, welche sich in erster Linie auf das nachfolgende Verhalten auswirkt, was weitere Probleme verursachen kann (Da man in der Regel im Stehen belohnt, könnte beispielsweise das Stehen für das Pferd lohnenswerter sein und dadurch mehr Druck für die Bewegung benötigt werden).

Das Belohnen von Verhalten, insbesondere durch Futterlob, welche über Druckaufbau erarbeitet oder aufrecht erhalten werden, birgt zusätzlich das Risiko, dass der Druck vom Pferd als nicht mehr so unangenehm empfunden wird oder aber die Belohnung als nicht mehr so lohnenswert, da hier eine Gegenkonditionierung vorgenommen wird. Außerdem bedeutet dies, dass die Konsequenzen für das Pferd nicht mehr so klar sind, was zusätzlichen Stress und eine Schwächung des Signals bedeuten kann.

Mögliche* Konsequenzen für das Training:

  • Es wird mehr Druck benötigt, weil der Druck durch die Belohnung nicht mehr als so unangenehm empfunden wird und die Druckwegnahme deshalb nicht mehr so verstärkend ist. Da das Verhalten jedoch über Druckaufbau erarbeitet ist und die Belohnung mit Druck kombiniert wird, kommt auch keine positive Verstärkung für das gewünschte Verhalten zum Tragen und der generelle Wert der Belohnung wird herabgesetzt.
  • Das Pferd bekommt Stress, insbesondere bei der Arbeit mit Futterlob, da es nie sicher ist, ob bei richtiger Reaktion eine Belohnung erfolgt oder eine Drucksteigerung (Strafe). Dies kann sich in extrovertiertem Streß (Übersprungshandlungen, Hektik, Aggressivität) oder introvertiertem Stress (Einfrieren, weniger Reaktion, “Ausklingen” im Training) äußern und wird häufig fehlinterpretiert, was dann oftmals zu mehr Druck führt und das Problem verschlimmert (Pferd wird als “stur” oder “dominant” bezeichnet).
  • Das Pferd “testet” häufiger. Da die wichtigste Konsequenz für das Pferd bei dieser Trainingsform das Nachlassen von Druck ist, dieser aber durch Belohnung ggf. abgeschwächt wird oder nicht konsequent erfolgt, das Verhalten zudem auch vom Pferd eher vermieden werden möchte, sucht es “die Lücke im System” und versucht sich zu entziehen.
  • Die Probleme, die durch das Mischen und die Anwendung von negativer Verstärkung entstehen, lassen beim Anwender häufig die Illusion entstehen, Training über positive Verstärkung sei mit ihrem Pferd nicht möglich, da es immer wieder zu Druckspitzen im Training kommt und Verhalten vom Pferd “nicht freiwillig” ausgeführt wird. Dieses Problem ist ohne Umstellung des Verhaltens auf reine positive Verstärkung oder aber durch das Reduzieren Mischen nicht zu beheben. Die Umstellung auf positive Verstärkung ist bei dieser Vorgehensweise jedoch schwierig und langwierig.

* Hierbei handelt es sich um mögliche Konsequenzen. Da die Konsequenzen für das Training von vielen Faktoren abhängig und beim “Mischen” kaum kalkulierbar/dokumentierbar sind, lassen sich die Folgen unmöglich vorhersehen. Es ist jedoch davon auszugehen, dass sich das Mischen demnach in irgendeiner Form negativ auf das Training und eine oder mehrere der genannten Konsequenzen auftreten. Das bedeutet allerdings nicht, dass es nicht „funktioniert“, zu mischen, es kann aber eben das ein oder andere Problem vor allen Dingen zu Lasten des Pferdes geben. (Persönliche Anmerkung: Ich persönlich habe noch nie jemanden gesehen, der „mischt“ und bei dem dieses aus meiner Sicht mehr Vor- als Nachteile gehabt hätte. Es ist allerdings natürlich stets davon abhängig, welche Prioritäten man im Training setzt.)

Modernes Pferdetraining sollte überwiegend auf positiver Verstärkung aufbauen. Grundsätzlich kann jedes Pferd mit positiver Verstärkung trainiert werden. Dies ist keine Frage eines bestimmten Pferdetyps oder -charakters, denn aufgrund seiner Biologie verfügt jedes Pferd – wie auch jedes andere Säugetier – über die Fähigkeit, ganz natürlich auf die 4 Quadranten (positive und negative Verstärkung und Strafe) zu reagieren. Selbstverständlich sollte die Persönlichkeit des Pferdes im Training Berücksichtigung, dies sollte jedoch nicht zu Lasten einer pferdegerechten Ausbildung gehen. Sicherlich erfordert es jedoch entsprechende Trainerfähigkeiten, positive Verstärkung ganz unabhängig von Aufgabe und Pferd anwenden zu können.  Eine Entscheidung gegen das Training mit positiver Verstärkung ist immer eine Entscheidung von Seiten des Menschen, denn schon evolutionär gesehen macht es für ein Individuum Sinn, sich gegen Strafe und aversive Reize und für positive Verstärkung zu entscheiden.