Immer wieder höre ich in Diskussionen über den Einsatz von Futter als Belohnung das Argument, man könne auch ohne Futter positiv Verstärken und dass das Ablehnen von Futterlob das Arbeiten mit positiver Verstärkung nicht ausschließt. Das ist grundsätzlich richtig, doch sollte man Bedenken, dass auch der Einsatz von Belohnung zunächst nichts darüber aussagt, ob mit positiver oder negativer Verstärkung trainiert wird.
Häufig sprechen einstellungsspezifische Gründe gegen den Einsatz von Futterlob, denn die Vorurteile gegenüber der Arbeit mit Futter halten sich hartnäckig. Aber auch Gründe, die eng mit der Philosophie des Natural-Horsemanship-Gedanken, es bestünde eine Rangfolge zwischen Pferd und Mensch, zusammenhängen, lässt die Befürworter dieser Trainingsmethoden eher ablehnend auf die Arbeit mit Futterlob schauen. Zwar setzt sich auch im Horsemanship allmählich der Gedanke durch, dass zumindest manche Pferdetypen durchaus mit Futterlob zu motivieren sind, aber auch hier wird Futter nur sehr sparsam und spezifisch eingesetzt.
Gerne wird damit argumentiert, man könne auch ohne Futter mit positiver Verstärkung trainieren und Futter wäre demnach nicht nötig. Oder eben auch „Ich belohne doch mit Futter, wenn das Pferd etwas richtig, richtig gut gemacht hat, dann gibt es auch mal eine Belohnung mit Futter!“ Schließlich gäbe es auch noch andere Möglichkeiten, Pferde zu belohnen. Auf Platz 1 ist dabei stets Komfort bzw. Pause, dicht gefolgt von Kraulen oder Streicheln, aber auch Klopfen oder der Einsatz der Stimme wird oft genannt.
Selbstverständlich kann man Pferde auch alternativ ohne Futter belohnen und selbstverständlich kann man auch ohne Futter mit positiver Verstärkung trainieren. Das ist allerdings gar nicht so einfach. Dass Pferde besonders motiviert sind und gerne mitarbeiten, wenn man sie belohnt, ist kein Geheimnis. Egal mit welcher Trainingsphilosophie man sich identifiziert, belohnt wird immer, denn ohne Belohnung würden Pferde kein neues Verhalten lernen. Doch nur, weil man sich über den Einsatz von Belohnung Gedanken macht und diese bewusst einsetzt, bedeutet das noch lange nicht, dass man auch mit positiver Verstärkung trainiert.
Einer der großen Unterschiede zwischen positiver und negativer Verstärkung ist die Aktivität des Pferdes. Bei der Arbeit mit positiver Verstärkung bringen wir das Pferd in die Lage, das gewünschte Verhalten zumindest im Ansatz zu zeigen. Es arbeitet dabei proaktiv mit und bestimmt durch sein Verhalten und den Fortschritt den weiteren Trainingsverlauf, der dem Lernverhalten des Pferdes angepasst wird. Dies geschieht durch sorgfältigen, drucklosen Verhaltensaufbau und die entsprechende Gestaltung der Lernsituation. Zu keinem Fall setzen wir das Pferd hierbei unter „Zugzwang“, in dem wir Druck generieren. Reagiert das Pferd auch nur ansatzweise wie gewünscht, belohnen wir das Pferd durch den Einsatz eines Verstärkers.
Wird mit negativer Verstärkung gearbeitet bedeutet das, das proaktiv ein Bewegungsanreiz gesetzt und damit Aktivität seitens des Pferdes eingefordert wird. Das heißt, es erfolgt zunächst mehr oder weniger viel Druck an gewünschter Stelle, es wird also ein „Kommando“ gegeben, um dem Pferd mitzuteilen, was erwartet wird. Reagiert das Pferd nicht, wird dieser Druck in der Regel aufrecht erhalten oder sogar erhöht, bis die gewünschte Reaktion folgt. Das Pferd reagiert demnach gewissermaßen unter „Zugzwang“, denn die einzige Möglichkeit, das „Kommando“ loszuwerden ist, sich richtig zu verhalten. Das Pferd wird also in jedem Fall etwas tun und so versuchen, die richtige Lösung zu finden. Erst, wenn dies geschehen ist, wird das Pferd belohnt. Im Gegensatz zur Arbeit mit positiver Verstärkung ist das Pferd hier reaktiv – es muss auf unser Verhalten reagieren.
Und schon sind wir mittendrin in der Debatte um positive Verstärkung. Um zu definieren, ob wir mit positiver Verstärkung arbeiten ist es wichtig, sich zu fragen, warum das Pferd wie gewünscht reagiert und warum das gewünschte Verhalten zuverlässiger auftritt, wenn wir danach fragen.
Baue ich Verhalten auf, brauche ich – in beiden Fällen – einen Verstärker, der das Pferd motiviert; der Volksmund spricht gerne von Belohnung. Doch was ist überhaupt eine Belohnung? Damit etwas als Belohnung funktioniert, muss zunächst einmal ein Bedürfnis bestehen, das heißt etwas, was das Pferd haben will. Dabei ist es unerheblich, ob das Bedürfnis grundsätzlich besteht (Futter, Sozialkontakt) oder aber künstlich kreiert wird, weil wir es dem Pferd vorher entziehen (Pause, Komfort).
Bei der Arbeit mit positiver Bestärkung funktioniert Futter besonders gut als Belohnung, weil der Anreiz, etwas dafür zu tun, besonders hoch ist. Denn positive Verstärkung ist nur dann effektiv und reell positive Verstärkung, wenn der Anreiz so hoch ist, dass das Pferd sich besonders bemüht, um erneut in den Genuss der Belohnung zu kommen. Der Anreiz muss so groß sein, dass das Pferd von sich aus agiert und Verhalten anbietet und wir das gewünschte Verhalten durch den Einsatz der Belohnung nur noch „markieren“ müssen – ohne dieses einzufordern. Natürlich kann man das Pferd auch mit Kraulen oder Streicheln belohnen, wenn das Pferd das für sich als Belohnung annimmt – den Wert einer Belohnung bestimmt stets das Tier, nicht der Trainer – doch gerade, wenn es anstrengend oder komplex wird, reicht dies oftmals nicht mehr aus. Das Pferd verliert die Lust, wendet sich ab oder aber simpel: das Verhalten verbessert sich nicht nennenswert. Als Mensch möchte man nun aktiv werden und dem Pferd mitteilen „Mach doch mal etwas“, doch gerade dann entfernen wir uns sehr schnell von der positiven Verstärkung. Hier wird auch klar, dass bei der Arbeit mit positiver Verstärkung der Einsatz von Pause oder Komfort als Belohnung nur sehr, sehr eingeschränkt und in Einzelfällen als Belohnung taugt. Anders als bei der negativen Bestärkung, besteht bei richtigem Trainingsaufbau kein Bedürfnis nach Pause. Im Gegenteil, das „Verordnen“ einer Pause würde bei einem motivierten, erwartungsvollem Pferd eher strafend wirken. Definieren wir mit Komfort das Entfernen von Druck, ist diese Möglichkeit bei der positiven Verstärkung schlichtweg nicht vorhanden, da zu keiner Zeit Diskomfort besteht.
Das Arbeiten mit negativer Verstärkung bedeutet, dass der Mensch das Pferd durch einen entsprechenden Reiz auffordert, das gewünschte Verhalten zu zeigen. Wird hier Druck ausgeübt oder wurde das gewünschte Verhalten über den Einsatz von Druck aufgebaut, ist das Bedürfnis des Pferdes nach Komfort oder Pause besonders hoch. Das Pferd wird also der Aufforderung deshalb nachkommen, weil es gelernt hat, dass der Druck nachlässt (Komfort) oder es Ruhepausen bekommt, wenn es sich richtig verhält. Das gewünschte Verhalten wird also entsprechend belohnt, doch in beiden Fällen stellt dies nur deshalb eine Belohnung dar, weil durch den Entzug zunächst ein künstliches Bedürfnis kreiert wurde und das Pferd den angenehmen Zustand wiederherstellen möchte. Dies ist keine positive Verstärkung – selbst dann nicht, wenn im Anschluss daran das gewünschte Verhalten zusätzlich mit Futter belohnt wird. Auch die Stimme stellt in diesen Fällen selten eine tatsächliche Belohnung dar. Sie ist dienlich, dem Pferd eine Rückmeldung über die Richtigkeit seiner Reaktion mitzuteilen, doch wird sie ohne den Einsatz von Druck nicht dazu ausreichen, das Verhalten zu verbessern.
Dazu kommen Verstärker, die häufig gar nicht bewusst eingesetzt werden: ein Durchparieren, wenn das Pferd sich besonders bemüht hat. Das Wechseln auf die bevorzugte Laufhand, wenn das Pferd sich auf der schlechten Hand gut gezeigt hat. Das Angaloppieren oder Schnellerwerden lassen, wenn das Pferd sich entsprechend verhalten hat. Das Entlassen aus der Übung, nachdem das Pferd sie zufriedenstellend ausgeführt hat. Kurzum immer genau das, was das Pferd lieber hätte. Doch in auch hier wird das Pferd in den meisten Fällen nicht intrinsisch motiviert (also von sich aus) handeln, sondern hat durch den Einsatz von negativer Verstärkung gelernt, das gewünschte Verhalten zu zeigen.
Um zu überprüfen, ob also tatsächlich mit positiver Verstärkung gearbeitet wird, sollte man also stets reflektiert und ehrlich sich selbst gegenüber prüfen, warum das Pferd wie gewünscht reagiert und was dazu beiträgt, dass Verhalten zuverlässiger gezeigt wird.
Auch, wenn wir in der Kommunikation mit dem Pferd bereits so fein sind, dass ein Blick oder ein leises Antippen der jeweiligen Körperpartie ausreicht, damit das Pferd reagiert, macht der Einsatz einer Belohnung hieraus keine positive Verstärkung, solange das Pferd nicht wirklich die Wahl hat. Auch, wenn nur hin und wieder mit Druckaufbau als Konsequenz reagiert werden muss und die Reaktion des Pferdes überwiegend wohlgesonnen ist und damit belohnt werden kann, trainieren wir mit negativer Verstärkung. Auch die Anwesenheit von Hilfsmitteln wie Gerte oder Stick, oder im Zweifel auch der Mensch selbst, sind bei negativ verstärktem Verhaltensaufbau bereits ein Indiz für den möglichen Einsatz von Druck als Konsequenz, wenn das Verhalten nicht wie gewünscht ausfällt. Zwar kann der Einsatz von Futter oder Streicheln als Belohnung den vorherigen Druckaufbau etwas abmildern und sogar dazu beitragen, dass das Verhalten zuverlässiger gezeigt wird, doch auch der zusätzliche Einsatz von Belohnung kann aus einer negativen Verstärkung keine positive Verstärkung machen, wenn das Verhalten nicht grundlegend über positive Verstärkung aufgebaut wird oder das Pferd zu keiner Zeit eine unangenehme Konsequenz zu befürchten hat.
Der Einsatz von negativer Verstärkung im Training ist kein Verbrechen und es steht jedem Pferdebesitzer frei, für sich selbst zu entscheiden, welche Trainingsmethoden er bevorzugt. Dann sollte man jedoch so ehrlich zu sich sein und diese auch klar als solche definieren – insbesondere dann, wenn man seine Methode zum Vergleich stellt und andere Trainingsmethoden in die Kritik nimmt.