B. F. SkinnerWährend Thorndike den Lernerfolg eher dem Zufall überließ und untersuchte, wie dies das Lernverhalten der Versuchstiere beeinflusste, beschäftigte sich ab etwa 1930 ein weiterer Psychologe mit diesem damals noch unerforschten Phänomen. Der Psychologe Burrhus F. Skinner versuchte dabei, das Verhalten der Versuchtstiere ganz bewusst in eine bestimmte Richtung zu lenken und zu kontrollieren, in dem er dem Verhalten Konsequenzen folgen ließ – angenehme oder unangenehme. Das Verhalten wurde daraufhin wahrscheinlicher oder unwahrscheinlicher.

Ein bekannter Versuch war die so genannte Skinner-Box, die ähnlich wie die Puzzle-Box von Thorndike aufgebaut war. Skinner sperrte dabei hungrige Ratten in Käfige, welche auf bestimmte Art und Weise modifiziert waren. Nach einer Weile zeigten die Ratten verschiedene Verhaltensweisen und operierten so mit ihrer Umwelt. So war ein Käfig z. B. mit einem Hebel ausgestattet, der bei Berührung Futter auswarf. Sehr schnell konnte beobachtet werden, dass die Ratte nach einer zufälligen Berührung mit dem Hebel nach dem Auslöser für das Futter suchte und das Verhalten, das Drücken des Hebels, immer häufiger auftrat, bis es sicher gezeigt wurde. Stoppte die Futterzufuhr jedoch, nahm das Verhalten wieder ab, da die Handlung nicht mehr belohnt wurde. Eine weitere Ratte wurde in einen Käfig gesperrt, dessen Boden unter Strom stand. Nachdem die Ratte einige Zeit panisch herumgerannt war, hockte sie sich still in eine Ecke und ließ es über sich ergehen, statt weiterhin sinnlos Energie zu verschwenden. Sie hatte gelernt, dass sie dem unangenehmen Reiz nicht entfliehen kann. Hätte der Strom beim Hinsetzen aufgehört zu fließen, hätte sie hingegen schnell gelernt, wie sie den Strom abstellen kann.

Anhand dieser Versuchsreihen definierte Skinner das heutige Modell der operanten Konditionierung, welches das von uns genutzte Lernsystem darstellt. Bei der operanten Konditionierung bestimmt die Konsequenz das Verhalten. Abhängig davon, ob die Konsequenz angenehm oder unangenehm ist, wird ein Verhalten wahrscheinlicher oder unwahrscheinlicher.

Wir unterscheiden dabei zwischen Verstärkung und Bestrafung. Während eine Verstärkung dafür sorgt, dass die Auftrittswahrscheinlichkeit eines Verhaltens erhöht wird, sorgt Strafe dafür, dass diese abnimmt. Um das Ganze noch ein wenig komplizierter zu machen, unterscheiden wir hierbei noch zwischen positiver und negativer Verstärkung und zwischen positiver und negativer Strafe. Sicher fragen Sie sich jetzt, wie Strafe denn positiv sein kann. Zu Recht! Natürlich ist Strafe keinesfalls angenehm für das Pferd. Bei der Bezeichnung positiv und negativ handelt es sich um eine mathematische Ordnung, man könnte stattdessen auch additive und subtraktive Verstärkung sagen.

Wir unterscheiden bei der operanten Konditionierung insgesamt vier Formen von Verstärkung und Strafe, die so genannten Quadranten der operanten Konditionierung.

Positive Bestärkung

Angenehmes wird hinzugefügt
Verhalten nimmt zu

Bei der positiven Verstärkung wird als Konsequenz auf ein Verhalten etwas Angenehmes, also eine Belohnung, hinzugefügt. Die Wahrscheinlichkeit, dass das Verhalten auftritt, wird damit erhöht.

Negative Bestärkung

Unangenehmes wird entfernt
Verhalten nimmt zu

negv

Bei der negativen Verstärkung wird als Konsequenz auf ein Verhalten ein unangenehmer Reiz, z. B. körperlicher Druck, entfernt. Die Wahrscheinlichkeit, dass das Verhalten auftritt, wird auch hier erhöht.

Positive Strafe

Unangenehmes wird hinzugefügt
Verhalten nimmt ab

Positive Strafe

Bei der positiven Strafe wird als Konsequenz auf ein Verhalten ein unangenehmer Reiz hinzugefügt. Die Auftrittswahrscheinlichkeit des Verhaltens nimmt dadurch ab.

Negative Strafe

Angenehmes wird entfernt
Verhalten nimmt ab

Negative Strafe

Bei der negativen Strafe wird als Konsequenz auf ein Verhalten ein angenehmer Reiz entfernt. Die Auftrittswahrscheinlichkeit des Verhaltens nimmt dadurch ab.

Diese Fakten sorgt regelmäßig für kontroverse Diskussionen, selbst unter Fachleuten. Denn natürlich behauptet jeder von sich, er arbeite mit positiver Verstärkung und kaum jemand würde von sich sagen, dass sein Trainingswerkzeug die negative Verstärkung ist. Denn die Bezeichnungen positiv und negativ wecken in fast jedem zunächst einmal emotionale Wertvorstellungen, während es sich eigentlich um eine sachliche Beschreibung der Trainingsform handelt. Zwar wird bei der negativen Verstärkung durchaus mit einem unangenehmen Reiz gearbeitet, das heißt jedoch nicht, dass diese Form der Verstärkung grundsätzlich abzulehnen ist, genauso wie die positive Verstärkung nicht grundsätzlich auch nur angenehm für das Pferd sein muss. Vielmehr gilt es, die Formen der operanten Konditionierung zu verstehen und das Training so entsprechend zu gestalten, damit das Lernen so angenehm wie möglich gestaltet werden kann.

» Weiter zu Teil 6 – Positive Verstärkung