Lernen am Erfolg (oder: Operante Konditionierung)

Vertreter

E. L. Thorndike

Thorndike entdeckt und beschreibt mithilfe seiner Katzenversuche des Prinzip des Lernens durch Irrtum und Erfolg. Er sperrt eine Katze in einen Käfig und wartet, bis die Katze die Katze zufälligerweise auf einen bestimmten Hebel drückt. Dann öffnet sich die Käfigtür und die Katze kommt ins Freie. Wenn die Katze wieder in den Käfig gesperrt wird, wird es sehr viel schneller gehen, bis sie wieder auf den Hebel drückt, um so ins Freie zu gelangen. Nach einigen Versuchen hat die Katze gelernt, sofort, wenn sie in den Käfig gesperrt wird, auf den Hebel zu drücken.

Das Thorndiksche Lerngesetz heißt demzufolge: 

Verhaltensweise, die zunächst zufälligerweise auftreten, die aber erfolgreich sind, werden in Zukunft sehr viel häufiger gezeigt. Der Erfolg verstärkt ein bestimmtes Verhalten.

Damit kommen - im Unterschied zur Klassischen Operationalisierung - zum ersten Mal die Folgen eines Verhaltens mit ins Spiel, wenn es um die Bedeutung von Lernen geht.

 

F. B. Skinner (1904 - 1994)

F. B. Skinner ist ein einflussreicher Anhänger einer extrem behavioristischen Anschauungsweise.

Skinner beschäftigte sich ursprünglich mit der Frage, unter welchen Bedingungen Tiere (Ratten, Tauben) verschiedene Verhaltensweisen am schnellsten und dauerhaftesten lernen. Anschließend bemüht er sich um eine allgemein gültige Lerntheorie. Seine Vorstellungen von einer durch eine wissenschaftliche Psychologie geprägten Gesellschaft veröffentlicht er auch in Science Fiction Romanen (v. a. Futurum II).

Skinner ist einer der härtesten und der verbittertsten Gegner einer kognitiven Psychologie, die in ihren Theorien Erlebenselemente berücksichtigt, und hälöt bis an sein Lebensende am - inzwischen längst überholten - Black-Box-Modell fest.

 

 

Das Lernprinzip der operanten Konditionierung

Grundidee: Die Konsequenzen, die ein Verhalten nach sich zieht, 

 

 

bestimmen die zukünftige Auftretenswahrscheinlichkeit dieses Verhaltens. 


Verhalten, das positive Konsequenzen nach sich zieht (= das positiv verstärkt wird), wird in Zukunft häufiger gezeigt. 
Verhalten, das keine positiven Konsequenzen nach sich zieht (=das nicht positiv verstärkt wird; das ignoriert wird), wird in Zukunft seltener gezeigt. 
Bestrafung führt allerdings nicht zum Erfolg. Es führt nicht dazu, dass erwünschtes V

erhalten aufgebaut wird, sondern nur dazu, dass unerwünschtes Verhalten unterdrückt wird.

ein Beispiel:


Skinner arbeitet mit unterschiedlichen Tieren, beispielsweise mit Ta

uben. Er bringt Tieren sehr komplexe Verhaltensabläufe bei, in dem er Schritt für Schritt jedes Verhalten systematisch verstärkt, das in Richtung "definiertes Zielverhalten" geht. Beispielsweise lehrt er seine Tauben, auf einem Bein rund um ein Wasserbecken zu "tanzen", dann umzudrehen und zurückzutanzen.

 

Der Prozess der Operanten Konditionierung

Systematisch dargelegt geht Skinner folgendermaßen vor.

  1. Er definiert ein Zielverhalten
  2. Immer wenn die Taube zufälligerweise ein Verhalten zeigt, das in Richtung Zielverhalten geht (also zum Beispiel auf einem Bein steht), wird sie sofort mit einer Futterpille verstärkt (belohnt).
  3. Schließlich erhält die Taube nur noch dann die Belohnung, wenn sie verschiedene vorher erlernte Verhaltensweisen in einer bestimmten Reihenfolge miteinander verknüpft.
  4. Wenn das Zielverhalten erreicht wird, wird die systematische Verstärkung eingestellt. Anstelle dessen erfolgt eine variable Verstärkung. Das heißt, die Taube erhält nicht mehr jedesmal, wenn sie ums Becken hüpft, eine Belohnung, sondern nur noch jedes vierte Mal. Damit stabilisiert sich der Lernprozess viel stärker, als wenn das erlernte Verhalten jedesmal verstärkt würde.

 

Grundprinzipien der Operanten Konditinierung

Die Theorie des Modell-Lernens lässt sich schematisch - im Rahmen des Black-Box-Modells - so darstellen:

V1
Taube steht 
auf einem Bein
K
Futterpille
BLACKBOX V2:
häufigeres Auftreten
dieses Verhaltens

 

Der Aufbau erwünschter Verhaltensweisen erfolgt über konstante Verstärkung (=systemat(=systematisches Einsetzen von positiven Konsequenzen; Futterpillen; Token)

Die Stabilisierung bereits gelernter Verhaltensweise erfolgt übervariable Verstärkung (unregelmäßiges Einsetzen von positiven Konsequenzen)

 

Der Abbau unerwünschter Verhaltensweisen erfolgt über konsequentes Ignorieren oder systematischen Verstärkerentzugund über die Verstärkung alternativer Verhaltensweisen.

 

Bestrafung (negative Konsequenzen auf ein unerwünschtes Verhalten) wird abgelehnt, weil es nach Ansicht Skinners nicht zum Erfolg führt (und nicht etwas aus ethischen Gründen)

 

Etwas missverständlich ist noch die Unterscheidung zwischen positiven und negativen Verstärkern
Ein positiver Verstärker ist eine angenehme Konsequenz, die auf ein erwünschtes Verhalten folgt (also z. B. ein Lob)
Ein negativer Verstärker ist die Beendigung eines unangenehmen Zustandes, der auf das erwünschte Verhalten folgt (klassisches Beispiel wäre ein unangenehmer Signalton, der beim Autofahren dann verlöscht, wenn der Sicherheitsgurt angelegt wird.)

 

Filmbeispiel: Skinners Taubenversuche

A1W: Erkläre,

  • was Skinner in diesem Experiment untersucht (Forschungshypothese)
  • wie er seine Taubenversuche aufbaut (Experiment-Design)
  • zu welchen Ergebnissen Skinner in seinem Experiment kommt
  • wie Skinner den Begriff "reinforcment" (Verstärkung) benutzt und was er darunter versteht. Erkläre in diesem Zusammenhang die Grundbegriffe "positive Verstärkung", "negative Verstärkung", "variable Verstärkung", "konstante Verstärkung"      

Arbeitsaufgaben und Diskussion

Das Prinzip der Operanten Konditionierung in der Praxis

 

A2R/T: Wie sind die folgenden Situationen aus der Perspektive operanter Konditionierung zu beurteilen?

 

 

Bsp. 1. Mutter und Kind im Supermarkt: Das Kind möchte unbedingt eine Süßigkeit, die Mutter lehnt diesen Wunsch zunächst ab. Weil das Kind aber nicht aufhört zu quengeln und die Leute sich schon umdrehen, gibt die Mutter schließlich nach: Das Kind erhält die gewünschte Süßigkeit.

Bsp. 2. In einer Volksschulklasse erarbeitet der Lehrer mit den Schülern ein bestimmtes Problemgebiet. Ein Schülerin zeigt mehrmals auf, wird vom Lehrer aber nicht drangenommen. Die Schülerin beginnt daraufhin zu stören. Der Lehrer wird auf sie aufmerksam und ermahnt sie.

Bsp. 3. Ein Lehrer / Eltern nehmen die positiven Leistungen eines Schülers kommentarlos zur Kenntnis. Wenn die Leistungen den Erwartungen aber nicht entsprechen, wird er kritisiert.

Bsp. 4. Wenn die Hauskatze am wertvollen Perserteppich kratzt, wird sie sofort vor die Tür gesetzt. Die Hauskatze beginnt daraufhin, am Teppich zu kratzen, wenn sie die Wohnung verlassen will.


 

Diskussion

 

A3R: Im Rahmen der operanten Konditionierung wird Strafe (=negative Konsequenz auf unerwünschtes Verhalten) als Mittel zum Aufbau von bestimmten Verhaltensweisen abgelehnt. Warum wohl? Wie wirken Strafen häufig?

 

A4R: Wann ist Verstärkung wirkungsvoller: Wenn sie immer (konstant) erfolgt, oder wenn sie nur ab und zu (variabel) erfolgt? Welche Schlussfolgerungen ließen sich dadurch ableiten.

 

A5T: Lassen sich aus den Prinzipien der Operanten Konditionierung sinnvolle Erziehungsprinzipien ableiten? Welche?

 

A6R: Ein Vorwurf an Vertreter Operanter Konditionierungstheorien war immer, dass sie Erziehung mit Dressur verwechseln würden. Ist dieser Vorwurf berechtigt? Inwiefern (nicht)?

 

A7R: Interpretiere das beigfügte Cartoon: Wer hat was gelernt? Was sind Beispiele aus der Lernpraxis (im Umgang mit Kindern oder mit Haustieren), an denen sich "umgekehrte Lernprozesse" und "ungewollte Lernprozesse" zeigen lassen?

 

 

Internetlinks