Operáns kondicionálás

Szerző: Leandro Alegsa

20-06-2021 21:14

Az operáns kondicionálás a tanulás egyik formája. Ebben az egyén a viselkedés következményei (eredményei) miatt változtatja meg a viselkedését.

A személy vagy állat megtanulja, hogy viselkedésének következménye van. Ez a következmény lehet

Megerősítés: pozitív vagy jutalmazó esemény. Ennek hatására a viselkedés gyakrabban fordul elő
Büntetés: negatív vagy büntető esemény. Ennek hatására a viselkedés ritkábban fordul elő
Kihalás: nem következik esemény, így a viselkedésnek nincs következménye. Ha egy viselkedésnek nincsenek következményei, akkor ritkábban fordul elő.

Az operáns kondicionálásban négy különböző kontextus létezik. Itt a "pozitív" és a "negatív" kifejezések nem az alapvető jelentésükben használatosak; a pozitív azt jelenti, hogy valamit hozzáadunk, a negatív pedig azt, hogy valamit elveszünk:

Pozitív megerősítésről (gyakran csak "megerősítés") akkor beszélünk, ha egy viselkedésformáért jutalom jár. Ez növeli a viselkedés gyakoriságát. A Skinner-féle dobozkísérletben a jutalom étel formájában jelenik meg, amikor a patkány megnyom egy kart.
A negatív megerősítés (néha "menekülés") akkor következik be, amikor egy averzív inger eltávolításra kerül. Ez növeli a viselkedés előfordulásának gyakoriságát. A Skinner-doboz kísérletben hangos zaj volt, amelyet akkor távolítottak el, amikor a patkány megnyomta a kart.
Pozitív büntetésről akkor beszélünk, ha olyan inger kerül be a viselkedésbe, amelynek hatására a viselkedés ritkábban fordul elő. Ilyen inger lehet például a hangos zaj, az áramütés (patkány) vagy a verés (gyermek).
Negatív büntetésről akkor beszélünk, amikor egy inger elvonásra kerül, ami azt eredményezi, hogy a viselkedés ritkábban fordul elő. Erre példa lehet, hogy a gyermek játékát elveszik, miután a gyermek egy nemkívánatos viselkedést tanúsít.

Az operáns kondicionálás gondolatát először Edward Thorndike fedezte fel, és B. F. Skinner elemezte.

Az operáns kondicionálás különbözik a Pavlov-féle klasszikus kondicionálástól. Az operáns kondicionálás a viselkedés önkéntes megváltoztatásával foglalkozik, a klasszikus kondicionálás a reflex kiképzésével.

Thorndike hatás törvénye

Az operáns kondicionálást, amelyet néha instrumentális tanulásnak is neveznek, először Edward L. Thorndike (1874-1949) tanulmányozta. Megfigyelte a macskák viselkedését, amint megpróbáltak kiszabadulni az otthon készített kirakós dobozokból. Amikor először tették a dobozokba, a macskáknak sokáig tartott, amíg megszöktek. A tapasztalattal egyre gyakrabban fordultak elő sikeres válaszok, így a macskák kevesebb idő alatt tudtak megszökni. A hatás törvényében Thorndike elmélete szerint a kielégítő következményekkel járó viselkedések hajlamosak a megismétlődésre, míg a kellemetlen következményekkel járó viselkedések kevésbé valószínű, hogy megismétlődnek. Röviden, bizonyos következmények erősítették a viselkedést, bizonyos következmények pedig gyengítették a viselkedést. Thorndike ezzel az eljárással állította elő az első ismert tanulási görbéket.

B. F. Skinner (1904-1990) az operáns kondicionálás részletesebb elemzését dolgozta ki. Skinner találta fel az operáns kondicionáló kamrát, amely lehetővé tette számára, hogy mérje a válaszadási sebességet, mint kulcsfontosságú függő változót. A karok lenyomásának vagy a billentyűcsapásoknak a rögzítését használta.

Az operáns kondicionálás alapelvei:

Megkülönböztetés, általánosítás és a kontextus fontossága.

A tanulás kontextusban történik.
A legtöbb viselkedés ingerkontroll alatt áll: egy adott válasz csak akkor lép fel, ha megfelelő inger van jelen.
Az ingerkontroll akkor is hatékony, ha az inger nem jelent semmit a válaszadó számára.

Kihalás: az operáns viselkedés kihaláson megy keresztül, amikor a megerősítés megszűnik.

A megerősítések csak akkor következnek be, ha a megfelelő válaszadás megtörtént, és még akkor sem biztos, hogy bekövetkezik. A viselkedések emiatt nem gyengülnek és nem olvadnak ki.
Az eredmények részben attól függnek, hogy milyen gyakran kapnak megerősítést.

A megerősítés ütemezése: a megerősítések időzítése döntő fontosságú.

Rögzített intervallumú menetrend: a megerősítőket meghatározott időközönként adják, feltéve, hogy a megfelelő válaszadás megtörténik.
Változó intervallumú ütemezés: a viselkedés megerősítése az utolsó megerősítés óta eltelt átlagos idő alapján történik. Arányos ütemezés: a megerősítésekre adott válaszok arányán alapul.
Rögzített intervallumú menetrend: a megerősítés meghatározott számú válaszadás után történik. Azt a speciális esetet, amikor a megerősítést minden egyes válasz után adjuk, folyamatos megerősítésnek nevezzük.
Változó időközönkénti ütemezés: a szállítási megerősítés a válaszok egy adott átlagos számán alapul.

Kérdések és válaszok

K: Mi az operáns kondicionálás?

V: Az operáns kondicionálás a tanulás egy olyan formája, amelyben az egyén megváltoztatja a viselkedését a viselkedés következményei (eredményei) miatt.

K: Mi az operáns kondicionálás négy összefüggése?

V: Az operáns kondicionálás négy kontextusa a pozitív megerősítés, a negatív megerősítés, a pozitív büntetés és a negatív büntetés.

K: Hogyan működik a pozitív megerősítés?

V: Pozitív megerősítésről akkor beszélünk, ha egy viselkedésforma jutalomban részesül, ami növeli a viselkedés előfordulásának gyakoriságát.

K: Hogyan működik a negatív megerősítés?

V: Negatív megerősítés akkor következik be, amikor egy visszataszító ingert távolítanak el, ami növeli a viselkedés előfordulási gyakoriságát.

K: Hogyan működik a pozitív büntetés?

V: Pozitív büntetésről akkor van szó, amikor egy inger kerül hozzáadásra, aminek következtében a viselkedés ritkábban fordul elő.
K: Hogyan működik a negatív büntetés? V: Negatív büntetés akkor történik, amikor egy ingert elveszünk, ami azt eredményezi, hogy a viselkedés ritkábban fordul elő.

K: Ki fedezte fel először az operáns kondicionálást?

V: Edward Thorndike fedezte fel először az operáns kondicionálást, amelyet később B. F. Skinner elemzett.

Keres