Az operáns kondicionálás a tanulás egyik alapvető formája: az egyén viselkedését annak következményei alakítják. Másképp fogalmazva, a cselekvések valószínűségét növelhetik vagy csökkenthetik azok következményei.
Alapfogalmak
A viselkedés következményeit három nagy kategóriába soroljuk:
- Megerősítés: olyan esemény vagy inger, amely után a viselkedés gyakrabban fordul elő. Lehet pozitív (valami hozzáadása, jutalom) vagy negatív (valami kellemetlen eltávolítása).
- Büntetés: olyan esemény vagy inger, amely után a viselkedés ritkábban fordul elő. Itt is beszélhetünk pozitív (valami hozzáadása, pl. kellemetlen inger) és negatív (valami elvétele, pl. jutalomvonás) büntetésről.
- Kihalás: ha a viselkedéshez nem kapcsolódik többé következmény, a viselkedés előfordulása általában csökken.
A „pozitív” és „negatív” kifejezések jelentése
Itt a pozitív és negatív nem erkölcsi minősítést jelölnek, hanem műveleti jelentést: pozitív = valami hozzáadása, negatív = valami elvétele. Példák:
- Pozitív megerősítés: egy viselkedés következményeként jutalom jár, ezért a viselkedés gyakorisága nő. A Skinner-doboz kísérleteiben ez gyakran étel volt, amely akkor jelent meg, amikor a patkány megnyomott egy kart.
- Negatív megerősítés: amikor egy averzív (kellemetlen) inger eltávolításával növeljük a viselkedés valószínűségét — például a zaj megszűnik, ha az állat egy gombot megnyom. (Ezt gyakran a menekülés vagy kerülés motiválja.)
- Pozitív büntetés: egy nemkívánatos inger hozzáadása, ami csökkenti a viselkedés előfordulását (például hangos zaj, enyhe áramütés az állatoknál vagy fizikai büntetés emberi példákban). A példa a helytelenül alkalmazott fegyelmezésre hívja fel a figyelmet: verés mint nemkívánatos módszer.
- Negatív büntetés: egy kellemes inger elvétele (például játék elvétele a gyerektől), ami szintén csökkenti a nemkívánatos viselkedést.
Történeti háttér
Az operáns kondicionálás gondolatát először Edward Thorndike fogalmazta meg a „hatás törvénye” (law of effect) keretében, amely szerint a jutalommal követett viselkedés megerősödik. B. F. Skinner továbbfejlesztette és kísérleti vizsgálatokkal (Skinner-doboz) részletezte az elméletet.
Fontos jelenségek és fogalmak
- Kihalás (extinction): ha a megerősítést megszüntetik, a viselkedés lassan csökken. Előfordulhat spontán visszatérés (spontaneous recovery), amikor a viselkedés rövid időre újra megjelenik.
- Általánosítás és diszkrimináció: az egyén megtanulhat hasonló ingerekre hasonló módon reagálni (általánosítás), illetve megkülönböztetni, mikor érdemes reagálni (diszkrimináció).
- Formálás (shaping): összetett viselkedések tanítása lépésről lépésre történik: a közelítő válaszokat megerősítve alakítják ki a célviselkedést.
- Láncolás (chaining): több egymásra épülő válasz megtanítása úgy, hogy minden elem megerősíti a következőt, végül az egész sorozat önmagában jutalmat hoz.
- Szekunder (feltételes) megerősítők: olyan ingerek (pl. pénz, dicséret), amelyek maguk nem elsődleges szükségletek, de társítás útján megerősítővé válnak.
Megerősítési ütemtervek
A megerősítés gyakorisága és időzítése döntő hatású a tanulásra. A fő típusok:
- Fix arány (Fixed Ratio, FR): meghatározott számú válasz után jár jutalom (pl. minden 10. sikeres eladás után bónusz). Gyors, magas reagálási arányt eredményez, de pihenőszakaszok is előfordulhatnak a jutalom után.
- Változó arány (Variable Ratio, VR): változó számú válasz után érkezik a jutalom (pl. nyerőgépek működése). Nagyon kitartó, magas válaszadási szintet hoz létre, mert a jutalom kiszámíthatatlan.
- Fix időköz (Fixed Interval, FI): az első válasz egy adott idő után jutalmazott (pl. fizetés két hetente). Reagálási csúcsok jelenhetnek meg a mérési időpont közeledtével.
- Változó időköz (Variable Interval, VI): a jutalom kiszámíthatatlan időintervallumok után érkezik. Folyamatos, stabil válaszadást eredményez.
Gyakorlati alkalmazások
Az operáns kondicionálás elveit széles körben alkalmazzák:
- Oktatás: pozitív megerősítés (dicséret, pontok) a motiváció növelésére, valamint formálás bonyolultabb készségek tanításához.
- Állattréning: célzott megerősítéssel új viselkedések megtanítása (pl. kutyák jutalomfalatért végzett trükkjei).
- Viselkedésterápia: nemkívánatos viselkedések csökkentése büntetés nélkül, megerősítési stratégiákkal (pl. tokenrendszerek, pótló jutalmazás).
- Munkaszervezés és gazdaság: ösztönző rendszerek tervezése (bónuszok, teljesítmény-alapú fizetés).
Etikai megfontolások
A büntetés alkalmazása különös óvatosságot igényel: gyakran rövid távon működik, de mellékhatásokkal járhat (félelem, agresszió, elkerülés, csökkent motiváció). A modern gyakorlatban a szakemberek általában a megerősítésen alapuló, kevésbé aversív módszereket részesítik előnyben.
Operáns vs. klasszikus kondicionálás
Az operáns kondicionálás más, mint a Pavlov-féle klasszikus kondicionálás: az előbbi a viselkedés következményeire épül (önkéntes válaszok alakítása), míg az utóbbi a reflex típusú válaszokhoz kapcsolt ingerek párosítására (feltételes reflexek kialakítása).
Összegzés
Az operáns kondicionálás kulcsfogalmai — megerősítés, büntetés, kihalás, formálás és a megerősítési ütemtervek — segítenek megérteni, hogyan tanulunk és hogyan lehet viselkedést megváltoztatni. Az elmélet gyakorlati alkalmazásai szerteágazóak, de hatékonyságuk növelése és etikus használata megfontolást igényel.