Vad är Operant Conditioning och hur fungerar det?

Operant konditionering (ibland kallad instrumentell konditionering) är en metod för inlärning som sker genom belöningar och bestraffningar för beteende. Genom operant konditionering skapas en koppling mellan ett beteende och en följd av det beteendet.

Till exempel, när ett labbrottryck trycker en blå knapp får han en matpellet som en belöning, men när han trycker på den röda knappen får han en mild elektrisk chock. Som ett resultat lär han sig att trycka på den blå knappen men undvika den röda knappen.

Men operant konditionering är inte bara något som äger rum i experimentella inställningar under träning av labbdjur; Det spelar också en stark roll i vardagslärandet. Förstärkning och bestraffning sker nästan varje dag i naturliga inställningar såväl som i mer strukturerade inställningar som klassrummet eller terapisessionerna.

Låt oss ta en närmare titt på hur operant konditionering upptäcktes, vilken inverkan den hade på psykologin, och hur den används för att förändra gammalt beteende och undervisa nya.

Operatorkonditionens historia

Operant konditionering gjordes av behaviorist B.F. Skinner, varför du ibland kan höra det kallas skinnerian konditionering. Som en behaviorist trodde Skinner att det inte var nödvändigt att titta på interna tankar och motivationer för att förklara beteendet. I stället föreslog han att vi bara skulle titta på de yttre, observerbara orsakerna till mänskligt beteende.

Genom den första delen av 1900-talet hade behaviorism blivit en viktig styrka inom psykologin. John B. Watsons idéer dominerade denna tankeskola tidigt. Watson fokuserade på principerna om klassisk konditionering, en gång berömd att han kunde ta någon oavsett bakgrund och träna dem för att vara allt han valde.

Där de tidiga behavioristerna hade fokuserat sina intressen på associativt lärande var Skinner mer intresserad av hur konsekvenser av människors handlingar påverkat deras beteende.

Skinner använde termen operant att hänvisa till något "aktivt beteende som verkar på miljön för att generera konsekvenser". Med andra ord förklarade Skinner teori hur vi förvärvar utbudet av lärda beteenden som vi uppvisar varje dag.

Hans teori var starkt påverkad av psykologens arbete Edward Thorndike, som föreslog vad han kallade effektlagen. Enligt denna princip är åtgärder som följs av önskvärda resultat mer benägna att upprepas medan de som följs av oönskade utfall är mindre benägna att upprepas.

Operant conditioning bygger på en ganska enkel premiss - åtgärder som följs av förstärkning kommer att stärkas och sannolikt kommer att uppstå igen i framtiden. Om du berättar en rolig historia i klassen och alla skrattar, kommer du troligen att vara mer benägna att berätta om den här historien igen i framtiden. Om du lyfter din hand för att ställa en fråga och din lärare berömmer ditt artiga beteende, kommer du troligen att höja din hand nästa gång du har en fråga eller en kommentar. Eftersom beteendet följdes av förstärkning eller ett önskvärt resultat förstärks de föregående åtgärderna.

Omvänt kommer åtgärder som leder till straff eller oönskade konsekvenser att försvagas och mindre sannolikt kommer att uppstå igen i framtiden. Om du berättar samma historia igen i en annan klass men ingen skrattar den här gången kommer du att vara mindre benägna att upprepa historien igen i framtiden. Om du råkar ut ett svar i klassen och din lärare skäller dig, kanske du är mindre benägna att avbryta klassen igen.

Typer av beteenden

Skinner skiljer sig mellan två olika typer av beteenden

Respondent behaviors är de som sker automatiskt och reflexivt, till exempel att dra handen tillbaka från en het spis eller rycka på benet när läkaren tappar på knäet. Du behöver inte lära dig dessa beteenden, de sker helt enkelt automatiskt och ofrivilligt.
Operantbeteenden, å andra sidan är de under vår medvetna kontroll. Vissa kan inträffa spontant och andra med avsikt, men det är följderna av dessa handlingar som sedan påverkar huruvida de uppstår igen i framtiden. Våra åtgärder på miljön och konsekvenserna av den åtgärden utgör en viktig del av lärandeprocessen.

Medan klassisk konditionering kunde svara för respondentbeteenden insåg Skinner att det inte kunde utgöra en hel del lärande. I stället föreslog Skinner att operant konditionering höll mycket större betydelse.

Skinner uppfann olika enheter under hans pojke och han satte dessa färdigheter i arbete under sina studier om operant konditionering.

Han skapade en enhet som kallas en operant konditionering kammare, som oftast kallas idag som en Skinner box. Kammaren var i huvudsak en låda som kunde rymma ett litet djur, såsom en råtta eller duva. Lådan innehöll också en bar eller nyckel som djuret kunde trycka för att få en belöning.

För att spåra svar utvecklade Skinner också en enhet som kallas en kumulativ inspelare. Den inspelade anordningen svarar som en uppåtgående rörelse av en linje så att svarhastigheter kan läsas genom att titta på linjens lutning.

Komponenter av operantkonditionering

Det finns flera nyckelbegrepp i operantkonditionering.

Förstärkning i operativ kondisionering

Förstärkning är en händelse som förstärker eller ökar beteendet som följer. Det finns två typer av förstärkare:

Positiva förstärkare är gynnsamma händelser eller resultat som presenteras efter beteendet. I situationer som återspeglar positiv förstärkning stärks ett svar eller beteende genom att lägga till något, till exempel beröm eller en direkt belöning. Till exempel, om du gör ett bra jobb på jobbet och din chef ger dig en bonus.
Negativa förstärkare involvera avlägsnande av en ogynnsam händelse eller utfall efter visning av ett beteende. I dessa situationer förstärks ett svar genom att avlägsna något som anses vara obehagligt. Till exempel, om ditt barn börjar skrika mitt i mataffären, men slutar när du skaffar honom en behandling, kommer du mer sannolikt att skänka honom en behandling nästa gång han börjar skrika. Din åtgärd ledde till att det obehagliga tillståndet avlägsnades (barnet skriker), vilket förstärker ditt beteende negativt.

I båda dessa fall av förstärkning ökar beteendet.

Förstärkning i konditioneringsuppförande

Straffet i Operant Conditioning

Straff är en presentation av en biverkning eller ett resultat som orsakar en minskning av beteendet som följer. Det finns två typer av straff:

Positiv bestraffning, ibland kallad straff genom ansökan, presenterar en ogynnsam händelse eller ett resultat för att försvaga svaret som följer. Spanking för felbeteende är ett exempel på straff genom ansökan.
Negativ bestraffning, även känd som straff genom avlägsnande, inträffar när en gynnsam händelse eller ett resultat avlägsnas efter att ett beteende uppträder. Att ta bort ett barns videospel efter missuppförande är ett exempel på negativ straff.

I båda dessa fall av straff minskar beteendet.

Straffet och dess inverkan på beteende

Förstärkningsplaner

Förstärkning är inte nödvändigtvis en enkel process och det finns ett antal faktorer som kan påverka hur snabbt och hur bra nya saker lärs. Skinner fann det när och hur ofta beteenden förstärkt spelade en roll i förvärvets snabbhet och styrka. Med andra ord påverkar förstärkningens tid och frekvens hur nya beteenden lärdes och hur gamla beteenden ändrades.

Skinner identifierade flera olika scheman av förstärkning som påverkar operantkonditioneringsprocessen:

Kontinuerlig förstärkning innebär leverans en förstärkning varje gång ett svar inträffar. Inlärning tenderar att förekomma relativt snabbt, men svarfrekvensen är ganska låg. Utrotning sker också väldigt snabbt när förstärkning är stoppad.
Fast-förhållande scheman är en typ av partiell förstärkning. Svar förstärks först efter det att ett visst antal svar har inträffat. Detta leder vanligen till en ganska stabil svarfrekvens.
Fasta intervall scheman är en annan form av partiell förstärkning. Förstärkning sker först efter det att ett visst tidsintervall har förflutit. Svarsfrekvensen förblir ganska stabil och börjar öka när förstärkningstiden drar sig nära, men långsamt omedelbart efter det att förstärkningen har levererats.
Variabel-förhållande scheman är också en typ av partiell förstärkning som involverar förstärkning beteende efter ett varierat antal svar. Detta leder till både en hög responshastighet och långsam utrotningshastighet.
Variabelintervallscheman är den slutliga formen av partiell förstärkning Skinner beskriven. Detta schema innebär att man förstärker förstärkning efter att en varierad tid har gått. Detta tenderar också att leda till en snabb responshastighet och långsam utrotningshastighet.

Förstärkningsplaner och hur de fungerar

Exempel på operatorkonditionering

Vi kan hitta exempel på operant konditionering på jobbet runt omkring oss. Tänk på att barn fyller läxor för att tjäna en belöning från en förälder eller lärare, eller att anställda avslutar projekt för att få beröm eller kampanjer.

Några fler exempel på operantkonditionering i åtgärd:

Om ditt barn utspelar sig under en shoppingresa kan du ge honom en godis för att få honom att vara tyst. Eftersom du har positivt förstärkt den felaktiga beteendet kommer han troligen att vara mer sannolikt att agera ut igen i framtiden för att ta emot en annan behandling.
Efter att ha spelat i en gemenskapsteaterspel får du applåder från publiken. Detta fungerar som en positiv förstärkare som inspirerar dig att prova för mer prestanda roller.
Du tränar din hund för att hämta genom att erbjuda honom beröm och klappa på huvudet när han utför beteendet på rätt sätt.
En professor berättar eleverna att om de har perfekt deltagande hela termin, så behöver de inte ta den slutliga helhetsexamen. Genom att avlägsna en obehaglig stimulans (slutprovet) blir eleverna negativt förstärkta för att regelbundet delta i klassen.
Om du misslyckas med att lämna in ett projekt i tid, blir din chef arg och bereder din prestation framför dina medarbetare. Detta fungerar som en positiv straffare, vilket gör det mindre troligt att du kommer att slutföra projekt sent i framtiden.

En tonårsflicka rensar inte upp sitt rum när hon frågades, så hennes föräldrar tar bort sin telefon för resten av dagen. Detta är ett exempel på en negativ bestraffning, där en positiv stimulans tas bort.

I några av dessa exempel orsakar löftet eller möjligheten till belöningar en ökning av beteendet, men operant konditionering kan också användas för att minska ett beteende. Avlägsnandet av ett önskvärt resultat eller ett negativt resultat kan användas för att minska eller förebygga oönskade beteenden. Till exempel kan ett barn bli tillsagt att de kommer att förlora recess privilegier om de pratar om sin tur i klassen. Denna potential för straff kan leda till en minskning av störande beteenden.

Ett ord från Verywell

Även om behaviorism kan ha förlorat mycket av den dominans som den höll under den tidiga delen av 20-talet, är operant konditionering ett viktigt och ofta utnyttjat verktyg i inlärnings- och beteendemodifieringsprocessen. Ibland leder naturliga konsekvenser till förändringar i vårt beteende. I andra fall kan belöningar och straff bli medvetet utplånad för att skapa en förändring.

Operant konditionering är något som du genast kan känna igen i ditt eget liv, oavsett om det är i ditt förhållningssätt att lära ditt barn gott beteende eller träna familjen hunden för att sluta tugga på dina favorit tofflor. Det viktiga att komma ihåg är att med någon typ av lärande kan det ibland ta tid. Tänk på vilken typ av förstärkning eller bestraffning som kan fungera bäst för din unika situation och bedöma vilken typ av förstärkning schema som kan leda till bästa resultat.