Cum funcționează programele de armare

Condiționarea operatorului este un proces de învățare în care noile comportamente sunt dobândite și modificate prin asocierea lor cu consecințe. Consolidarea unui comportament mărește probabilitatea ca acesta să apară din nou în viitor, în timp ce pedepsirea unui comportament scade probabilitatea ca acesta să se repete.

În condiționarea operantului, programele de întărire sunt o componentă importantă a procesului de învățare. Când și cât de des întăresc un comportament poate avea un impact dramatic asupra puterii și ratei răspunsului.

Cele 3 teorii majore ale învățării

Program de armare

Un program de întărire este, în principiu, o regulă care precizează ce cazuri de comportament vor fi întărite. În unele cazuri, un comportament ar putea fi întărit de fiecare dată când apare. Uneori, un comportament ar putea să nu fie întărit deloc.

Fie armarea pozitivă, fie armarea negativă pot fi folosite ca parte a condiționării condiționate. În ambele cazuri, obiectivul de consolidare este acela de a întări un comportament astfel încât acesta să apară probabil din nou.

Planurile de întărire au loc atât în situații de învățare apărute în mod natural, cât și în situații de formare mai structurate.

În situațiile din lumea reală, probabil că comportamentele nu vor fi întărite ori de câte ori apar. În situațiile în care încercați în mod intenționat să consolidați o anumită acțiune (cum ar fi în școală, sport sau în formarea animalelor), urmați un program specific de întărire.

Unele programe sunt mai potrivite pentru anumite tipuri de situații de formare. În unele cazuri, antrenamentul ar putea solicita un program și apoi să treacă la altul după ce a fost predat comportamentul dorit.

Cele două forme fundamentale ale programelor de întărire sunt denumite întărirea continuă și armare parțială.

Amplificare continuă

În armarea continuă, comportamentul dorit este întărit de fiecare dată când are loc. Acest program este cel mai bine folosit în timpul etapelor inițiale de învățare pentru a crea o asociere puternică între comportament și răspuns.

Imaginați-vă, de exemplu, că încercați să învățați un câine să vă scuture mâna. În timpul etapelor inițiale de învățare, veți respecta un program de întărire continuă pentru a învăța și a stabili comportamentul.

Aceasta ar putea implica apucarea labei câinelui, tremurând-o, spunând "se agită" și apoi oferind o recompensă la fiecare realizare a acestor pași. În cele din urmă, câinele va începe să efectueze singură acțiunea.

Programele de întărire continuă sunt cele mai eficiente atunci când încearcă să predea un nou comportament. Acesta denotă un model la care fiecare răspuns precis definit este urmat de o consecință definită strict.

Amenajarea parțială

Odată ce răspunsul este stabilit cu fermitate, un program de întărire continuă este de obicei schimbat la un program de armare parțială.

În armarea parțială (sau intermitentă), răspunsul este întărit doar o parte din timp. Comportamentele învățate sunt dobândite mai lent cu armare parțială, dar răspunsul este mai rezistent la dispariție.

Gândiți-vă la exemplul anterior în care ați fost pregătiți un câine să se agită și. În timp ce inițial ați folosit întărirea continuă, consolidarea comportamentului de fiecare dată este pur și simplu nerealistă. În timp, ați trece la un program parțial pentru a oferi o armare suplimentară odată ce comportamentul a fost stabilit sau după ce a trecut un timp considerabil.

Există patru programe de armare parțială:

Rapoarte fixe

Note fixesunt cele în care un răspuns este întărit numai după un anumit număr de răspunsuri. Acest program produce o rată ridicată și constantă de răspuns, cu o scurtă pauză după livrarea armatorului.

Un exemplu de schemă cu raport fix ar fi furnizarea unei pelete de hrană unui șobolan după ce apasă o bară de cinci ori.

Variabile-Ratio Schedule

Scheme cu raportare variabilăapare atunci când răspunsul este întărit după un număr imprevizibil de răspunsuri. Acest program creează o rată constantă de răspuns. Jocurile de noroc și jocurile de loterie reprezintă exemple bune ale unei recompense bazate pe un program de variabilă a raportului.

În cadrul unei setări de laborator, acest lucru ar putea implica furnizarea de pelete alimentare la un șobolan după o presare pe bară, din nou după patru prese de bara și apoi din nou după două prese de bar.

Intervale fixe

Intervalele cu intervale fixe sunt cele în care primul răspuns este recompensat numai după ce a trecut o anumită perioadă de timp. Acest program generează cantități mari de răspuns în apropierea sfârșitului intervalului, dar reacționează mult mai lent imediat după livrarea armatorului.

Un exemplu de acest lucru într-o setare de laborator ar fi consolidarea unui șobolan cu o peletă de laborator pentru prima presă de bare după ce a trecut un interval de 30 de secunde.

Scheme cu intervale variabile

Programele de intervale variabile apar atunci când un răspuns este recompensat după ce a trecut o perioadă de timp imprevizibilă. Acest program produce o rată lentă și constantă de răspuns.

Un exemplu în acest sens ar fi furnizarea unei pelete alimentare la un șobolan după prima presare de bare după un interval de un minut; o a doua peletă pentru primul răspuns după un interval de cinci minute; și o a treia peletă pentru primul răspuns după un interval de trei minute.

Utilizând programul corespunzător

Deciderea momentului de consolidare a unui comportament poate depinde de o serie de factori. În cazurile în care încerci să înveți un comportament nou, un program continuu este adesea o alegere bună. Odată ce comportamentul a fost învățat, este de preferat trecerea la un program parțial.

În viața de zi cu zi, programele parțiale de întărire apar mai frecvent decât cele continue. De exemplu, imaginați-vă dacă ați primit o recompensă de fiecare dată când ați apărut pentru a lucra la timp. Cu timpul, în loc ca recompensa să fie o întărire pozitivă, negarea recompensei ar putea fi privită ca o întărire negativă.

În schimb, recompensele ca acestea sunt, de obicei, făcute pe un program de întărire parțială mai puțin previzibil. Nu numai că acestea sunt mult mai realiste, dar, de asemenea, ele tind să producă rate de răspuns mai ridicate, fiind în același timp mai puțin susceptibile la dispariție.

Schemele parțiale reduc riscul de satializare odată ce a fost stabilit un comportament. Dacă se acordă o recompensă fără sfârșit, subiectul poate să nu mai efectueze comportamentul dacă recompensa nu mai este dorită sau necesară.

De exemplu, imaginați-vă că încercați să învățați un câine să stea. Dacă folosiți alimente ca recompensă de fiecare dată, câinele se poate opri din momentul în care este plin. În astfel de cazuri, ceva de genul laudă sau atenție poate fi mai eficient în consolidarea unui comportament deja stabilit.

Ce este o armă secundară?

Un cuvânt de la Verywell

Condiționarea operatorului poate fi un instrument puternic de învățare. Schema de întărire utilizată în timpul procesului de instruire și întreținere poate avea o influență majoră asupra cât de rapid este dobândit un comportament, puterea răspunsului și cât de frecvent este afișat comportamentul.

Pentru a determina ce programare este preferabil, trebuie să luați în considerare diferite aspecte ale situației, inclusiv tipul de comportament care este predat și tipul de răspuns dorit.

Modul în care armarea socială influențează comportamentul