Condizionamento Operante

Il condizionamento operante o strumentale è spiegato qui di seguito. Approfondisci i tuoi studi o scopri di cosa si tratta

Condizionamento Operante

L'APPRENDIMENTO

Introduzione - Tipi di apprendimento: condizionamento classico - condizionamento operante - apprendimento seriale - apprendimento cognitivo - altre forme di apprendimento

B) Il paradigma del condizionamento operante (o strumentale)

Ben presto, ci si rese conto che lo schema pavloviano non riusciva a dar ragione di come l’organismo concretamente operi, di come agisca nel e sul mondo, insomma di quelle sue attività spontanee e indipendenti da una specifica situazione-stimolo: tale schema, dunque, deve venir completato da un altro paradigma d'indagine dei comportamenti adattivi di un organismo, per quanto riguarda gli aspetti più propriamente attivi.

Thorndike, l’antesignano dell’ "indirizzo", descrisse (1931) a tal proposito due leggi dell’apprendimento:
- "legge dell’effetto": una risposta che determina un effetto piacevole tende a ripetersi, mentre una conseguenza spiacevole non favorisce la ripetizione della risposta;
- "legge dell’esercizio": la ripetizione di una risposta diventa sempre più probabile quanto più spesso viene ripetuta.

Pertanto, un comportamento può essere appreso più facilmente se vengono applicate le due leggi, ovvero: ripetendo risposte che ricevono ricompense si ottiene il massimo dell’apprendimento.
Thorndike (1911) studiò l’apprendimento nell’animale utilizzando gabbie dotate di vari strumenti che potessero consentire all’animale di uscirne. Dopo alcuni tentativi, l’animale imparava quale strumento utilizzare per uscire. L’interpretazione di questo tipo di apprendimento è che l’animale non arriva alla soluzione utilizzando il ragionamento, ma dopo un processo per tentativi ed errore.
Anche Thorndike utilizzava le regole dell’apprendimento per associazioni ma, visto che il comportamento dell’animale era strumentale alla ricerca di una ricompensa, lo descrisse appunto come "apprendimento strumentale". In questo modo, le risposte seguite da stati soddisfacenti diventano abitudini, mentre quelle che provocano stati fastidiosi vengono eliminate.

B. F. Skinner (1938) sviluppò queste osservazioni, inglobandole nella sua definizione di "condizionamento operante", riferendosi a una risposta emessa senza la necessità di uno stimolo che la possa attivare (come nel condizionamento classico), ma che è legata alla possibilità di ricevere, come visto, una ricompensa tale da stimolare un comportamento volontario, e quindi è acquisita in seguito all’azione del "rinforzo".
Mentre il condizionamento operante (dove la ricompensa o la punizione sono subordinate al verificarsi della risposta) funziona in forza della "legge dell’effetto", il condizionamento classico (dove lo stimolo incondizionato si verifica indipendentemente dal comportamento del soggetto) funziona - come visto - in forza della "legge di contiguità".
Infine, il condizionamento classico implica risposte involontarie, il cui controllo è affidato al Sistema Nervoso Autonomo, mentre il condizionamento operante è applicabile prevalentemente a risposte del sistema muscolare e di quello scheletrico o a processi mentali superiori per i quali interviene il Sistema Nervoso Centrale.
Skinner ideò una gabbia ("Skinner box"), in cui l’animale (un ratto) aveva a disposizione su una delle pareti una levetta, premendo la quale otteneva una risposta. Il comportamento emesso nella gabbia per ottenere un rinforzo venne chiamato appunto "operante".
Anche questo tipo di condizionamento è oggetto all’estinzione della risposta quando il rinforzo non segue più il comportamento.

I tre elementi di Skinner:
Studiando questo tipo di apprendimento, Skinner sviluppò delle definizioni operative che ruotano intorno a tre elementi:
a. "rinforzo" (o "rafforzatore"): il rinforzo viene definito come una condizione che aumenta la probabilità di quel tipo di risposta.

Esso può essere classificato secondo:
- la "valenza" sull’organismo: positivi/ricompensa, negativi/shock;
- i bisogni sui quali agisce: bisogni primari/rafforzatori primari, bisogni secondari/rafforzatori secondari;
- secondo la modalità di somministrazione: ratio parziale/continua.

I parametri del "rinforzo" sono, invece, 3:
- la quantità, per cui quanto maggiore è il rinforzo, tanto più rapida è la velocità di apprendimento;
- il tempo, per cui la ricompensa o la punizione raggiungono il massimo di efficacia quando sono immediate;
- la natura del rinforzo (cibo…).

In condizioni naturali, inoltre, uno stimolo originariamente indifferente può assumere caratteri di rinforzo se collegato con un rafforzatore efficace. Il nuovo rinforzo prodottosi viene chiamato "secondario"; esso dapprima agisce esclusivamente perché correlato al rinforzo primario, diventando in seguito indipendente da esso (esempio del denaro).

b. "punizione"
: si distingue il rinforzo negativo dalla punizione, in quanto il primo aumenta la probabilità che un comportamento si verifichi una volta che venga allontanato dalla situazione, mentre la punizione ha un’azione diretta sulla diminuzione del comportamento in atto.

c. "modellamento"
(o "shaping"): in quest'operazione, si premiano tutte le risposte che si avvicinano a quella desiderata, aumentando la ricompensa al progressivo avvicinamento alla risposta completa (ad es., nell’addestramento di animali da circo).

Da non dimenticare, infine, 2 fattori importanti in quanto facilitanti o inibenti l’apprendimento:
- il "transfer", che è l’influenza che l’apprendimento di un’attività esercita sull’apprendimento di un’altra attività;
- l’ "interferenza retroattiva", che è l’effetto che l’apprendimento successivo esercita sulla ritenzione dell’apprendimento precedente.

Un consiglio in più