BF Skinner: théorie du comportementalisme et du conditionnement opérant

Burrhus Frederic Skinner, mieux connu sous le nom de BF Skinner, était un psychologue américain connu pour ses contributions au développement de la théorie du behaviorisme et pour son roman utopique Walden Two (1948).

Le Behaviorism suppose que tous les comportements sont des réponses à certains stimuli de l'environnement, ou des conséquences de l'histoire de l'individu. Bien que les comportementalistes acceptent généralement le rôle important de l'héritage dans la détermination du comportement, ils se concentrent principalement sur les facteurs environnementaux.

Il est le psychologue le plus reconnu dans le courant du behaviorisme et sa théorie a été l'une des plus influentes en psychologie.

Né en Pennsylvanie en 1904, il commence à travailler ses idées sur le comportement humain après avoir obtenu son doctorat à Harvard. Les travaux de Skinner incluent The Behavior of Organisms (1938) et un roman basé sur ses théories, Walden Two (1948). Il a exploré le behaviorisme en relation avec la société dans des ouvrages ultérieurs, notamment Au-delà de la liberté et de la dignité humaine (1971).

En tant qu'étudiant au Hamilton College, Skinner a développé une passion pour l'écriture. Après avoir obtenu son diplôme en 1926, il essaya de devenir écrivain professionnel, mais obtint peu de succès. Deux ans plus tard, il a décidé de suivre une nouvelle direction pour sa vie. Il s'est inscrit à l'université de Harvard pour étudier la psychologie.

Skinner considérait le libre arbitre comme une illusion et l’action humaine comme dépendant des conséquences d’actes antérieurs. Si les conséquences sont mauvaises, il est fort probable que l’action ne se répète pas. Au contraire, si les conséquences sont bonnes, il est probable que l'action se répète. Skinner a appelé cela le principe de renforcement.

Pour renforcer le comportement, Skinner a utilisé le conditionnement opérant et pour l'étudier, il a inventé la chambre de conditionnement opérant, également appelée boîte de Skinner.

Dans les années 1920, Watson avait quitté la psychologie universitaire et d'autres comportementalistes commençaient à avoir de l'influence, proposant de nouvelles méthodes d'apprentissage en dehors du conditionnement classique.

La façon de penser de Skinner était légèrement moins extrême que celle de Watson. Skinner croyait que nous avions un esprit, mais qu'il était simplement plus productif d'étudier des comportements observables plutôt que des événements mentaux internes.

Introduction au comportementalisme

Le comportementalisme était le principal paradigme de la psychologie entre 1920 et 1950, fondé par John Watson et fondé sur la conviction que les comportements peuvent être mesurés, formés et modifiés. Le comportementalisme peut être résumé par la citation suivante de Watson, considéré comme le "père" de ce courant psychologique:

"Donnez-moi une douzaine d'enfants en bonne santé et bien éduqués, afin que je puisse les éduquer, et je promets d'en choisir un au hasard et de le former pour devenir un spécialiste de tout ce que je peux choisir: médecin, avocat, artiste, homme d'affaires, mendiant ou voleur, quels que soient son talent, ses inclinations, ses tendances, ses aptitudes, ses vocations et la race de ses ancêtres ".

John Watson, Behaviorism, 1930.

Selon les principes du behaviorisme, tous les comportements sont appris de l'environnement dans lequel nous grandissons. Les comportementalistes ne croyaient pas aux déterminations biologiques.

En outre, ils étaient principalement préoccupés par les comportements observables et estimaient qu’il n’y avait pas beaucoup de différence entre l’apprentissage chez l’homme et celui chez l’animal.

Comment le behaviorisme a-t-il commencé?

Le médecin russe Pavlov a été le premier à étudier les théories concernant le behaviorisme dans les années 1890. Le conditionnement classique pavlovien a été découvert par hasard, lorsqu'il a découvert, lors d'une expérience sur la digestion de ses chiens, qu'ils salivaient en entrant dans la pièce., sans même apporter de la nourriture avec lui.

En résumé, le conditionnement classique implique un apprentissage associant un stimulus non conditionné qui apporte par défaut une réponse dans l'organisme (par exemple un réflexe) à un nouveau stimulus, de sorte que ce dernier porte également la même réponse.

Cette théorie a ensuite été développée par Watson (1913), qui était le psychologue américain qui a fondé l'école psychologique comportementale, en publiant un article intitulé "La psychologie vue par un comportementaliste". Plus tard, il a conditionné un enfant à craindre un rat blanc.

Thorndike, psychologue et pédagogue américain, a formalisé le terme "loi d’effet" en 1905. En 1936, Skinner, le psychologue américain qui a constitué le véritable centre de cet article, a publié "Le comportement des organismes" et introduit les concepts de conditionnement opérant et de modélisation.

Comportementalisme selon Burrhus Frederic Skinner

Le travail de Skinner était fondé sur l'idée que le conditionnement classique était trop simple pour constituer une explication complète du comportement humain complexe. Skinner pensait que le meilleur moyen de comprendre le comportement humain était de vérifier les causes d’une action et ses conséquences. Il a appelé cette approche "conditionnement opérant".

Le conditionnement opérant a à voir avec le opérant: actions intentionnelles qui ont un effet sur l'environnement qui nous entoure. Skinner a commencé à identifier les processus qui rendaient plus ou moins probables la survenue de certains comportements opérants.

La théorie de Skinner sur le conditionnement opérant est basée sur les travaux de Thorndike (1905). Edward Thorndike a étudié l'apprentissage chez les animaux en utilisant une boîte à puzzle pour proposer la théorie connue sous le nom de "Loi de l'effet".

Le conditionnement opérant de Skinner

Comme nous l'avons dit, Skinner est considéré comme le père du conditionnement opérant, mais son travail est basé sur la loi de l'effet de Thorndike. Skinner a introduit un nouveau terme dans la loi d’effet: renforcement. Le comportement renforcé a tendance à se répéter; un comportement qui n'est pas renforcé a tendance à s'éteindre (s'affaiblit).

Skinner a étudié le conditionnement opérant en effectuant des expériences sur des animaux, qu'il a placés dans une "boîte à Skinner", similaire à la boîte à puzzle de Thorndike.

Skinner a inventé le terme «conditionnement opérant», qui implique de changer un comportement en utilisant des renforcements donnés après la réponse souhaitée. Skinner a identifié trois types de réponses ou d'opérandes pouvant suivre le comportement:

  • Opérateurs neutres. Ce sont des réponses de l'environnement qui n'augmentent ni ne diminuent la probabilité que le comportement se répète.
  • Ces réponses augmentent la probabilité que le comportement se répète. Les renforts peuvent être positifs ou négatifs.
  • Ce sont des réponses qui diminuent la probabilité qu'un comportement se répète; les punitions affaiblissent le comportement en question.

Nous avons tous connu des exemples de comportements affectés par des renforts et des punitions. Lorsque nous étions enfants, par exemple, si nous parlions en classe, l'enseignant nous disait de nous taire. Cette réponse de l'enseignant est une punition qui, du moins prétendument, devrait affaiblir le comportement de conversation avec le camarade de classe en classe.

À l'adolescence, par exemple, le port d'un style ou d'une marque de vêtement spécifique pourrait être renforcé de manière positive par des pairs du même âge, par le biais de flatteries, d'une acceptation sociale ou tout simplement d'un geste gentil. Cela renforce et incite davantage à répéter le comportement du port de vêtements de certaines marques.

Renforcement positif

Skinner a démontré comment le renforcement positif fonctionne en plaçant un rat affamé dans sa boîte Skinner. La boîte contenait un levier d'un côté et le rat, en se déplaçant à travers la boîte, appuyait accidentellement sur le levier. Immédiatement, un granule de nourriture est tombé dans un petit récipient à côté du levier.

Les rats ont vite appris à passer directement au levier après avoir été plusieurs fois dans la boîte. La conséquence de recevoir la nourriture s’ils appuyaient sur le levier leur permettait de répéter le comportement encore et encore.

Le renforcement positif renforce un comportement en fournissant une conséquence que la personne considère enrichissante. Par exemple, si votre enseignant vous donne de l'argent chaque fois que vous avez terminé vos devoirs, vous aurez plus de chances de répéter ce comportement, ce qui renforcera ce comportement.

Renforcement négatif

La suppression d'un renforcement désagréable peut également renforcer un certain comportement. C'est ce qu'on appelle le renforcement négatif, parce que l'élimination d'un stimulus indésirable est "gratifiante" pour la personne ou l'animal. Le renforcement négatif renforce le comportement car il arrête ou élimine une expérience désagréable.

Par exemple, lorsque vous avez mal à la tête, vous prenez une aspirine pour le soulager. Le fait que la douleur disparaisse est un facteur de renforcement négatif pour le comportement de prise d'aspirine, ce qui la rend plus susceptible de se reproduire à l'avenir lorsque vous avez mal à la tête.

Skinner étudia encore une fois le fonctionnement du renforcement négatif, plaçant un rat dans sa boîte de Skinner et l'exposant à un courant électrique désagréable qui le gênait un peu. Cette fois, le levier de la boîte a provoqué l'arrêt du courant électrique.

Les rats, d’abord, ont appuyé sur le levier par accident, mais ont vite appris à le presser pour arrêter le courant électrique. La conséquence de leur fuite dans le ruisseau leur permettait de répéter l’action chaque fois qu’ils étaient placés dans la boîte ou chaque fois qu’ils ressentaient l’électricité.

En fait, Skinner a même appris aux rats à éviter le courant électrique en allumant une lumière juste avant l’apparition du courant électrique. Les rats ont appris tôt à appuyer sur le levier lorsque la lumière s'est allumée, car ils savaient que cela empêcherait l'activation du courant électrique.

Ces deux réponses sont appelées "apprentissage par évasion" et "apprentissage par évitement".

Punition

La punition est définie comme le contraire du renforcement, dans la mesure où elle est conçue pour affaiblir ou éliminer une réponse au lieu d’augmenter sa probabilité. C'est un événement aversif qui diminue le comportement qui suit.

Comme avec le renforcement, la punition peut fonctionner directement en appliquant un stimulus désagréable, tel qu'un choc électrique après une réponse, ou en éliminant un stimulus potentiellement gratifiant.

Par exemple, escompter de l’argent de la paye de quelqu'un pour punir les comportements indésirables. Il est nécessaire de souligner qu’il n’est pas toujours facile de faire la distinction entre les punitions et les renforts négatifs.

Il existe plusieurs problèmes lors de l’utilisation de punitions, tels que:

  • Le comportement puni n'est pas oublié, il est supprimé. Ce comportement revient lorsque la punition n'est pas présente.
  • La punition peut entraîner une augmentation de l'agression. Cela peut montrer que l'agressivité est une façon de régler les problèmes.
  • Les punitions créent une peur qui se généralise à des comportements indésirables, par exemple la peur d'aller à l'école.
  • Plusieurs fois, la punition ne modélise pas le comportement vis-à-vis du but souhaité. Le renfort vous dit quoi faire, alors que la punition vous dit seulement ce qu'il ne faut pas faire.

Comportements de modélisation

Une autre contribution importante de Skinner est la notion de modélisation comportementale par approximations successives. Skinner soutient que les principes du conditionnement opérant peuvent être utilisés pour produire des comportements extrêmement complexes si les récompenses et les punitions sont appliquées de manière à encourager l'organisme en question à se rapprocher de plus en plus du comportement souhaité.

Pour que ce résultat se produise, les conditions (ou les éventualités) requises pour recevoir la récompense doivent changer chaque fois que l'organisme fait un pas pour se rapprocher du comportement souhaité.

Selon Skinner, la plupart des comportements humains (y compris le langage) peuvent être expliqués comme le produit de ce type d'approximation successive.

Modification du comportement

La modification du comportement est un ensemble de thérapies ou de techniques basées sur un conditionnement opérant. Le principe de base consiste à modifier les événements environnementaux liés à un certain comportement d'une personne. Par exemple, renforcez les comportements souhaités et ignorez ou punissez ceux qui ne le sont pas.

Cependant, ce n'est pas aussi simple qu'il y paraît. Renforcer toujours un comportement souhaité, par exemple, revient essentiellement à corrompre quelqu'un.

Il existe plusieurs types de renforcement positif. Le renforcement primaire se produit lorsqu'une récompense renforce un comportement en soi. Le renforcement secondaire survient lorsque quelque chose renforce un comportement car il conduit à un renforcement primaire.

Applications pédagogiques pratiques

Dans la situation d’apprentissage classique, le conditionnement opérant s’applique aux sujets liés aux salles de classe et à l’étude, au lieu d’être appliqué au contenu lié à l’apprentissage.

En ce qui concerne l'application pédagogique de la modélisation comportementale, un moyen simple de modéliser un comportement consiste à fournir un retour d' informations (performances) sur les performances de l'apprenti (par exemple, compliments, signaux d'approbation, encouragements).

Par exemple, si un enseignant souhaite encourager ses élèves à répondre aux questions en classe, il devrait les féliciter à chaque tentative, que la réponse soit correcte ou non. Progressivement, l'enseignant ne fera l'éloge des élèves que lorsque leurs réponses sont correctes et, au fil du temps, seules les réponses exceptionnelles seront louées.

Les comportements indésirables, tels que les retards à l'arrivée en classe et la prédominance des discussions en classe, peuvent être éteints en étant ignorés par l'enseignant, au lieu d'être renforcés en attirant l'attention de l'enseignant sur ces comportements.

Savoir que vous avez réussi est également important, car cela motive l'apprentissage futur. Cependant, il est important de varier le type de renforcement fourni afin de maintenir le comportement. Ce n'est pas une tâche simple, car l'enseignant peut sembler hypocrite s'il réfléchit trop à la façon dont il devrait se comporter lorsqu'il loue un élève.

Autres applications pratiques et évaluation critique

Le conditionnement opérant peut être utilisé pour expliquer un grand nombre de comportements, allant du processus d'apprentissage à la toxicomanie en passant par l'acquisition du langage. Il a également des applications pratiques, telles que celles éducatives que nous avons décrites précédemment, ainsi que dans les prisons, les hôpitaux psychiatriques et en économie.

En économie, une application connue du conditionnement opérant est l'économie de jetons, un système par lequel la personne reçoit des jetons juste après avoir exécuté le comportement souhaité. Les puces sont collectées puis échangées contre un objet important pour l'individu.

L'utilisation de la recherche animale sur le conditionnement opérant soulève également la question de l'extrapolation des résultats.

Certains psychologues prétendent que nous ne pouvons pas généraliser au comportement humain les résultats de la recherche sur les animaux, car leur anatomie et leur physiologie sont différentes et ne peuvent pas refléter leurs expériences ni invoquer la raison, la patience et la mémoire en tant qu'humains.