Conditionnement opérant
Vue d'ensemble

Citation

« N'abandonnez jamais votre droit à l'erreur, car vous perdriez la capacité d'apprendre des choses nouvelles et d'avancer dans la vie. »

David Burns

Remerciements

Je voudrais remercier le Professeur J.M. Giffroy (Université de Namur, Belgique) pour m'avoir autorisé à insérer la majeure partie de ses cours dispensés à l'école nationale vétérinaire de Toulouse en 2000 pour l'obtention du diplôme de vétérinaire comportementaliste.

Sommaire

Le conditionnement opérant est encore appelé :

  • conditionnement skinnérien,
  • conditionnement instrumental,
  • conditionnement de type II.


Il est à la base de l'apprentissage par essais et erreurs : l'animal apprend à faire un lien entre son comportement et un événement de l'environnement.

Dans le conditionnement opérant, l'animal lui-même doit effectuer un comportement - par son action sur le levier, le rat obtient de la nourriture -. Dans le conditionnement répondant ou classique, l'activité est une réponse de l'animal (salivation du chien dans l'expérience princeps de Pavlov) à une stimulation.

Stimuli discriminatifs


Le conditionnement opérant établit une association S-R ou plus précisément, une association S- (R-conséquence de R) ou encore SD ou SΔ Ø R Ø S.

  • Le ou les stimuli discriminatifs composant la situation environnementale présente sont symbolisés :
    • SD (positif),
    • SΔ (négatif).
  • R est la réponse conditionnée.
  • S représente la conséquence de la réponse. Elle peut être l'apparition ou la disparition d'un stimulus.


Ce conditionnement est à la base de l'apprentissage.


L'animal sélectionne parmi les opérations qu'il effectue spontanément et au hasard dans son environnement, celles qui lui sont favorables.


Il se crée alors une association entre les stimulations présentes, le comportement effectué par l'animal et l'effet, favorable ou défavorable pour lui, produit par ce comportement sur l'environnement physique ou social.

L'environnement d'un sujet produisant une réponse apprise par conditionnement opérant comprend un ou plusieurs stimuli (signal lumineux ou sonore, commandement verbal ou gestuel du maître...) qui annoncent que, si la réponse correspondante est émise, elle va être renforcée.


Les stimuli " bénéfiques" (à action favorable) sont appelés stimuli discriminatifs positifs ou, en abrégé, SD.

Le propriétaire d'un chien dit « Assis ! » (SD). Le chien s'assied et reçoit une caresse. En dehors de cette circonstance particulière, le chien s'assied régulièrement, mais ne reçoit pas de renforcement de son maître.


D'autres stimuli discriminatifs annoncent, au contraire, qu'une réponse ne sera pas suivie de renforcement ou sera punie : ils sont appelés stimuli discriminatifs négatifs ou SΔ.

Le propriétaire d'un chien dit « Couché ! » (SΔ ). Le chien s'assied et ne reçoit rien.


D'une manière générale donc, un stimulus discriminatif est un stimulus en présence duquel la probabilité ou la fréquence d'une réponse est modifiée :

  • soit dans le sens d'une augmentation,
  • soit dans le sens d'une diminution.

Dans la nature, le stimulus discriminatif est souvent une situation particulière composée d'un ensemble de stimuli.

Contrairement aux réponses apprises du conditionnement classique, les réponses apprises par le conditionnement opérant mettent généralement en oeuvre la musculature striée, c'est-à-dire celle du squelette : ce sont des réponses motrices.

Conditions expérimentales

Les premières expériences ont été effectuées par Edward Thorndike (1874-1949) sur des chats qui devaient apprendre à s'échapper d'une cage (1898).

  • Quand un chat est placé dans une boîte dont l'ouverture se trouve à l'intérieur, il utilise toutes sortes de comportements pour essayer de se libérer.
  • Après plusieurs tentatives (essais et erreurs), le chat apprend à effectuer la réponse spécifique (réponse instrumentale conditionnée) : sortir de la boîte qui constitue sa récompense.

Les conditions expérimentales qui ont permis d'étudier le conditionnement opérant sont principalement :

  • les cages de Skinner,
  • les labyrinthes.

Cage de Skinner


Cage de SkinnerUne cage de Skinner - du nom de Burrhus Frédéric Skinner (1904-1990) - est une cage où l'animal est mis en présence :

  • de stimuli (lampes électriques de différentes couleurs, sonnerie...),
  • d'un ou de plusieurs instruments (leviers, boutons-poussoirs, interrupteurs...),

dans laquelle un renforcement peut lui être apporté (aliment, choc électrique...).

Un rat est placé dans une cage de Skinner dans laquelle se trouve un levier actionnant un mécanisme qui fait entrer dans la cage des croquettes.

  • Le rat effectue au hasard toutes sortes d'opérations sur les objets qui se trouvent dans la cage, dont le levier.
  • Après qu'il a actionné quelques fois le levier, ce qui est suivi par la présentation de croquettes, il ne fait plus d'erreurs : la pesée sur le levier est devenue la réponse correcte.

Labyrinthe


Rat dans un labyrintheUn labyrinthe est un ensemble de voies dont une seule mène à la sortie (le rat est alors récompensé, en général par de la nourriture) et dont les autres, en nombre variable, sont sans issue.

Le labyrinthe est utilisée dans toutes les tâches d'orientation (tâches et comportements spatiaux).

L'efficacité d'un animal dans un labyrinthe s'apprécie en comptant le nombre d'erreurs ou la durée nécessaire pour atteindre la sortie.

J'ai récupéré quelques dessins et photos de rats ayant des solutions originales pour passer avec succés cette épreuve du labyrinthe ( infos).

Exemples

Le conditionnement opérant est souvent appliqué dans l'éducation et ledressage des animaux de travail. En outre, il est très présent dans la vie quotidienne.

Un chien apprend que pousser sur la poignée d'une porte permet de l'ouvrir et donc d'avoir accès à la cuisine où il trouve des renforcements tels que chaleur, présence humaine ou nourriture.

RenforcementUn chat apprend que si la sonnerie du téléphone retentit pendant que sa propriétaire prépare le repas, il peut s'emparer sans risque d'une nourriture inaccessible à d'autres moments.

Un chien apprend que boiter est renforcé par l'attention que lui porte son propriétaire.

Un chien apprend que poursuivre sa queue est renforcé par les cris d'excitation et d'encouragement des enfants de la maison.

Un chien apprend à se coucher à distance suite à un coup de sifflet de son conducteur.

Un chien de petite taille ronge un os. Un chien plus grand survient et lui vole cet os. Le petit chien se précipite alors sur un morceau de bois et le ronge (activité redirigée). Ce comportement entraîne chez le grand chien une poursuite, d'où l'abandon de l'os dérobé. Cela permet au petit chien de le récupérer.

ApprentissageDifférentes formes d'apprentissageConditionnement classique
Conditionnement opérantLois du CORenforcementsPunitionsDangers
HabituationSensibilisationImprégnationApprentissage par imitation
Apprentissage par observationApprentissage latentApprentissage par intuition
Apprentissages complexes

Bibliographie
  • Giffroy J.M. (Prof. Université de Namur, Belgique) - L'apprentissage et ses applications - 3ème cycle professionnel des écoles nationales vétérinaires, Toulouse, 2000