Renforcements négatifs
Caractéristiques et exemples

Citation

« Je suis comme un paralytique qui a trouvé dans l'immobilité le moyen d'éviter les chutes. »

Benjamin Constant

Sommaire

Caractéristiques des renforcements négatifs

Une réponse d'échappement ou d'évitement est destinée à soustraire le sujet à un stimulus aversif potentiellement dangereux : sa valeur adaptative est dès lors importante.


Ce type d'apprentissage est donc généralement très rapide, surtout lorsque la réponse attendue fait partie des comportement défensifs figurant dans l'éthogramme.


Une réponse installée par renforcement négatif présente aussi la caractéristique de bien résister à l'extinction et donc d'être très stable.

Lors de plusieurs séances successives, des chiens ont appris à éviter un choc électrique relativement fort en produisant une réponse d'évitement.

  • Ils ont été ensuite placés sur procédure d'extinction. La non-production de la réponse suite à l'apparition du signal n'était pas suivie du choc électrique. Chacun des 13 animaux de l'expérience a suivi 200 séances d'extinction.
  • Tous les chiens ont continué à répondre. En outre, les réponses étaient produites aussi rapidement que durant l'installation de la réponse : sur les 2.600 réponses observées, 11 seulement ont été émises 10 secondes après le signal.


A cause de la rapidité de son installation et de sa résistance à l'
extinction, le renforcement négatif est souvent utilisé tant dans la vie quotidienne qu'au laboratoire.

Interprétation théorique des renforcements négatifs


Une réponse émotionnelle de peur constitue en elle-même un stimulus aversif
. 

La situation stimulante qui la déclenche est donc, de toute façon, renforcée négativement, même si aucune autre conséquence désagréable n'apparaît.

La théorie bifactorielle de l'évitement explique de cette manière le déroulement du phénomène.

  • Dans un premier temps, le stimulus aversif déclenche une réponse de peur.
    • Par conditionnement classique, l'animal associe le signal de danger (" warning signal ") au stimulus aversif.
    • Le signal devient un stimulus conditionnel (SC) qui peut déclencher à lui seul une réponse émotionnelle conditionnée de peur, elle-même aversive.
  • Dans un deuxième temps, l'animal cherche à se soustraire au signal de danger, devenu aversif.


L'apprentissage d'une réponse d'évitement est le résultat de l'apprentissage d'une réponse d'échappement à un stimulus conditionnel déclenchant la peur.

R.G. Weisman et J.S. Litner proposent une interprétation légèrement différente du deuxième temps.

  • La réponse d'évitement entraîne l'apparition de stimuli (parmi ceux-ci, la disparition du ou des signaux de danger) qui sont des signaux de sécurité (" safety signals ").
    • Ces signaux de sécurité annoncent une période où le stimulus aversif est absent.
    • De ce fait, les " safety signals " constituent des stimuli conditionnels inhibiteurs de la peur.
  • Par conditionnement opérant, ils deviennent le renforcement positif de la réponse d'évitement qui les précède.

Le deuxième temps peut être aussi expliqué en se référant à la théorie de la relaxation de Denny.

  • Selon celle-ci, après toute réaction émotionnelle se produit une réaction émotionnelle opposée dès que la stimulation de la première a cessé.
    • Un état de " relaxation " fait donc suite à l'état de peur.
    • Il est accompagné notamment par un ralentissement cardiaque et une diminution de la pression sanguine et se traduit extérieurement par une attitude plus " détendue ", plus " sûre de soi " de l'animal dès que le " warning signal " a disparu.
  • Cet état de relaxation est le renforcement positif de la réponse d'évitement.

Exemples de renforcements négatifs

Un chien apprend à s'éloigner des enfants afin d'éviter que ceux-ci ne lui tirent la queue.

Lors de l'apprentissage du rapport d'objet, le conducteur essaie de persuader son chien de prendre l'apportable dans sa gueule en le récompensant. Malgré de très nombreuses tentatives, il n'y arrive pas et décide de changer de méthode.

  • Tout en disant « Prend ! », il pince l'oreille du chien. Celui-ci gémit et, pour ce faire, entrouvre la bouche. Le conducteur en profite pour y placer l'apportable.
  • Dès que l'apportable est dans la gueule du chien, le pincement de l'oreille est arrêté.
  • Après quelques séances, le chien apprend par renforcement négatif à éviter d'avoir l'oreille pincée en prenant l'apportable en bouche quand il entend « Prend ! ».

EvitementUn chien se trouve sur la table d'examen chez le vétérinaire.

  • Comme chaque fois dans ce cas, son maître le tient fermement pour que le praticien puisse faire une injection.
  • Le chien se débat, grogne, montre les dents et mord le praticien. Ce dernier renonce à son traitement par piqûre et prescrit le même médicament sous forme de comprimés.
  • A la visite suivante, le chien adopte immédiatement une conduite agressive. Il se met en situation d'évitement qui empêche que le stimulus aversif constitué par une piqûre ne survienne dès que les signaux qui lui ont été associés (cabinet vétérinaire, table d'examen...) sont présents.

Lorsqu'un chien ne revient pas quand on l'appelle, le renforcement négatif peut être utilisé afin d'obtenir une réponse correcte et régulière.

  • Suite à l'ordre « Viens ! », si l'animal ne revient pas immédiatement, un stimulus aversif est présenté : tractions répétées sur la longue laisse, disparition du maître qui s'est caché derrière un arbre, spray par collier commandé à distance... Certains prétendent même lancer des petits cailloux sur la croupe de l'animal au moyen d'une catapulte ! 
  • Ces stimuli aversifs disparaissent dès que le chien produit le mouvement de retour vers le conducteur.

Conséquences des renforcements négatifs

ApprentissageDifférentes formes d'apprentissageConditionnement classique
Conditionnement opérantLois du CORenforcementsRenforcements positifs
Renforcements négatifsRenforcements involontairesPunitionsDangers
HabituationSensibilisationImprégnationApprentissage par imitation
Apprentissage par observationApprentissage latentApprentissage par intuition
Apprentissages complexes

Bibliographie
  • Giffroy J.M. (Prof. Université de Namur, Belgique) - L'apprentissage et ses applications - 3ème cycle professionnel des écoles nationales vétérinaires, Toulouse, 2000