Renforcements négatifs
Définitions et réponses
- Conditionnement opérant : généralités
- Lois du conditionnement opérant
- Renforcements
- Punitions
- Préparation des animaux
- Dangers des conditionnements
- Différences entre les deux conditionnements
Un renforcement négatif est un stimulus aversif qui disparaît ou qui n'apparaît pas suite à une réponse conditionnée et qui augmente la probabilité de réapparition de cette réponse
Vue d'ensemble
1. Lors de renforcement négatif, le sujet apprend à échapper ou à éviter une situation qui a pour lui des conséquences défavorables.
Remarque : rappelons qu'un stimulus aversif est un stimulus dont l'animal veut s'éloigner ou qui provoque des sensations et des réponses de mal-être, de douleur ou de peur.
- Le stimulus aversif est l'opposé du stimulus appétitif.
- Le stimulus aversif sert également dans la punition positive.
2. Dans le renforcement négatif, la production de la satisfaction est indirecte (loi de l'effet).
C'est ce qui se passe quand on apprend au chien à accepter un lieu pour dormir en l'agressant chaque fois qu'il se couche ailleurs et en le laissant en paix lorsqu'il choisit le lieu qui lui a été assigné.
Le terme négatif, valable pour les renforcements et les punitions, indique le retrait du stimulus (le terme positif l'apport) et n'a donc rien à voir avec son action agréable ou désagréable sur l'animal.
Le renforcement négatif, comme le renforcement positif, peut être :
- primaire, i.e. aversif d'emblée (non-douloureux ou douloureux...),
- secondaire, i.e. réprimander, dire « Non ! »... permet acquérir, par conditionnement classique, des qualités aversives après avoir été associés, par exemple à la douleur.
L'apprentissage par renforcement négatif est plus rapidement installé et plus résistant à l'extinction qu'un apprentissage par renforcement positif.
Au laboratoire comme dans la pratique, c'est cet apprentissage qui est le plus utilisé.
Réponses
1. Le renforcement négatif engendre généralement un large éventail de réponses comportementales pour échapper ou éviter les menaces détectées.
Par exemple, afin d'éviter de recevoir un choc électrique, un organisme peut :
- s'échapper, i.e. fuite (échappement ou flight),
- s'immobiliser, i.e. immobilité (freeze),
- se battre, i.e. combat ou flght,
- produire une réaction de stress ou de peur,
- s'engager dans une combinaison de tels comportements.
2. Le renforcement positif produit généralement une approche qui permet des réponses purement appétitives ou consommatrices pour poursuivre un résultat gratifiant.
Réponse d'échappement
Le stimulus aversif est présent et la réponse d'échappement permet à l'animal de s'y soustraire, en général par la fuite.
Prenons deux exemples.
a. Il commence à pleuvoir : le chien qui se réfugie dans sa niche effectue une réponse d'échappement.
b. Un chien est muni d'un collier étrangleur.
Lorsqu'il marche en laisse à la même allure que son maître et à la hauteur du genou de ce dernier la sensation désagréable que produit le collier disparaît.
Réponse d'évitement
Le stimulus aversif n'est pas présent mais l'animal, suite à un stimulus particulier, effectue une réponse d'évitement qui permet d'empêcher qu'il ne survienne.
1. La réponse d'évitement permet une anticipation de l'animal (processus d'anticipation).
L'évitement peut s'installer après l'échappement par l'apprentissage d'un ou de plusieurs stimuli discriminatifs permettant d'anticiper.
2. Prenons deux exemples.
a. Il ne pleut pas encore, mais le tonnerre gronde, i.e. stimulus discriminatif positif.
Le troupeau de bovins gagne le couvert des arbres et évite ainsi d'être mouillé.
b. Un oiseau, qui aperçoit un chat qui s'approche de l'arbre où il est perché, s'envole.
3. L'évitement de Sidman est une forme particulière d'évitement où aucun stimulus discriminatif n'est présenté qui annoncerait l'apparition du stimulus aversif.
- L'animal peut l'éviter en produisant des réponses en se basant sur le temps qui suit chacune de ses réponses ou les apparitions du stimulus aversif (Conduites instrumentales et estimations des durées chez l'animal 1969)
- Concrètement, on observe des réponses apparaissant à des intervalles plus ou moins réguliers.
Un rat est dans une cage de Skinner dans laquelle une poussée sur un levier permet d'empêcher que des chocs électriques lui soient appliqués.
- Quand il ne pousse pas sur le levier, des chocs surviennent toutes les 5 secondes. L'intervalle entre deux stimuli aversifs est de 5 secondes.
- Quand il effectue une poussée, un choc survient après 10 secondes. L'intervalle entre une réponse et un stimulus aversif est de 10 secondes.
- Chaque fois que le rat répond trop tard, il reçoit un choc et le choc suivant lui est donné 5 secondes après. S'il répond correctement, le délai avant le choc suivant est de 10 secondes.
La tendance actuelle est de déterminer la hiérarchie sur la base des mouvements d'évitement de la même manière que chez les animaux de rente.
Cette méthode semble révéler des différences de position entre chaque individu s'avérant stables et indépendantes des circonstances.
Caractéristiques et exemples de renforcements négatifs
ApprentissageDifférentes formes d'apprentissageConditionnement classiqueConditionnement opérantLois du CORenforcementsRenforcements positifsRenforcements négatifsRenforcements involontairesPunitionsDangersHabituationSensibilisationImprégnationApprentissage par imitationApprentissage par observationApprentissage latentApprentissage par intuitionApprentissages complexes