Citation
« La seule façon de renforcer notre intelligence
est de n'avoir d'idées arrêtées sur rien, de laisser
l'esprit accueillir toutes les pensées. »
John Keats
Le renforcement ou renforçateur
est un stimulus qui apparaît ou disparaît suite à l'exécution
d'une réponse, entraînant une augmentation de l'intensité,
de la fréquence ou de la probabilité d'apparition de cette
réponse.
Les renforcements vont donc permettent d'installer ou de favoriser un comportement,
contrairement aux punitions.
La quantité et la qualité du renforcement apporté va, d'une manière générale - ce n'est que partiellement exact pour la réponse d'évitement -, influencer proportionnellement la probabilité de réapparition de la réponse ou la force de celle-ci.
Un rat apprend plus vite à pousser sur un levier s'il reçoit cinq grammes de nourriture à chaque bonne réponse que s'il ne reçoit qu'un gramme.
Un rat court plus vite dans un labyrinthe s'il reçoit de l'eau saturée en glucose que de l'eau pure. Le même phénomène se produit s'il reçoit de la viande fraîche au lieu d'un plat d'aliment industriel.
Avec les renforcements, les réponses comportementales augmentent en fréquence et en intensité.
Avec les punitions, les réponses comportementales diminuent en fréquence et en intensité.
Les termes positif et négatif, valables pour les renforcements et les punitions, n'ont donc rien à voir avec les actions (agréables ou désagréables) sur l'animal.
Du point de vue de l'apprentissage, les renforcements ont une efficacité
supérieure aux punitions.
Pour bien comprendre, prenons l'exemple de l'apprentissage du « Assis ! » où les deux types de renforcements et les deux types de punitions peuvent être utilisés.
Suite au stimulus discriminatif qu'est le commandement « Assis ! » :
le chien s'assied, produisant donc une réponse correcte. A ce moment,
le chien se couche, produisant donc une réponse incorrecte. A ce
moment,
Dans certaines conditions, le même stimulus peut servir de renforcement
et de punition, les deux procédures étant alors combinées.
Cela peut entraîner des confusions lorsqu'on tente d'identifier le mécanisme mis en oeuvre dans une méthode d'apprentissage. Un chien qui marche correctement en laisse doit régler son allure pour se trouver en tout temps avec la tête exactement à la hauteur du genou gauche de son conducteur.
Un renforcement primaire, ou renforcement
non conditionné, correspond à un besoin vital de l'animal.
La solution la plus couramment utilisée
est la nourriture.
Outre ses inconvénients d'ordre pratique et diététique, elle a aussi l'inconvénient d'être soumise à la réaction de satiété.
Par exemple, pour éduquer un chiot, je propose aux propriétaires
de déposer la quantité globale journalière de nourriture
dans un récipient.
Un renforcement secondaire, ou renforcement
conditionné, est un élément qui n'a, à priori,
pas de valeur " satisfaisante " pour l'espèce
et qui va l'acquérir par association avec un renforcement primaire.
Un renforcement secondaire n'est pas un renforcement au départ et
ne produit pas d'emblée la réponse : il acquiert cette
capacité par conditionnement
classique.
Cet apprentissage par conditionnement classique peut se faire :
Chez le chien, des renforcements secondaires fréquemment utilisés sont les félicitations : « Il est gentil ! , Bon chien ! ... » parce qu'elles ont été associées à des caresses ou des friandises.
La présence de la mère est un renforcement secondaire pour le jeune animal parce qu'elle a été associée à la chaleur et à la nourriture.
Chez l'Homme, l'argent est un renforcement généralisé.
Lorsqu'un chien a appris à répondre à un ordre verbal, il est possible de le faire répondre aussi suite à un coup de sifflet ou à un geste du bras.
Le mot " secondaire " utilisé dans ce contexte
n'exprime pas une gradation dans la force de la stimulation, mais trouve
son appellation dans la chronologie du conditionnement.
L'usage du renforcement secondaire est plus commode que celui du renforcement
primaire.
Un renforcement impératif est celui
qui est pourvu d'une signification importante pour l'animal : son utilisation
permet un apprentissage rapide.
Un renforcement peut être très impératif dans certaines conditions et moins impératif dans d'autres circonstances, notamment en fonction de la motivation du sujet.
Un jeûne de 24 heures donne une signification impérative à la nourriture. Au fur et à mesure que celle-ci est consommée, elle constitue un stimulus de plus en plus atténué.
Trouver un endroit adéquat pour uriner ou déféquer constitue un renforcement seulement quand la vessie ou le rectum sont remplis.
L'opportunité de se promener est un renforcement pour un chien alors que pour un autre, plus âgé, ce n'en est pas un.
Un renforcement
impératif peut subir une atténuation ou estompage, - en anglais,
fading - s'il diminue quantitativement.
Cette atténuation, si elle est effectuée progressivement, peut ne pas avoir d'influence sur l'apprentissage en cours.
Certains renforcements ne subissent pas d'atténuation.
Chez beaucoup de chiens, les renforcements sociaux tels que félicitations,
caresses, contacts physiques avec le maître... ne subissent pas d'atténuation.
Ils peuvent d'ailleurs être plus impératifs que les renforcements
alimentaires.
Un comportement que l'individu effectue
fréquemment peut constituer le renforcement d'un autre comportement.
Le principe de Premack, découvert en 1965, peut être formulé de la manière suivante : tout comportement émis régulièrement à une fréquence élevée peut être lui-même utilisé comme renforçateur pour un autre comportement.
Le " principe de Premack " consiste à associer une activité
intéressante à une activité moins intéressante.
Certains l'appelle la " loi de grand-maman " : « Les enfants, vous pourrez aller jouer lorsque vous aurez fini vos devoirs ! »
En terme plus scientifique :
Pour le chien comme pour l'enfant, le jeu constitue un exemple type de réponse renforçante : c'est ainsi que le jeu peut être un bon moyen de renforcer une activité, a fortiori lorsque celle-ci est très contraignante. C'est le principe qui est utilisé pour dresser des chiens à rechercher les stupéfiants.
ApprentissageDifférentes
formes d'apprentissageConditionnement
classique
Conditionnement
opérantLois du CORenforcementsRenforcements positifs
Renforcements négatifsRenforcements involontairesPunitionsDangers
HabituationSensibilisationImprégnationApprentissage par imitation
Apprentissage par observationApprentissage
latentApprentissage
par intuition
Apprentissages complexes