Suite de l’article précédent…
Avant propos : je le répète, il n’y a pas qu’une méthode pour réussir un apprentissage, mais il y a des méthodes plus ou moins efficaces, plus ou moins rapides, plus ou moins réfléchies… Je ne dis pas que celle-ci est la meilleure, loin de là. Je dis juste qu’elle est réfléchie et efficace…
… Je vais te donner un exemple concret, un des exercices les plus délicats à exécuter si on veut utiliser un renforcement 100 % positif, avec de la nourriture.
Imaginons que tu veuilles apprendre à ton chien à marcher au pied grâce à la friandise, sans contrainte et sans clicker. Rappelle-toi bien une chose. Le bon usage de la croquette est soumis à 4 lois du renforcement (associées aux 4 lois de l’apprentissage citées dans l’article précédent) :
Timing du renforcement
Fréquence du renforcement
Endroit du renforcement
Intention derrière le renforcement (attention à l’intention, c’est une donnée très importante et souvent
négligée. Elle nécessite de savoir lire ce que pense et veut le chien à l’instant T.)
Voici ce que je te vois souvent faire : tu tiens une croquette dans ta main, du côté du chien et à peu près à sa hauteur, comme ça le chien suit la main et marche au pied. Après quelques dizaines de mètres, tu t’arrêtes, le chien vient se remettre en face de toi et tu lui donnes la croquette pour le récompenser d’avoir bien marché avec toi. Ca marche, ton chien a marché au pied. Mais il n’a rien compris ni rien appris (ou du moins, pas exactement ce que tu voulais lui apprendre) ! Tu viens de bafouer les 4 lois du renforcement, et ton chien aura beaucoup de mal à apprendre à marcher au pied de cette façon. Je ne dis pas qu’il n’y arrivera pas. Je dis juste que l’apprentissage sera sans doute plus long et moins fiable. Tu auras aussi plus de mal à te débarrasser de la croquette dans les étapes suivantes.
En réalité, que veux-tu apprendre au chien ? A marcher au pied ? Pas exactement. Tu veux lui apprendre plusieurs choses :
– A Marcher
– à Côté de toi
– sur Plusieurs pas.
Cela se décompose en plusieurs données
L’endroit : “être à côté”. Il faut donc récompenser le chien pile lorsqu’il se trouve à côté de toi, et pas lorsqu’il se retourne vers toi pour avoir sa croquette en te barrant à moitié la route, sinon, tu lui apprends à marcher en crabe, ou à te dépasser et à te barrer la route dès que tu ralentis.
Le timing : “marcher”. Tu veux lui apprendre à marcher à côté de toi, donne-lui donc sa croquette quand il marche, ou si c’est trop difficile
(chien de petite taille), donne-la-lui pile au moment où tu t’arrêtes, et pas 6 ou 7 secondes après, le temps de la sortir de ta poche ou d’un sachet (c’est là, en général, que le chien revient se mettre en face de toi).
La fréquence : “plusieurs pas”. Tu veux que l’action se prolonge, donne-lui donc une récompense tous les pas, puis tous les deux pas, puis
tous les trois pas etc. Ainsi, il ne se découragera pas et tu le récompenseras avant qu’il ne commette d’erreur. De réussite en réussite, il apprendra. Ca, c’est vraiment le plus difficile dans la pratique. Sois prêt à y passer du temps, et toute la ration du chien si nécessaire !
L’intention : La donnée la plus subtile et la plus délicate. Tu veux que le chien comprenne qu’il faut marcher à côté de toi, et non pas simplement suivre ta main. Si tu gardes la croquette dans ta main à hauteur de son nez, ou que tu la lui donnes quand il essaye de l’atteindre du bout de la truffe, tu lui apprends simplement à s’intéresser à ta main et pas à toi ; voire pire : à réclamer la croquette. Dès que tu bougeras la main, ou quand tu n’auras plus de croquette dans la main, le chien quittera ton pied. Non pas parce qu’il fait sa mauvaise tête, mais parce que tu ne lui as pas appris la bonne chose. Ne lui donne donc pas la récompense s’il est fixé sur ta main ou s’il te pousse la main avec le museau. Evidemment, ça nous renvoie au timing et à la fréquence : il faudra le récompenser après très peu de pas (voire un seul) et au bon endroit, pour ne pas qu’il cherche la croquette ailleurs, mais qu’il associe la récompense avec le fait de marcher à cet endroit là.
J’espère que cet exemple t’aura permis de mieux cerner comment utiliser la croquette, et surtout comment utiliser les lois du renforcement.