Les recherches en neurosciences expliquent comment le cerveau change de mode de fonctionnement lorsqu’on consomme régulièrement une drogue.
Le comportement humain est régi par deux types d’actes. Le premier est l’acte d’habitude, sorte d’automatisme appris une fois, comme par exemple tendre le bras droit pour appuyer sur un interrupteur lorsque l’on entre dans une pièce non éclairée la nuit, faire du vélo etc. On ne réfléchit pas, on ne s’interroge pas sur la valeur de l’acte que l’on va effectuer, c’est comme ça. Le deuxième est l’acte dirigé vers un but. Dans ce cas, l’action est précédée d’une représentation des conséquences immédiates ou à long terme : on réfléchit, on évalue les motifs qui nous poussent ainsi que la récompense, le bénéfice qu’on en tirera et, au final, on décide de la réaliser ou non.
Tout comme l’acte d’habitude, le comportement dirigé peut être déclenché par un stimulus extérieur, je vois un gâteau dans la vitrine du pâtissier, ou un stimulus intérieur, j’ai faim. Mais alors que dans le contexte de l’habitude, la vision du gâteau nous amène à entrer dans la pâtisserie et commander le gâteau, dans le cas de l’acte dirigé, il y a prise de conscience : d’accord ce gâteau est appétissant mais il est 10h du matin et le manger serait de la gourmandise, alors au revoir le gâteau ! À l’inverse, j’ai faim, il est 13h, mon dernier repas remonte à hier soir, je manque d’énergie et suis en hypoglycémie, manger me redonnera de la force donc je vais à la cantine et je n’ai pas besoin de réfléchir aux gestes que je dois faire car j’ai l’habitude, je sais comment manger.
Les deux modes de fonctionnement coexistent et s’équilibrent. Ce n’est pas parce qu’on a appris à manger qu’on avale tous les aliments qui passent à notre portée, ce n’est pas parce qu’on voit un vélo qu’on l’enfourche immédiatement pour rouler.
Lorsqu’on expérimente une drogue ou lorsqu’on en fait un usage récréationnel, il s’agit d’un acte dirigé. La raison pour laquelle on prend le produit est soupesée, la valeur de l’objectif est connue, la décision est réfléchie, elle nous appartient pleinement. Il s’agit soit de rechercher les effets euphorisants de la substance, soit ses capacités de médication (réduction de l’anxiété ou d'un désordre interne), soit pour expérimenter une situation dangereuse ou interdite. Toutefois, avec la répétition de l’usage, les choses changent progressivement, la prise de produit devient plus automatique : cela devient un acte d’habitude.
De fait, une des caractéristiques de l’addiction est, selon le DSM5, la poursuite de la consommation bien qu’on ait conscience que cela aura des conséquences néfastes sur les plans physique et/ou psychologique. Il s’agit bien alors ici d’un acte d’habitude, on prend de la drogue parce qu’il y en a, sans réfléchir au motif de la consommation ni à la valeur que cela apportera. L’acte d’habitude a pris le pas sur l’acte dirigé.
Cette théorie de bascule vers un comportement « d’habitude » est un des fondements neurobiologiques les plus solides pour expliquer la survenue de l’addiction. Elle s’appuie sur une connaissance de plus en plus fine de la neuroanatomie du cerveau et des circuits neuronaux ainsi que sur des expériences réalisées sur des modèles animaux.
La zone clef concernée dans le cerveau est le striatum, structure majeure du circuit de la récompense. Cette zone est située sous le cortex. Elle est symétrique c’est-à-dire que chaque hémisphère cérébral en possède une. Le striatum est divisé en « quadrants fonctionnels ». Cela signifie que les neurones qui leur sont connectés n’ont pas les mêmes origines et ceux qui en repartent n’ont pas les mêmes destinations. Par conséquent ils ne sont pas impliqués dans les mêmes fonctions. Chez le rat, ce sont les quadrants dorsaux, le striatum dorsomédian SDM et le striatum dorsolatéral SDL, qui sont impliqués dans le processus qui gouverne l’initiation de l’action. Les quadrants ventraux forment le noyau accumbens (NAcc) qui est impliqué dans la prédiction de la valeur de la récompense et le coût de l’action. Le NAcc est connecté aux neurones à dopamine qui sous-tendent les mécanismes d’apprentissage associés à la récompense et la motivation associée. Le SDM en conjonction avec le cœur du NAcc régit les comportements « dirigés » alors que le SDL est impliqué dans les comportements d’habitude. Chacune de ces zones est associée à un système de mémoire spécifique.
Pour analyser l’implication des différents circuits dans les comportements face aux drogues, les chercheurs utilisent des expériences d’apprentissage et de dévaluation. Dans une première phase, l’animal (un rat ou une souris) est mis dans une cage dite opérante où il apprend à associer une action à une certaine récompense, comme par exemple appuyer sur un levier pour obtenir une dose de cocaïne ou d’alcool. Cet apprentissage ne nécessite que quelques jours et on mesure l’attrait de l’animal pour la récompense en comptant le nombre d’appuis sur le levier, un comportement qui dépend de la dopamine libérée dans le NAcc. Le test consiste à analyser l’attitude de l’animal si on « dévalue » la récompense. Pour ce faire, le jour du test, on met d’abord l’animal dans une cage où il a libre accès au produit pendant 1 heure ; il n’a plus d’effort à faire pour obtenir la récompense, celle-ci est dite « dévaluée ». Travailleriez-vous pour obtenir un pot de glace si on vous avait donné accès à autant de glace que vous pouvez ingurgiter juste avant ? Immédiatement après, on le remet dans la cage opérante. On regarde à quel point l’animal recherche la récompense (nombre d'appuis sur le levier) malgré le fait qu’il a eu un accès libre au préalable à cette même récompense. Par définition, si l’animal cherche moins la récompense après dévaluation (moins d’appuis sur le levier), l’animal fait comprendre qu’il n’est pas stupide et qu’il ne va pas travailler pour une récompense dont il vient juste de se gorger. Son comportement est dirigé par une représentation de la valeur de la récompense, il est dit dirigé par un but (goal-directed behavior). Mais si l’animal est insensible à la dévaluation, c’est-à-dire qu’il continue à appuyer de la même façon après avoir eu accès libre à la récompense, le comportement est dit habituel (habit behavior).
Les expériences ont montré que la prise « dirigée », volontaire, de drogue active le circuit « cœur du Nac-SDM ». Dans le cas où la prise de drogue est répétée et l’animal entraîné, dévaluer la récompense ne modifie en rien le comportement de l’animal, qui continue d’appuyer sur le levier pour obtenir la drogue. De fait, on observe que la simple présentation du stimulus déclenche la libération de dopamine dans le SDL. Cela signifie que le circuit initial est progressivement désactivé au profit du circuit « cœur de Nac-SDL ».
En répétant les prises, le pouvoir de décider à quel moment et en quelles circonstances prendre la drogue s’efface progressivement : l’habitude prend le dessus.
Une fois la prise de drogue devenue un comportement d’habitude, cela change la donne pour s’en défaire, car comme disait le célèbre humoriste américain Mark Twain : « Cesser de fumer est la chose la plus aisée qui soit. Je sais ce que c’est : je l’ai fait cinquante fois ».
Nalpas
MD, PhD
Directeur de recherche émérite
Département Information Scientifique et Communication de l'Inserm
Belin
Lecturer in neuroscience - Department of Pharmacology, University of Cambridge
Chercheur à l'Inserm
Thibault