Neuroștiințele rescriu rolul Dopaminei și supranumele de substanță a fericirii

Neuroștiințele rescriu rolul Dopaminei și supranumele de substanță a fericirii
Dopamina, unul dintre cei mai studiați neurotransmițători, a fost multă vreme considerată „substanța plăcerii” – legată de recompensele oferite de droguri, mâncare sau like-uri pe rețele sociale. Modelul dominant timp de decenii, Reward Prediction Error (RPE), propus de Wolfram Schultz și colaboratorii în 1997, explică modul în care neuronii dopaminergici semnalizează erorile de predicție: eliberează un val de dopamină la recompense neașteptate, se deplasează spre semnalele predictive (cum ar fi o lumină care anunță suc) și generează un semnal negativ când recompensa așteptată lipsește. Acest cadru matematic a inspirat învățarea automată, rețelele neuronale și a oferit o explicație coerentă de la sinapse la comportament și dependență.

În ultimii ani, tehnici avansate de monitorizare au urmărit cum se eliberează dopamina în timp real la animale vii. Acestea au scos la iveală funcții mult mai diverse. Dar cea mai nouă idee inversează rolurile: întîi e recompensa și apoi creșterea dopaminei.

Neuronii dopaminergici nu codifică doar valoarea recompenselor. Unii semnalizează poziția animalului într-un labirint, viteza de deplasare, direcția mișcării spre sau departe de un obiectiv. Tot ei arată atenția, memoria de lucru, comportamente sociale, noutatea, amenințările sau stimuli aversivi.

Un studiu din 2026 arată că dopamina codifică efortul depus pentru a atinge scopuri, nu doar valoarea lor finală. Alte cercetări demonstrează că neuronii dopaminergici prioritizează între multiple recompense posibile. Apa, când ești însetat sau cântecul pentru a atrage un partener la păsări. Sunt implicați în predicția acțiunilor viitoare, favorizând repetarea lor.

Aceste descoperiri pun sub semnul întrebării suficiența modelului RPE. Mark Humphries, neuroștiințific la University of Nottingham (Marea Britanie), afirmă: „Dopamina era domeniul din neuroștiință unde aveam un model computațional care explica clar ce semnalizează și ce calculează. Modelul inițial nu mai este suficient pentru a explica toate aceste date.”

Ipoteze veci, modele noi

Geoffrey Schoenbaum, de la Johns Hopkins School of Medicine, consideră că „după o perioadă de dominație clară, ipoteza RPE își arată vârsta”. Erin Calipari, farmacolog la Vanderbilt University, menționează rezistența inițială la publicațiile care arătau răspunsuri dopaminergice la stres sau șocuri. „Oamenii s-au supărat foarte tare. A fost ca o replică din iad.”

O alternativă propusă este modelul ANCCR (Adjusted Net Contingency for Causal Relations), care inversează logica. Recompensa apare prima, iar dopamina crește odată cu repetarea ei. Asta ajută animalul să identifice ulterior semnalele cauzale. Acest cadru pare mai intuitiv pentru anumite forme de învățare. Dezbaterea va continua la întâlnirea Societății Dopaminei din Sevilla (mai 2026), unde cercetătorii vor discuta dacă modelul clasic trebuie revizuit radical sau doar extins.

Implicațiile depășesc neuroștiința fundamentală. O reevaluare a dopaminei ar putea schimba înțelegerea și tratamentul tulburărilor precum ADHD, dependența sau schizofrenia, unde ipotezele actuale despre „recompense defectuoase” stau la baza multor abordări terapeutice.

Rădăcinile conceptului de eroare de predicție a recompensei

Ideea că creierul anticipează recompensele și învață din diferența dintre ceea ce așteaptă și ceea ce primește are origini adânci în experimentele clasice ale psihologului rus Ivan Pavlov din secolul XX. Prin faimoasele sale studii de condiționare clasică, Pavlov a demonstrat că câinii învață să asocieze stimuli din mediu (cum ar fi sunetul unui clopoțel) cu așteptarea hranei, declanșând salivație chiar înainte ca mâncarea să apară. Acest principiu fundamental – învățarea prin asociere între un semnal predictiv și o recompensă – a devenit piatra de temelie a înțelegerii proceselor de învățare.

Conceptul pavlovian a inspirat ulterior cercetători din domeniul informaticii care, începând cu anii 1960, căutau să dezvolte teorii formale ale învățării automate (machine learning). Modele precum cel propus de Rescorla și Wagner (1972) au rafinat ideea, arătând că învățarea apare tocmai atunci când există o eroare de predicție – o discrepanță între recompensa așteptată și cea reală. Această eroare acționează ca un semnal de corecție, ajustând progresiv predicțiile viitoare.

Reflexul pavlovian

Recompensa și rețelel neuronale artificiale

În anii 1990, ideea a fost integrată în proiectarea rețelelor neuronale artificiale. Matematicienii și informaticienii au dezvoltat algoritmi de învățare prin diferențe temporale (Temporal Difference – TD learning). E o extensie mai sofisticată a modelului Rescorla-Wagner. Acesta permite actualizarea predicțiilor nu doar la momentul recompensei, ci și la apariția semnalelor predictive. Aceste cadre computaționale au oferit o bază matematică elegantă pentru a explica modul în care un agent biologic, artificial poate învăța să maximizeze recompensele viitoare.

Acest lanț conceptual, de la experimentele lui Pavlov la modelele psihologice ale erorii de predicție și apoi la algoritmii de reinforcement learning, a culminat cu ipoteza că neuronii dopaminergici din creier codifică tocmai această eroare de predicție a recompensei (Reward Prediction Error – RPE). Modelul RPE, formalizat în lucrările influente ale lui Wolfram Schultz și colaboratorii săi la sfârșitul anilor 1990, a reprezentat timp de decenii unul dintre cele mai reușite poduri între neuroștiință și informatică. El explica felul cum dopamina semnalizează recompense neașteptate. Dopamina transferă răspunsul către indicii predictivi și generează un semnal negativ când recompensa așteptată lipsește.

Astăzi, deși modelul RPE rămâne un reper major, date recente din neuroștiință pun sub semnul întrebării dacă el surprinde întreaga complexitate a semnalelor dopaminergice, sugerând funcții mai diverse ale dopaminei dincolo de simpla predicție a recompenselor.

0 comentarii Comentarii