Биология добра и зла. Как наука объясняет наши поступки. Роберт Сапольски
поспешат нажать на рычаг. Получается, что дофамин не просто обслуживает ожидание награды, он подпитывает целенаправленное поведение, необходимое для ее получения. Он увязывает размер вознаграждения с требуемыми действиями. Здесь и рождается мотивация: ее начало – в дофаминергических нейронах, идущих в ПФК, на долю которой выпадает самое трудное (т. е. работать).
Иными словами, дофаминовая радость касается не самой награды. Это удовольствие от стремления к вознаграждению, когда имеются хорошие шансы его получить[72]{115}.
Таким образом, становится понятна природа мотивации или ее отсутствия (как это бывает во время депрессии, когда из-за стресса тормозится выделение дофамина, или при переживании тревожных состояний, когда это торможение обусловлено нейронами, приходящими из миндалины){116}. Также становится понятен источник силы воли, которую нам организует лобная кора. Если в экспериментах приходится выбирать между немедленным удовольствием и отсроченным, сиюминутное желание возбуждает дофаминовые центры в лимбической системе (мезолимбический путь), а обдумывание отложенной награды активирует центры в лобном отделе (мезокортикальный путь). Чем больше активация в последнем, тем с большей вероятностью предпочтение будет отдано отложенному удовольствию.
Для подобных заключений потребовались исследования сценария с чередой коротких рабочих периодов, за которыми следует быстрая награда{117}. А что если сценарий другой: долгая работа, да еще с отсроченным на значительное время вознаграждением? В этом случае наблюдался дополнительный подъем дофамина, медленный и постепенный, он подпитывал выполнение работы. Амплитуда подъема зависит определенным образом[73] от времени отсрочки и от размера вознаграждения.
Эксперименты прояснили, как дофамин обеспечивает отложенное удовольствие. Если ждать награды, допустим, время Х, то она будет иметь для нас условную «дофаминовую» ценность Z. А если той же награды ждать в два раза дольше, то можно предположить, что и ценность ее уменьшится вдвое. Но нет, она уменьшится вчетверо, до 1/4 Z: у нас есть ограничения по времени, мы не любим ждать.
В основе этого явления – сговор лобной коры и дофамина. Штраф за длительность – 1/4 Z вместо 1/2 Z – организуется в прилежащем ядре, тогда как длПФК и вмПФК определяют саму длительность{118}.
Все это порождает сложные взаимовлияния. Например, активируя длПФК или, наоборот, приглушая вмПФК, можно сдвинуть предпочтение к быстрой награде. В одном отличном исследовании Кнутсон показал с помощью нейросканирования, что у нетерпеливых людей этот штраф за отсрочку (снижение уровня дофамина в зависимости от времени отсрочки) заметно больше. У них, когда соответствующие центры возбуждены, прилежащее ядро недооценивает размер награды, а длПФК переоценивает длительность отсрочки{119}.
Весь этот ансамбль –
72
Превосходным примером радости стремления, формирующей мотивацию, является проявление материнской заботы у крыс. Тут ключевую роль играет мезолимбическая система, определяя выделение дофамина равно как во время действий, так и по их результативному завершению.
115
К сноске: M. Numan and D. Stoltzenberg, “Medial Preoptic Area Interactions with Dopamine Neural systemsin the Control of the Onset and Maintenance of Maternal Behavior in Rats,”
116
S. McClue et al., “Separate Neural Systems Value Immediate and Delayed Monetary Rewards,”
117
M. Howe et al., “Prolonged Dopamine Signaling in Striatum Signals Proximity and Value of Distant Rewards,”
73
В дальнейших рассуждениях под величиной награды будет подразумеваться наклон прямой, т. н. штраф за отсрочку. Если отодвигать время получения награды, то наклон будет быстро становиться все более пологим; величина наклона в зависимости от отсрочки меняется не пропорционально, а более сложным образом. –
118
W. Schultz, “Subjective Neuronal Coding of Reward: Temporal Value Discounting and Risk,”
119
K. Ballard and B. Knutson, “Dissociable Neural Representations of Future Reward Magnitude and Delay During Temporal Discounting,”