Биология добра и зла. Как наука объясняет наши поступки. Роберт Сапольски

Биология добра и зла. Как наука объясняет наши поступки

поспешат нажать на рычаг. Получается, что дофамин не просто обслуживает ожидание награды, он подпитывает целенаправленное поведение, необходимое для ее получения. Он увязывает размер вознаграждения с требуемыми действиями. Здесь и рождается мотивация: ее начало – в дофаминергических нейронах, идущих в ПФК, на долю которой выпадает самое трудное (т. е. работать).

Иными словами, дофаминовая радость касается не самой награды. Это удовольствие от стремления к вознаграждению, когда имеются хорошие шансы его получить[72]{115}.

Таким образом, становится понятна природа мотивации или ее отсутствия (как это бывает во время депрессии, когда из-за стресса тормозится выделение дофамина, или при переживании тревожных состояний, когда это торможение обусловлено нейронами, приходящими из миндалины){116}. Также становится понятен источник силы воли, которую нам организует лобная кора. Если в экспериментах приходится выбирать между немедленным удовольствием и отсроченным, сиюминутное желание возбуждает дофаминовые центры в лимбической системе (мезолимбический путь), а обдумывание отложенной награды активирует центры в лобном отделе (мезокортикальный путь). Чем больше активация в последнем, тем с большей вероятностью предпочтение будет отдано отложенному удовольствию.

Для подобных заключений потребовались исследования сценария с чередой коротких рабочих периодов, за которыми следует быстрая награда{117}. А что если сценарий другой: долгая работа, да еще с отсроченным на значительное время вознаграждением? В этом случае наблюдался дополнительный подъем дофамина, медленный и постепенный, он подпитывал выполнение работы. Амплитуда подъема зависит определенным образом[73] от времени отсрочки и от размера вознаграждения.

Эксперименты прояснили, как дофамин обеспечивает отложенное удовольствие. Если ждать награды, допустим, время Х, то она будет иметь для нас условную «дофаминовую» ценность Z. А если той же награды ждать в два раза дольше, то можно предположить, что и ценность ее уменьшится вдвое. Но нет, она уменьшится вчетверо, до 1/4 Z: у нас есть ограничения по времени, мы не любим ждать.

В основе этого явления – сговор лобной коры и дофамина. Штраф за длительность – 1/4 Z вместо 1/2 Z – организуется в прилежащем ядре, тогда как длПФК и вмПФК определяют саму длительность{118}.

Все это порождает сложные взаимовлияния. Например, активируя длПФК или, наоборот, приглушая вмПФК, можно сдвинуть предпочтение к быстрой награде. В одном отличном исследовании Кнутсон показал с помощью нейросканирования, что у нетерпеливых людей этот штраф за отсрочку (снижение уровня дофамина в зависимости от времени отсрочки) заметно больше. У них, когда соответствующие центры возбуждены, прилежащее ядро недооценивает размер награды, а длПФК переоценивает длительность отсрочки{119}.

Весь этот ансамбль –

Скачать книгу

72

Превосходным примером радости стремления, формирующей мотивацию, является проявление материнской заботы у крыс. Тут ключевую роль играет мезолимбическая система, определяя выделение дофамина равно как во время действий, так и по их результативному завершению.

115

К сноске: M. Numan and D. Stoltzenberg, “Medial Preoptic Area Interactions with Dopamine Neural systemsin the Control of the Onset and Maintenance of Maternal Behavior in Rats,” Front Neuroendo 30 (2009): 46.

116

S. McClue et al., “Separate Neural Systems Value Immediate and Delayed Monetary Rewards,” Sci 306 (2004): 503; J. Jennings et al., “Distinct Extended Amygdala Circuits for Divergent Motivational States,” Nat 496 (2013): 224.

117

M. Howe et al., “Prolonged Dopamine Signaling in Striatum Signals Proximity and Value of Distant Rewards,” Nat 500 (2013): 575; Y. Niv, “Dopamine Ramps Up,” Nat 500 (2013): 533.

73

В дальнейших рассуждениях под величиной награды будет подразумеваться наклон прямой, т. н. штраф за отсрочку. Если отодвигать время получения награды, то наклон будет быстро становиться все более пологим; величина наклона в зависимости от отсрочки меняется не пропорционально, а более сложным образом. – Прим. пер.

118

W. Schultz, “Subjective Neuronal Coding of Reward: Temporal Value Discounting and Risk,” Eur J Nsci 31 (2010): 2124; S. Kobayashi and W. Schultz, “Influence of Reward Delays on Responses of Dopamine Neurons,” J Nsci 28 (2008): 7837; S. Kim et al., “Prefrontal Coding of Temporally Discounted Values During Intertemporal Choice,” Neuron 59 (2008): 161; M. Roesch and C. Olson, “Neuronal Activity in Orbitofrontal Cortex Reflects the Value of Time,” J Neurophysiology 94 (2005): 2457; M. Bermudez and W. Schultz, “Timing in Reward and Decision Processes,” Philosophical Trans of the Royal Soc of London B 369 (2014): 20120468; B. Figner et al., “Lateral Prefrontal Cortex and Self-Control in Intertemporal Choice,” Nat Nsci 13 (2010): 538; K. Jimura et al., “Impulsivity and Self-Control During Intertemporal Decision Making linkced to the Neural Dynamics of Reward Value Representation,” J Nsci 33 (2013): 344; S. McClure et al., “Time Discounting for Primary Rewards,” J Nsci 27, 5796.

119

K. Ballard and B. Knutson, “Dissociable Neural Representations of Future Reward Magnitude and Delay During Temporal Discounting,” Neuroimage 45 (2009): 143.