
人类每天都在面临各种需要自我控制的决策,从抵制甜品诱惑、控制购物冲动,到戒除不良习惯、制定长期储蓄计划。自我控制失败时,可能导致饮食失调、网络成瘾、过度消费等问题。心理学和神经科学领域重点关注“延迟折扣”现象,它揭示了人们在即时奖励与延迟奖励之间选择时的内在机制。
延迟折扣描述了一个普遍现象:人们倾向于选择更早到手的奖励,而非等待更大但需要延迟的奖励。在跨时间选择中,每个结果的主观价值都会根据获得它所需的等待时间而被“折扣”。通过数学函数可以精确分析这一折扣过程,描述主观价值如何随着延迟时间的增加而下降。
过去十年间,随着脑成像技术在跨时间选择研究中的广泛应用,延迟折扣研究取得了突破性进展。
参与结果评估的心理过程可按照对“情感”与“理性”的依赖程度来区分。这种区分对应着满足即时欲望与坚持抽象长期目标之间的权衡。学者们用不同术语描述这些过程:热与冷、自动与控制、冲动与深思、激情与理性、具体与抽象、行动者与计划者。
情感与认知相互作用是情绪调节的共同特征,延迟折扣可被视为运用情绪调节策略的行为。跨时间选择情境中的自我调节策略,可通过情绪调节的过程模型来理解。调节可以发生在决策过程的不同阶段,每个阶段对应着不同的干预方式,认知消耗也各不相同。
在决策发生前进行干预,目的是避免可能需要自控的情境和环境,这被称为“预防性干预”。跨时间选择中有一种“预承诺”策略,即提前承诺某种行为路径,以避免不必要的诱惑。许多人选择定期存款而非活期存款,限制自己随意取款的冲动,正是这一策略的体现。
在决策时调节价值评估过程,转移注意力或重新评估诱人刺激,被称为“价值重构”。当面对美食诱惑时,专注于其健康影响而非味觉享受,就是在主动重构价值判断的方式。
在价值评估完成之后,通过自上而下的认知调节来抑制冲动选择,被称为“认知抑制”。即使体验到不同选项的诱惑,仍然能够做出与长期目标一致的选择,这是认知抑制发挥作用的典型表现。
价值评估与认知调节的相互作用,与“热”系统和“冷”系统的功能紧密对应。“热”系统处理情感性、即时性的信息,倾向于快速反应;“冷”系统则负责理性分析和长期规划。两者并非相互独立,而是在决策过程中持续博弈,最终共同影响行为结果。将跨时间选择研究作为两个系统交互的结合,为理解调节决策的机制提供了有效框架。

多个系统共同参与延迟折扣过程。虽然单一效用函数可以解释大多数情境下的决策制定,但个体内部和个体间在延迟折扣行为上的变异性很难用单系统来解释。功能性磁共振成像等技术为延迟折扣中涉及的质性不同神经系统提供了有力证据。研究者逐渐将这些系统归纳为两个相互影响的核心机制,分别承担情感驱动与认知调控的功能。
人类每天面临大量选择。重要决策如选择大学、投资理财需要仔细考虑,但对于绝大多数日常选择,若逐一深思熟虑,就很难完成日常事务。价值评估过程是一组相对自动的过程,在有意识控制之外指导行为,促进人们应对日常面临的无数选择。这种自动判断常伴随情感反应,在延迟折扣中表现尤为明显——即时奖励可能极具诱惑力,产生情感色彩浓厚、高度兴奋的趋近倾向。
情绪理论认为,这些过程的功能之一是传达评估信息,如危险信号,在不让人完全意识到威胁来源的情况下影响行为。这类评估往往是反射性的、无意识的,不受深思熟虑的控制,其方式对明确理解来说往往是模糊的。
在神经层面,复杂的大脑结构网络支撑着自动价值评估过程,包括皮质和皮质下区域。积极的动机和情感信号在中脑多巴胺神经元所投射的大脑区域中编码和传递,包括伏隔核和腹内侧前额叶皮层。其他区域如杏仁核和岛叶皮层也参与情感处理,特别是对显著或厌恶事件的处理。伏隔核和杏仁核作为这些回路的核心结构,在进化上相当古老,在许多动物物种中以相对保守的功能存在。
动物实验中,大鼠会持续自我刺激能够引发多巴胺释放到伏隔核的中脑区域,每小时多达两千次,排除所有其他活动,直至身体疲惫。许多滥用药物如可卡因和冰毒会直接增加大脑中多巴胺的可用性,清楚证明了多巴胺在奖励系统中的核心地位。
大脑还包含一个单独网络来编码厌恶信号并检测环境中应该避免的结果。杏仁核是最明确与学习和检测负面刺激、负面环境状态相关的大脑结构。
杏仁核和伏隔核功能的明显特征是自动性。杏仁核对恐惧或显著刺激的反应甚至在没有意识到看到它们时也会发生,比如当图像显示得极快只能下意识感知时。这些系统允许人们继续日常生活,也曾帮助祖先在环境中快速反应,以避免捕食者、获得稍纵即逝的奖励。
然而,在延迟折扣领域,自动价值评估过程对于长期规划能力不足。该系统倾向于产生适合即时环境的行为,对于需要在数周或数年内进行规划的目标,价值评估过程不具备确定适当行为的能力。这些情况下,决策需要仔细考虑目标并对未来状态进行模拟,这些与目标相关的功能被称为认知控制。
认知控制系统通过对不同行动方案的深思熟虑、基于规则的考虑来定义。认知控制中涉及的计算发生在意识觉知范围内,是人们在推理时能够主观体验到的那种思维活动。当面临不熟悉的情况、没有足够经验知道适当反应时,这些能力尤为重要。
著名的斯特鲁普任务能说明这一点:必须说出单词书写的颜色,同时抑制阅读单词本身,比如用绿色墨水写的“红”字。若没有明确的控制行为,人们很可能因自动阅读单词而犯错。
与认知控制相关的大脑结构与价值评估的结构不同。这些结构包括前额叶皮层的背外侧和前部区域、背内侧前额叶皮层内的区域,以及后顶叶皮层。
这些大脑区域参与各种认知过程,如工作记忆、抽象推理和一般问题解决。广泛共识认为这些系统对大脑灵活应对快速变化的任务需求,以及追求长期、目标导向行为的能力至关重要,特别是在面临来自更显著刺激或自动反应的竞争时。
背外侧前额叶皮层对成功规划和其他执行功能至关重要。该区域的损伤与组织、规划、工作记忆和注意力功能障碍相关。背外侧前额叶皮层还与工作记忆中信息的维持和操作相关,与其在理性问题解决中整合和操作存储的心理表征的作用一致。
背侧前扣带皮层在高级认知中同样起重要作用,特别是对操作表现的在线监控以及冲突和错误检测。根据主导理论,背侧前扣带皮层中的冲突检测作为门控机制,信号何时需要额外控制。该理论认为背侧前扣带皮层检测自动过程何时导致偏差,并调节背外侧前额叶皮层的活动,促使行为发生改变。
背外侧前额叶皮层和背侧前扣带皮层编码情境信息并促进深思熟虑处理和规划,这正是认知控制的核心功能。这个系统的关键限制在于,相对于自动价值评估,信息处理缓慢且计算成本高昂,且一次只能明确考虑一件事,处理过程是串行的。
在许多情况下,面临的选择需要在追求即时满足的冲动和长远来看更有益的行动之间进行权衡。跨时间选择实验正是针对这种困境,要求人们在较早可用的较小奖励和较长延迟后可用的较大奖励之间做决定。这类研究揭示了人类决策行为中深层的非理性模式,也为理解自控能力的个体差异提供了有力工具。
在所有其他条件相等的情况下,每个人都更愿意更早和更大数量地获得奖励,但人们在如何折扣未来补偿价值方面存在很大差异。患有慢性冲动控制缺陷的人,如病理性赌徒和药物成瘾者,往往比普通人更严重地折扣延迟奖励的价值。患有注意缺陷多动障碍的人也比健康人群更陡峭地折扣奖励。随着人们从青春期到成年,折扣率趋于下降,与发展过程中自我控制能力的整体改善一致。
从机制角度看,做出跨时间选择需要根据结果的延迟来折扣其价值,并选择具有最大折扣价值的选项。理性上,以这种方式产生的偏好应该在时间上保持一致。如果更喜欢结果甲而非在甲之后固定时间发生的结果乙,那么无论甲是今天发生还是一年后发生,这一偏好都应保持不变。
如果情况并非如此,就会有某个临界时间点使偏好发生转换,最初更喜欢乙,但随后逆转为更喜欢甲。数学上,确保偏好一致性的唯一折扣函数是随延迟呈指数下降的函数。
然而,无论人类还是动物都没有表现出这种一致性。一名大学生面临选择:立即获得五百元现金购买心仪的鞋子,或者等待一个月获得一千元。在遥远的将来做这个决定时,大多数人会理性地选择等待一个月。但当这个选择变成眼前的现实时,许多人会选择立即拿走五百元,即使知道等待一个月能得到双倍金钱。这种偏好逆转表明,人在近期内比在长期内折扣得更为陡峭,具有对立即可得奖励做出冲动反应的倾向。
时间依赖的偏好逆转最常通过假设延迟折扣遵循双曲线折扣函数来解释。双曲线函数捕捉了折扣率随时间下降的观察——近期内折扣陡峭,远期内折扣平缓。然而,这个框架对解释人们在不同情况下对不同商品表现出的广泛折扣率范围作用有限。
双曲线折扣似乎最适用于处理某种程度上具有内脏唤起性的商品,如金钱和食物。一种替代方法将跨时间选择行为描述为由独立评价系统参与的结果,每个系统使用不同的折扣函数,多个不同折扣函数的组合效果可以产生类似双曲线的行为模式。这种解释的最简单版本表明存在两种折扣系统:一种只评价立即可用的商品,折扣陡峭;另一种则在时间上更适度地折扣,更接近理性。这与前面讨论的两个处理系统很好地对应,自动价值评估系统表现出陡峭的折扣,而认知控制系统对即时和未来奖励给予更平等的权重。

跨时间选择的神经科学研究为参与决策制定的自动系统与控制系统之间的分离提供了有力支持。研究者通过功能磁共振成像等技术,在真实决策场景中观察大脑活动,逐渐揭示了不同神经系统在跨时间选择中的具体分工,并在个体差异和因果机制方面积累了丰富的实证证据。
在早期功能磁共振成像研究中,参与者面临两种类型的选择:一种是立即可用选项与更大、延迟选项之间的选择,另一种是两个选项都只在延迟后可用的选择。根据折扣的双过程模型,涉及立即可用奖励的选择在本质上更具情感唤起性,因此部分反映冲动价值评估系统的功能;仅涉及延迟奖励的选择则更多依赖深思熟虑过程来形成判断。
实验结果与这种表述一致。与价值评估相关的大脑结构,包括伏隔核和腹内侧前额叶皮层,在涉及立即可用选项的决策期间被激活。而参与深思熟虑处理的结构,包括背侧前扣带皮层和背外侧前额叶皮层,在涉及两个延迟结果的决策期间更多参与。
此外,对于将即时奖励与延迟奖励对比的选择,两个系统中相对的大脑激活强度可以预测最终的选择结果。当自动价值评估系统中的结构更活跃时,人们倾向于做出更冲动的选择;当认知控制系统中的结构更活跃时,人们更可能选择更大的延迟选项。
一名研究生,导师给了他两个选择:现在获得三千元奖学金立即使用,或者等待六个月获得六千元奖学金。当大脑扫描显示伏隔核高度活跃时,他更可能选择立即获得三千元;当背外侧前额叶皮层更活跃时,他则更可能理性地选择等待六个月。
在个体差异方面,这个双系统框架同样得到了良好的解释。研究表明,伏隔核对获得奖励的反应程度可以预测折扣率——自动价值评估系统对奖励的激活越强,一个人往往越倾向于冲动地追求即时满足。相比之下,认知控制能力的个体差异与折扣率的降低相关。在工作记忆任务上表现更好,并且在前额叶皮层前部区域显示更大反应的人,在跨时间选择中往往更有耐心。
让口渴参与者在不同时间点交付的果汁数量之间做选择的实验,复制了上述发现,证明这种双重处理并非特定于金钱奖励。在食物决策中,背外侧前额叶皮层活动往往通过抑制腹内侧前额叶皮层的反应来支持更健康选项的选择。
功能脑成像提供的数据在本质上是相关性的,即功能磁共振成像提供了大脑哪些区域与特定认知过程相关的信息,但几乎无法揭示这些大脑区域是否真正导致了观察到的行为差异。
为了解决这一局限,研究者通过更直接的操作评估了这些结构的因果重要性。一项研究使用重复经颅磁刺激来操作跨时间决策过程,对左右背外侧前额叶皮层施用刺激后,参与者完成跨时间选择任务。结果显示,对左侧前额叶皮层的刺激导致人们做出更不耐心的选择,证明了该区域的激活因果地促进目标导向的决策制定。
另一项研究通过药理学手段增强多巴胺功能,给参与者服用增加多巴胺能活动的药物,发现折扣率随之提升。这与双系统框架的预期一致,进一步证明了多巴胺系统在即时奖励评估中的核心作用。

前面讨论的双系统模型主要源自行为研究,其许多属性与大脑奖励系统和执行功能相关区域的已知功能相符。然而,大脑功能的其他细节要求更复杂的模型,需要为个体大脑区域分配更精确的功能,也需要对大脑系统在选择期间如何相互作用形成更完整的理论。至少有三个研究方向支持这种更精细的多系统延迟折扣模型。
一项功能磁共振成像研究在食物决策背景下区分了价值评估与自我控制相关大脑系统的贡献。参与者在健康程度和味觉品质不同的食物选项之间进行选择,研究者同步记录大脑活动。参与者根据食物偏好被分为“自我控制者”和“非自我控制者”,前者同时基于健康和味觉做决定,后者仅基于味觉做决定。
腹内侧前额叶皮层的激活与分配给个别食物项目的总主观价值相关,活动强度与参与者的选择偏好一致。对于自我控制者,腹内侧前额叶皮层在选择时的激活同时与健康和味觉相关;而对于非自我控制者,腹内侧前额叶皮层激活仅与味觉相关。这表明腹内侧前额叶皮层在整合认知与情感影响方面起核心作用,其功能比双系统模型所描述的更为精细。
一名正在减肥的上班族,面临午餐选择:美味的麻辣火锅还是清淡的蔬菜沙拉。当腹内侧前额叶皮层活跃时,它会整合两种信息:火锅的美味程度和对健康的影响。如果能够成功自控,背外侧前额叶皮层会抑制对火锅美味的冲动反应,帮助做出更健康的选择。
背外侧前额叶皮层和背侧前扣带皮层作为认知控制系统的关键节点,在认知神经科学中得到了广泛研究。对两者相互作用的了解,最多来自知觉决策任务中的功能研究。背侧前扣带皮层被认为监测不兼容反应的共同激活,充当检测错误可能性和控制需求的探测器;背外侧前额叶皮层则维持适当的任务目标并相应地指导行动选择。当检测到冲突时,背侧前扣带皮层的活动增加,进而激活背外侧前额叶皮层。
在延迟折扣中,类似的机制同样起作用。当面临两个看起来同样吸引人的选项时——比如今天的一百元和一个月后的两百元——反应冲突不可避免,背侧前扣带皮层活动随之增加。研究分析表明,背侧前扣带皮层是其活动与反应时间成比例的关键区域:选择越困难,反应时间越长,该区域的激活也越强。
背侧前扣带皮层与背外侧前额叶皮层网络是深思熟虑决策制定的基础,它指导选择朝向最大化价值的选项,无论是专门针对长期利益,还是在更一般意义上的价值权衡。
海马体在认知神经科学中以其在情节记忆中的作用而著称——记住特定生活事件的能力。情节记忆对于构想未来同样重要,海马体损伤的患者无法对假设的未来事件进行推理,因为人们依靠过去的经验来构想可能的未来情境。
对于延迟折扣,海马体的这种功能极为关键。回忆过去的经历和想象未来的发生,是控制决策制定的重要组成部分。有方向性的记忆回忆由背外侧前额叶皮层对海马体的输入以目标导向的方式引导。当未来奖励与具体时间节点相关联时,背外侧前额叶皮层和海马体都会表现出更强的激活,海马体对未来日期的募集越大,对未来奖励的折扣越少。
当人们面对相同的跨时间选择,若未来时间与具体事件相关联,比如某个节假日或重要里程碑,他们比仅考虑延迟天数时更有耐心。某人面临选择:现在收到五千元,或者在春节三个月后收到八千元。当他将等待与春节团聚的具体场景联系起来——用这笔钱给家人买礼物、准备年夜饭——他的海马体会更加活跃,这让他更容易选择等待以获得更大的奖励。这表明,控制过程不仅与价值评估相互作用,还与记忆等认知功能密切相关。

日常生活中面临跨时间困境时,可以采用多种策略来克服诱惑。这些策略与其所影响的大脑系统和认知过程紧密相关,理解其背后的神经机制,有助于更有针对性地运用这些方法。不同的策略在干预时机、认知消耗和适用情境上各有侧重,可以根据实际情况灵活选用。
避免诱惑最广为人知的策略被称为“预承诺”,即在实际选择时间之前提前承诺某种行动路线,以避免冲动反应。支付宝的定期理财产品是典型的预承诺工具,许多人选择将钱存入有锁定期的产品,即使收益率未必是最高的,但这限制了他们随意取款的冲动。健身房的年卡制度也是另一个典型案例,许多人支付全年费用来强制自己坚持锻炼计划,通过经济损失的压力帮助克服懒惰的诱惑。
预承诺策略极其有效。研究发现,当退休计划包含逐步增加储蓄的预承诺机制,通过承诺将未来加薪的一部分用于储蓄时,储蓄率会显著提升。
由于预承诺需要对未来情况的预期和规划,它依赖于背外侧前额叶皮层和海马体的参与。具体地思考未来情境,正是这两个脑区协同工作的结果。当人们能预见到自己存在某种行为上的“弱点”时,就会提前采取行动加以预防,这本身就是高水平认知控制的体现。
在没有预承诺的情况下,面对诱人的刺激时,可以通过认知重构来抑制情绪反应,帮助做出更理性的决定。研究者观察了人们在试图认知调节自身渴望时的大脑变化,当积极调节渴望时,人们做出了更健康的决定;当专注于食物选择的愉快方面时,则表现出较少的控制性决策。积极的情感调节与大脑中自动价值评估相关区域活动的减少有关。
一名准备减肥的大学生,面临是否购买奶茶的决定。当采用认知重构策略时,他会主动思考:每杯奶茶的热量相当于慢跑四十分钟才能消耗,而且长期饮用高糖饮料会影响皮肤状态和体重。通过改变关注焦点,将即时享乐的吸引力转向长期健康的考量,他更容易抵制即时的消费冲动。
一项研究中,儿童需要选择现在接受一个奖励,或在未来某个不确定时间接受两个奖励。这种延迟通常对儿童极为困难。研究发现,引导儿童思考奖励的抽象品质,降低其在感官层面的可取性,显著改善了他们等待更好结果的能力。延迟满足能力较差的儿童,在成年后被再次研究时,在试图抑制对诱人线索的反应时,奖励相关脑区表现出更强的激活,进一步证明抑制奖励相关激活是跨时间选择中控制决策的重要因素。
一个七岁的孩子面临选择:现在吃一颗糖果,还是等妈妈回来后可以吃两颗。研究人员引导他将糖果想象成“圆圆的彩色纸片”而不是“甜甜的美味糖果”。通过这种抽象化思维,孩子更容易抵制立即吃糖的诱惑,耐心等待获得更多奖励。
以更具体的方式思考未来,可以增加延迟奖励的吸引力。未来利益往往以非常笼统的方式被感知,缺乏与即时结果相同的鲜活感,改变构造方式可以一定程度上弥补这种不平衡。
研究还发现,将跨时间选择以“明确零”框架重新表述,能显著提升人们的耐心。通常,跨时间选择被表达为在较小即时奖励和较大延迟奖励之间做决定。将此重新表达为“现在一百元,一个月内什么都没有”或“现在什么都没有,但一个月内两百元”,人们会显著更有耐心。
一位消费者考虑是否现在花两千元买一个心仪的包,还是把钱存起来。传统框架是“现在买包,还是以后有更多钱”;明确零框架则是“现在买包,以后账户余额为零,还是现在不买,以后账户有更多收入”。在明确零框架下,更容易看到两个选择的真实后果,更可能选择延迟满足。
某学习平台发现,当课程完成时限从“三十天内完成”改为具体日期“十二月二十五日前完成”时,学生的完课率显著提高。这种具体化的时间表述激活了学生的海马体,让他们更容易坚持学习计划。
延迟折扣涵盖了一系列重要行为,其中情绪调节策略具有深远的实践意义,特别是对于改善冲动性问题。双系统模型假设存在一个自动的、充满情感的过程集,与更灵活、深思熟虑的系统相互作用来管理行为。从神经科学角度研究延迟折扣,意义已超出学术范畴,对理解和干预社会中广泛存在的自控问题具有重要价值。
神经科学为建立价值评估和自我控制在决策制定中的功能提供了补充性的实证方法,并为延迟折扣的机制理解带来了额外的细节层次。基于识别假设认知过程特质的分析,将腹内侧前额叶皮层和背侧前扣带皮层分别识别为自动价值评估和控制决策制定的组成部分。后续研究完善了对这些结构的理解,使人们对自我控制如何工作,以及价值评估和自我控制如何通过腹内侧前额叶皮层相互作用,有了更精细的认识。
在接下来的研究方向中,对支持跨时间决策制定的整体神经架构的理解,将不断扩展,纳入更多大脑系统和认知过程。目前对情绪调节如何影响跨时间选择期间的神经激活已有基本理解,但仍需进一步研究来阐明不同调节策略在大脑功能层面的差异。
这一领域的研究成果在临床和教育实践中具有直接的应用价值。了解冲动性的个体差异来源,有助于更清晰地识别高风险人群,如青少年、成瘾者和具有注意缺陷的个体,并为其提供更有针对性的干预方案。学校心理健康教育、戒瘾治疗和公共健康政策,都可以借鉴这一框架设计更有效的干预手段。
成瘾、肥胖和其他自我控制问题在社会中普遍存在,都可以通过跨时间选择的框架来理解。对延迟折扣更详细的机制理解,将为对抗这些问题的临床与教育干预提供更坚实的科学基础。