6 / 15

行为选择与人生方向

坐在电影院看恐怖片时，每当主角走向紧闭的门，阴森的配乐骤然响起，心跳便会不自觉地加速。这种反应并非偶然——在多次观影之后，大脑已悄悄将特定的音乐与紧张的视觉场景联系在了一起，形成一种无需刻意思考便能触发的条件反射。

心理学家长期研究有机体如何从世界经验中获取知识。学习，指的是基于经验而产生的行为或行为潜能相对持久的变化。

这一定义有两个核心：

变化必须源于经验，而非单纯由身体成熟或大脑自然发育所致
这种变化必须具备相对的持久性，能在不同场合稳定呈现。理解学习，是理解人类行为的起点。

学习的基本特征

学习并不总是以显而易见的方式呈现出来，它既体现在可观察的行为改变上，也潜藏于那些尚未外显的态度与价值观之中。厘清学习的本质特征，有助于更准确地把握学习发生的条件和规律。

学习最直接的体现是行为上的变化，如学会骑自行车、掌握一门方言。然而，大脑中发生的变化是看不见的，学习只能通过表现的改善才得以显露。问题在于，表现并不总能反映学习的全貌。一个人可能通过阅读大量文学作品逐渐培养出对文字的审美感受，但这种感受未必体现在任何可测量的行为之中。他所获得的，是行为变化的潜能——一种影响日后阅读选择和思维取向的内在倾向。这正是“学习”与“表现”之间的本质差异：所学的内容，与在行为中实际表达出来的内容，并非总是一致的。

要被称为学习，行为的变化还必须在不同场合相对一致。一旦学会游泳，这项技能便在相当程度上具备了稳定性。当然，一致并不等于永久。一名长期坚持练习的乒乓球爱好者，在停止训练数年后，技术水平可能有所退步。但曾经达到的那个高度，不会从记忆中完全消失。当他再次拿起球拍时，重拾技能的速度往往远快于当初从零开始——这便是“节省效应”的体现：学习留下了痕迹，即使表现已经衰退。

学习的核心在于经验如何改变我们的行为模式，就像水滴石穿一样，重复的经验逐渐塑造着我们的思维和行为方式。

学习的基本形式

在复杂的学习类型出现之前，有两种最原始、最基础的学习形式贯穿于几乎所有有机体的生活之中，那就是习惯化与敏感化。二者看似相反，却共同构成了有机体适应环境的底层机制。

习惯化是指当同一刺激反复出现时，有机体对它的反应逐渐减弱的现象。新学期开学的第一天，校园广播里的早操音乐会让许多同学抬头注意；但一个月之后，同样的旋律响起，大多数人已经充耳不闻，继续低头做自己的事。这并非因为听觉系统失灵，而是大脑判断这一刺激不再具有新鲜信息价值，主动降低了对它的关注程度。习惯化帮助有机体将有限的注意力集中在真正新颖的事件上，正是“见怪不怪”所描述的道理。

敏感化则与之相反，指有机体在经历强烈或有威胁性的刺激后，对后续刺激的反应反而增强。“一朝被蛇咬，十年怕井绳”是对这一现象最贴切的描述。曾经被狗咬伤过的人，日后哪怕只是在路边听到狗叫，也可能心跳加速、迅速远离。这种高度警觉的状态，是有机体在面对潜在威胁时保护自身的生存机制。

行为主义的兴起

现代心理学对学习的系统研究，很大程度上发端于约翰·华生在20世纪初的工作。华生创立了行为主义心理学流派，这一流派在此后近半个世纪里主导着美国心理学的发展方向。华生在1919年出版的《从行为主义观点看心理学》一书中，对心理学的研究对象作出了根本性的重新界定。

华生与可观察行为

华生认为，内省——即人们对自身感觉、意象和情感的言语报告——不是研究行为的可靠手段，因为它过于主观。科学家无从验证这些私人经验的准确性，而科学需要的是可以客观测量和重复验证的数据。既然内省不可信，心理学的研究对象就应当转向可观察的行为本身。

“意识状态，就像所谓的招魂术现象一样，无法客观验证，因此永远无法成为科学的数据。”华生将心理学的主要目标明确界定为“行为的预测和控制”。

这种对客观性的强调推进了心理学的科学化进程，但也引发了一个长期争论——人类复杂的心理现象，是否真的能够完全用行为术语来解释？

斯金纳与激进行为主义

伯尔赫斯·弗雷德里克·斯金纳在华生的基础上走得更远，提出了“激进行为主义”的立场。斯金纳的关注点不在于内在心理状态是否可以作为研究数据，而在于这些内在状态是否真的能够“引发”行为。在他看来，思考、想象等心理活动本身并不是行为的原因，而是环境刺激所产生的结果。

将一只禁食24小时的鸽子放进一个装置，当它啄击小圆盘时便能获得食物。很快，鸽子便学会了这一动作。斯金纳指出，这整个过程可以用环境事件完整解释：禁食造成的驱力，以及食物所起到的强化作用。鸽子内心“感到饥饿”这一主观体验，是食物剥夺的结果，而非啄击行为的原因——无需诉诸任何内在心理状态，行为便能得到充分的解释。

“要解释鸟类的行为，不需要了解其内在心理状态，只需要了解学习原理——正是这些原理使得鸟类获得了行为与奖励之间的联系。”——斯金纳

经典条件反射

回到开篇的恐怖电影场景，恐怖音乐响起时心跳加速，并不是什么神秘反应，而是身体学会了在两个环境事件之间建立联系的结果：音乐与视觉恐惧场景反复同时出现，身体便将二者绑定在了一起。这种学习形式被称为经典条件反射——原本不引起反应的中性刺激，通过与能自然引发反应的刺激反复配对，最终也能独立引发相似的反应。

巴甫洛夫的实验发现

经典条件反射的系统研究源于一次意外。俄国生理学家伊万·巴甫洛夫原本在研究狗的消化过程，他设计了一套技术，将狗腺体的分泌物引出体外加以测量。助手每次将肉粉放入狗嘴时，流口水的反应便会出现。然而在多次重复之后，巴甫洛夫发现了一个奇异的现象——狗在肉粉尚未入口之前，仅仅看到食物、看到拿着食物的助手，甚至只是听到助手的脚步声，便已开始流口水。学习，就这样以一种出人意料的方式显现出来。

此后，巴甫洛夫对这一现象展开了系统研究：

将狗放在约束装具中，定期呈现音调等中性刺激，随后给予食物

起初，狗对音调仅表现出定向反应——竖起耳朵，转动头部寻找声源

经过反复配对训练后，音调一响，狗便开始流口水，定向反应逐渐消失

将灯光、节拍器等不同中性刺激替换音调进行同样的配对训练，均能观察到相同结果，证明了这一现象的普遍性

条件反射的基本要素

经典条件反射程序涉及几个核心概念，理解这些概念是掌握这一学习机制的基础。

任何能够自然引发反射性行为的刺激，被称为无条件刺激，因为这种控制无需依赖先前的学习。无条件刺激所引发的行为，称为无条件反应。在巴甫洛夫的实验中，肉粉是无条件刺激，流口水是无条件反应。

灯光和音调在实验之初对流口水没有任何控制力，它们是中性刺激。经过与无条件刺激的反复配对之后，这些中性刺激便转变为条件刺激——其引发行为的能力，取决于它与无条件刺激所建立起来的联系。条件刺激所引发的反应，称为条件反应。

大自然赋予无条件刺激与无条件反应之间的天然联系，而经典条件反射所创造的，是条件刺激与条件反应之间的后天联系。条件刺激因此获得了部分原本属于无条件刺激的行为影响力。

手机铃声本是一个中性刺激，但在长期使用过程中，它频繁伴随着重要消息或紧急通知一同出现。久而久之，仅仅是铃声响起，身体便会产生一种隐约的紧张感——这正是条件反射在日常生活中无声运作的印记。

经典条件反射的过程与应用

经典条件反射并非静止的，它在时间中动态地发展、衰退，甚至在不同刺激之间迁移扩散。理解这些过程，不仅有助于解释情绪和偏好的形成，也为理解恐惧与成瘾等行为现象提供了重要线索。

获得、消退与自发恢复

条件反应首次出现并在反复训练中逐渐增强的过程，称为获得。条件刺激和无条件刺激之间的时间间隔至关重要——二者必须在时间上足够接近，才能被大脑感知为彼此相关。研究发现，延迟条件反射效果最佳，即条件刺激在无条件刺激出现之前开始呈现，并持续到无条件刺激出现为止。若时间间隔过长，联系的建立便会大打折扣。

时间模式	特征	效果
延迟条件反射	条件刺激先出现，持续至无条件刺激出现	效果最佳
痕迹条件反射	条件刺激在无条件刺激出现前停止	效果较好
同时条件反射	两个刺激同时出现	效果一般
倒退条件反射	条件刺激在无条件刺激之后出现	效果较差

当条件刺激不再伴随无条件刺激出现时，条件反应会逐渐减弱，最终停止——这一过程称为消退。然而消退并不意味着遗忘。经历消退训练之后，若条件刺激再次单独出现，条件反应往往会以微弱的形式重新浮现，巴甫洛夫将此称为自发恢复。

消退只是压制了条件反应的表现，并未真正抹去原有的学习痕迹。一旦原来的配对训练恢复，条件反应会比最初获得时更快地重新建立起来，这正是“节省效应”的体现。

刺激泛化与辨别

在有机体获得条件反应之后，与条件刺激相似的其他刺激也可能引发类似的反应，这一现象称为刺激泛化。被某只狗咬伤的孩子，此后可能对所有的狗都产生恐惧，而不仅仅是那只特定的狗。泛化使有机体无需对每一个细微差别都重新学习，具有重要的适应价值。

然而，过度泛化有时也会产生问题，这时就需要刺激辨别来加以校正。通过辨别训练，有机体学会只对特定刺激作出反应，而对其他相似但不具预测意义的刺激保持克制。经过一段时间的接触，原先对所有狗都感到恐惧的孩子，也许能逐渐学会区分吠叫凶猛的陌生犬与温顺亲人的家犬，对二者作出不同的反应。泛化与辨别之间的平衡，使有机体既能高效地将已有经验迁移应用，又能保持对环境细节的敏感分辨。

情绪、偏好与成瘾行为

经典条件反射在日常生活中最隐蔽也最普遍的作用，体现在情绪和偏好的形成上。仔细回想一下，生活中有没有一些无法完全解释原因的强烈情感——对某个地方莫名的亲切感，或是对某种气味的本能厌恶？这些感受很可能是条件反射长期积累的产物，而非理性思考的结果。

广告行业深谙此道。某些饮料和汽车品牌的广告，几乎总是将产品与青春活力、家庭温情或成功形象放在一起呈现。产品本身不过是一个中性刺激，但在反复与情感场景配对之后，它便逐渐获得了唤起特定情绪的能力。

条件反射产生的情绪反应往往绕过理性判断直接发生。正因如此，即便明知某种食物无害，一旦它的外形或气味与令人不适的经历产生了联系，厌恶感依然会涌上心头——这不是意志力的问题，而是条件学习的结果。

成瘾行为同样与经典条件反射密切相关。在使用成瘾物质的过程中，药物作为无条件刺激引起生理反应，身体为维持内部平衡会产生相应的对抗性反应。随着反复使用，吸毒的环境、器具乃至特定的人际关系，都可能成为条件刺激，在药物尚未进入体内时便触发身体的预备性反应。这一机制解释了耐受性的形成：在熟悉环境中，身体已提前做好准备，需要更大剂量才能产生同等效果；而在陌生环境中，这种预备性反应缺失，原本“惯常”的剂量可能造成严重危险。中国多地的戒毒康复研究均证实，脱离原有生活环境是降低复吸风险的重要因素，这背后正是条件反射原理在发挥作用。

操作性条件反射

电影散场后，你可能会对自己说，以后再也不看恐怖片了。这句话背后隐含着另一种截然不同的学习逻辑——你意识到某个行为带来了不愉快的后果，因此决定在未来减少这一行为。这种由行为后果决定行为频率的学习机制，称为操作性条件反射。与经典条件反射不同，操作性条件反射关注的不是刺激之间的配对，而是行为与环境之间的互动关系。

效果定律与行为塑造

与巴甫洛夫同时代的美国心理学家桑代克，通过观察猫从谜箱中逃脱的行为，提出了行为学习的基本原则。猫被关进一个带有机关的木箱中，食物放在箱外。起初，猫只是毫无目的地乱抓乱踢，偶然触碰到机关才得以逃脱。随着试验次数增加，无效行为逐渐减少，直奔机关的动作变得越来越迅速。

桑代克将这一规律概括为效果定律：产生满意后果的行为，在相同情境下再次出现的可能性会增加；产生不满意后果的行为，则会逐渐消退。这种刺激—反应联系的建立过程，是渐进而自动的，动物通过反复尝试与错误，让有效行为在后果的筛选下保留下来。

斯金纳在桑代克的基础上发明了操作箱，系统研究环境后果如何影响行为。他将由有机体主动发出、能对环境产生可观察效应的行为称为“操作”。鸽子啄食、大鼠觅食、婴儿咕咕叫——这些行为都不是由特定刺激直接引发的，而是有机体主动与环境互动的结果。通过系统操纵这些行为的后果，行为出现的频率便可以被精确地增加或减少。

操作性条件反射的核心逻辑在于：有机体学会了哪些行为能在特定环境中产生理想的效果。婴儿的咕咕声如果总能换来父母温柔的回应，这个声音便会越来越频繁地出现。

强化与惩罚

操作性条件反射中最关键的两个概念，是强化与惩罚。二者都通过改变行为的后果来影响行为频率，但方向相反。

强化指的是某种后果使行为在未来出现的可能性增加。强化又分为正强化和负强化两种形式：

正强化是在行为发生之后呈现一个有吸引力的刺激，从而使该行为变得更加频繁。学生课堂上积极回答问题，老师给予表扬，这份表扬便是正强化物，使举手发言的行为得到强化。负强化则是在行为发生之后移除一个令人厌恶的刺激，同样会使该行为的频率上升。下雨时撑伞，伞移除了被淋湿的不适感，这个不适感的消除便是负强化——它让人在下次下雨时更可能带伞出门。

惩罚与强化的方向相反，它使行为在未来出现的可能性降低。正惩罚是在行为后呈现厌恶刺激：触碰滚烫的锅沿引发疼痛，疼痛惩罚了这一行为，使人下次不再轻易去碰。负惩罚则是在行为后移除吸引性刺激：父母因孩子打架而没收了他心爱的游戏机，游戏机的失去便是负惩罚，意在减少打架行为的发生。

正强化和负强化虽然名称相似，但作用机制不同。二者的共同点是都会增加行为频率；区别在于，正强化通过给予吸引性刺激来实现，负强化通过移除厌恶性刺激来实现。将两者混淆是学习这一概念时最常见的错误。

辨别刺激与情境控制

有机体的行为并非在任何情境下都以同样的方式出现。学生在课堂上保持安静，在操场上却可以大声嬉戏，这不是矛盾，而是情境控制在起作用。

在特定行为之前出现、并与强化或惩罚存在系统联系的刺激，被称为辨别刺激。有机体学会识别这些信号——在某些刺激存在时，特定行为能带来理想后果；在另一些刺激存在时，同样的行为则可能招致惩罚。交通信号灯是生活中最典型的辨别刺激：绿灯意味着通行会得到“顺利前行”的强化，红灯则意味着通行可能带来罚款甚至事故的惩罚。斯金纳将辨别刺激——行为——后果这一序列称为三项权变，认为它可以解释大多数人类的日常行为。

强化计划

斯金纳在一次偶然的机会中发现，并非每次行为都需要得到强化，行为才能维持下去。某个周末实验室食物告急，他不得不减少给大鼠的奖励频次，只在固定时间间隔之后才给予食物。出乎意料的是，大鼠的反应频率并未因此下降。更令人惊讶的是，当完全停止给食时，这些只接受过间歇强化的大鼠，比那些每次都有奖励的大鼠坚持了更长的时间——这就是部分强化效应。

强化计划	强化规则	行为特征	生活中的对应情形
固定比率	完成固定次数后强化	高频但强化后有短暂停顿	快递员每送达一定数量包裹获得提成
变比率	平均次数固定，具体次数随机	最高且最持久的反应率	彩票购买，不知道哪张会中奖
固定间隔	固定时间后首次反应得到强化	临近强化时反应增多	每月固定发薪，临近发薪日工作积极性提升
变间隔	平均时间固定，具体时间随机	稳定而持续的低中频反应	老师随机进行抽查测验，促使学生每天复习

变比率计划之所以能产生最难消退的行为，正是因为有机体永远无法确定下一次强化何时到来——每一次行为，都可能是那个“关键的一次”。赌博的吸引力在心理学意义上，正来源于此。

行为塑造与生物限制

老鼠并不会天生按压杠杆，鸽子也不会生来便知道啄击小圆盘有食物可得。复杂行为的习得，有赖于一种称为塑造的技术：通过依次强化越来越接近目标行为的中间步骤，最终引导有机体做出期望中的行为。

学习汉字是塑造原理在教育中的典型体现。教学并不从一开始就要求学生写出整个字，而是先学笔画，再学偏旁，再到整字，最后到组词造句。钢琴教学中从单手练习到双手协调，运动训练中将复杂动作分解为若干步骤逐一掌握，都是塑造原理的具体运用。

然而，行为塑造并非无边无际。动物训练师布兰德夫妇发现，训练有素的浣熊在学会将硬币投入储钱罐后，当硬币数量增加，它便开始反复摩擦硬币——这正是浣熊在野外“清洗食物”的本能动作。无论训练如何系统，这种向本能行为的回归依然会出现，被称为本能漂移。

本能漂移说明学习并非无限可塑，生物体对特定类型的学习存在天生的倾向与限制，这被称为生物预备性。老鼠极易将味觉与恶心联系起来，却很难将声音与恶心建立同等强度的联系，这是进化历程中形成的生存偏好，而非训练能够轻易改变的。

“江山易改，本性难移”这句古语，在心理学意义上有其深刻的道理。顺应生物天性而非强行对抗，往往是更有效的教育和训练策略。

认知对学习的影响

经典条件反射和操作性条件反射提供了理解行为变化的基础框架，但仅凭这两种机制，并不足以解释所有的学习现象。某些学习形式涉及更为复杂的内在过程——思维、记忆、期望与理解。这些涉及知识表征和处理的心理活动，统称为认知。越来越多的证据显示，行为的变化不仅受外部刺激和后果的驱动，认知过程在其中同样扮演着不可忽视的角色。

认知地图

爱德华·托尔曼是最早系统研究学习中认知过程的心理学家之一。他设计了一种迷宫实验：让大鼠在迷宫中自由探索一段时间后，将原有的通路阻断，大鼠是否能找到新的路径？结果发现，有过探索经验的大鼠在原路被堵之后，能够几乎立刻选择最短的迂回路线，而这条路线之前从未因带来食物奖励而被强化过。

这意味着大鼠并非只学会了“按特定顺序做出特定动作”，而是在大脑中形成了迷宫整体布局的内部表征——即认知地图。凭借这张内部地图，大鼠能够灵活地规划路径，而不是机械地重复固定的刺激—反应序列。

现代研究持续证实了多个物种令人印象深刻的空间记忆能力。松鸦每年秋天在分散区域掩埋数千颗种子，数月之后仍能以极高的准确率逐一找回。这种能力不依赖运气，而是依赖大脑中始终保持更新的认知地图。

概念学习

认知过程不仅体现在空间记忆中，还体现在有机体对抽象规律的把握上。研究者向鸽子呈现两个彩色圆圈的阵列，在短暂的延迟后，其中一种颜色发生了改变。鸽子只需啄击改变了颜色的圆圈便能获得奖励。经过训练，鸽子不仅掌握了用于训练的颜色，还能将同样的反应迁移到从未接触过的全新颜色组合之上。

这一结果表明，鸽子学会的并非只是“对特定颜色作出特定反应”，而是掌握了“颜色发生了变化”这一更为抽象的概念。有机体能够从具体经验中提炼出超越具体实例的规律，这正是认知学习区别于简单条件反射的关键所在。

观察学习

人类与许多动物在尝试新事物时的一大区别，在于人类会主动观察他人的经验，并从中获取信息。当你在餐厅看到其他食客津津有味地品尝某道菜，你点这道菜的意愿便会上升；当你目睹朋友吃了某种东西后身体不适，你便会主动绕开这种食物。这种通过观察他人行为及其后果来改变自身行为的方式，称为观察学习。

班杜拉的实验提供了观察学习的有力证明：儿童在观看成人攻击充气玩偶的视频之后，独自玩耍时也表现出了类似的攻击行为，即便没有人教导他们这样做，也没有任何直接的奖励驱动。观察本身，就足以触发学习。

观察学习得以发生，是因为大脑能够从他人的经历中建立认知期望：“如果我也这样做，可能会得到相似的结果。”这种期望在行动发生之前便已形成，无需亲身经历强化或惩罚。

“见贤思齐焉，见不贤而内自省也”，这句出自《论语》的古训，恰好概括了观察学习的核心逻辑——通过观察他人的行为与后果，调整自己的行为取向。观察学习使人类得以站在前人的经验之上，大幅压缩了通过亲身试错所需的时间与代价。

观察学习的效果受到以下四个要素的制约：

要素	说明	生活中的体现
注意力	必须充分关注榜样的行为，年龄或经历相近的榜样更易吸引注意	“近朱者赤，近墨者黑”道出了榜样选择的重要性
记忆保持	观察到的行为须在记忆中留存，以便日后提取	反复播放的公益广告比一次性宣传更有行为改变效果
行为复制	观察者须具备模仿所需的能力，超出能力范围的行为难以复制	儿童更容易模仿同龄人的行为而非成人的复杂技能
模仿动机	观察者须有模仿的理由，看到榜样行为带来奖励，模仿意愿显著提升	获奖学生分享学习方法后，同班同学往往会主动效仿

班杜拉的研究还揭示了媒体内容通过观察学习对行为的影响。长期观看暴力内容的儿童，不仅在行为上表现出更高的攻击倾向，还倾向于高估现实世界中的暴力程度，并对暴力逐渐产生麻木感。这三重效应相互叠加，构成了媒体暴力研究中反复被证实的基本结论。

媒体内容通过观察学习影响行为，这种影响是双向的。积极正面的内容能够有效促进亲社会行为，帮助儿童建立合作、分享和同理心等品质；而长期接触攻击性内容则会在潜移默化中降低行为的道德门槛。

学习如何塑造行为

回到开篇那场恐怖电影：你选择走进影院，是因为朋友的推荐让你预期会有不错的体验，这是观察学习在发挥作用；即便换了一条路，你依然找到了影院，因为脑中存有那片区域的认知地图；电影放映过程中，恐怖音乐与惊吓场景的反复同时出现，让你的心跳对音乐产生了条件反射；散场后你暗自决定，以后再也不来了——这是操作性条件反射中惩罚效应的体现。一次普通的观影经历，悄然交织着多种不同的学习机制。

学习并非只发生在课堂，它渗透在每一次经历、每一段关系、每一个习惯的形成之中。经典条件反射解释了情绪与偏好为何在不知不觉中形成；操作性条件反射揭示了行为如何在后果的塑造下保留或消退；认知学习则展示了思维、期望与模仿在行为变化中的深远作用。三种机制各有侧重，却彼此补充，共同构成了理解人类学习的基本图景。

理解这些原理，不只是心理学课堂上的知识积累，它对教育实践、习惯养成乃至自我成长都有直接的指导意义。克服一种恐惧，需要了解消退的机制；培养一个好习惯，需要利用强化计划的规律；向他人学习，需要识别值得关注与模仿的榜样。学习心理学的价值，正在于让这些平日无形运作的机制变得清晰可见、可以主动运用。

“学而时习之，不亦说乎？”这句两千年前的智慧，与现代心理学的发现不谋而合——学习是持续的过程，在不断的实践与反思之中，行为才能真正发生持久的变化。

行为选择与人生方向 | 自在学