
坐在电影院看恐怖片时,每当主角走向紧闭的门,阴森的配乐骤然响起,心跳便会不自觉地加速。这种反应并非偶然——在多次观影之后,大脑已悄悄将特定的音乐与紧张的视觉场景联系在了一起,形成一种无需刻意思考便能触发的条件反射。
心理学家长期研究有机体如何从世界经验中获取知识。学习,指的是基于经验而产生的行为或行为潜能相对持久的变化。
这一定义有两个核心:
变化必须源于经验,而非单纯由身体成熟或大脑自然发育所致
这种变化必须具备相对的持久性,能在不同场合稳定呈现。理解学习,是理解人类行为的起点。
学习并不总是以显而易见的方式呈现出来,它既体现在可观察的行为改变上,也潜藏于那些尚未外显的态度与价值观之中。厘清学习的本质特征,有助于更准确地把握学习发生的条件和规律。
学习最直接的体现是行为上的变化,如学会骑自行车、掌握一门方言。然而,大脑中发生的变化是看不见的,学习只能通过表现的改善才得以显露。问题在于,表现并不总能反映学习的全貌。一个人可能通过阅读大量文学作品逐渐培养出对文字的审美感受,但这种感受未必体现在任何可测量的行为之中。他所获得的,是行为变化的潜能——一种影响日后阅读选择和思维取向的内在倾向。这正是“学习”与“表现”之间的本质差异:所学的内容,与在行为中实际表达出来的内容,并非总是一致的。
要被称为学习,行为的变化还必须在不同场合相对一致。一旦学会游泳,这项技能便在相当程度上具备了稳定性。当然,一致并不等于永久。一名长期坚持练习的乒乓球爱好者,在停止训练数年后,技术水平可能有所退步。但曾经达到的那个高度,不会从记忆中完全消失。当他再次拿起球拍时,重拾技能的速度往往远快于当初从零开始——这便是“节省效应”的体现:学习留下了痕迹,即使表现已经衰退。
学习的核心在于经验如何改变我们的行为模式,就像水滴石穿一样,重复的经验逐渐塑造着我们的思维和行为方式。
在复杂的学习类型出现之前,有两种最原始、最基础的学习形式贯穿于几乎所有有机体的生活之中,那就是习惯化与敏感化。二者看似相反,却共同构成了有机体适应环境的底层机制。
习惯化是指当同一刺激反复出现时,有机体对它的反应逐渐减弱的现象。新学期开学的第一天,校园广播里的早操音乐会让许多同学抬头注意;但一个月之后,同样的旋律响起,大多数人已经充耳不闻,继续低头做自己的事。这并非因为听觉系统失灵,而是大脑判断这一刺激不再具有新鲜信息价值,主动降低了对它的关注程度。习惯化帮助有机体将有限的注意力集中在真正新颖的事件上,正是“见怪不怪”所描述的道理。
敏感化则与之相反,指有机体在经历强烈或有威胁性的刺激后,对后续刺激的反应反而增强。“一朝被蛇咬,十年怕井绳”是对这一现象最贴切的描述。曾经被狗咬伤过的人,日后哪怕只是在路边听到狗叫,也可能心跳加速、迅速远离。这种高度警觉的状态,是有机体在面对潜在威胁时保护自身的生存机制。
现代心理学对学习的系统研究,很大程度上发端于约翰·华生在20世纪初的工作。华生创立了行为主义心理学流派,这一流派在此后近半个世纪里主导着美国心理学的发展方向。华生在1919年出版的《从行为主义观点看心理学》一书中,对心理学的研究对象作出了根本性的重新界定。
华生认为,内省——即人们对自身感觉、意象和情感的言语报告——不是研究行为的可靠手段,因为它过于主观。科学家无从验证这些私人经验的准确性,而科学需要的是可以客观测量和重复验证的数据。既然内省不可信,心理学的研究对象就应当转向可观察的行为本身。
“意识状态,就像所谓的招魂术现象一样,无法客观验证,因此永远无法成为科学的数据。”华生将心理学的主要目标明确界定为“行为的预测和控制”。
这种对客观性的强调推进了心理学的科学化进程,但也引发了一个长期争论——人类复杂的心理现象,是否真的能够完全用行为术语来解释?
伯尔赫斯·弗雷德里克·斯金纳在华生的基础上走得更远,提出了“激进行为主义”的立场。斯金纳的关注点不在于内在心理状态是否可以作为研究数据,而在于这些内在状态是否真的能够“引发”行为。在他看来,思考、想象等心理活动本身并不是行为的原因,而是环境刺激所产生的结果。
将一只禁食24小时的鸽子放进一个装置,当它啄击小圆盘时便能获得食物。很快,鸽子便学会了这一动作。斯金纳指出,这整个过程可以用环境事件完整解释:禁食造成的驱力,以及食物所起到的强化作用。鸽子内心“感到饥饿”这一主观体验,是食物剥夺的结果,而非啄击行为的原因——无需诉诸任何内在心理状态,行为便能得到充分的解释。
“要解释鸟类的行为,不需要了解其内在心理状态,只需要了解学习原理——正是这些原理使得鸟类获得了行为与奖励之间的联系。”——斯金纳

回到开篇的恐怖电影场景,恐怖音乐响起时心跳加速,并不是什么神秘反应,而是身体学会了在两个环境事件之间建立联系的结果:音乐与视觉恐惧场景反复同时出现,身体便将二者绑定在了一起。这种学习形式被称为经典条件反射——原本不引起反应的中性刺激,通过与能自然引发反应的刺激反复配对,最终也能独立引发相似的反应。
经典条件反射的系统研究源于一次意外。俄国生理学家伊万·巴甫洛夫原本在研究狗的消化过程,他设计了一套技术,将狗腺体的分泌物引出体外加以测量。助手每次将肉粉放入狗嘴时,流口水的反应便会出现。然而在多次重复之后,巴甫洛夫发现了一个奇异的现象——狗在肉粉尚未入口之前,仅仅看到食物、看到拿着食物的助手,甚至只是听到助手的脚步声,便已开始流口水。学习,就这样以一种出人意料的方式显现出来。
此后,巴甫洛夫对这一现象展开了系统研究:
将狗放在约束装具中,定期呈现音调等中性刺激,随后给予食物
起初,狗对音调仅表现出定向反应——竖起耳朵,转动头部寻找声源
经过反复配对训练后,音调一响,狗便开始流口水,定向反应逐渐消失
将灯光、节拍器等不同中性刺激替换音调进行同样的配对训练,均能观察到相同结果,证明了这一现象的普遍性
经典条件反射程序涉及几个核心概念,理解这些概念是掌握这一学习机制的基础。
任何能够自然引发反射性行为的刺激,被称为无条件刺激,因为这种控制无需依赖先前的学习。无条件刺激所引发的行为,称为无条件反应。在巴甫洛夫的实验中,肉粉是无条件刺激,流口水是无条件反应。
灯光和音调在实验之初对流口水没有任何控制力,它们是中性刺激。经过与无条件刺激的反复配对之后,这些中性刺激便转变为条件刺激——其引发行为的能力,取决于它与无条件刺激所建立起来的联系。条件刺激所引发的反应,称为条件反应。
大自然赋予无条件刺激与无条件反应之间的天然联系,而经典条件反射所创造的,是条件刺激与条件反应之间的后天联系。条件刺激因此获得了部分原本属于无条件刺激的行为影响力。
手机铃声本是一个中性刺激,但在长期使用过程中,它频繁伴随着重要消息或紧急通知一同出现。久而久之,仅仅是铃声响起,身体便会产生一种隐约的紧张感——这正是条件反射在日常生活中无声运作的印记。
经典条件反射并非静止的,它在时间中动态地发展、衰退,甚至在不同刺激之间迁移扩散。理解这些过程,不仅有助于解释情绪和偏好的形成,也为理解恐惧与成瘾等行为现象提供了重要线索。
条件反应首次出现并在反复训练中逐渐增强的过程,称为获得。条件刺激和无条件刺激之间的时间间隔至关重要——二者必须在时间上足够接近,才能被大脑感知为彼此相关。研究发现,延迟条件反射效果最佳,即条件刺激在无条件刺激出现之前开始呈现,并持续到无条件刺激出现为止。若时间间隔过长,联系的建立便会大打折扣。
当条件刺激不再伴随无条件刺激出现时,条件反应会逐渐减弱,最终停止——这一过程称为消退。然而消退并不意味着遗忘。经历消退训练之后,若条件刺激再次单独出现,条件反应往往会以微弱的形式重新浮现,巴甫洛夫将此称为自发恢复。
消退只是压制了条件反应的表现,并未真正抹去原有的学习痕迹。一旦原来的配对训练恢复,条件反应会比最初获得时更快地重新建立起来,这正是“节省效应”的体现。
在有机体获得条件反应之后,与条件刺激相似的其他刺激也可能引发类似的反应,这一现象称为刺激泛化。被某只狗咬伤的孩子,此后可能对所有的狗都产生恐惧,而不仅仅是那只特定的狗。泛化使有机体无需对每一个细微差别都重新学习,具有重要的适应价值。
然而,过度泛化有时也会产生问题,这时就需要刺激辨别来加以校正。通过辨别训练,有机体学会只对特定刺激作出反应,而对其他相似但不具预测意义的刺激保持克制。经过一段时间的接触,原先对所有狗都感到恐惧的孩子,也许能逐渐学会区分吠叫凶猛的陌生犬与温顺亲人的家犬,对二者作出不同的反应。泛化与辨别之间的平衡,使有机体既能高效地将已有经验迁移应用,又能保持对环境细节的敏感分辨。
经典条件反射在日常生活中最隐蔽也最普遍的作用,体现在情绪和偏好的形成上。仔细回想一下,生活中有没有一些无法完全解释原因的强烈情感——对某个地方莫名的亲切感,或是对某种气味的本能厌恶?这些感受很可能是条件反射长期积累的产物,而非理性思考的结果。
广告行业深谙此道。某些饮料和汽车品牌的广告,几乎总是将产品与青春活力、家庭温情或成功形象放在一起呈现。产品本身不过是一个中性刺激,但在反复与情感场景配对之后,它便逐渐获得了唤起特定情绪的能力。
条件反射产生的情绪反应往往绕过理性判断直接发生。正因如此,即便明知某种食物无害,一旦它的外形或气味与令人不适的经历产生了联系,厌恶感依然会涌上心头——这不是意志力的问题,而是条件学习的结果。
成瘾行为同样与经典条件反射密切相关。在使用成瘾物质的过程中,药物作为无条件刺激引起生理反应,身体为维持内部平衡会产生相应的对抗性反应。随着反复使用,吸毒的环境、器具乃至特定的人际关系,都可能成为条件刺激,在药物尚未进入体内时便触发身体的预备性反应。这一机制解释了耐受性的形成:在熟悉环境中,身体已提前做好准备,需要更大剂量才能产生同等效果;而在陌生环境中,这种预备性反应缺失,原本“惯常”的剂量可能造成严重危险。中国多地的戒毒康复研究均证实,脱离原有生活环境是降低复吸风险的重要因素,这背后正是条件反射原理在发挥作用。

电影散场后,你可能会对自己说,以后再也不看恐怖片了。这句话背后隐含着另一种截然不同的学习逻辑——你意识到某个行为带来了不愉快的后果,因此决定在未来减少这一行为。这种由行为后果决定行为频率的学习机制,称为操作性条件反射。与经典条件反射不同,操作性条件反射关注的不是刺激之间的配对,而是行为与环境之间的互动关系。
与巴甫洛夫同时代的美国心理学家桑代克,通过观察猫从谜箱中逃脱的行为,提出了行为学习的基本原则。猫被关进一个带有机关的木箱中,食物放在箱外。起初,猫只是毫无目的地乱抓乱踢,偶然触碰到机关才得以逃脱。随着试验次数增加,无效行为逐渐减少,直奔机关的动作变得越来越迅速。
桑代克将这一规律概括为效果定律:产生满意后果的行为,在相同情境下再次出现的可能性会增加;产生不满意后果的行为,则会逐渐消退。这种刺激—反应联系的建立过程,是渐进而自动的,动物通过反复尝试与错误,让有效行为在后果的筛选下保留下来。
斯金纳在桑代克的基础上发明了操作箱,系统研究环境后果如何影响行为。他将由有机体主动发出、能对环境产生可观察效应的行为称为“操作”。鸽子啄食、大鼠觅食、婴儿咕咕叫——这些行为都不是由特定刺激直接引发的,而是有机体主动与环境互动的结果。通过系统操纵这些行为的后果,行为出现的频率便可以被精确地增加或减少。
操作性条件反射的核心逻辑在于:有机体学会了哪些行为能在特定环境中产生理想的效果。婴儿的咕咕声如果总能换来父母温柔的回应,这个声音便会越来越频繁地出现。
操作性条件反射中最关键的两个概念,是强化与惩罚。二者都通过改变行为的后果来影响行为频率,但方向相反。
强化指的是某种后果使行为在未来出现的可能性增加。强化又分为正强化和负强化两种形式:
正强化是在行为发生之后呈现一个有吸引力的刺激,从而使该行为变得更加频繁。学生课堂上积极回答问题,老师给予表扬,这份表扬便是正强化物,使举手发言的行为得到强化。负强化则是在行为发生之后移除一个令人厌恶的刺激,同样会使该行为的频率上升。下雨时撑伞,伞移除了被淋湿的不适感,这个不适感的消除便是负强化——它让人在下次下雨时更可能带伞出门。
惩罚与强化的方向相反,它使行为在未来出现的可能性降低。正惩罚是在行为后呈现厌恶刺激:触碰滚烫的锅沿引发疼痛,疼痛惩罚了这一行为,使人下次不再轻易去碰。负惩罚则是在行为后移除吸引性刺激:父母因孩子打架而没收了他心爱的游戏机,游戏机的失去便是负惩罚,意在减少打架行为的发生。
正强化和负强化虽然名称相似,但作用机制不同。二者的共同点是都会增加行为频率;区别在于,正强化通过给予吸引性刺激来实现,负强化通过移除厌恶性刺激来实现。将两者混淆是学习这一概念时最常见的错误。
有机体的行为并非在任何情境下都以同样的方式出现。学生在课堂上保持安静,在操场上却可以大声嬉戏,这不是矛盾,而是情境控制在起作用。
在特定行为之前出现、并与强化或惩罚存在系统联系的刺激,被称为辨别刺激。有机体学会识别这些信号——在某些刺激存在时,特定行为能带来理想后果;在另一些刺激存在时,同样的行为则可能招致惩罚。交通信号灯是生活中最典型的辨别刺激:绿灯意味着通行会得到“顺利前行”的强化,红灯则意味着通行可能带来罚款甚至事故的惩罚。斯金纳将辨别刺激——行为——后果这一序列称为三项权变,认为它可以解释大多数人类的日常行为。
斯金纳在一次偶然的机会中发现,并非每次行为都需要得到强化,行为才能维持下去。某个周末实验室食物告急,他不得不减少给大鼠的奖励频次,只在固定时间间隔之后才给予食物。出乎意料的是,大鼠的反应频率并未因此下降。更令人惊讶的是,当完全停止给食时,这些只接受过间歇强化的大鼠,比那些每次都有奖励的大鼠坚持了更长的时间——这就是部分强化效应。
变比率计划之所以能产生最难消退的行为,正是因为有机体永远无法确定下一次强化何时到来——每一次行为,都可能是那个“关键的一次”。赌博的吸引力在心理学意义上,正来源于此。
老鼠并不会天生按压杠杆,鸽子也不会生来便知道啄击小圆盘有食物可得。复杂行为的习得,有赖于一种称为塑造的技术:通过依次强化越来越接近目标行为的中间步骤,最终引导有机体做出期望中的行为。
学习汉字是塑造原理在教育中的典型体现。教学并不从一开始就要求学生写出整个字,而是先学笔画,再学偏旁,再到整字,最后到组词造句。钢琴教学中从单手练习到双手协调,运动训练中将复杂动作分解为若干步骤逐一掌握,都是塑造原理的具体运用。
然而,行为塑造并非无边无际。动物训练师布兰德夫妇发现,训练有素的浣熊在学会将硬币投入储钱罐后,当硬币数量增加,它便开始反复摩擦硬币——这正是浣熊在野外“清洗食物”的本能动作。无论训练如何系统,这种向本能行为的回归依然会出现,被称为本能漂移。
本能漂移说明学习并非无限可塑,生物体对特定类型的学习存在天生的倾向与限制,这被称为生物预备性。老鼠极易将味觉与恶心联系起来,却很难将声音与恶心建立同等强度的联系,这是进化历程中形成的生存偏好,而非训练能够轻易改变的。
“江山易改,本性难移”这句古语,在心理学意义上有其深刻的道理。顺应生物天性而非强行对抗,往往是更有效的教育和训练策略。

经典条件反射和操作性条件反射提供了理解行为变化的基础框架,但仅凭这两种机制,并不足以解释所有的学习现象。某些学习形式涉及更为复杂的内在过程——思维、记忆、期望与理解。这些涉及知识表征和处理的心理活动,统称为认知。越来越多的证据显示,行为的变化不仅受外部刺激和后果的驱动,认知过程在其中同样扮演着不可忽视的角色。
爱德华·托尔曼是最早系统研究学习中认知过程的心理学家之一。他设计了一种迷宫实验:让大鼠在迷宫中自由探索一段时间后,将原有的通路阻断,大鼠是否能找到新的路径?结果发现,有过探索经验的大鼠在原路被堵之后,能够几乎立刻选择最短的迂回路线,而这条路线之前从未因带来食物奖励而被强化过。
这意味着大鼠并非只学会了“按特定顺序做出特定动作”,而是在大脑中形成了迷宫整体布局的内部表征——即认知地图。凭借这张内部地图,大鼠能够灵活地规划路径,而不是机械地重复固定的刺激—反应序列。
现代研究持续证实了多个物种令人印象深刻的空间记忆能力。松鸦每年秋天在分散区域掩埋数千颗种子,数月之后仍能以极高的准确率逐一找回。这种能力不依赖运气,而是依赖大脑中始终保持更新的认知地图。
认知过程不仅体现在空间记忆中,还体现在有机体对抽象规律的把握上。研究者向鸽子呈现两个彩色圆圈的阵列,在短暂的延迟后,其中一种颜色发生了改变。鸽子只需啄击改变了颜色的圆圈便能获得奖励。经过训练,鸽子不仅掌握了用于训练的颜色,还能将同样的反应迁移到从未接触过的全新颜色组合之上。
这一结果表明,鸽子学会的并非只是“对特定颜色作出特定反应”,而是掌握了“颜色发生了变化”这一更为抽象的概念。有机体能够从具体经验中提炼出超越具体实例的规律,这正是认知学习区别于简单条件反射的关键所在。
人类与许多动物在尝试新事物时的一大区别,在于人类会主动观察他人的经验,并从中获取信息。当你在餐厅看到其他食客津津有味地品尝某道菜,你点这道菜的意愿便会上升;当你目睹朋友吃了某种东西后身体不适,你便会主动绕开这种食物。这种通过观察他人行为及其后果来改变自身行为的方式,称为观察学习。
班杜拉的实验提供了观察学习的有力证明:儿童在观看成人攻击充气玩偶的视频之后,独自玩耍时也表现出了类似的攻击行为,即便没有人教导他们这样做,也没有任何直接的奖励驱动。观察本身,就足以触发学习。
观察学习得以发生,是因为大脑能够从他人的经历中建立认知期望:“如果我也这样做,可能会得到相似的结果。”这种期望在行动发生之前便已形成,无需亲身经历强化或惩罚。
“见贤思齐焉,见不贤而内自省也”,这句出自《论语》的古训,恰好概括了观察学习的核心逻辑——通过观察他人的行为与后果,调整自己的行为取向。观察学习使人类得以站在前人的经验之上,大幅压缩了通过亲身试错所需的时间与代价。
观察学习的效果受到以下四个要素的制约:
班杜拉的研究还揭示了媒体内容通过观察学习对行为的影响。长期观看暴力内容的儿童,不仅在行为上表现出更高的攻击倾向,还倾向于高估现实世界中的暴力程度,并对暴力逐渐产生麻木感。这三重效应相互叠加,构成了媒体暴力研究中反复被证实的基本结论。
媒体内容通过观察学习影响行为,这种影响是双向的。积极正面的内容能够有效促进亲社会行为,帮助儿童建立合作、分享和同理心等品质;而长期接触攻击性内容则会在潜移默化中降低行为的道德门槛。
回到开篇那场恐怖电影:你选择走进影院,是因为朋友的推荐让你预期会有不错的体验,这是观察学习在发挥作用;即便换了一条路,你依然找到了影院,因为脑中存有那片区域的认知地图;电影放映过程中,恐怖音乐与惊吓场景的反复同时出现,让你的心跳对音乐产生了条件反射;散场后你暗自决定,以后再也不来了——这是操作性条件反射中惩罚效应的体现。一次普通的观影经历,悄然交织着多种不同的学习机制。
学习并非只发生在课堂,它渗透在每一次经历、每一段关系、每一个习惯的形成之中。经典条件反射解释了情绪与偏好为何在不知不觉中形成;操作性条件反射揭示了行为如何在后果的塑造下保留或消退;认知学习则展示了思维、期望与模仿在行为变化中的深远作用。三种机制各有侧重,却彼此补充,共同构成了理解人类学习的基本图景。
理解这些原理,不只是心理学课堂上的知识积累,它对教育实践、习惯养成乃至自我成长都有直接的指导意义。克服一种恐惧,需要了解消退的机制;培养一个好习惯,需要利用强化计划的规律;向他人学习,需要识别值得关注与模仿的榜样。学习心理学的价值,正在于让这些平日无形运作的机制变得清晰可见、可以主动运用。
“学而时习之,不亦说乎?”这句两千年前的智慧,与现代心理学的发现不谋而合——学习是持续的过程,在不断的实践与反思之中,行为才能真正发生持久的变化。