
为什么看到考场就会感到紧张?为什么玩游戏时如此专注,学习时却容易分心?为什么小时候父母的一句表扬就能让你兴奋不已?这些看似不同的现象,背后都与学习有关。学习不仅是指在学校里读书考试,更是我们适应环境、改变行为的基本方式。从婴儿学会走路,到学生掌握知识,再到成年人适应工作,学习贯穿我们的一生。
接下来,我们将探索学习的科学原理,了解三种重要的学习方式:经典条件反射、操作条件反射和观察学习。这些理论不仅帮助我们理解行为的形成机制,还能指导我们改善学习方法、调整教育策略、理解现代社会中的许多现象。
心理学中,学习指的是因经验产生的较持久的行为或行为潜能的变化。它不是本能或单纯生理成熟,而是通过和环境的互动获得的、能够长时间持续的改变。有些学到的知识暂时不会表现出来,但依然属于学习。
最基本的两种学习是习惯化和敏感化,都属于非联结学习(不涉及刺激之间的关联)。习惯化是对重复出现的刺激反应变弱,比如刚搬新家时会被噪音影响,但久了之后就习惯了,不再注意。敏感化则是反应变强,比如深夜反复听到异响会越来越紧张和警觉。这两种机制帮助我们适应和筛选环境信息。更复杂的学习则需要刺激之间或刺激与行为之间的联系。
经典条件反射(也称巴甫洛夫条件反射)是最早被系统研究的学习形式之一,揭示了我们如何学会将原本无关的刺激与特定反应联系起来。这个发现不仅对心理学有深远影响,还帮助我们理解许多日常生活中的现象。
20世纪初,俄国生理学家巴甫洛夫在研究狗的消化系统时,偶然发现了一个有趣的现象:实验室的狗不仅在看到食物时流口水,甚至在看到送食物的助手时也会流口水。这个意外的观察让巴甫洛夫意识到,狗学会了将送食物的助手与食物本身联系起来。
巴甫洛夫开始系统地研究这种学习现象。在他最著名的实验中,每次给狗喂食前都会响铃。一开始,铃声对狗毫无意义,不会引起任何特殊反应;但食物会自然地引起狗流口水。经过多次“铃声-食物”的配对后,即使只响铃而不给食物,狗也会流口水。狗学会了将铃声与食物联系起来,铃声成为了食物即将到来的信号。
这个过程中涉及几个关键概念。食物是无条件刺激(UCS),因为它天生就能引起流口水这一无条件反应(UCR)。铃声最初是中性刺激,本身不会引起流口水。但通过与无条件刺激配对,铃声变成了条件刺激(CS),能够引起条件反应(CR)——即听到铃声就流口水。
经典条件反射的核心在于学习刺激之间的关联。原本中性的刺激,通过与有意义的刺激反复配对,获得了新的信号意义,从而能够引起类似的反应。
经典条件反射的形成和变化遵循一些基本规律:
获得阶段:这是条件反射形成的阶段。中性刺激(如铃声)反复与无条件刺激(如食物)配对呈现。随着配对次数增加,条件反应(流口水)逐渐增强。最初几次配对后,条件反应可能很弱或不明显;但随着练习增多,反应会变得越来越强、越来越稳定。
消退阶段:如果条件刺激(铃声)反复出现,但不再伴随无条件刺激(食物),条件反应会逐渐减弱,最终消失。消退并不是简单地“忘记”,而是学会了新的关联——铃声不再预示食物的到来。
自发恢复:即使条件反应已经消退,如果经过一段时间后再次呈现条件刺激,条件反应可能会重新出现,尽管通常比原来弱。这种现象说明消退并没有完全抹去原来的学习,原来的关联仍然潜在地存在于记忆中。
泛化:一旦形成了条件反射,与条件刺激相似的其他刺激也可能引起类似的条件反应。假如狗学会了对特定频率的铃声流口水,那么其他频率的铃声也可能引起流口水反应,尽管反应强度可能较弱。泛化使学习能够迁移到新的情境。
分化:与泛化相反,分化是指学会区分不同刺激的能力。通过训练,可以让狗只对特定频率的铃声流口水,而对其他频率的铃声不反应。分化让我们能够做出更精确的反应。
这些过程共同构成了经典条件反射的完整学习周期。在实际生活中,这些过程往往交织在一起,影响着我们的行为和情绪反应。 经典条件反射在我们的日常生活中无处不在,影响着我们的情绪、行为和习惯。
考试焦虑的形成。许多学生一看到考场就会感到紧张、心跳加速、手心出汗。如果学生在过去的考试中经历过失败、批评或其他负面体验(无条件刺激),这些体验会自然地引起焦虑(无条件反应)。考场环境(答题卡、考试铃声、监考老师)作为中性刺激,与这些负面体验配对后,就成为了条件刺激。之后,即使还没开始考试,仅仅是进入考场,就会引起焦虑(条件反应)。这种考试焦虑可以通过消退来减轻。如果学生能够在考场环境中经历更多积极或中性的体验(如成功的考试、放松的模拟测试),而不再总是与失败配对,那么焦虑反应就会逐渐减弱。这正是许多考前辅导中采用模拟考试、放松训练的原理。
广告中的情感关联。广告商深谙经典条件反射的原理。他们常常将产品(中性刺激)与美好的音乐、漂亮的画面、快乐的人群(能引起愉悦情绪的无条件刺激)配对呈现。经过反复观看这样的广告,消费者会将产品与愉悦的情绪联系起来。当在超市看到这个产品时,会产生积极的情绪反应,从而增加购买的可能性。

品牌忠诚度的培养。为什么我们对某些品牌情有独钟?部分原因就在于经典条件反射。如果你在使用某个品牌的产品时获得了良好的体验(手机运行流畅、服装穿着舒适),这些积极体验会与品牌标志(商标、包装设计)建立关联。以后即使只是看到这个品牌的标志,也会产生积极的情绪,增强购买意愿。
恐惧的习得。经典条件反射也能解释许多恐惧和焦虑的形成。研究者让一名婴儿接触一只白鼠(中性刺激),同时制造巨大的响声(无条件刺激,引起恐惧反应)。经过几次配对后,这名婴儿看到白鼠就会哭泣和害怕,甚至对其他毛茸茸的物品(兔子、皮毛大衣)也产生了恐惧反应。在现代生活中,许多恐惧症(如对狗的恐惧、对电梯的恐惧)可能就源于类似的条件反射。幸运的是,心理治疗中发展出了多种基于经典条件反射原理的方法(如系统脱敏、暴露疗法)来帮助人们克服这些恐惧。
操作条件反射关注的是行为与后果(结果)之间的关联。简单说:行为被奖励,出现频率就增加;被惩罚,出现频率就减少。
桑代克通过“问题箱”实验发现,能带来满意结果的行为会保留下来(如猫拉杆开门拿到食物),称为效果律。斯金纳进一步提出操作条件反射理论,用“斯金纳箱”实验说明:行为发生后获得奖励(如老鼠按杠杆得食物),将更容易重复;反之被惩罚,行为减少。
这种学习在生活中很常见,比如孩子做作业后被表扬更积极,作弊被处分后减少作弊。操作条件反射的核心是行为的后果,分为四种类型:正强化、负强化、正惩罚和负惩罚。
需要注意的是,这里的“正”和“负”不是指好坏,而是指操作的方式:“正”表示给予(增加),“负”表示移除(减少)。“强化”意味着增加行为频率,“惩罚”意味着减少行为频率。
正强化:通过奖励来增加行为。例如,学生认真学习后被表扬,会更愿意继续努力。
负强化:通过移除不愉快的刺激来增加行为。比如头痛时吃药,止痛后下次头痛还会吃药。包括逃避(已经出现厌恶刺激时采取行动)和回避(预防厌恶刺激发生)。
正惩罚:给予不愉快的刺激来减少行为,如上课讲话被罚站。
负惩罚:移除愉快刺激来减少行为,如不听话被取消看电视时间。相比正惩罚更温和,副作用较少。
强化比惩罚更有效。研究表明,强化(特别是正强化)在塑造长期行为方面比惩罚更有效。惩罚可能带来焦虑、逃避和对惩罚者的敌意,而强化能够培养积极的情绪和内在动机。因此,在教育和管理中,应该多用强化,少用惩罚。
在操作条件反射中,不仅后果的类型很重要,后果出现的时间和频率也同样重要。斯金纳研究发现,不同的强化程式(即按什么规则给予强化)会导致不同的行为模式和抗消退能力。
连续强化是指每次目标行为出现后都给予强化。每次孩子收拾好玩具就表扬一次;每次投币就能从自动售货机获得商品。连续强化能够让新行为快速建立,因为行为与后果之间的关联非常清晰。但是,连续强化的行为也容易消退——一旦停止强化,行为很快就会减少。
间歇强化(或部分强化)是指只在部分情况下给予强化。间歇强化有四种基本类型:
固定比率:每完成固定次数的行为后给予强化。计件工资(做够10件产品发一次工资)、积分卡(买够5杯咖啡送1杯)。这种程式会产生高频率的反应,但在强化之后会有短暂的停顿(因为知道下一次强化还远着)。
变动比率:平均完成一定次数的行为后给予强化,但具体次数不固定。老虎机(不知道拉多少次会中奖)、推销员的工作(不知道拜访多少客户才能成交一单)。这种程式产生的反应频率最高,抗消退能力最强,因为个体永远不知道下一次强化何时到来,所以会持续尝试。
固定时距:每隔固定时间给予强化(如果在这段时间内做出了目标行为)。固定时间的考试、每月发工资。这种程式会导致时间临近时反应增多(考前突击),而在刚完成强化后反应减少。
变动时距:平均每隔一定时间给予强化,但具体时间不固定。老师不定期抽查作业、交警不定时设卡检查。这种程式产生稳定且持续的反应,因为个体无法预测何时会检查。
从图表可以看出,变动比率强化产生的反应最持久,而连续强化虽然建立快但消退也快。这就解释了为什么赌博如此容易上瘾——它采用的正是变动比率强化,让人永远抱有“下一次就会赢”的希望。
操作条件反射的原理在教育、管理、行为矫正等领域有广泛应用。
游戏和短视频的强化机制。电子游戏和短视频常用操作条件反射原理吸引用户,如任务奖励(正强化)、随机掉落或不断刷新内容(变动比率强化)、签到奖励(固定时距强化)、点赞评论(正强化)等,让人容易上瘾。
代币制在教育中的应用。老师用“小红花”或积分卡奖励良好行为(正强化),兑换实际奖励,有效塑造积极行为。但要避免过度依赖外部奖励,防止削弱内在动机。
行为塑造。行为塑造法通过逐步强化接近目标行为的表现,帮助学习复杂技能,比如学骑车时从坐上车、保持平衡到独立骑行,被广泛用于教育和技能训练。
父母教育方式的影响。父母多用正强化(表扬好行为)有助孩子形成积极行为和自信;过度惩罚(如体罚)易让孩子焦虑逃避,甚至学会攻击他人。惩罚应及时、明确并配合强化替代行为,如取消游戏时间(负惩罚)的同时表扬孩子用语言表达(正强化)。
经典条件反射和操作条件反射都强调直接经验的重要性——个体需要亲自经历刺激配对或行为后果才能学习。然而,我们的许多学习并不需要亲身体验,而是通过观察他人的行为及其后果来实现的。这种学习方式被称为观察学习(也叫社会学习或替代学习),它极大地扩展了学习的效率和范围。
心理学家阿尔伯特·班杜拉通过著名的“波波玩偶实验”系统地研究了观察学习。在这个实验中,儿童观看一段成人攻击充气玩偶(波波玩偶)的录像:成人对玩偶拳打脚踢、用锤子敲打。之后,让儿童单独和波波玩偶待在房间里。结果发现,观看了攻击行为的儿童也对玩偶表现出类似的攻击行为,而且攻击方式与录像中的成人惊人地相似。
这个实验清楚地表明,儿童不需要亲自受到强化或惩罚,仅仅通过观察就能学会新的行为。更重要的是,如果录像中的成人因攻击行为而受到奖励,儿童更可能模仿这种行为;如果成人因攻击行为受到惩罚,儿童模仿的可能性就降低。这种现象被称为替代强化——观察者通过看到榜样行为的后果来学习。
班杜拉提出,观察学习包含四个基本过程:
注意过程:首先,我们需要注意到榜样的行为。影响注意的因素包括榜样的特征(吸引力、地位、能力)、观察者的特征(兴趣、能力)和行为本身的特点(新颖性、复杂性)。我们更倾向于注意那些与我们相似的、有魅力的、有权威的榜样。
保持过程:观察到的行为需要在记忆中保持。这通常通过心理表象(在脑海中重现榜样的动作)或语言编码(用语言描述行为步骤)来实现。学习舞蹈动作时,我们会在脑海中重放老师的示范,或者用语言记住“先抬左脚,再转身”等步骤。
复制过程:将记忆中的行为转化为实际动作。这需要具备相应的身体能力和技能。观察学习不仅包括单纯模仿,还包括对行为的理解和适应性调整。
动机过程:最后,是否实际表现出学到的行为,取决于动机。如果预期行为会带来奖励(直接或替代强化),或者行为本身有内在价值,我们就更可能表现出这个行为。
观察学习在我们生活中无处不在,它是人类文化传承的重要机制。从婴儿模仿父母的面部表情,到学生学习老师的解题方法,再到员工学习优秀同事的工作技巧,观察学习让我们能够高效地获取知识和技能,而不必每次都从零开始、亲身尝试所有的错误。
父母和教师是最重要的榜样。儿童通过观察父母和老师,学会了大量的行为、态度和价值观。如果父母在生活中展现诚实、努力、善良的品质,孩子更可能内化这些品质;相反,如果父母经常撒谎、懒惰、粗鲁,孩子也可能学会这些行为。“身教重于言教”正是这个道理——父母和老师的实际行为比口头说教更有影响力。

媒体和网络的影响。现代社会中,儿童和青少年接触大量的媒体内容——电视、电影、视频游戏、网络视频。这些媒体人物成为了重要的观察学习对象。研究表明,观看大量暴力内容的儿童更可能表现出攻击性行为;观看亲社会行为(如助人、分享)的儿童更可能表现出这些积极行为。这并不意味着媒体直接“导致”暴力,但它确实是影响行为的一个因素。
短视频和网红文化。当今的短视频平台创造了无数“榜样”。青少年观看美妆博主、游戏主播、知识博主的视频,学习化妆技巧、游戏策略、学习方法。这种观察学习可以是积极的(学习有用的技能),也可能带来问题(模仿不健康的生活方式或价值观)。重要的是培养批判性思维,学会辨别哪些是值得模仿的榜样。
职场中的师徒制和培训。许多行业采用师徒制培养新人——经验丰富的员工担任导师,新员工通过观察和模仿来学习。这种方式比单纯的理论培训更有效,因为它提供了真实情境中的行为示范。优秀的导师不仅展示“怎么做”,还解释“为什么这么做”,帮助新人理解行为背后的原理。
观察学习让我们能够“站在巨人的肩膀上”。我们不必亲身经历所有的失败和错误,而是可以从他人的经验中学习。这大大提高了学习效率,加速了个人成长和社会进步。同时,也提醒我们要意识到自己行为的榜样作用——无论是作为父母、教师还是公众人物。
虽然经典学习理论认为任何刺激都可与反应建立联系,但实际上,学习也受到生物进化的限制。有些刺激-反应的关联容易学会,有些则很难,这体现了进化的影响。
比如,加西亚的实验发现,老鼠很容易将新味道和恶心联系起来,即使味道与不适间隔时间很长,反而难以把恶心与光或声音关联,这被称为生物准备性。这让动物能更快学会对有害食物的厌恶,提高生存概率。人类也会因为一次生病就厌恶某种食物,这其实是保护机制。
此外,布雷兰夫妇发现:即使动物被训练形成新习惯,仍会“漂移”回本能行为,比如浣熊学会投币后仍会像洗食物一样搓硬币。这说明本能有时会干扰学习结果。
这些现象说明,学习不是“万能钥匙”,我们更容易学会和本能相关或有利生存的内容。教育和训练时,要考虑到不同学习内容的难度差异,以及人与人之间的天赋和差别。
学习能帮助我们适应环境、获得知识和改变行为。本节介绍了三种主要学习机制:经典条件反射、操作条件反射和观察学习。
经典条件反射让我们学会刺激之间的关联,比如听到铃声就流口水,看到考场就紧张。操作条件反射则强调行为与后果的关系,通过奖励和惩罚塑造我们的行为。观察学习让我们从他人的行为和经验中学习,而不必事事亲身尝试。
此外,学习也有生物进化的限制。比如某些关联更容易学习,说明我们不是“白纸”,而是受进化影响。 掌握这些原理,有助于更高效地学习、改变习惯和理解他人。学习是终身过程,理解其规律就是掌握成长钥匙。
1. 小明原本不怕狗,但有一次被狗咬伤后,现在只要看到狗就会感到害怕。这种恐惧的形成主要是基于什么学习机制?
答案:经典条件反射
解析:这里,狗(原本的中性刺激)与被咬伤带来的疼痛和恐惧(无条件刺激和反应)配对后,狗成为了条件刺激,能够引起恐惧这一条件反应。这是典型的经典条件反射过程。小明不需要每次都被咬才害怕,仅仅看到狗这个刺激就足以引发恐惧反应。
2. 在某个手机游戏中,玩家打怪可能随机掉落珍稀装备,但具体打多少次怪才能获得装备是不确定的。这种奖励机制属于哪种强化程式?
答案:变动比率强化程式
解析:变动比率强化是指平均完成一定次数的行为后给予强化,但具体次数不固定。游戏中随机掉落装备的机制正是如此——玩家不知道打多少次怪才能获得装备,所以会持续地打怪。这种强化程式产生的反应频率最高,抗消退能力最强,这也是为什么许多游戏使用这种机制来保持玩家的参与度。
3. 小红看到同学因为上课认真听讲而受到老师表扬后,她也开始认真听讲。这属于什么类型的学习?
答案:观察学习(社会学习)
解析:小红通过观察同学的行为及其后果(获得表扬)来学习,这是典型的观察学习。她不需要亲自体验被表扬,而是通过替代强化(看到他人因某行为而受到强化)学会了这个行为。班杜拉的社会学习理论强调,我们可以通过观察榜样及其行为后果来学习新的行为。
4. 某位学生为了避免考试不及格带来的羞愧感而努力学习,最终考试及格了。这种学习机制属于操作条件反射中的哪一种?
答案:负强化
解析:这是负强化的例子。学生通过努力学习(行为)避免了考试不及格和随之而来的羞愧感(移除厌恶刺激),这增加了他未来努力学习的可能性。负强化包括逃避学习和回避学习,这里属于回避学习——通过行为预防厌恶刺激的发生。需要注意的是,负强化不是惩罚,而是强化(增加行为)的一种,只是通过移除厌恶刺激来实现。
1. 结合操作条件反射的原理,分析为什么短视频平台容易让人“上瘾”?请至少说明两种学习机制。
参考答案:
短视频平台的“上瘾”机制主要基于以下操作条件反射原理:
首先是变动比率强化。用户刷短视频时,不知道刷多少个视频才能看到特别有趣的内容,这种不确定性让用户持续刷新。就像老虎机一样,变动比率强化产生的反应频率最高、抗消退能力最强,因为用户总是抱着“下一个可能更精彩”的期待。
其次是正强化的即时性。每当用户看到有趣的视频,大脑就会产生愉悦感(多巴胺释放),这是即时的正强化。点赞、评论、分享等互动也会带来社交反馈,进一步强化了刷视频的行为。这种即时满足感让用户很难停下来。
这两种机制共同作用,使得短视频平台具有很强的行为塑造能力,导致用户投入大量时间。
2. 假如你是一位老师,班上有个学生经常上课讲话。请运用强化和惩罚的知识,设计一个既有效又温和的行为矫正方案。
参考答案:
基于强化优于惩罚的原则,我会设计以下方案:
第一步:正强化替代行为。与其只关注学生上课讲话这个问题行为,不如强化他的良好行为。当学生认真听讲、安静做笔记或举手发言时,及时给予表扬和认可(正强化)。这能够增加良好行为的频率,自然就减少了讲话行为。
第二步:负惩罚作为辅助。如果学生仍然上课讲话,可以采用温和的负惩罚——暂时取消他的某个小特权(如课间休息时间、选座位的权利)。这比批评和责骂等正惩罚更温和,副作用更小。
第三步:理解行为动机。了解学生为什么上课讲话——是因为课程太难听不懂、太简单感到无聊,还是想获得同伴的关注?针对不同的动机采取不同的策略。假如是想获得关注,可以提供更多正面的关注机会(如让他分享想法、担任小组长)。
关键是多用正强化,关注和强化学生的良好行为,而不是只盯着问题行为。同时,确保强化和惩罚都是及时、一致和明确的。