6 / 15

视觉信息处理与认知机制

几十年前，有位心理学教授在口试中问道：“一只蚂蚁能看多远？”大多数学生都答不上来。答案其实是九千三百万英里，也就是到太阳的距离。视觉能看多远，取决于光线在到达眼睛之前走了多远的路。这句话听上去绕口，却道出了一个常被忽视的道理。

大多数人直觉上认为，看东西是眼睛主动“扫描”周围世界的过程，仿佛眼中会射出某种看不见的光束。这种误解并不罕见，直到公元十世纪，阿拉伯学者伊本·海赛姆才用实验证明，光线是从物体向四面八方反射出来的，只有垂直击中视网膜的光才能被感知。我们从来不是在“放出”视线，而是在“接收”光线。

即使在今天，仍有相当多的大学生错误地认为，当他们看东西时，眼睛会发出某种光线。这种误解背后隐藏着一个更深的问题：我们对自身感知机制的理解，远比我们以为的要少。

当你看到一棵树时，那棵树的“影像”并不存在于树那里，而是存在于你的大脑里。只有当外部刺激改变了大脑的神经活动，感知才真正发生。视觉研究的出发点，正是对这一看似简单、实则复杂的过程的追问。

感觉编码的基本原理

我们之所以能够“看见”或感受到外部世界，第一步就是要把外界的物理能量（如光线、声音、气味等）转变为神经系统能够处理的电信号——这个过程被称为感觉编码。在视觉系统中，外来的光线首先被眼睛感受器（视网膜上的感光细胞）捕获，这些感受器会把光能转化为电脉冲。

随后，这些电信号会通过一系列神经元传递，最终到达大脑的相关区域。也就是说，外部世界的信息，必须经过神经元的“翻译”，才能被大脑读取和理解。理解这一感觉编码的机制，是我们深入认识整个视觉系统工作原理的基石，因为视觉的每一步处理都依赖于最初获得的神经信号的质量和特征。

特异性神经能量定律

德国生理学家约翰内斯·米勒在1838年提出了一个至今仍具有重要意义的原理。他发现，无论什么方式激活了某条感觉神经，大脑都会将这条神经的信号解释为它所专属的那种感觉。来自听觉神经的信号，不管它是由声波还是电击触发的，大脑都将其解读为声音；来自视觉神经的信号，则永远被解读为光线或图像。

闭上眼睛用手指轻压眼球，即便在全黑的房间里，你也会“看到”一些光点或色块闪烁。这并不是真实的光，而是机械压力激活了视觉感受器，大脑按照惯例将这条神经的信号解释为视觉体验。这一现象清楚地表明，大脑解读的是“哪条神经在放电”，而不是刺激本身的物理性质。

这条原理揭示了一个令人深思的事实：我们所体验到的感觉，本质上是大脑对特定神经活动的固定解读，而不是对外部世界的直接复制。

感觉编码的强度原则

除了“哪条神经在放电”之外，“放电的频率”同样携带关键信息。大部分感觉编码依赖于神经元的放电频率，也就是单位时间内发送动作电位的数量。以疼痛为论，当痛觉轴突每秒发出大量动作电位时，人会感到剧烈疼痛；放电频率降低时，疼痛感随之减弱。强烈的光线比微弱的光线会让视觉神经元放电更频繁，大脑由此判断光线的亮度。

感觉编码的核心在于两点：一是神经元的身份，决定了感觉的种类；二是神经元的放电频率，决定了感觉的强度。这两个维度共同构成了大脑理解外部世界的基本语言。

这里有一个有助于理解的类比。钢铁遇到水，会生锈；从钢铁的“立场”来看，水最重要的属性就是“令它氧化”。当然，钢铁没有感知，这只是一个比方。真正的意思是，“绿色”并不是草地本身固有的属性，就像“令人生锈”不是水固有的属性一样。绿色，是光线从草地反射后，与人眼视网膜和大脑神经元共同作用所产生的主观体验。绿色存在于我们的神经系统之中，而不是存在于草地上。

感知的基本过程

每种动物都生活在充满物体的环境中，需要准确感知周围的世界。当物体发出或反射的能量刺激感受器，信息传递到大脑，动物才能对这个物体形成感知。但大脑究竟是如何理解这些原始信号的？

17世纪哲学家笛卡尔曾认为，大脑对刺激的内部表征与刺激本身在外观上是相似的，就像眼睛投射出一幅排列整齐的图像。这个直觉性的想法有相当的吸引力，却是错误的。

大脑以一种与你所看到的东西在外观上完全不同的方式存储信息。计算机储存一个三角形，靠的是一串0和1，那串数字本身看起来不像三角形。同样，大脑通过神经元活动模式来储存三角形的表征，如果你去检查那些神经元的状态，你看不到任何三角形的形状。

大脑通过三种主要方式编码信息：哪些神经元有反应、它们反应的强度，以及它们反应的时间模式。这三个维度共同构成了大脑处理感觉信息的完整框架。某些神经元的冲动表示光，另一些神经元的冲动表示声音，这种专门化分工正是米勒所阐述的特异性神经能量定律的具体体现。

眼睛的结构与信号传导

视觉系统的起点在于眼球本身。首先，外界的光线穿过透明的角膜，进入眼球内部。随后，光线继续通过可调节大小的瞳孔，以及可以动态调节曲率以实现对焦的晶状体。在这些结构的共同作用下，光线最终被精准地汇聚并投射到位于眼球后部的视网膜上。

视网膜表面布满了数以亿计的感光细胞，这些细胞能够感受到不同强度和波长的光，并将其转化为神经电信号。生成的神经信号会沿着复杂的神经通路，从视网膜经过视神经，传送到大脑的视觉皮层。这个从物理光线到神经信号再到大脑解读的流程，构成了视觉信息处理最基础、最关键的物理和生理过程。只有充分了解眼球的结构和各部分的功能，才能真正掌握之后所有关于视觉系统工作机制的深层原理。

眼球的光学原理

光线通过位于虹膜中心的瞳孔进入眼球。瞳孔的大小会根据光线强弱自动调节，光线强时缩小，光线弱时扩大。光线进入后，经由可以调节焦距的晶状体和固定曲率的角膜共同聚焦，最终投射到眼球后表面的视网膜上。

来自世界左侧的光线会击中视网膜的右半部分，来自上方的光线则击中视网膜的下半部分。图像在视网膜上是左右颠倒、上下翻转的。这种颠倒对神经系统来说并不构成障碍，因为视觉系统处理的不是图像本身，而是通过神经活动对其进行的编码。

视网膜内的信号传递

视网膜内部的信号传递路径出人意料。感受器位于视网膜的最外层，靠近眼球后壁，它们捕获光线后，信息先传递给双极细胞，双极细胞再传递给神经节细胞，神经节细胞的轴突汇聚形成视神经，最终延伸至大脑。

这种解剖结构有一个直接的后果：视神经穿出眼球的那个位置没有感受器，因此这里的光线信息无法被接收，形成了视野中的一个盲点。血管也在同一位置进出眼球。正常情况下，我们感觉不到盲点的存在，因为大脑会自动用周围区域的信息“填补”它。

中央凹与周边视觉的分工

视网膜中央有一个叫作中央凹的微小区域，专门负责精细视觉。当你阅读文字或辨认细节时，眼球会自动转动，将目标物体对准中央凹。中央凹中的血管和神经节细胞轴突极少，几乎不遮挡光线，感受器排列也极为密集。更重要的是，中央凹里每个感受器都单独连接到一个双极细胞，再单独连接到一个神经节细胞，这种“一对一”的连接保证了极高的空间分辨率。

视网膜周边区域则截然不同。越往外围，越多的感受器共用一个双极细胞，多个双极细胞再汇合到一个神经节细胞。这种汇聚式连接使周边视觉牺牲了细节精度，但换来了对微弱光线的高度敏感性。在漆黑的环境中，用眼睛的余光看东西往往比直视更清楚，原因正在于此。

比较维度	中央凹	视网膜周边
感受器类型	以锥状体为主	以杆状体为主
连接方式	一对一连接	多对一汇聚
擅长功能	精细细节、色觉	微弱光线感知
空间分辨率	高	低

视觉感受器与色觉机制

视网膜上的感受器分为两类，它们在功能上高度互补，共同覆盖了从极暗到极亮的宽广光照范围，并支撑起复杂的色彩感知。

视网膜包含两种感受器：杆状体和锥状体。杆状体主要分布在视网膜周边，数量约为1.2亿个，对微弱光线极为敏感，但在强光下容易饱和，而且不参与色彩感知。锥状体集中在中央凹及附近，数量约600万个，在明亮环境下工作最佳，是色觉的核心细胞。值得注意的是，尽管杆状体数量比锥状体多出约20倍，但由于中央凹的“一对一”连接结构，锥状体提供了大脑约90%的视觉输入。

1.2亿个杆状体和600万个锥状体最终汇聚到视神经中的约100万根轴突上。这意味着大量的信息在到达大脑之前就已经经过了显著的压缩和筛选，视网膜本身就承担着重要的信息处理功能。

感光色素的工作机制

杆状体和锥状体都含有感光色素，这些特殊的化学物质在被光击中时会发生化学反应，释放能量并触发神经信号。感光色素由11-顺式视黄醛与视蛋白结合而成，前者是维生素A的衍生物，后者是一类蛋白质，不同的视蛋白会使感光色素对不同波长的光产生选择性敏感。光照使11-顺式视黄醛转变为全反式视黄醛，这一化学变化激活细胞内的第二信使系统，最终产生可传递的神经电信号。光在这个过程中被色素分子吸收，不会在眼内继续反射传播。

色觉的三色理论

可见光是电磁辐射的一部分，波长范围从不足400纳米到700多纳米。人眼将最短的可见波长感知为紫色，随着波长增加，依次感知为蓝色、绿色、黄色、橙色和红色。这些颜色并不是光本身固有的属性，而是我们的感知系统对不同波长的主观解读。紫外线的波长短于可见光，人眼没有对应的感受器，所以我们看不见它；但许多鸟类和昆虫拥有对紫外线敏感的感受器，对它们而言，紫外线就是一种真实的光。

人类能分辨数百万种颜色，但并不是对每种颜色都有专门的感受器。英国学者托马斯·杨在19世纪初提出，颜色感知的实现方式是通过比较几种感受器类型的反应，而不是靠无数种专属感受器来一一对应。赫尔曼·冯·亥姆霍兹后来完善了这一思路，提出了色觉的三色理论，也称杨—亥姆霍兹理论。

亥姆霍兹发现，将适当比例的三种特定波长的光混合，可以匹配出任何一种颜色。由此他推断，人类只需要三种类型的锥状体就足够了，每种锥状体对不同波长范围的光最为敏感：短波长锥状体对蓝紫色光最敏感，中波长锥状体对绿色光最敏感，长波长锥状体对红橙色光最敏感。大脑通过比较三种锥状体的相对反应比例，来判断所看到的颜色。

以550纳米的黄绿色光为例，它几乎等量地激发中波长和长波长锥状体，对短波长锥状体的激发极少，大脑根据这个比例判断出黄绿色。

对立过程理论与颜色恒常性

三色理论能够解释很多现象，但并不完整。19世纪生理学家埃瓦尔德·赫林注意到，某些颜色的组合在感知上是“对立”的。红色和绿色不能同时被感知为一种颜色，蓝色和黄色同样如此，白色和黑色也构成一对对立。他提出了对立过程理论：大脑中存在三对颜色对立通道，分别处理红—绿、黄—蓝、白—黑三个维度的颜色信息。

盯着一张鲜红色的图片看一分钟，然后迅速将视线转向白色墙壁，你会看到一个绿色的残影。这是因为负责感知红色的神经元持续兴奋后疲劳，当刺激消失时，对立的绿色通道相对占据优势，形成了所谓的“负后像”。这一现象是对立过程理论的直观体现。

即便如此，三色理论和对立过程理论都无法单独解释一个日常现象：颜色恒常性。当你在白炽灯、日光灯或阳光下看同一个苹果，苹果总是显得红色的，尽管三种光源的光谱成分完全不同。大脑并不只是被动接收某一波长，而是将物体的颜色与整个场景中其他物体的颜色进行比较，从中“减去”光照的影响。物理学家埃德温·兰德为此提出了视网膜理论，认为皮层会比较来自视网膜各处的信息，通过对比关系来确定每个区域的感知颜色，而非仅凭绝对的光谱成分来判断。

色觉缺陷

在17世纪的颜色研究之前，人们普遍认为所有人看到的世界都是一样的，颜色被认为是物体固有的属性。科学家们发现色觉缺陷的存在，彻底改变了这种认识。有些人在其他视觉功能完全正常的情况下，却无法辨别某些颜色，这说明颜色感知不是光的固有属性，而是大脑处理过程的结果。

色觉缺陷最常见的类型是红绿色觉缺陷。患者的长波长锥状体和中波长锥状体含有相同的感光色素，因此对红色和绿色的区分能力受损。造成这一缺陷的基因位于X染色体上，由于男性只有一条X染色体，只要这条染色体携带缺陷基因就会发病；女性有两条X染色体，需要两条都携带才会发病，因此发病率远低于男性。

大脑对视觉信息的处理

视网膜接收到光信号并完成初步编码后，信息沿着视觉通路传入大脑，经过一系列层级化的处理，最终形成我们所体验到的丰富视觉世界。这一过程远比“看一眼”这个动作听起来复杂得多。

视网膜的神经节细胞轴突汇成视神经，从眼球后部穿出，沿大脑下表面延伸。两侧眼睛的视神经在视交叉处相遇，来自每只眼睛鼻侧的信息在这里交叉至对侧大脑，颞侧的信息则保持同侧传递。这样的结果是，视野左半侧的信息由右脑处理，右半侧则由左脑处理。大部分神经节细胞轴突的终点是丘脑的外侧膝状体核，少量轴突前往上丘以及参与调控昼夜节律的下丘脑区域。

视觉信息到达下丘脑的部分，负责调节生物钟。这就是为什么光照会影响睡眠节律——即便是看起来与睡眠毫无关系的“看到亮光”这个动作，实际上也在向身体的时间系统发送信号。

视网膜中的侧抑制机制

在任何一个瞬间，两只眼睛的视网膜合计向大脑发送约2.5亿条信息，大脑不可能对每一条信息平等关注，而是需要提取其中有意义的模式。视网膜在信号传递过程中，已经开始通过侧抑制机制对信息进行初步筛选和增强。

侧抑制的原理是：当某个感受器受到光线刺激时，它不仅会激发相应的双极细胞，还会通过水平细胞轻微抑制周边感受器的输出。这样一来，在一个光亮区域的边缘，亮侧的信号被进一步增强，暗侧的信号被进一步压制，边界处的对比度得到显著强化。

用一个生活中的场景来理解这个机制：一排同学站成一列，每人原本都有一份答卷。中间几名同学拿到了额外的题目，但规定他们必须从自己和左右邻座手中各“取走”一份。最终，中间同学得益有限，而正好站在中间组旁边的同学损失最大，形成了鲜明的对比。视觉系统就是用类似的方式，在边界处制造信号的强烈反差，让轮廓更加清晰。

侧抑制不仅是一种信号处理技巧，它也解释了日常视觉中的“马赫带”现象。在两个亮度不同的区域交界处，人眼往往会感知到亮侧更亮、暗侧更暗，即便实际亮度并无此差别，这正是侧抑制在视网膜层面制造的视觉效果。

感受野与视觉层级

视觉系统中的每个细胞都有一个感受野，即能够引发它兴奋或抑制的视野范围。感受器本身的感受野极小，仅对应视野中的一个微小点。一组感受器连接到一个双极细胞，双极细胞的感受野就是这组感受器感受野的总和；多个双极细胞再汇合到一个神经节细胞，感受野进一步扩大。这种逐级扩大的结构，就像一个层层汇报的组织体系，低层级单元关注局部细节，高层级单元整合更大范围的信息。

神经节细胞的感受野呈现一种特殊结构：圆形中心区域和环绕它的甜甜圈形周围区域，两者的反应性质相反。“中心—on、周围—off”型神经节细胞在中心区域受光时兴奋，周围区域受光时被抑制；“中心—off、周围—on”型则相反。这种对比式的感受野结构，使神经节细胞对光线边界极为敏感，而对大面积均匀光照反应较弱。

灵长类动物的神经节细胞分为三类，各有分工：

类型	细胞体大小	感受野大小	主要功能
小细胞神经元	小	小，集中于中央凹附近	精细细节与颜色感知
大细胞神经元	大	大，分布于整个视网膜	运动与整体模式检测
尘细胞神经元	小	分布于整个视网膜	功能多样，参与颜色对比等

初级视觉皮层

来自外侧膝状体核的视觉信息，大部分传输至枕叶皮层的初级视觉皮层，即V1区域，也称纹状皮层。V1区域不仅在实际视觉感知时活跃，当人闭上眼睛进行视觉想象时，同样区域的神经活动也会增强，且模式与真实感知时相近。

V1区域受损的人不仅失去有意识的视觉，还会失去视觉想象能力，甚至在梦中也不再出现视觉图像。相比之下，因眼部疾病失明的人，由于V1区域完好，仍然保有视觉想象和视觉梦境。这一对比清楚说明，有意识的视觉体验依赖于大脑皮层，而不只是眼睛。

部分V1区域受损的患者表现出一种令人惊奇的现象，被称为盲视。在他们视野的受损区域，他们完全没有视觉感知，甚至无法辨别明亮阳光和完全黑暗。然而，如果要求他们猜测那个区域有什么物体，或者让他们用手指向那里，他们往往能给出正确答案。他们自己也感到困惑，声称只是在“随便猜”。这种现象说明，视觉信息的处理存在有意识和无意识两条并行路径。

简单细胞、复杂细胞与终止抑制细胞

20世纪50年代，大卫·休贝尔和托斯滕·维塞尔在用光点刺激猫的枕叶皮层时，发现皮层细胞几乎毫无反应。他们偶然发现，移动幻灯片时产生的边缘线条，才能引发皮层细胞的强烈反应。由此，他们揭示了视觉皮层细胞对线条方向的选择性，并识别出几类功能不同的细胞。

简单细胞具有固定的兴奋区和抑制区，对特定方向、特定位置的线条或边缘反应最强，稍微改变线条的方向或位置，反应就会减弱。有趣的是，更多的简单细胞对水平或垂直方向的刺激有偏好，而不是对角线，这与我们生活环境中水平和垂直结构更为常见的事实相吻合。

复杂细胞位于V1和V2区域，对刺激的确切位置不那么敏感，只要是在其宽泛感受野内特定方向的线条或边缘，都能引发反应。复杂细胞对运动中的刺激反应最为强烈，对方向的偏好也十分明确，例如一条垂直条从左向右移动时会引发最大反应，反向移动则反应减弱。

终止抑制细胞，也叫超复杂细胞，在感受野的一端存在强烈的抑制区域。只要刺激的线条没有超过这个抑制区，细胞就会正常反应；一旦线条延伸进入抑制区，反应就会被压制。这使得终止抑制细胞对线条的长度极为敏感。

休贝尔和维塞尔因发现视觉皮层的感受野特性及其组织规律，获得了1981年的诺贝尔生理学或医学奖。他们的工作不仅揭示了视觉皮层如何从简单边缘开始构建复杂视觉，也为后来的“层级特征提取”理论奠定了基础，甚至影响了今天深度学习卷积神经网络的设计思路。

视觉皮层的柱状组织

视觉皮层中，功能相似的细胞以垂直于皮层表面的柱状结构聚集在一起。同一个柱内的细胞，对线条方向的偏好是一致的，对眼睛输入的偏好也基本相同，有的柱只对左眼输入有反应，有的只对右眼，有的对两眼都有反应。当研究者将电极垂直穿过皮层记录时，遇到的细胞都有相同的方向偏好；当电极斜向穿过皮层时，则会依次遇到偏好不同方向的细胞。

视觉皮层的发展与可塑性

视觉皮层中细胞的功能特性是先天决定的，还是后天习得的？这个问题的答案是两者皆有，但两者所发挥作用的时间窗口不同。

在新生哺乳动物中，视觉系统的许多基本特性无需视觉经验就能正常形成，遗传决定了基本的神经回路框架。然而，这个框架需要适当的视觉经验来加以维持、精调和巩固。如果在关键的早期阶段缺少正常的视觉输入，神经回路就会发生改变，且这种改变在敏感期结束后将难以逆转。

单眼剥夺的后果

若在小猫出生后的前四到六周内缝合一侧眼睑，被剥夺那只眼睛所对应的视觉皮层突触连接会逐渐弱化，打开眼睛后，皮层对那只眼睛的输入几乎不再有反应。然而，若将两只眼睛都封闭，皮层对视觉输入的整体响应性仍能在一段时间内维持。原因在于，单眼剥夺时，睁开眼睛的轴突与闭合眼睛的轴突形成竞争，前者“抢占”了皮层资源；两眼都封闭时，则没有这种竞争，双方均不占优。

这一竞争机制对临床有重要意义。儿童斜视——俗称“斗鸡眼”——如果不及时矫正，大脑会逐渐偏向使用位置更正常的那只眼睛，另一只眼睛对应的皮层区域会因缺乏竞争性激活而逐渐萎缩，形成弱视。传统的治疗方法是遮盖较好的眼睛，强迫弱眼参与视觉竞争，从而刺激其对应皮层的发展。

敏感期的意义

对于视觉经验的不同方面，研究者都能识别出一个特定的敏感期。在敏感期内，经验对神经回路的影响特别深远持久；敏感期结束后，同样的经验产生的效果则大幅下降。敏感期的终止与某些稳定突触结构、抑制新轴突萌芽的化学物质的增多有关。

在婴幼儿期经历的视觉剥夺，往往比成年后发生同样的剥夺带来更严重的后果。先天性白内障若不在婴儿期及时手术，即便日后修复了晶状体，视力恢复的程度也会因为敏感期内缺乏正常视觉输入而受到永久限制。这与成年后才出现的白内障截然不同，后者手术后通常能完全恢复正常视力。

早期视觉经验对皮层结构的塑造

若幼猫在整个敏感期内只能看到水平线条，其视觉皮层中几乎所有细胞都会变成只对水平线条有反应，对垂直线条的响应近乎消失，且这种改变在恢复正常环境后也基本无法逆转。

这种机制在人类中同样存在。约有70%的婴儿在出生时存在一定程度的散光，即眼球曲率不对称，导致某个方向的线条在视网膜上的成像较模糊。如果散光未被及时发现和矫正，视觉皮层会在这段时间内减少对模糊方向线条的神经元分配。即便后来散光得到矫正，对某个方向线条的感知敏锐度也可能不如没有散光的人。

敏感期的存在提示我们，视觉系统的发展有其时间窗口，错过了就难以弥补。无论是先天性眼部缺陷、早期斜视，还是单眼遮蔽，都应尽早干预。视觉系统的可塑性是把双刃剑：它赋予了系统根据经验优化的能力，也意味着错误的经验会造成难以挽回的影响。

视觉皮层的并行处理通路

人们容易认为，只要看见了某样东西，就能感知到它的一切属性。但实际情况远非如此。视觉皮层的不同区域遵循“按需分工”的原则，各自处理视觉信息的不同方面，形成多条并行处理通路。

初级视觉皮层V1将信息传送到次级视觉皮层V2，V2再将信息分发至多个专门区域。这些连接并非单向的，V1与V2之间、各专门区域之间都存在双向信号传递。从V2开始，最重要的分流是腹侧通路和背侧通路。

腹侧通路经由颞叶皮层向前延伸，专门处理“物体是什么”的问题，负责识别物体的形状、颜色和身份，因此也被称为“什么”通路。背侧通路经由顶叶皮层延伸，专门处理“物体在哪里”以及“如何与它互动”的问题，负责定位物体、引导运动，因此也被称为“在哪里”通路。

这种分工并不意味着两条通路之间完全隔绝，它们会相互交流，各自也在一定程度上参与对方的功能。但通路损伤所造成的截然不同的缺陷，充分说明了这种分工的现实存在。

背侧通路受损的患者，通常能正常阅读、识别面孔，也能详细描述眼前的物体，但走路时会撞到家具，无法准确伸手抓取东西，问他们物品摆在哪里，他们答不上来，即使那件东西就在他们视野内。他们知道“是什么”，却不知道“在哪里”。腹侧通路受损的患者则相反，能够绕开走廊中的障碍物，能准确伸手握住别人递来的东西，却无法通过视觉认出那个人是谁，无法阅读文字，也无法通过外观识别物体。

形状的精细识别

下颞叶皮层是腹侧通路的重要组成部分，其中的细胞对可识别的物体图形有选择性反应。研究发现，这些细胞对特定物体的反应并不受物体位置、大小或观察角度的影响，表现出高度的“形状不变性”。更有趣的是，这些细胞的反应依据观察者实际感知到的内容，而非图像的物理属性。当同一张图片的“图—底关系”发生变化，同一个轮廓从被感知为“物体”变为被感知为“背景”时，细胞的反应就会随之改变。

对形状识别能力完全丧失但其他视觉功能完好的状态，称为视觉失认症，通常由颞叶皮层损伤引起。患者能够感知颜色和亮度，也能慢慢描述物体的各个局部特征，却无法整合这些特征来识别出“这是什么”。

在下颞叶皮层中，研究者通过功能性磁共振成像发现了若干专门化区域：

面孔识别的特殊机制

面孔识别在人类社会中具有非同寻常的重要性。辨认出一个人，意味着能够提取关于这个人的记忆、判断其意图、决定如何与之互动。人类自出生起就对面孔表现出特殊偏好，新生儿更多地注视面孔图案，而不是同等复杂度的非面孔图案。

不过，新生儿的“面孔识别”与成人有所不同。对新生儿而言，“面孔”的判别标准相当宽松，只要眼睛在上方、嘴在下方，即便面部各要素被打乱，婴儿也认为这是一张脸。精确的面孔识别能力随着经验的积累不断提高，一直持续发展到青春期。

人脑对面孔的识别遵循一种“偏差检测”机制：长期看到的面孔会在大脑中形成一个统计意义上的“平均面孔”，对陌生面孔的识别实质上是检测它偏离这个平均值的方式。这解释了为什么与自己同族的面孔更容易区分，而不同族裔的面孔看起来往往“大同小异”——因为大脑学习的“平均模板”主要来自熟悉群体的统计规律。

面盲症患者因梭状回等相关区域受损或天生缺乏连接，无法识别面孔，但阅读能力和其他视觉功能完好。有患者描述，他在镜子前曾多次向自己“道歉”，以为撞到了别人，后来才意识到镜中人就是自己。他们能判断一张面孔属于老人还是年轻人，属于男性还是女性，却无法认出对方是谁，哪怕是自己的家人。

颜色感知的皮层基础

视觉皮层中有一个专门与颜色感知密切相关的区域，称为V4区域。V4区域中的细胞反应对应于物体的感知颜色，而不仅仅是其物理反射的光谱。

V4区域受损的患者不会变成色盲，他们仍能看到颜色，但失去了颜色恒常性。在正常光照下认出的橙色，换一种光照环境后就可能无法识别。给这样的猴子训练识别黄色物体，一旦改变头顶的照明颜色，猴子就找不到那个物体了。

运动感知的神经基础

在进化历史上，运动物体始终代表着需要立即关注的信息——它可能是猎物，也可能是天敌。大脑专门发展出处理运动信息的神经机制，以确保对运动的快速响应。

两个特别专门化的运动处理区域是MT区域和MST区域，它们主要接收来自大细胞通路的输入。MT区域中的大多数细胞只对特定方向和特定速度的运动产生反应，对加速和减速同样敏感，对三维空间中的运动都有响应，甚至对暗示运动的静止图片也会有所反应，比如运动员起跑瞬间的定格照片。MST区域的细胞对更复杂的运动模式有反应，如整个视野的扩张、收缩或旋转，这对应于人向前走、向后退或倾斜头部时的视觉体验。

MT和MST区域受损后，患者会出现运动盲症，能看见物体，却无法感知物体的运动。

有一位运动盲症患者描述，走路的行人在她眼中会“突然出现在一个新位置”，中间的移动过程对她来说是不存在的。倒水时，水面看起来是静止的，她不会停手，直到杯子溢出。过马路时，远处的汽车一转眼就出现在了面前，让她根本无法判断何时安全过街。这些日常挑战提示我们，运动感知虽然在正常人看来毫不费力，却是由专门的神经回路支撑的。

有一个简单的方式可以体会运动感知被抑制的感觉：对着镜子，先注视自己的左眼，再将注意力迅速移到右眼。你会发现，自己看不到眼球在移动，尽管它确实动了。若让另一个人做同样的眼球转动，你却能清楚地看见。这是因为在主动的眼球运动（扫视）发生前约75毫秒，大脑就预先向视觉皮层的运动检测区域发出信号，要求其“暂停运作”，以避免将眼球自身的运动误判为外部世界在移动。这种抑制在MT区域和顶叶皮层的“在哪里”通路中尤为显著，而负责形状和颜色的区域则维持正常活动。

视觉认知的整合与反思

从光线进入眼球到形成完整的视觉体验，视觉系统在多个层级上同时进行着精密的信息处理。视网膜通过侧抑制强化边界对比，初级视觉皮层的细胞检测线条方向和边缘，腹侧通路识别“是什么”，背侧通路定位“在哪里”，专门区域分别处理颜色、运动和面孔。这些看似独立的处理流，在最终的视觉体验中无缝整合，形成了我们感知到的连贯世界。

这种高度分工又高度协作的机制，既体现了进化在功能效率上的极致追求，也揭示了视觉体验的本质：我们所“看到”的，并不是世界本来的样子，而是大脑对传入信息进行主动建构和诠释的结果。

每个视觉处理区域的损伤都会造成特定类型的缺陷：V1受损失去所有有意识视觉，V4受损失去颜色恒常性，MT受损失去运动感知，梭状回受损失去面孔识别，颞叶腹侧通路受损失去物体识别，顶叶背侧通路受损失去空间定位。这种“分离性缺陷”的存在，是模块化视觉处理的最直接证据。

视觉系统的可塑性同样不容忽视。大脑在敏感期内会根据视觉经验调整神经回路，这是适应的优势，也是脆弱性的来源。及时识别和矫正儿童期的视觉异常，为大脑提供充分的正常视觉经验，是保障视觉系统健康发展的关键。

理解视觉系统，不仅仅是理解眼睛如何看东西，而是理解大脑如何基于有限且不完整的感觉输入，建构出一个连贯、稳定、有意义的现实图景。这种主动建构的过程，正是心理学与神经科学研究的核心议题之一。

视觉信息处理与认知机制 | 自在学