首页课程创意工坊价格

5 / 14

人员配置决策

绩效测量理论与实践 | 自在学

绩效测量理论与实践

绩效测量渗透在生活的各个层面：教师通过考试评估学生学习效果，学生通过课程评价反馈教学质量，民调反映公众对政府的满意度，球迷用胜负记录判断球队表现，职场中上级通过年度考核评价下属工作成效。

工作环境中的绩效测量功能多样且重要。企业利用绩效数据验证招聘测试有效性，将员工表现与测试结果关联分析，判断测试预测工作成功的能力。绩效测量为员工发展提供依据，管理者据此制定针对性培训计划。

绩效测量在人力资源管理各环节发挥关键作用：薪酬管理中，企业比较员工绩效差异决定加薪奖金分配；人员调配时，绩效档案帮助确定员工岗位适配性；晋升决策中，绩效记录成为评估的重要依据；裁员时，绩效常成为去留的决定因素。

绩效测量既是评价工具，更是激励发展手段。通过设定标准、评估达成情况并提供反馈，组织能有效提升员工工作动机和满意度。

绩效数据类型与测量关系

实际工作中，绩效表现通过三种数据类型衡量：客观数据、人事数据和判断性数据。

客观绩效数据是可量化的工作结果，包括销售额、客户投诉数量、产品产量等。某电商公司客服的工作表现可通过日处理订单数量、客户满意度评分、投诉解决率等客观指标评估。

1762849524 (1)-min.png

判断性绩效数据是对个人工作行为有效性的评价，最常见的是上级对下属的年度绩效评估。这种评价依赖观察者主观判断，但同样具有重要价值。

不同绩效测量类型间的关联度低于预期。研究显示，上级评价与客观绩效指标相关性通常仅为0.2-0.39，虽统计显著但远低于预期。

这一现象揭示重要结论：每种绩效测量从不同角度反映工作表现，不存在“通用”绩效因子；客观指标无法简单替代主观评价，反之亦然；客观测量虽具直观吸引力，但未必更可靠，且范围较窄，难以捕捉工作绩效的复杂性。

判断性绩效测量更易捕捉工作绩效细节和复杂性，客观测量虽看似“客观”，实际也包含主观判断成分。

绩效测量方法

实地操作测量

实地操作测量通过让员工在标准化条件下完成工作相关任务评估技能水平。某银行招聘柜员时，让应聘者使用模拟银行系统处理开户、转账、理财咨询等业务场景。此方法既用于招聘，也可评估现有员工技能。

消防员技能评估包括：操作无线电与指挥中心通信、使用内部通讯系统协调队友、操作消防设备灭火、拆卸组装救援工具等。每项任务由训练有素的观察员根据检查清单评分。

该方法优势在于直接源于工作分析，效度高。基于实际工作内容，员工对此评估方式信任度较高。实地操作测量的延伸是“走查测试”，要求员工向面试官详细描述完成任务的步骤。面试官根据描述正确性和完整性评分。

电子绩效监控

信息技术发展使电子绩效监控在现代职场日益普遍。数千万员工正接受计算机、录像和音频设备监控。先进视频系统能监控员工是否在岗及具体行为。

快递行业中，快递员手持扫描设备不仅收集包裹信息，还记录配送路线、停留时间、配送效率等数据，为公司提供丰富绩效信息。

电子绩效监控存在争议。支持者认为电子监控客观且工作相关，比其他绩效测量更“公平”。反对者认为此做法侵犯隐私、破坏信任、降低自主性、过分强调数量忽视质量、造成压力、导致员工士气和生产力下降。

员工对电子绩效监控的接受度取决于关键因素：监控活动与工作相关、员工参与系统设计实施、员工能在特定时间延迟或阻止监控、员工事先得到监控通知。

某航空公司对订票代理的过度监控案例：代理人员通话间隔仅11秒，每工作日总共只有12分钟时间休息。若一周内未经授权断开电子系统超过两次，公司采取纪律措施。此类过度监控引起员工强烈反感。

电子绩效监控须谨慎使用，避免在提高绩效同时降低员工工作动机和满意度。最有效应用是用于员工发展，提供工作行为反馈。

绩效管理与绩效评价差异

二十年前，工业心理学和人力资源教材大量使用“绩效评价”或“绩效考核”术语。现在更多遇到“绩效管理”概念，这反映了理念的重要转变。

传统绩效评价系统基于任务导向的工作分析，与组织目标或盈利能力关系偶然。绩效管理系统强调个人行为与组织战略目标联系，在组织目标背景下定义绩效。

绩效管理包含三个组成部分：绩效定义（组织目标和战略）、实际测量过程、上下级关于个人行为如何符合组织期望的沟通。

传统绩效评价主要涉及绩效管理的测量部分，但缺乏其他组成部分（被评价者积极参与开发理解测量系统，以及关于组织个人期望成就的持续沟通），使绩效评价在多维世界中成为一维过程。

绩效评价与绩效管理的主要差异：频率上，绩效评价每年一次由人力资源部门发起，绩效管理更频繁且可由上级或下属发起；开发上，绩效评价系统由人力资源部门开发交给管理者使用，绩效管理系统由管理者和员工共同开发；反馈上，绩效评价反馈每年一次跟随评价过程，绩效管理反馈在需要讨论期望和绩效时随时进行。

绩效管理系统将传统任务分析与战略工作分析结合，在过程中包含目标和组织战略，强调各绩效领域的战略重要性。

绩效评级内容与方法

整体绩效评级

绩效评级表有不同层级，有些宽泛并得出整体绩效评级。这种高层次关注出于简化需要，用于管理目的，如货币奖励分配给评级高于预定水平的人员。

整体绩效实际上没有“真实”或概念意义，如同平均学分绩点，是简单管理指标。研究表明，整体评级受各种因素影响，包括未明确提供给评级者考虑的因素。

某互联网公司年度绩效评估中，员工整体评级受任务绩效、团队协作行为和反生产行为等多因素影响。即使评级表未明确包含这些方面，仍会影响整体评级。

特质评级局限性

特质评级需要避免使用。早期绩效评级中，上级常根据坚持性、专注力或警觉性等特质评估下属。

现代绩效评价认为，评级者应描述行为或行动，而非宽泛模糊的“特质”。明确定义的特质（如大五人格特征）可能支持有效绩效，但它们是行为或行动。特质是绩效预测因子的习惯或倾向，非绩效测量指标。

基于特质的绩效测量系统在法律上比基于行为的系统更难辩护。实际应用中，应关注员工具体行为表现，而非抽象个性特征。

基于任务的评级

基于任务的绩效评级系统是工作分析的直接延伸。评级者指出员工在关键任务或任务组（职责）上的有效性。

警察巡逻员职责领域包括：逮捕干预、向市民提供信息、交通管制、报告撰写、作证、急救、调研、培训等。此类评级易在法庭辩护，易被在职人员接受，因为被评级职责与相关工作间存在明确直接关系。

关键事件方法

关键事件是特定绩效领域中对确定绩效好坏起“关键”作用的行为。中层管理“书面沟通”职责中，有效关键事件可能是“简洁明了，包含相关附件和对同一主题早期沟通的引用”，无效关键事件可能是“几乎无法理解，事实混淆，顺序颠倒，经常提及读者不熟悉的事件或文件”。

通过这些事件开发评级量表，作为量表的定义点或基准。实践中，通过工作分析、访谈或研讨会确定职责领域，要求在职人员或上级描述该职责领域中特别有效和无效的行为实例。

绩效评级结构特征与方法

绩效评级量表有三个基本特征影响结果效度：被评级职责或特征的行为定义程度、响应类别含义的定义程度（“满意”或“4”的评级意味着什么）、解释或审查评级的人理解评级者意图的程度。量表上定义量表点的基准称为“锚点”。

只有量表具备所有三个结构特征时，才能最大程度减少评级分配或解释中的错误。

图形评级量表

图形评级量表因绩效分数在从高到低量表上以图形方式显示而得名。作为最早的绩效评估量表类型，声誉不佳，但这种声誉可能不应得。

批评者多引用维度定义不佳或量表锚点描述不佳等缺陷，但这些批评非针对评级格式本身。若图形评级量表具有明确定义的维度、可理解且适当放置的锚点、明确的个人评级分配方法，可与任何其他格式一样有效。

研究发现，评级者偏好或易用性方面，3点量表（高、中、低）和8点量表间差异不大。但被评级者感受不同，更喜欢更多评级量表单位，认为在9点量表上提高一两步骤比在3点量表上从“一般”提高到“优秀”有更多改进可能性。

检查清单

检查清单是收集判断性绩效信息的另一方法。评级者看到一系列行为，在最能（或最不能）描述被评级者的项目旁打勾。

项目可能直接来自工作分析或关键事件分析。通常，项目被分配值（评级者不知道），对应项目代表的绩效水平。权重来自相关职位在职人员和上级的专家判断。这种检查清单称为加权检查清单，个人最终评级是所有被选中项目的总和或平均值。

大学教师加权检查清单包括：

教师创造鼓励提问讨论的课堂环境（4.2分）
教师清晰呈现材料（2.2分）
讲座组织充分（1.7分）
教师热情友好（2.7分）
教师使用经验或研究例子（3.8分）

检查清单变体是强制选择格式，评级者必须从四个陈述中选择两个描述被评级者。陈述根据社会期望值及区分有效无效绩效的价值选择。

行为锚定评级量表

行为锚定评级量表（BARS）有时称为行为期望量表，偶尔要求评级者描述工作者在特定情况下可能期望做什么（即行为）。

构建BARS的传统方法耗时，涉及大量专业人员互动。这种互动增强公平感，促进对绩效改进的战略性关注，但可能需要几个月开发一套有效量表。

行为观察量表

行为观察量表（BOS）方法基于让评级者评估某人实际做了什么比评估可能做什么更准确的想法。

与BARS方法不同，BOS要求评级者考虑员工被观察到以特定方式行动的频率。BOS方法支持反馈，比BARS格式更易开发。因通常直接从工作分析中开发，也比其他技术更易辩护。

员工比较方法

评级方法中，个别员工根据某种标准评估。其他评估形式涉及人与人直接比较，称为员工比较方法。最明显方法是根据某个维度、职责领域或标准对员工简单排名，员工根据评估熟练程度从高到低排名。

排名变体是配对比较方法，每个员工（通常在工作组或相同职位个人集合中）在各种维度上与组中每个其他个人比较。

员工比较在某些情况下有用。组织面临的常见问题是裁员时决定裁掉谁。此时，组织通常根据技术绩效、要完成的新工作或预期工作、新工作或预期工作所需知识技能等维度对个人排名。

员工比较方法用于裁员外其他目的的明显缺点是缺乏明确绩效标准，除了员工在同事中的排名。这使反馈困难，员工目标是获得更好排名，但很少提供如何做到的指导。

绩效评级来源与360度系统

绩效评估中有多种评级信息来源，包括上级、同事、在职人员、下属、客户、供应商等。相对较新且日益流行的绩效测量发展是360度评估，包括多个或所有这些来源。每种来源都有其独特的观察角度和价值，同时也存在特定的局限性。

上级评级

一级和二级管理者是最常见的绩效信息来源。上级可密切观察在职人员行为，能很好评估该行为对部门和组织成功的贡献程度。他们通常具有更广阔的组织视角，能够将个人绩效与整体业务目标联系起来。上级评级的优势在于对工作标准和期望有清晰理解，能够观察员工在不同情况下的表现，具有评估绩效对组织影响的权威性，并可以提供职业发展指导。

尽管上级是员工绩效重要观点的逻辑选择，但许多上级积极避免评估和反馈。研究发现几个解释因素：下属向上级汇报时间长度（时间越短越不愿意）、下属经验量（经验越少需要更多纠正性反馈导致更不愿意）、上级和下属间信任程度。此外，上级可能缺乏评估技能或担心破坏工作关系。

同事评级

同事比上级更可能每天与工作者互动，因此可能更了解典型绩效。相比之下，上级更可能熟悉最大绩效。理论上，同事应是绩效信息的良好来源，特别是在团队合作、沟通技能和日常工作行为方面。同事评级的独特价值包括观察到真实的日常工作行为，了解团队协作和人际交往能力，提供平行视角而非等级视角，以及能够评估专业技能和知识共享。

同事评级的明显障碍是许多“同事”可能地理分离，特别是个人可能在家工作的情况。当同事评级用于管理目的（如晋升、加薪）时，可能出现问题，因为同事竞争固定资源时可能存在利益冲突。此外，同事间的个人关系也可能影响评级的客观性。

自我评级

自我评级通常是传统绩效评价系统的一部分。个人完成关于自己的评级表，并带到与上级的会议上，上级已填写关于下属的相同表格。这种方法鼓励员工进行自我反思和自我评估。自我评级的益处包括促进员工的自我意识和反思，为绩效讨论提供起点，识别员工认为的优势和发展领域，以及增强员工在评估过程中的参与感。

征求工作者信息的行为很可能增加该工作者的程序公正感。自我评级中明显存在扭曲和不准确可能性，因为个人对自己工作的看法通常比上级看法更高。然而，当员工知道自我评级将与上级讨论时，这种扭曲会最小化。研究表明，自我评级往往比其他来源的评级更宽松，但在发展性反馈中仍有重要价值。

下属评级

越来越多组织关注下属对老板评估的价值。研究发现，只要不用于管理决策，上级就支持这种信息来源。下属可能最适合评估领导行为（或缺乏领导行为）及这些行为对下属的影响。下属评级特别有效的领域包括领导风格和管理有效性，沟通清晰度和频率，支持和指导质量，决策制定过程的公平性，以及创造积极工作环境的能力。

下属评级面临的挑战包括担心报复、缺乏匿名性保护，以及可能缺乏评估管理技能的专业知识。因此，这种评级通常需要严格的保密措施和明确的发展性用途。

客户和供应商评级

许多职位需要与组织外部个人互动。最明显的是客户，但员工也可能与向组织提供材料和服务的供应商有重要互动。这些外部方观点可能独特，提供填写员工绩效档案的机会。外部评级的价值体现在提供真实的服务质量反馈，评估客户关系管理能力，了解组织在外部的声誉和形象，以及识别改进服务交付的机会。

必须谨慎，将询问限制在客户看到的绩效领域。这将代表员工所有职责的子集，可能仅限于人际关系、沟通和动机问题。外部评级者可能不了解内部工作要求或约束条件，因此他们的反馈需要在适当的背景下解释。

360度评估系统

审查的信息来源集合代表各种观点。通过使用这些来源，可从许多角度检查员工行为，因此使用各种来源被称为360度评估。

由于某些来源信息的敏感性及涉及管理问题时出现的潜在冲突，360度系统通常用于反馈和员工发展。

评级扭曲

即使评级系统意图收集个人绩效的准确估计，并建立结构特征协助收集这些准确估计，评级者并不总是提供准确估计。

常见评级错误包括：

中心趋势错误：评级者选择量表中间点描述绩效，即使更极端的点可能更好地描述员工。
宽松/严厉错误：评级者异常容易（宽松错误）或异常严厉（严厉错误）分配评级的结果。
光环错误：评级者有一系列维度要评级时，在每个维度上给员工分配相同评级。有一个光环围绕所有评级，使它们相似。

评级者培训

一般假设评级扭曲是无意的，评级者不知道扭曲其评级的影响。可能存在这些扭曲有动机的可能性。尽管如此，一些扭曲可能通过培训纠正。

管理培训：大多数评估系统简单易懂。有经验的管理者在整个管理生涯中一直进行绩效评级。因此，对于简单、直接、设计良好的图形评级系统，几乎不需要管理培训。

心理测量培训：涉及让评级者意识到常见评级扭曲，希望使这些扭曲更突出将减少扭曲可能性。虽然有一定道理，但假设扭曲不是有动机的，这种培训的实际效果有问题。

参考框架培训：基于评级者需要提供评级上下文——一个“框架”的假设。这种培训包括步骤：提供关于绩效多维性质的信息，确保评级者理解量表上锚点含义，进行标准绩效的练习评级，提供该练习的反馈。

评级可靠性和效度

可靠性：工业心理学家对绩效评级可靠性进行激烈辩论。一些研究表明，绩效评级的评级者间可靠性（即同一人的两个评级者间一致程度）可能在0.50到0.60范围内，这些值通常被认为代表“差”可靠性。

然而，这些值不应令人惊讶。当检查绩效信息来源时，看到每个来源（如上级、下属、同事、自我）都为过程带来不同观点。既然如此，为什么要期望他们间有高度一致性？

效度：绩效评级效度首先取决于评级量表的构思和开发方式。开发有效量表的第一步是考虑组织中绩效的含义，这可基于工作或工作分析或能力建模。量表应代表工作行为的重要方面。

评级动机与目标冲突

一些研究者对绩效评估过程采取不同观点，建议许多评级者无意准确，而是将过程用作某种个人或组织目的的手段。

研究者将绩效评价重新定义为目标导向活动，确定过程中三个不同利益相关者，每个都有不同目标：评级者、被评级者、组织。

拥有多个具有不同目标的利益相关者的问题是，当单一系统用于绩效评估时，它们经常冲突。当单一系统用于满足不同利益相关者的多个目标时，评级者必须在分配评级前选择满足哪个目标。

解决这些问题没有简单方法。一个解决方案是拥有多个绩效评估系统，每个用于不同目的。另一个解决方案可能是让利益相关者（评级者、被评级者和人力资源代表）大量参与系统开发。

绩效反馈与改进

个别工作者寻求反馈，因为它减少不确定性，并提供关于绩效水平的外部信息来平衡内部（自我）感知。大多数工作者更喜欢接受积极反馈，大多数上级更喜欢给予积极反馈。

即使当反馈讨论与管理讨论分开时，个人可能对吸收负面评论有“上限”。研究发现，随着反馈会话中负面评论数量增加，接受者的防御性评论和反应也增加。

破坏性批评

负面反馈有黑暗面，被描述为破坏性批评。破坏性批评被定义为残酷、讽刺和冒犯性的负面反馈，通常是一般性而非具体的，经常针对员工个人特征而非与工作相关的行为。

破坏性批评通常发生在上级允许下属表现不佳的事件堆积后。到那时，上级不可避免地对表现不佳有强烈情绪，因此反馈结果是破坏性的。

360度反馈实施

为有效实施360度反馈，应遵循准则：确保来源匿名性；评估者由上级和被评级员工共同确定；专门用于发展和成长目的，而非管理决策；培训信息来源及提供反馈的人员；在反馈会话后跟进定期机会。

研究表明，改进最可能在以下条件下发生：反馈强调需要某些改变，接受反馈的人有积极取向，接受反馈的人承认需要改变，接受反馈的人相信改变实际可以发生，接受反馈的人为改变设定具体目标，接受反馈的人采取导致技能和绩效改进的行动。

绩效评估与文化

360度反馈过程是讨论文化对绩效评价影响的好方法。在360度反馈中，下属被期望评估上级。但考虑权力距离高的文化，工作者期望上级对下属拥有并行使相当大权力的文化。

研究发现，与典型情况不同，上级是管理行为最不一致的观察者，同事是最不一致的。推理这是因为管理者和上级间的高权力距离在上级方面造成知识和观察差距。

基于日益增长的跨文化研究基础，至少有一个结论有根据：组织在将绩效评估系统引入跨国环境时需要对文化问题敏感。

绩效评估与法律

当人们感到被人力资源系统不公平对待时，经常通过对雇主提起诉讼来表达感受。

一项对1980年至1995年间涉及绩效评估的法院案例审查发现不少于1,870个联邦法院决定，代表惊人的不满程度。

分析结果显示，法官主要关心公平问题，而非系统技术特征。决定中最常引用的特征是：是否使用工作分析开发系统，是否给评级者书面指示，组织是否为员工提供申诉评级的机制，多个评级者是否同意评级。

1762850904-min (1).png

基于对法院决定及绩效测量系统研究文献的审查，建议雇主可采取各种保障措施，减少诉讼可能性，并在提起诉讼时增加绩效测量系统的可辩护性。

绩效评估与受保护群体

自1970年代后期以来，研究者一直研究绩效评级中系统性不公平的可能性。他们的结果几乎没有发现这种不公平的证据。对1980年至2008年间进行的所有研究审查再次得出结论，几乎没有研究证据支持对女性、少数民族或老年员工在绩效评估中系统性劣势的担忧。

一些绩效评级批评者提出更精细论点，即真正的“主观”系统允许最大程度偏见。研究检查这个问题，没有发现任何常见格式（图形或行为锚定）中系统性歧视的证据。

练习题

选择题

1. 以下哪项不是绩效测量在工作环境中的主要用途？

A. 员工发展和培训需求识别

B. 薪酬和奖金分配决策

C. 员工个人生活指导

D. 晋升和调岗决策

答案：C

解析： 绩效测量主要用于工作相关的决策，如员工发展、薪酬分配、晋升调岗等，不涉及员工的个人生活指导。

2. 客观绩效数据与主观评价数据之间的相关性通常为：

A. 0.8-0.9（高相关）

B. 0.6-0.7（中等相关）

C. 0.2-0.4（低相关）

D. 接近0（无相关）

答案：C

解析： 研究表明，客观绩效指标与主观评价之间的相关性通常只有0.2到0.39左右，这说明不同类型的绩效测量从不同角度反映工作表现。

3. 360度反馈系统最适合用于：

A. 薪酬决策

B. 员工发展和反馈

C. 裁员决策

D. 晋升评估

答案：B

解析： 由于360度反馈涉及多个信息来源，存在潜在的利益冲突，因此最适合用于员工发展和反馈，而不是行政决策。

4. 以下哪种评级错误是指评级者倾向于给所有维度相同评分？

A. 中心趋势错误

B. 宽松错误

C. 严厉错误

D. 光环错误

答案：D

解析： 光环错误是指评级者在多个维度上给员工分配相同或相似的评级，就像有一个“光环”围绕着所有评级。

问答题

5. 请解释绩效管理与传统绩效评价的主要区别，并说明绩效管理的三个核心组成部分。

答案： 绩效管理与传统绩效评价的主要区别在于：

频率：绩效管理是持续性的，而传统评价通常一年一次
参与度：绩效管理由管理者和员工共同开发，传统评价由HR部门制定
反馈：绩效管理提供及时反馈，传统评价反馈滞后
战略联系：绩效管理强调与组织战略目标的联系

绩效管理的三个核心组成部分：

绩效定义：包括组织目标和战略
测量过程：实际的绩效评估
沟通交流：上下级关于个人行为如何符合组织期望的持续沟通

解析： 绩效管理是一个更全面、更战略性的系统，它不仅关注测量，更重视发展和改进。

6. 分析电子绩效监控的优势和劣势，并提出在实施时应注意的关键因素。

答案： 电子绩效监控的优势：

客观性强，数据准确
实时监控，及时发现问题
成本效益高
减少人为偏见

电子绩效监控的劣势：

可能侵犯员工隐私
过分强调数量忽视质量
增加员工压力，降低士气
可能破坏信任关系

实施时的关键因素：

确保监控活动与工作相关
让员工参与系统设计
允许员工在特定时间暂停监控
事先通知员工监控安排
主要用于员工发展而非惩罚

解析： 电子监控是双刃剑，关键在于如何平衡组织需求与员工权益，重点应放在发展而非控制上。