在数据可视化中,比较是最常见的分析需求之一。我们经常需要比较不同类别之间的数值,比较不同时间点的数据,比较不同组之间的差异。比较类图表正是为了满足这些需求而设计的。掌握比较类图表的特点和使用场景,是数据可视化的基本功。

柱状图(Bar Chart)是最常用的比较类图表之一。它使用矩形条的高度或长度来编码数值,非常适合比较不同类别的数据。
垂直柱状图(Vertical Bar Chart)是最常见的柱状图形式。在垂直柱状图中,类别放在横轴上,数值用柱子的高度来表示。垂直柱状图的优势在于,我们习惯从上到下比较高度,所以能够快速识别最大值和最小值。
垂直柱状图适合以下场景:类别数量不太多(通常不超过10个),类别名称不太长,需要强调数值的差异。比如,比较不同产品的销售额、比较不同地区的GDP、比较不同月份的访问量等。
下面是一个垂直柱状图的示例,展示了某公司四个季度的销售额:
从图中可以清楚地看到,第四季度的销售额最高,第二季度次之,第一季度最低。这种直观的比较是柱状图的核心优势。
水平柱状图(Horizontal Bar Chart)是垂直柱状图的变体,将类别放在纵轴上,数值用条形的长度来表示。水平柱状图的优势在于,当类别名称较长时,有更多的空间来显示标签,不会出现标签重叠的问题。
水平柱状图适合以下场景:类别名称较长,类别数量较多,需要强调排序关系。比如,比较不同国家的GDP、比较不同产品的用户满意度、比较不同部门的员工数量等。
下面是一个水平柱状图的示例,展示了不同产品的销量排名:
分组柱状图(Grouped Bar Chart)可以在同一个图表中比较多个系列的数据。它将不同系列的数据并排显示,每个类别有多个柱子,每个柱子代表一个系列。
分组柱状图适合以下场景:需要同时比较多个系列的数据,系列数量不太多(通常2-4个),需要强调不同系列在同一类别下的差异。比如,比较不同产品在不同地区的销售额、比较不同部门在不同季度的业绩、比较不同渠道在不同月份的转化率等。
下面是一个分组柱状图的示例,展示了三个产品在不同季度的销售额:
从图中可以清楚地看到,每个季度三个产品的销售额对比,以及每个产品在不同季度的变化趋势。分组柱状图让我们能够同时进行横向比较(同一季度不同产品)和纵向比较(同一产品不同季度)。
堆叠柱状图(Stacked Bar Chart)将不同系列的数据堆叠在一起,每个柱子由多个部分组成,每个部分代表一个系列。堆叠柱状图可以展示整体的构成,同时也可以比较不同类别之间的总量。
堆叠柱状图适合以下场景:需要展示整体的构成,需要同时比较总量和部分,部分之间的相对大小有意义。比如,展示不同地区的收入构成(工资、奖金、其他)、展示不同产品的成本构成(材料、人工、其他)、展示不同渠道的流量构成(直接、搜索、社交)等。
下面是一个堆叠柱状图的示例,展示了不同地区的收入构成:
从图中可以清楚地看到,每个地区的总收入(柱子的总高度),以及每个地区不同收入来源的构成。堆叠柱状图让我们能够同时比较总量和构成。
堆叠柱状图不适合比较非底部的部分,因为它们的基准线不同。如果需要比较所有部分,应该使用分组柱状图。
条形图(Bar Chart)和柱状图在本质上是相同的,只是方向不同。条形图是水平方向的,柱状图是垂直方向的。但在实际应用中,条形图通常特指水平方向的图表。

基础条形图(Basic Bar Chart)是最简单的条形图形式,每个类别用一个条形来表示。条形图的优势在于,当类别名称较长时,有更多的空间来显示,不会出现标签重叠或旋转的问题。
基础条形图适合以下场景:类别名称较长,类别数量较多,需要强调排序。比如,比较不同国家的GDP、比较不同城市的房价、比较不同大学的排名等。
分组条形图(Grouped Bar Chart)可以在同一个图表中比较多个系列的数据,将不同系列的数据并排显示。分组条形图与分组柱状图类似,只是方向不同。
分组条形图适合以下场景:需要同时比较多个系列,类别名称较长,需要强调不同系列在同一类别下的差异。
堆叠条形图(Stacked Bar Chart)将不同系列的数据堆叠在一起,展示整体的构成。堆叠条形图与堆叠柱状图类似,只是方向不同。
堆叠条形图适合以下场景:需要展示整体的构成,类别名称较长,需要同时比较总量和部分。
折线图(Line Chart)使用线条来连接数据点,非常适合展示数据随时间的变化趋势。折线图的核心优势在于连续性,它能够清晰地展示趋势和变化。
单线图(Single Line Chart)是最简单的折线图形式,只有一条线。单线图适合展示单个指标随时间的变化趋势。
单线图适合以下场景:只有一个系列的数据,需要展示趋势,时间点是连续的。比如,展示股票价格的变化、展示气温的变化、展示网站访问量的变化等。
下面是一个单线图的示例,展示了某产品在过去12个月的销量趋势:
从图中可以清楚地看到,产品销量整体呈上升趋势,虽然在3月和6月有小幅下降,但总体趋势是向上的。折线图的连续性让我们能够清晰地看到这种趋势。
多线图(Multi-line Chart)可以在同一个图表中展示多个系列的数据,每个系列用一条线来表示。多线图适合同时比较多个指标的变化趋势。
多线图适合以下场景:需要同时比较多个系列,系列数量不太多(通常不超过5个),需要展示趋势和对比。比如,比较不同产品的销量趋势、比较不同地区的温度变化、比较不同渠道的转化率变化等。
下面是一个多线图的示例,展示了三个产品在过去12个月的销量趋势对比:
从图中可以清楚地看到,三个产品的销量都呈上升趋势,但产品A的销量最高,产品B次之,产品C最低。多线图让我们能够同时看到每个产品的趋势和不同产品之间的对比。
面积图(Area Chart)是折线图的变体,将折线下方的区域填充颜色。面积图可以强调数值的大小,同时也可以展示趋势。当有多个系列时,可以使用堆叠面积图来展示整体的构成。
面积图适合以下场景:需要强调数值的大小,需要展示趋势,需要展示累积效果。比如,展示不同渠道的流量累积、展示不同产品的销售额累积、展示不同地区的用户增长累积等。
下面是一个堆叠面积图的示例,展示了三个渠道的流量累积:
面积图适合展示累积效果,但如果需要精确比较不同系列在同一时间点的数值,应该使用分组柱状图或多线图。
雷达图(Radar Chart),也称为蜘蛛图(Spider Chart)或极坐标图(Polar Chart),使用多个轴从中心点向外辐射,每个轴代表一个维度,数据点用多边形来表示。雷达图适合同时比较多个维度的数据。
雷达图适合以下场景:需要同时比较多个维度,维度数量不太多(通常5-8个),需要展示综合表现。比如,比较不同产品的多维度评价、比较不同员工的多项能力、比较不同地区的多项指标等。
雷达图的优势在于,它能够在同一个图表中展示多个维度,让我们能够全面了解一个对象的综合表现。雷达图的局限性在于,当维度数量较多时,图表会变得复杂难读,而且不同维度之间的比较不够直观。
下面是一个雷达图的示例,展示了三个产品在五个维度上的评分:
从图中可以清楚地看到,产品A在设计和品牌方面表现突出,但在价格方面较弱;产品B在各个维度上表现均衡;产品C在价格方面有优势,但在其他方面相对较弱。雷达图让我们能够全面了解每个产品的综合表现。
雷达图不适合精确比较,因为不同维度之间的角度关系不够直观。如果需要精确比较,应该使用分组柱状图。
在实际应用中,我们经常面临一个问题:应该选择哪种图表?这个问题的答案取决于多个因素:数据的类型、比较的目的、展示的场景等。
首先,我们需要明确要比较什么。是要比较不同类别的数值?还是要比较不同时间点的数据?还是要比较不同组之间的差异?
如果要比较不同类别的数值,应该考虑柱状图或条形图。如果类别数量不多,类别名称不长,应该使用垂直柱状图。如果类别数量较多,类别名称较长,应该使用水平条形图。
如果要比较不同时间点的数据,应该考虑折线图或面积图。如果只有一个系列,应该使用单线图。如果有多个系列,应该使用多线图。如果需要强调累积效果,应该使用面积图。
如果要同时比较多个维度,应该考虑雷达图。但要注意,雷达图不适合精确比较,只适合展示综合表现。
如果只有一个系列,选择相对简单。如果是类别比较,使用基础柱状图或条形图。如果是时间序列,使用单线图。
如果有多个系列,需要考虑系列之间的关系。如果需要比较不同系列在同一类别下的差异,应该使用分组柱状图或分组条形图。如果需要展示整体的构成,应该使用堆叠柱状图或堆叠条形图。如果需要比较不同系列的趋势,应该使用多线图。
不同的展示场景对图表有不同的要求。如果是报告或演示,应该选择清晰、简洁的图表。如果是交互式探索,可以选择更复杂的图表,让用户能够深入探索。
如果是打印输出,应该考虑颜色在黑白打印时的效果,避免使用过多依赖颜色的设计。如果是屏幕显示,可以使用更丰富的颜色和交互效果。
比较类图表是数据可视化中最常用的图表类型。掌握柱状图、条形图、折线图、面积图、雷达图等图表的特点和使用场景,能够帮助我们更好地展示数据,支持决策。
在接下来的章节中,我们将学习分布类图表和关系类图表,了解如何展示数据的分布特征和变量之间的关系。
不同的目标受众对图表的理解能力不同。如果是专业用户,可以使用更复杂的图表,如雷达图、堆叠面积图等。如果是普通用户,应该使用更简单、更直观的图表,如柱状图、折线图等。