
1. 选择数据图类型
1.1. 数据图借助了我们发现数据关系的能力
1.2. 数据图将数据分块并凸显重要的对照关系,从而将数据关系可视化
1.3. 确定底层关系是选择适当数据图类型的关键
- 1.3.1. 首先要确定你想要强调的底层数据关系,然后让这个关系指导你选择数据图
1.4. 数据图涵盖了大部分场景,各类受众都会觉得司空见惯
- 1.4.1. 司空见惯是特征,不是毛病,能让受众用更少的认知负荷来解码数据图
1.5. 数据图的目的是将受众的注意力聚焦到底层数据上,而不是聚焦到编码数据的图像上
1.6. 务求简单。只有在受众需要的情况下,才选择复杂的数据图
1.7. 数据图呈现数据关系。要选择适当的数据图,关键是确定受众需要理解哪一种关系
2. 类别关系
2.1. 类别关系是比较同一个指标在不同类别下的值
2.2. 这是最常见、最直观的数据关系
2.3. 表示类别关系的词语
- 2.3.1. 任何与类别成对出现的数量值
2.4. 场景示例
-
2.4.1. 不同产品的销售额
-
2.4.2. 不同本科专业的毕业率
-
2.4.3. 不同销售人员的平均成交额
-
2.4.4. 不同织物类型的耐久度
-
2.4.5. 不同人群的广告观看量
2.5. 常用数据图
-
2.5.1. 柱形图
-
2.5.1.1. 类别关系最适合用常见的柱形图呈现
-
2.5.1.2. 往往是因为受众熟悉这种数据图,认知负荷小
-
2.5.1.3. 纵向柱形图的适用情况
2.5.1.3.1. 类别比较为主
2.5.1.3.2. 比较项目的数量有限
2.5.1.3.3. 标签适合横排
-
2.5.1.4. 横向柱形图的适用情况
2.5.1.4.1. 类别太多,一字排开放不下
2.5.1.4.2. 类别名称太长,在纵向柱形图里只能斜着放
2.5.1.4.3. 有多个类似的纵向柱形图,将其中一部分改为横向能避免混淆
-
-
2.5.2. 簇状柱形图
-
2.5.2.1. 簇状柱形图可以进行两个类别间的比较
-
2.5.2.2. 在选择这种数据图之前,要确保跨类比较是有意义的
-
2.5.2.3. 只有当两张图确实无法表现出数据关系时,才可以用簇状柱形图
-
2.5.2.4. 为主的一类要把柱子贴在一起,这是运用了格式塔原理的连接律,所以更方便受众观看
-
2.6. 呈现类别关系的最佳实践
-
2.6.1. 分类要有意义(通常是基于数据)
- 2.6.1.1. 数据分类排序一定要有意义
3. 时间关系
3.1. 时间关系比较的是相同类别内不同时间点的情况
3.2. 时间通常设为x轴,以左为早,以右为晚
3.3. 表示时间关系的词语
- 3.3.1. 变化
3.4. 场景示例
-
3.4.1. 上升
-
3.4.2. 增加
-
3.4.3. 波动
-
3.4.4. 增长
-
3.4.5. 降低
-
3.4.6. 下降
-
3.4.7. 减少
-
3.4.8. 趋势
3.5. 时间关系的常用数据图
-
3.5.1. 折线图和柱形图
-
3.5.1.1. 时间关系通常用折线图或柱形图来表示
-
3.5.1.2. 两者分别强调了数据的不同侧面,因为它们将数据分成了不同的块
3.5.1.2.1. 折线强调数据的总体形状和趋势
3.5.1.2.2. 柱形图强调数值对比
-
3.5.1.3. 相同的数据换用柱形图来表示,就是强调单个月份,淡化总体趋势
-
-
3.5.2. 连续折线图适用情况
-
3.5.2.1. 强调数据的总体形状
-
3.5.2.2. 讨论焦点是模式和趋势
-
-
3.5.3. 离散柱形图适用情况
-
3.5.3.1. 强调个别数值
-
3.5.3.2. 讨论焦点是特定时间点之间的比较
-
-
3.5.4. 两点式折线图被称为坡度图
3.6. 呈现时间关系的最佳实践
-
3.6.1. x轴上的时间要等距分布
- 3.6.1.1. x轴上的时间段要长度相等,不能忽长忽短
-
3.6.2. 选择有意义的时间间隔
-
3.6.2.1. 时间间隔太密可能会凸显噪声,模糊了数据蕴含的模式
-
3.6.2.2. 时间间隔太宽则可能会忽略受众需要了解的模式
-
3.6.2.3. 适当的间隔要由关系的性质决定
-
4. 总分关系
4.1. 总分关系有两层含义,一是将总体分成各个部分,二是各个部分的相对比重
4.2. 饼图表现的就是总分关系
4.3. 表示总分关系的词语
-
4.3.1. 份额或占总体份额
-
4.3.2. 百分比或占总体百分比
-
4.3.3. 组合
4.4. 场景示例
-
4.4.1. 供应商份额
-
4.4.2. 成本构成
-
4.4.3. 市场格局
-
4.4.4. 消费者组合
4.5. 总分关系的常用数据图
-
4.5.1. 堆积柱形图
-
4.5.1.1. 总分关系图借助格式塔原理的连接律,呈现各个部分是如何构成了总体
-
4.5.1.2. 堆积柱形图的适用场景
4.5.1.2.1. 强调各个部分是如何构成了总体
4.5.1.2.2. 可以通过排序方式,帮助受众了解哪些部分较大,哪些较小
4.5.1.2.3. 包含所有部分
4.5.1.2.3.1. 不得省略总体的任何一个组成部分
-
-
4.5.2. 簇状柱形图的适用场景
-
4.5.2.1. 强调各个部分的比重
-
4.5.2.2. 不一定呈现所有部分
-
4.5.2.3. 可以通过加注或语境暗示的方式,强调图中部分总和比例为100%
-
-
4.5.3. 如果总分关系非常重要,有理由让受众承受更大的认知负荷,那还可以选用另外两种更复杂的数据图,即瀑布图和马赛克图
-
4.5.4. 瀑布图
-
4.5.4.1. 瀑布图是将堆积柱形图横向拆分,强调每个类别比某个基准值大多少或小多少
-
4.5.4.2. 不同于堆积柱形图,瀑布图可以有负值,而且能够表现出各个部分的次序
-
4.5.4.3. 还可以加入色调等编码,而不至于像多色堆积柱形图那样显得杂乱
-
4.5.4.4. 适用于流入(比如收入)和流出(比如支出)合起来构成整体的情况
-
4.5.4.5. 瀑布图的适用场景
4.5.4.5.1. 总体中既包含正的部分,也包含负的部分
4.5.4.5.2. 除了数值相加以外,还有其他有意义的次序
4.5.4.5.3. 受众对话题足够感兴趣,能够容忍相当程度的认知负荷
-
-
4.5.5. 马赛克图
-
4.5.5.1. 有时叫作mekko图,得名于芬兰纺织设计公司Marimekko,该公司以大胆的彩色几何图案闻名
-
4.5.5.2. 有时被形容为“方饼图”,同时利用高度和宽度来编码数据
-
4.5.5.3. 每根柱子的宽度代表大类的总值,高度代表大类下的各个小类的值
-
4.5.5.4. 与簇状柱形图一样,马赛克图也可以用于大类内部或大类之间的比较
-
4.5.5.5. 马赛克图浓缩了大量信息
4.5.5.5.1. 对受过训练的人来说,信息密度大的马赛克图非常好用,但对没有受过训练的人来说,马赛克图会带来明显的认知负荷
-
4.5.5.6. 马赛克图的适用场景
4.5.5.6.1. 呈现两个类别的总分关系
4.5.5.6.2. 理解这种数据图需要大量讲解,受众能够容忍这一点
-
4.5.5.7. 马赛克图常常用来表示多级市场细分矩阵
-
4.6. 呈现总分关系的最佳实践
-
4.6.1. 类别比较一定要有共同的基准线
-
4.6.1.1. 堆积柱形图的一个缺点是,柱子中段的各个部分难以相互比较,因为没有共同的基准线
-
4.6.1.2. 必须有共同的基准线,受众才容易进行比较
-
-
4.6.2. 各部分排序一定要有意义
-
4.6.2.1. 与所有类别比较一样,总分关系下的各部分排序也一定要有意义—通常是按照从大到小的顺序
-
4.6.2.2. 有助于受众区分大小相近的部分
-
4.6.2.3. 时间排序是有意义的
4.6.2.3.1. 相比于按收入多少给每天的时段排序,时间顺序会更直观
-
-
4.6.3. 尽量不要用饼图,除了有限的场景以外
-
4.6.3.1. 饼图是最广为人知的数据图之一
4.6.3.1.1. 作为大多数人最早学到的图表之一,几乎所有人都能一眼看出来饼图表示总分关系
4.6.3.1.2. 饼图在数值识读方面会给受众带来巨大挑战
-
4.6.3.2. 由于饼图的种种缺点,很多可视化专家都不提倡,甚至直接禁止使用饼图
4.6.3.2.1. 受众难以精确比较各个部分的大小
4.6.3.2.2. 除了最大的几个部分外,其余部分的标签难以辨认
-
4.6.3.3. 饼图中大小相近的部分很难比较
-
4.6.3.4. 排列顺序暗示了每个部分的大小关系,但任何一个部分的百分比都难以估算
-
4.6.3.5. 只要部分数目稍微多一点儿,饼图就很难加标签了,最小部分的标签更是没法识读
-
4.6.3.6. 柱形图可以更精确、更清晰地传达同样的信息
-
4.6.3.7. 饼图有一个重大优势:熟悉
4.6.3.7.1. 人们知道饼图传达的是总分关系,而且各个部分合起来就是总体,哪怕具体数值难以识读
-
4.6.3.8. 饼图只在有限场景下值得考虑
4.6.3.8.1. 总体只包括几个部分
4.6.3.8.2. 各部分之间差距大且明显
4.6.3.8.3. 没有小的部分(或者可以合并为“其他”)
4.6.3.8.4. 重点在于展示总体的所有组成部分,而非部分之间的比较
4.6.3.8.5. 受众不习惯以图片化方式获取信息
-