高手总结的15个技巧,让你轻松玩转数据可视化!
接下来,,看看数值构成随时间变化的案例:第一大区(包含四个重点地区)近四年收入构成的趋势要如何可视化?自己想一想,再下滑看推荐方案。 ![]() △ 业务数据 ![]() △ 堆叠面积图 推荐方案是堆叠面积图,可以展现分量(地区)对于总量(大区)的贡献,并显示总量(大区)的变化过程。需要说明的是,地区收入的起点并非从 y=0 开始,而是在下面的地区基础上逐层叠加,最后组成一个整体。 4. 累计比较 – 堆叠柱状图 如果将上图X轴的标签文字(即年份)和图例(即地区)互换(如下图A),用来看每个地区近四年的收入构成,用哪个图更合适? ![]() ![]() △ 堆叠柱状图 是不是觉得都可以?那图中 X1 有何含义?堆叠面积图 A 方案和堆叠柱状图 B 方案都可以表现累加值。差别在于,堆叠面积图的 x 轴是连续数据(如时间),堆叠柱状图的 x 轴是分类数据。此案例中的 x 轴是非连续的分类数据,因此用 B 方案更适合。 5. 累计增减 – 瀑布图 若想表达两个数据点间数量的演变过程,可使用瀑布图。开始的一个值,在经过不断的加减后,得到一个值。瀑布图将这个过程图示化,常用来展现财务分析中的收支情况。 ![]() △ 瀑布图 以上就是「构成」类常用图表,可归纳如下。 ![]() 三、分布&联系 通过分布&联系型图表能看到数据的分布情况,进而找到某些联系,如相关性、异常值和数据集群。 常见使用场景:客户的年龄段分布?单票成本与收件量的关系? 1. 两个变量 – 散点图 仍以业务为例,下图为全国网点的单票成本/收入分布情况。 ![]() △ 散点图 单单这样看,可能看不出什么,如果加两条平均线就不一样了。 ![]() 加了平均线,就知道哪些网点高于平均线,哪些低于平均线。但网点那么多,总不能逐个点击查看是哪个大区的,给散点加上颜色后,就很有意义了。 ![]() 通过此图,可以看出哪些大区单票利润较低,急需提升,比如广泛聚集于右下角的第四大区,单票收入低于平均线,单票成本却高于平均线。 2. 三个变量 – 气泡图 大家都知道,网点总利润除了和单票利润有关,还和体量(即收件量)有关,用散点的面积大小表示收件量,就变成了气泡图。 ![]() △ 气泡图 3. 结合地图 – 热力图 气泡图与地图结合可演变为热力图。通过热力图,能看到哪些网点收派件量较多,需进行资源调配。 ![]() △ 热力图 以上是 「分布&联系」类的常用图表,可归纳如下: ![]() 小结 当我们拿到数据后,先提炼关键信息,明确数据关系及主题,再选择合适的图表进行可视化。希望下图能给各位一些参考(结合可视化专家 Andrew Abela 的图表选择指南,进行了简化调整)。 (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |