不知道大家有没有过这样的经历:老板下令让针对某项业务数据做个分析报告,明明和同事拿到的数据是一样的,分析的业务指标也差不多,但交上去的分析报告总是不如同事的亮眼,比如像下面这两份数据分析报告:
这是一份销售数据分析分析报告,单看这张分析报告看起来也马马虎虎,该有的指标基本都有,各类指标的变化趋势也能一眼看出来,但是如果和下面这张销售数据分析图放在一起呢?
很显然,两张数据分析结果放在一起,老板自然一眼就看上第二个,而第一个人做出的努力就默默的被忽略了,甚至还会给老板留下能力不行的差印象。因此,做数据分析,最后一步的可视化展现相当重要。那么如何做出高端的数据可视化呢?
优秀的数据可视化作品可以用三个关键词概括:准确、清晰、优雅。
准确:精准地反馈数据的特征信息(既不遗漏也不冗余,不造成读者疏漏&误读细节)
清晰:获取图表特征信息的时间越短越好
优雅:美观(颜色搭配)、协调(相同场景的图表遵循统一规范)。
想要准确、清晰的呈现数据,关键在于图表的选用,下面给大家说说可视化图表的使用技巧:
常用可视化图表的使用技巧
常用的可视化图表一般有这几个:条形图、柱状图、折线图、饼图、散点图、雷达图等等,这些都是在数据可视化过程中使用率很高的,但即便这些简单的可视化图表大家十分熟悉,在使用的过程中还是有很多容易忽略的误区
1、柱状图
柱状图通过柱高能够比较清晰的反映数据的差异,一般情况下用来反映分类项目之间的比较,也可以用来反映时间趋势。但是柱形图的局限在于它仅适用于中小规模的数据比较,当数据项比较多的时候就不易分辨。一般来说,最好不要超过10个。
另外,柱状图的横轴是时间维度,用户习惯性认为存在时间趋势。如果遇到横轴不是时间维度的情况,建议用颜色区分每根柱子。
2、条形图
条形图用来反映分类项目之间的比较,适合应用于跨类别比较数据。在我们需要比较项类的大小、高低时适合使用条形图。
3、饼图
饼图用来反应数据占比,在需要描述某一部分占总体的百分比时,适合使用饼图。但在数据可视化过程中能不用饼图最好就不用,因为肉眼对面积大小并不敏感,最好在使用过程中要加上数据标签,这样会清晰一些。
另外,饼图在使用中最好不要超过6个部分,如果要表达的部分太多,就会导致人无法读取确切的数据信息,比如像下面这样,这种情况最好是使用条形图
4、散点图
散点图的数据为三维数据,使用两组数据构成多个坐标点,分析坐标点的分布情况,判断两个变量之间的关联或分布趋势。比如通过上图就可以看出哪些大区单票利润较低,急需提升,比如广泛聚集于右下角的第四大区,单票收入低于平均线,单票成本却高于平均线。
可以用颜色区分系列,也可以用散点大小定第三维度,这就衍生图出了气泡图。
5、雷达图
雷达图适用于多维数据(四维以上),且每个维度必须可以排序。对于一些多维的性能数据,如综合评价,常用雷达图表示。指标得分接近圆心,说明处于较差状态,应分析改进;指标得分接近外边线,说明处于理想状态。数据点一般6个左右,太多的话辨别起来有困难。
5个高级可视化图表
除了上面几个常用的数据可视化图表,再大家推荐几个能够让可视化结果焕然一新的几个高级可视化图表
1、数据可视化地图
数据地图也是我们在进行可视化中经常会用的图表之一,数据地图可以最直观的表达出数据之间的空间关系,因此在很多数据分析场景中被广泛应用。比较常见的就是区域地图、线地图、点地图,这些基本都是静态地图:
除了静态地图,还有更高级的动态可视化图表,比如流向地图,经常应用于区际贸易、交通流向、人口迁移、购物消费行为等场景,像这次疫情期间的人口流动状况就可以使用流向地图,动态的效果给人的视觉冲击更强烈。
2、人口金字塔图
人口金字塔图一般用来现实显示人口中各个年龄组的分布,一般用来对比男女性的年龄分布,如果做成动画,视觉效果会十分高级,比如像下面这样:
3、瀑布图
若想表达两个数据点间数量的演变过程,可使用瀑布图。开始的一个值,在经过不断的加减后,得到一个值。瀑布图将这个过程图示化,常用来展现财务分析中的收支情况。
4、矩形树图
上面说了柱形图不适合表达过多数据项(比如上百)的数据,那应该怎么办?矩形树图出现了。它直观地以面积表示数值,用颜色表示类目,类目维度下还可以有多个二级类目。如果用柱形图表达,效果有多糟糕可想而知:
5、百分百堆积柱状图
百分百堆积柱状图是由柱形图衍生而来的,不仅可以直观的看出每个系列的值,还能够反映出系列的占比,尤其是当需要看某一单位的综合以及各系列值的比重时。
数据可视化技巧
1、避免使用鲜艳的颜色
明亮鲜艳的颜色就像是把所有的字母都大写了,这样读者很难集中注意力在某一个重要数据上。单调的颜色,反而能很好地用于数据可视化,因为它们可以让你的读者理解你的数据,而不至于被数据淹没,当你想要强调某一项数据时,可以使用鲜明的颜色。
2、适当应用动态交互效果
就像我刚才说的,动态的视觉效果给人的冲击里更大,在可视化的过程中可以利用动态图表来增强可视化结果的互动性,比如动态地图钻取,图表联动等等
3、可视化布局
4、善用可视化工具
俗话说,工欲善其事必先利其器,巧用数据可视化工具也能使可视化结果事半功倍。有代码基础的朋友可以用python的插件库,比如:matplotlib、Seaborn、ggplot、Plotly,或者E charts等图表插件。或者可以直接用数据分析软件制作,比如FineBI、tableau等,内置的图表类型很丰富,操作也相对来说比较简单。
FineBI数据可视化过程
最后,希望大家都能做成漂亮美观、令人眼前一亮的数据可视化