今天我们就来说说数据可视化。想必很多人在上手数据分析之后,都会经常进行可视化工作。所谓图抵千言,图表的使用,真的会事半功倍。但在现实中,很多人遇到的问题是:你做的图表是不是太丑了?你做的图到底想表达什么?图表太多,哪个更好?很多人都羡慕下面这些先进高端的数据可视化,但是自己动手做的时候却不知从何下手,或者实现难度太大,只能“看图叹气”.其实,做好可视化对我们来说并不难。最简单的方法是学习一些高级图表效果。折线图、柱状图等常见图表很容易给人一种共通感,而高级图表效果不仅可以提高美观和引人注目,而且可以更清晰地展示数据。下面我将分享五种可视化中常用的高级图表,以及实现这些图表效果的具体方法。一、选择可视化工具要想做出优秀的可视化,一个好的工具是必不可少的。其实简单到excel这种基本人人都会用的东西,也可以配置图表的颜色,这是数据可视化入门的基础。但是这对原始数据有一定的要求,量不能大,数据要干净,不能画地图之类比较炫酷的图表。最后的结果是什么?结果,数据可视化已经减少到相同的柱形图和折线图,以及相同的配色方案。因此,数据分析师一般都会使用专业的可视化工具。比较常见的有python、R等编程语言,以及FineBI、tableau等专业BI工具。这次我就以FineBI为例,教大家如何制作高级图表。先说一下FineBI可视化运行的过程:数据准备:通过数据连接,将数据以业务包中自助数据集的形式存入数据库,为可视化准备数据数据处理:数据的初步处理根据需求处理,如过滤、分组、排序、合并等操作可视化图表制作:通过拖拽指标实现可视化图表的创建仪表盘设计完成:在仪表盘上对图表进行排列设计,最终形成一个完整的可视化dashboard进阶图表一:流程图地图图表是我们在可视化中经常使用的组件之一。比较常见的是面图和线图,比较高级的比如热图和点图基本都是静态图;流向图是一种更高级的动态图表,常用于跨区域贸易、交通流量、人口流动、购物消费行为等场景。1、数据准备在分析春运客流之前,我们需要准备流向图的制作数据,包括客流路线、城市、对应的经纬度和城市ID,如图下图:准备好数据后,我们就可以开始制作春运的迁移流图了。2.拖拽地理字段因为我们直接准备经纬度字段,所以我们先将经纬度字段转换成地理角色,然后将转换后的经纬度字段拖到横纵轴上,如图下图:3.设置细粒度的经纬度默认的聚合方式是平均,这种情况下图中只显示一个点。我们还需要一个维度字段来划分细粒度的经纬度字段,所以我们将迁徙路线字段拖入细粒度,并在图表类型中选择流量图,如下图所示:然后进一步划分细粒度的,即每条迁徙路线都在对应的城市维度之下。将城市字段拖拽到细粒度,将迁移路线字段移动到图形属性下的颜色栏,可以做出这样的效果:4.增加流向效果实现按迁移划分线路后routes和cities,我们还要指定流向的顺序,将ID字段拖到图形属性下的连接栏中,如下图:点击OK设置动画效果。可以看出,图中的流向遵循迁移路线的方向。5.优化效果如果我们想增加移民数量的描述,即根据移民数量调整流线的颜色,那么我们需要将移民数量字段拖到下面的颜色条中图形属性,移动原迁移路线字段到标签/提示/细粒度城市顶部,选择任意位置移动,如下图:进阶图表二:瀑布图瀑布图本质上是一个直方图。当用户想表达两个数据点之间的数量演化过程,比如工资支出的构成,可以用瀑布图实现,通过不断的数值加减得到最终的实际工资。1.数据处理数据准备同上,我们需要先处理数据,先添加一个新的列,添加一个名为“累计值准备”的列,公式如下图所示:然后添加一个新的列column,添加一个名为yvaluepreparation的列,选择Accumulatedvalue/group,设置取值规则为accumulatedvalue,数值来自于accumulatedvaluepreparation,如下图:新增一列,添加列名y轴值,公式如下图:再增加一列,命名为label,公式如下图,这一步是将basic,performance,overtime标记为increase,insurance,provident基金、个税减额,应发工资和实际工资汇总;2.创建瀑布图并创建新的仪表板和组件。将item字段拖到横轴,将y轴值和数据字段拖到纵轴,图表类型下选择瀑布图,数据字段会自动移动到图表属性下的尺寸栏,并且图表会显示为瀑布图,如下图;项目字段选择自定义排序,自己排序如下图:将标签字段拖到图形属性下的颜色栏,瀑布图中矩形的颜色会按照增减显示,和总结,如下图所示:3.效果展示调整矩形、组件背景、标题栏等的颜色和字体,可以得到如下示例的效果:进阶图表3:人口金字塔人口金字塔图显示了人口中各个年龄段的分布情况,通常用于其中一种可视化类型。常见的分布是按年龄列出的女性和男性人口,如下图所示:1.数据处理创建一个自助数据集,添加字段0岁人口和性别,如下图,添加一列年龄,字段填入“0年龄”,如下图:同上操作分别处理其他年龄段的数据,处理后的业务包如下图:2.新建图表,新建仪表盘并创建组件,选择新增的人口普查自助数据集上表,复制待分析指标区域的人口字段,如下图:为人口和人口1字段添加详细过滤条件,性别属于男性,性别属于女性,如下图:将age拖入横轴,将population和population1字段都拖入纵轴,在图表类型中选择比较直方图,如下图:3、查看效果此时,男性在图表预览中实现了按年龄列出的女性人口。我们还可以根据男性和女性调整显示颜色,将性别字段拖到图形属性下的颜色栏中,如下图所示:高级图表4:数据栏我们知道数据栏功能可以用在Excel非常直观的查看选中区域的值的大小,如下图:1.新建图表,新建仪表盘,新建组件,选择互联网行业业务包下的访问统计事实表,如如下图:进入组件详细设置界面,设置“统计日期”,“访问平台”字段拖至纵轴,“视图”字段拖至横轴,如图下图:2.选择图形,图形将自动显示为折线图。我们要显示的是数据条,所以在图形属性下的形状条中,选择切换为柱状图,如下图:3.效果调整所以我们设置横轴的数值轴,在坐标轴刻度自定义中设置最大值,取消勾选坐标轴标签和周标题,如下图:点击确定保存数值坐标轴设置,同时可以设置分类坐标轴取消轴标题的显示。在图形属性下的大小栏中,将栏宽调整到最大值,如下图:此时在图表预览中可以看到数据条的效果,如下图:进阶图表5:100%堆积柱形图具体方法是新建一个gaugeBoard,在IndicatorstoAnalyze栏中点击AddCalculatedIndicator,如下图所示:添加的calculatedindicator公式如下:单击确定以保存计算的指标。将生产线、车间字段名称拖入横轴,将计算指标字段拖入纵轴,图表类型下选择分区柱状图,如下图:交换横纵轴字段,启用计算指标字段的堆叠按钮,将水平字段拖入图形属性下的颜色栏中,如下图,并将计算指标字段的数值格式设置为百分比;多系列百分比堆积柱形图最终效果如下图所示:
