今年以来,大数据成为整个IT领域非常热门的话题,尤其是阿里巴巴的马云提出“人类正在从IT走向时代到DT时代”,把大数据推上了风口浪尖。然而,对于大多数企业而言,往往存在大量没有实际利用价值的数据,更谈不上帮助管理者进行业务决策。 作为专业的应用性能管理服务商,云智常年处理客户的各种IT数据。我们如何看待大数据,如何让大数据为企业的商业决策产生价值?请看云智高级产品经理福克斯对大数据最后一公里的思考——数据可视化的价值。什么是大数据? 我爸爸是公务员。他有个爱好,就是每天看新闻联播。新闻中经常提到大数据。偶尔他会问我什么是大数据?国际上的定义是对大规模数据的采集、存储、管理和分析的集合,远远超出了传统数据库软件工具的能力。它们具有数据规模大、数据流动快、数据类型多样、价值密度低四个特点。难懂吗? 有一个笑话可以让你形象地理解大数据。林彪带兵打仗有个特别的习惯,那就是每次打完仗,都要用小本子记下自己缴获的武器种类、数量等数据,总是好玩,而且大家都不关心。一天,又一次遭遇战,当士兵们向他宣读缴获武器的数量时,他突然停了下来,然后兴奋地指出这次遭遇战很可能是与敌人的指挥部队。原因是这次缴获的小枪与大枪的比例高于平时的战斗,小车与大车的比例,以及官兵的比例也高于平均水平,所以他得出了这个结论.部队在这一数据的指引下,一口气追击逃兵,成功擒获敌军指挥官。 通过这个故事,大家可以形象的了解到大数据的作用和价值。不管大多数企业还是个人已经意识到大数据的真实存在,毫无疑问,我们生活在大数据时代。随着大数据的兴起,数据分析分为以下几个步骤:采集、统计、分析、呈现,而数据呈现就是数据的可视化,被称为大数据的最后一公里。 什么是数据可视化 大数据已经被列入国家十三五规划,提倡开放共享。开放共享的背后,意味着人人都可以进入和进入大数据领域。企业不再担心数据资源被垄断,因为一切都是开放的,如何获取数据将不再是问题。难点在于数据的价值。通过什么样的手段,才能直观、清晰地表达数据的价值。 之前看到一篇文章《设计中的设计》,提出了一个概念叫视觉对话。如果你想和两个不懂语言的陌生人交流,给他们一张纸和一支笔,他们一定要用最简洁的方式把自己的想法写下来进行交流。这是一个视觉对话。 其实这就是数据可视化的本质。通过可视化图表,以比文字快10倍的速度将不熟悉的读者带入。大数据时代的一个显着特征是数据可视化的兴起。作为大数据最后一公里的展示环节,数据可视化将技术与艺术完美结合,以图形化的手段清晰有效地传达和传达信息。 一方面,数据赋予可视化价值;另一方面,可视化增加了数据的灵性。两者相辅相成,帮助企业从信息中提取知识,从知识中获取价值。 为什么要做数据可视化 为什么很多公司开始拥抱数据可视化?哪些趋势正在推动可视化,换句话说,为什么公司变得更加可视化? 先声明一下,数据可视化绝对不是最近才流行起来的,早在原始社会,穴居人就用岩画作为信息传递的手段,而我目前用过的最好用的大数据分析软件是卓越。 与5年前相比,企业对数据可视化的需求越来越强烈。原因很简单,数据实在是太多了。正是因为信息的爆炸式增长,才造就了谷歌和百度这两家以IT信息检索为核心业务的搜索引擎巨头。 我们今天所处的移动互联网时代,与传统互联网时代截然不同。一方面,移动互联网用户规模是传统互联网的三倍,使用频率是传统互联网的五倍。所以,我们说这是传统互联网市场的15倍。近两年,大数据的概念越来越火。我们可以看看Aigra的大数据图表,就知道一分钟内互联网上会产生多少内容。 通过这张图,我们可以看出大数据有多大,这对企业来说意味着两件事:一方面,企业需要新的工具来分析和理解大数据;目的是利用这些数据做出更好的商业决策,通过数据分析最直观地理解数据的含义,这离不开数据可视化。 数据可视化的作用和实现方法 数据可视化对企业有什么影响?我个人认为并不是所有的数据都要可视化。很多数据可视化确实有点牵强,但是数据可视化可以给我们带来三个功能: 1。大规模数据可视化可以帮助业务管理者快速理解大量数据,更高效地工作。 2。正确的数据可视化可以清楚地显示数据背后的含义。 3。数据可视化可以帮助企业做出准确的决策。 数据越来越多,企业越来越希望找出数据背后的意义和价值,我们的云智能透视宝也越来越有优势!常用的用户统计分析系统或日志分析收集的数据仅限于用户行为和IT系统本身,但对于企业业务来说,两者是密切相关的。IT性能的好坏影响用户体验和用户转化,用户蜂拥而至也会造成性能瓶颈。 通过InsightPay,可以将用户的行为数据与系统性能关联起来。它不仅可以分析用户喜欢的功能,还可以分析其性能对用户的影响。当我们InsightPay覆盖的行业越来越广时,企业也可以利用自己的数据和行业平均指标进行横向比较,进而辅助企业进行决策。这对企业来说是非常有价值的,这就是大数据可视化的魅力所在。 基本上,各种图表在不同的场景下有不同的含义。上图指导我们什么样的数据需要什么样的图表,展示会更清晰,更容易让客户了解数据的价值。在透视宝中,也需要根据不同的使用场景选择更适合的图表展示,后续我们会进行针对性的优化和适当的调整。 这是一张非常经典的数据可视化图表。以地图的形式实时显示QQ在线用户数。我们可以换个角度思考。如果这是某企业APP的在线用户数,能不能联系到老板?在办公室,让老板随时清楚了解当前用户对应用的使用情况,哪些区域是暗区,哪些区域是活跃集中的,这无疑对业务决策有很大帮助。这些数据都可以通过维信宝获得,也就是说我们维信宝可以发挥超强的作用。 这是奥杜邦鸟类与气候变化报告的一部分,该报告预测了季节性变化的区域,黄色代表夏季,蓝色代表冬季。地图具有神奇的能力,既可以成为强大的数据可视化工具,也可以成为强大的报告工具,可以向我们展示我们无法直接看到的事物。 个人认为在数据可视化领域对应的技术有以下三种: 1。数据降维。我认为数据降维是数据处理的首要任务。我们通常把自己的个人欲望强加在数据可视化上,我们有太多的指标需要通过一个信息图来处理,这里面就有一个问题。这些维度的数据真的需要用图来表示吗?客户能否看懂显示的信息?所以往往数据的降维和简化是首要任务。其次,我们需要对数据进行清洗,去掉所谓的噪音,留下有价值的信息,否则我们后面分析数据的时候会受到不必要的干扰。 2。协会关系。数据本身毫无意义。只有关联起来,才能产生意义和价值。不同的散点通过内外连接聚合起来,这样数据就可以通过不同的维度进行关联,来传达数据的价值,比如人群与性别、年龄、身高就是一个非常典型的关系。 3。扁平化交互,PC和手机屏幕有限,每增加一种颜色都会增加信息量,从而干扰原始信息的传递,我们可以采用两种策略在地图可视化中隐藏数据,一种是逐层钻取,充分利用区域的层级包含关系,让信息按省-市-县层级展示,不用一下子展开;另一个是扩展地图,它浓缩和收集复杂的信息,就像一个抽屉,需要的时候打开它。 这三种技术说起来容易,但在实践中却不一定,因为我们往往很难控制自己的欲望,添加数据,添加关联,添加功能。不管做什么事情,控制自己的欲望并坚持下去是很重要的。不忘初心,人常在。 举个栗子 说说视觉组织的模型。最大的大数据公司是哪家?是拥有12亿注册用户的Facebook吗?还是Amzaon和GOOGLE?他们都是著名的、国际知名的大公司,这些公司都不是普通人,但在模式上,目前的荣誉应该归Netflix(Netflix)所有。 公司的起源与互联网或大数据无关。通俗地说,就是一家DVD租赁公司。Netflix成立于1997年,最初只是开展邮寄DVD出租业务。那时候,不管是在国外还是在中国,都有路边小店叫录像带出租店。租影碟需要亲自到店里左右翻找,还经常拖延归还CD而收取滞纳金。Netflix不开店,采用邮寄模式,一炮走红。2000年,仅滞纳金一项,Netflix的收入就达到8亿美元,占其总收入的16%。 十年过去,视频租赁模式从成熟走向没落。更重要的是,随着时间的推移,DVD损坏、客户盗窃、邮寄成本增加等诸多问题已经让Netflix的租赁模式难以支撑。于是在2007年,Netflix开始颠覆自己,从实体DVD转向流媒体。在这个过程中,Netflix意识到它的客户正在生成数量惊人的数据,不仅是关于谁看了什么,而且还收集了更多有价值的信息: 地理定位数据,它可以找到用户在哪里观看视频; 设备数据,用户通过哪个终端观看视频; 时间数据,用户观看视频的时间,比如星期几,具体时间; 行为数据,用户每次观看视频后退、快进、暂停的行为。 不仅如此,Netflix还通过社交网络Facebooke、Twitter等网站收集用户的社交行为数据,再通过坚实的基础平台和强大的大数据分析能力将数据可视化,成功预测用户的喜好和偏好. 未来,Netflix可以进一步加强预测客户接下来想看什么视频和内容的能力,并根据声音、风景、颜色等因素进行推荐。这些元数据为了解客户想要观看的内容提供了更有价值的见解。 透视宝数据可视化的价值 以上是我对大数据和可视化的体会。接下来结合透视宝做一些思考: 1。应用性能数据和业务数据分析,应用性能数据和业务数据密切相关,可以讲述客户性能数据和交易数据背后的故事。通过应用性能数据与业务数据的关联分析,可以很好地预测性能瓶颈何时已经开始影响到客户的业务。最直观的不仅仅是用户的流失,更重要的是经营业绩。衰退。 2。透视大屏幕。Perspective作为应用性能的领导者,一方面提供解决方案,帮助用户发现应用性能问题。另一方面,我们提倡提供应用程序性能数据可视化。通过应用性能数据的可视化,将通俗易懂的大数据分析结果呈现在客户面前,一目了然地定位问题,发现性能背后的意义。 当然,我们还在按部就班地做这件事。例如,未来透视宝的大屏可以通过地图实时展示APP用户的活跃度、性能状态,以及性能对用户分布的影响。我们的想象力非常广阔。 接下来分享的主题,可视化是大数据的最后一公里,一半时间,数据可视化是视觉宝非常重要的一个功能,未来我们会做好这方面的工作。最后分享几个数据可视化的资源工具,供大家学习借鉴。
