数据其实是一个很传统的行业。自软件诞生之日起,数据行业就已经存在。比如最早的时候有很多数据报表的数据可视化,后来有了商业智能,有了DataWarehouse(也就是数据仓库),然后是数据挖掘。数据行业不仅仅是软件,还有管理,也就是数据治理,也就是如何让企业数据治理的质量更好。所以数据行业本身就是一个非常传统的行业。每个较大的企业都有自己的数据分析部门和数据仓库部门。那么为什么过去的数据湖和数据平台没有今年的数据中心那么火爆。而且关注数据中心的不仅仅是技术部门,还有很多业务部门。业务部门之前并没有特别关注这些技术的数据平台和这些技术的概念。为什么?一、平台化的概念说到数据平台,就不得不提到平台化。不管我们在讲非典,在讲路径,在讲数据中台,还是在讲业务中台,其实思想的根本来源都来自于平台化,也就是平台化。比如我们拿一个饮料厂的产品线来说,它可以生产果汁、饮料等产品。可能是三四条不同的生产线。将原料加工成饮料有很多环节。虽然品种不同,但很多环节都是相似的,比如装瓶、搅拌等。那么这些不同的生产流程和生产线,我们可以把那些公共的部分结合起来,让它们更加专业化,然后让它们独立维护,然后把那些不同的产品做成面向客户的,让客户体验到不同的产品,这样就是独立,这是平台化的思想。中台有两个很重要的中台,一个是业务中台,一个是数据中台。业务中心提供可重用的服务,API数据中心提供数据洞察和智能。不管是哪种平台,其实都是平台思维的一种体现,一种具象化。2、数据平台为什么受欢迎?这是一个例子。无论是原始的数据平台、数据湖还是数据仓库,其出发点往往是有局限性的。应该说是配套的技术体系。也就是首先要考虑我有什么数据,然后再考虑我能做什么。这是一个传统的数据平台,一个数据湖,它依赖于现有数据的质量和现有数据的状态。这样的配套技术平台。但是在我们现在讲的概念中,数据中心更多的是基于业务。比如我们现在设计的一套精益数据方法,就是从业务出发。您不需要一开始就查看您的系统。有什么样的数据,重点是要解决你的业务需要什么样的数据服务?只要服务有价值,我们就会想办法获取数据。如果我们没有能力,我们将构建技术能力来完成数据服务的提供。因此,数据中台与传统数据平台最重要的区别在于,技术平台的区别在于数据中心的思维是业务思维。从业务问题出发,这也是业务部门如此欢迎数据中心的原因。我们的目标是即使我的数据只有50%的准确率,那么我在提升数据质量的同时,我也希望这50%的准确率数据也能为我产生商业价值。过去这么多年,我们搭建的系统就是为了把业务数字化。现在我们很多企业在搭建好后台系统之后,实际上是在搭建业务系统,将数据转化为业务。我们现在在行业中强调的一点。原来我们说先有业务,后有数据,先有应用系统,再有数据系统。这一观点将从今年开始发生变化。在业务系统建立之前,我们必须要有数据思维,将数据集成到业务系统的架构中。原来我们说的业务系统叫OLTP,是在线交易系统,数据系统叫OLAP,是在线分析系统。现在我们可以看到一个趋势,这个趋势就是OLTP和OLAP的融合,也就是很多公司所说的P流融合,也就是批处理和实时流数据处理的融合。原来我们的OLTP和OLAP是并行的关系。首先,我们需要通过OLTP系统产生数据,然后ETL,再抽取到OLAP,然后将多个OLTP系统一起抽取,然后在OLTP和OLAP系统中产生洞察。把它变成数据可视化报告给业务部门看,然后改变你的OLTP方式。在这里,OLTP和OLAP是并行的关系。在这种情况下,企业中使用的原始数据中有70%到80%是数据可视化、BI和数据屋报告,这些都是人们阅读的。这称为人机界面。然后去提取,然后做出你的决定,改变你的行为,然后看数据。从今年开始,数据中心更加强调机器之间的接口,这是我数据分析的结果。它不仅是报表可视化的形式,还有一些数据的形式,比如这些API。该服务直接嵌入到交易系统中产生影响,成为您的价格策略、您的推荐引擎和您的风险管理。所以当我们谈到数据中心时,它不仅仅是一个技术平台,更是一个系统。数据中心会对应企业中的一个部门、一个组织,也必须有数据策略支撑。必须有数据治理。一个数据服务会在数据中心上生长,数据服务会提供给我们的业务系统,提供给我们的业务。平台,然后我们接收到的数据消费者都是在数据中心平台上成长起来的。数据中心平台是一个生态,一个平台,一个数据服务,一个生产、加工、交易、计量、运营的平台,所以我们实际上称数据中心为系统。3、数据中心对企业的价值数据中心解决的核心问题:解决应用开发快于数据开发的效率问题。解决数据开发与数据产生价值的协同问题。解决很多企业的开发人员和技术人员不具备数据能力的问题,这是从技术层面解决核心问题。1、应用开发要快于数据开发。原来我们在做报表的时候,或者需要在业务系统中查询一个数据结果的时候,过程比较麻烦,它的测试往往也比较复杂,因为业务系统具有业务属性,但数据是跨业务、集成的。在OLAP领域,这样的情况很多。比如在我公司,Java开发工程师好找,做应用的人好找。懂数据,会做数据建模,会做算法的人比较少。相对较少。但是在我们应用开发的过程中,我们会发现数据需求实在是太多了。在这种情况下,应用开发的速度要快于数据开发的速度。2.加速从数据到价值的服务生成过程很多时候,我们会发现不同的应用开发项目组会调用同一个数据模型,同一个数据服务,但是因为不了解数据,他们不知道底层的数据结构,所以他们不同的项目组可能用不同的方法处理同一个数据,自己做,然后结果是不一样的。有些是错误的,所以开发速度慢,数据结果不准确,质量低。但是现在数据中心需要解决这个问题。数据复用能力成为数据能力平台,让做数据的人专注做数据,把数据变成乐高积木,为应用开发提供数据服务,然后不同的应用开发项目团队可以协同工作,调用唯SARS数据服务,保证其数据质量和一致性,加速从数据到价值的服务生成过程,打造高响应度、更智能的业务。如何加快你的业务对数据反馈到你的数据产品的速度和响应速度,也是数据中台要解决的问题。它需要通过数据中心来弥补应用的价值、应用的速度、你的数据生成速度的差异,时间上的差异,有时还有业务理解上的差异。
