一、数据中台的定义数据中台是将企业休眠的数据转化为数据资产,持续使用数据、产生智慧、服务业务,从而实现数据价值体系和机制的实现。通过数据中心提供的方法和运行机制,形成聚合与整合、提纯与处理、建模处理、算法学习,以共享服务的形式提供数据供业务使用,从而与业务进行链接.进而结合业务中心的数据生产能力,最终构建数据生产-消费-再生的闭环。为了更好地理解数据中心,我们将其与数据仓库、数据湖、BI、大数据等相关概念进行对比。1、与数据仓库的比较数据仓库是面向主题的、集成的、相对稳定的反映历史变化的数据集合,用于支持管理决策。因此,它的重点是收集数据。数据仓库可以使用维度建模方法论,从业务流程中抽象出通用的维度和指标,形成数据模型,为决策分析提供通用的数据分析能力。与数据仓库相比,数据中心至少有四个优势。首先,数据中心强调数据的商业化,让数据能够被利用,满足企业数据分析和应用的需求。其次,平台中台数据整理的过程比数据仓库的建设更加复杂和全面。数据中台增加了一个环节,从企业的整体角度梳理数据域,这是数据中台建设中非常重要的一环。数据域的梳理恰恰体现了集中化的能力。比如在新零售场景下,企业的交易场景有很多,包括自建商城渠道、第三方电商渠道、外卖订餐渠道、线下门店渠道等。在建设数据中台时,需要规划一个交易域,将各个渠道的业务流程抽象出来,能够覆盖线上线下运营部门在运营过程中需要评估的维度和度量。因此,数据中心的建设过程应从企业全局出发,打通人、货、场多个维度的数据,让消费者无论从哪个渠道进来,都能洞察到他们与企业的接触轨迹。数据仓库的搭建比较简单,关注的是如何设计维度模型,如何拆解指标和维度,而很少关注基于人、货、场主体的实体连接,然后为前端业务中转做一个全局画像数据。第三,数据中心建设的范围远远大于数据仓库的建设。除了完成数据仓库的建模外,还需要制定全面的数据治理方案,甚至在建设过程中还需要成立专门的数据治理委员会,推进复杂的数据治理工作。最重要的一点是,在数据中心的规划阶段,要主动迎合业务,要全面梳理哪些业务场景需要数据赋能,形成业务闭环。因此,在建设数据中台时,一定要着眼于业务场景的赋能。第四,对于企业而言,建设数据中心不仅仅是搭建能力平台。正如我们在《中台战略》一书中提到的,建设中台需要中台文化和与之相匹配的中台组织。因此,从宏观上看,数据中台承担了企业重构数据组织的功能,倒逼企业必须建设一套与之相匹配的数据中台组织,才能运营好数据中台。数据仓库纯粹关注系统解决方案,不涉及组织形式。因此,简单来说,数据仓库侧重于构建数据,而数据中台则将构建、治理、管理、服务放在同一层级。数据仓库只是数据中心的一个子集。那我们为什么要从数据仓库发展到数据中心呢?因为传统的数据仓库已经不能完全满足企业数据分析的需求。企业从原来的统计分析转向预测分析,提供标签、推荐等算法,从被动分析转向主动分析,从非实时分析转向实时分析,从结构化数据转向结构化、半结构化非结构化和多样化的数据。2.与数据湖的比较还有一个概念与数据中心和数据湖(DataLake)有关。数据湖是数据存储的概念。作为一个集中式存储库,它可以以自然格式存储任何规模的数据,包括来自关系数据库行和列的结构化数据,半结构化数据,如XML、JSON、日志等。非结构化数据,如电子邮件和文档,如以及图像、音频、视频等二进制数据,实现数据的集中管理。Hadoop是目前最常用的实现数据湖概念的技术。例如HBase让数据湖存储海量数据,Spark让数据湖批量分析数据,Flink让数据湖实时访问和处理物联网数据。3、与BI的比较BI(BusinessIntelligence)是一系列分析数据,获得洞察力,帮助企业做出决策的方法、技术和软件。与数据仓库相比,BI还包含了数据挖掘、数据可视化等工具,可以支持用户在一定范围内任意组合维度和指标,从而上升到支持决策的层面,而不仅仅是作为数据仓库。4、与大数据相比,数据中心不等于大数据。数据中心是基于大数据、人工智能等技术的数据采集、存储、通信、管理和使用平台。数据中心需要以Hadoop、Spark等为代表的大数据处理技术的支持,但数据中心和大数据不能等同。数据中台不仅包括大数据处理技术,还包括智能算法、与业务挂钩的特性、数据资产、数据工具等。5.总结数据中台可以说是上述概念和技术的集大成者。首先,大数据丰富的数据计算和存储技术为数据中心提供了强大的数据处理能力。其次,数据中心作为企业数据的聚集地,其底层还承载着数据湖的功能。第三,数据仓库对数据进行领域建模是数据中心的重要组成部分,承载着对企业数据进行有序管理的功能。最后,基于强大的数据能力,结合业务场景提供实时、智能的服务和应用是数据平台的核心价值。二、数据平台的价值数据平台不等于大数据平台,数据平台的核心工作还不足以收集企业所有的数据并汇总。数据中心的使命是利用大数据技术,通过全局规划管理企业的数据资产,让数据使用者随时随地获取可靠的数据。因此,一旦数据中心建成并持续运营,其价值将随着时间的推移呈指数级增长。平台在数据上的价值有很多,下面对三大价值进行详述,如图4-1所示。▲图4-1数据中心的三大价值1.帮助企业建立数据标准在没有数据中心之前,企业基本不会有全球数据标准。表单和数据标准也无法实施。数据中心的建设自然会帮助企业建立数据标准,包括数据建设规范和数据消费规范。数据构建规范包括数据访问规范、数据建模规范、数据存储规范和数据安全规范。数据消费规范包括数据权限规范、数据调用规范和数据销毁规范。这些标准必须在建设数据中心的时候就建立起来,并依靠数据中心来执行和实施。2、推动中台组织的形成无论企业的战略规划多么宏伟,都离不开一套科学合理的组织来实施。数据中心的建设将是企业宏观战略规划的重要组成部分,因此企业在实践数据中心建设的过程中,首要的问题就是如何打造一套能够为建设稳定保驾护航的设备和运营一个数据中心数据中心的台湾团队。数据中台系统工程将企业数据的相关方,包括中台建设团队、中台运维团队、数据产品经理团队、数据资产管理团队、数据运营团队等横向连接起来,形成一个标准的企业数据委员会,从而形成一个真正的企业中台组织。需要注意的是,中台组织可以是跨越各个业务部门的弱矩阵组织,也可以是一个完整的实体组织。这需要因地制宜,因公司而异。3、全面赋能业务,促进降本增效。数据中心的最终价值在于降低成本和提高效率。无论是构建数据标准,还是组建中台组织,其核心目标都是帮助企业实现战略规划。通过数据中台,可以更合理的安排团队;数据从加工生产到使用的整个时间周期将大大缩短;中台的力量将企业营销、交易、服务、库存、物流等多方数据打通整合,结合两方和第三方数据,形成强大的全球视野的数据资产,以及滋养每个业务部门。同时,有针对性地针对场景,设计赋能场景的数据应用,帮助其从研、产、销等多方面缩短产品开发周期,未来产出畅销产品,精准找到人群愿意购买企业产品的用户,从而增强用户对企业产品和服务的友好体验,提高用户对企业品牌的忠诚度,减少企业经营过程中的损失,压缩供货周期链。这些价值观是公司一直孜孜不倦追求的目标。
