数据中心是一个诞生于中国的名词,很多公司都在为“什么是数据中心”、“我要上XX中心”而徘徊。其炒作程度堪比当年的“大数据”一词。如果您查看Gartner的炒作周期图表,数据中心目前正接近炒作的顶峰。与其不断讨论什么是数据中台,企业更应该明白,构建数据中台的目的是为了让企业高效数据驱动,减少重复的架构建设。如果要用一张图来描述Gartner如何看待数据中心的建设方向,可以如下图所示。数据中心建设方向应以企业数字化平台为核心,即Gartner定义的数据与分析平台(红色虚线),助力企业数字化平台(客户体验平台、生态平台、物联网平台和内部信息系统)业务用户可以做出更好的决策,并在各种数字平台的合作和孵化下形成可重复使用的数据分析能力。数据分析能力应该是业务端无处不在、高度自助的,最终帮助数字平台实现Gartner定义的打包业务能力(PackagedBusinessCapability)。以下是Gartner对想要建设数据中心的公司的建议。台中数据管理策略的平衡数据上面提到的“大而全”的方向听起来很不错,但是很多公司并没有考虑可重用性或者Self-service(这也是很多公司建立数据的初衷中心)。原因很简单。一下子完成所有平台的数字化是不现实的。很多企业,尤其是传统企业,很多业务的数字化还没有完成,更不用说建设数据中心了。像阿里、腾讯这样的数字原生企业在搭建中台上是非常有优势的,或者说数据中台是这些企业在业务呈指数级增长的情况下自然增长的产物。此外,数据作为数字化业务核心资产的价值也被广泛接受。企业最直接的反应就是在构建数字化平台时尝试收集数据,好像这是实现商业价值的关键。比如过去很火的数据湖,就会把收集数据作为核心能力。但收集数据并不一定能带来商业价值,企业也不可能一口气收集完所有数据。以物联网平台为例,数据分布在网络上、边缘设备上、网关上、云端上、传统系统上。例如,需要自主行为的“事物”(例如互联汽车或风力涡轮机)必须在机载或网关处进行数据和处理,以对不断变化的条件做出即时反应。面向消费者的物联网解决方案,例如用于健身追踪的可穿戴设备,通常将数据存储在云端以供分析。几乎所有物联网解决方案还必须与传统业务应用程序共享和集成数据,以执行客户服务和长期绩效分析。此外,对实时(或“近实时”)集成的日益增长的需求引入了即使是最快的数据收集策略也无法满足的提前期要求。在采取响应之前在“边缘”对数据采取行动的操作流程不符合将所有数据提前收集到中央存储位置的要求。试图收集所有这些物联网数据以供后续处理和使用既不现实也不可行。同时,保护个人身份信息的隐私法规将阻碍数据的整体收集。因此,一些数据用例会需要连接(Connect)数据,而不仅仅是收集数据。企业数据中心的建设,绝不是把所有的数据都收集到一个地方,然后开始应用数据。随着数据的不断涌入,只有通过连接(Connect)的方式,才能在原来存储数据的介质中复用数据。是数据中心也应该具备的一种手段。收集数据和连接数据的平衡是现代数据管理的必要条件。数据虚拟化能力将是需要保留现有数据库和投资数据湖但又想建立数据中心的企业必须考虑的要素。重复或冗余的数据永远存在,企业需要建立的不是“单一事实来源”,而是“单一信任来源”。企业可以进一步参考Gartner提出的新一代数据管理设计原则DataFabric,实现可重用和增强的数据集成服务、数据管道和语义层,实现灵活的数据交付。将数据中心定位为组织战略,推动了合作企业在逐步数字化转型过程中面临的共同问题。他们独立工作并构建相似的解决方案,例如针对不同业务目的的数据分析模型,这些模型具有共同的元素。.充其量这会造成重复,但更多时候它会增加复杂性,因为它会创建不同的点解决方案,即使在单个业务中也无法沟通,更不用说它在整个公司的业务价值链中了。从这个角度来看,Gartner建议企业将数据中心定义为组织战略,将数据分析团队作为数字化平台建设的必备要素。Gartner在《Gartner 数字化业务团队问卷》2019年还发现,数据分析/商业智能是融合团队中IT之外最常见的功能。一个好的数据分析团队是由中心化的团队和分散在各个业务线的团队组成的。很多企业过于注重技术架构的构建,而不是业务人员基于数据的协作。在一味追求新的数据分析技术栈的过程中,他们忽略了为解决实际业务用户的问题而进行的组织策略调整,而把原来的遗留问题从数据仓库搬到了数据湖,然后到当前的数据中心,而不是解决它们。现代数据分析团队应该是数据分析能力的赋能者,从掌控数据能力,到推动基于数据的合作。从业务场景出发,梳理现有数据分析能力企业在持续构建自己的数字化平台时,已经投入了各种数据分析资产。这时,他们已经放弃了既定的数据仓库、数据湖和数据集成,取而代之的是“数据中心”这个新名词。不需要平台。企业需要做的是将数据中心作为组织战略,与各部门共同构建可重用、自助式的数据分析能力。从业务流程到数字平台,自上而下(红线)梳理现有的数据分析能力。大多数企业已经在做自下而上(蓝线)的数据分析平台,这没有错,尤其是企业集中的IT团队部署了数据仓库,设计了ETL流程和报告系统。但是,作为一线企业,获取这些能力是被动的。久而久之,就没有业务主动要求提升自身的数据分析能力了。但是,要想让企业更加数据驱动,或者说让企业自己搭建的数据中心平台真正发挥作用,倒逼业务从业务场景做数据分析是必由之路,尤其是在业务端结尾。一群提出业务问题以启动AnalyticsMoments的人。下图展示了一个典型的电子商务业务场景。从业务端定义和梳理分析时刻,从技术栈寻找对应的数据分析能力的过程。Analysismoment是Gartner定义的一种数据分析过程,它通过对数据进行可视化、探索和应用算法来支持业务结果的交付,从而做出更好或更快的决策并使业务流程自动化。在这个例子中,数据分析能力(最右边)逐渐建立,背后有大量厂商可供选择。这些能力能在多大程度上被其他分析时代复用,门槛能有多低,业务应用直接决定了数据中心的成败。其中,厂商的能力可以通过Gartner每年在数据分析领域的九个《魔力象限(Magic Quadrant)》和配套的《关键能力(Critical Capability)》报告进行评估。整理分析时间往往是数据中心建设中最难的部分。一方面依赖供应商是否具备业务咨询能力梳理业务场景,另一方面也依赖企业自身的数据素养不断优化数据分析。能力要求。企业可以利用建立数据中心的机会,梳理现有的数据分析能力,或者尝试新的数据分析能力。Gartner的年度《Gartner Analytics Atlas》报告可以帮助企业像能力字典一样进行分类和选择。将数据分析功能集成到重用中是一个创新过程。从刚才的例子中,我们也可以看出,电商场景的业务逻辑已经非常成熟清晰,背后的数据分析能力可以快速复用。然而,可重用数据分析能力是一个非常主观的概念。数据素养不同的团队,对数据分析能力的要求也大不相同。越简单易用,越容易被其他业务场景复用。不同之处在于数据的上下文和用户的上下文。如果数据中心的输出能力只是DataasaService,即API的形式,还远不能被业务直接使用,从而降低了企业对数据分析的应用广度。企业应通过集成和复用丰富数据分析能力的输出。随着新技术的引入和融合团队的建立,这无疑是一个创新的过程。例如,基于机器学习的增强数据分析和管理工具可以大大降低用户的使用门槛(自然语言驱动的分析),减少数据管理的工作量(主动使用元数据来学习用户行为)。企业应该明白,使用增强能力是为了减少数据分析的人工部分,从而让用户有更多时间去构思企业如何使用数据。图分析(Graph)的引入将进一步帮助企业发现严重未被利用的数据。图可以发现企业数据与不同部门使用的数据之间被忽视或难以察觉的联系,从而还原需求。使用能力有据可查,图已经成为很多数据分析产品的基础技术。企业在建立数据中心时,缺少的可能既不是数据的数量,也不是数据的质量,而是数据之间的联系。如果企业搭建的数据中台需要进一步减少重复开发的工作量,但从技术角度提高数据分析的利用率,这些技术都值得进一步研究。增强型数据管理和图形技术也是Gartner今年十大数据分析技术之一。我可能会问所有企业高管的最后一个问题是,如果您真的拥有一个完美的数据中心来满足您的所有技术期望,那么您员工的数据素养是否跟上了?作者:孙鑫,Gartner高级研究总监
