本期参与《大咖来了》直播栏目的嘉宾是易观CTO郭伟,分享主题《如何建设大数据中台》,主要涉及三aspects:为什么要建设大数据中台,技术大数据中台的参考模型和思考,大中台和小前台场景技术人员应该做什么。为什么要建设大数据中台现在和未来,大部分企业都将逐渐成为数据公司,数字用户资产将成为这些企业的核心资产,人工智能、大数据等前沿技术将成为这些企业的核心资产。也成为基础设施,推动每个企业的业务用户和业务线快速增长。事实上,大数据平台是企业从传统信息化向数字化演进的必然产物。中间阶段是技术人员从后台走向前台的过渡阶段。你为什么这么说?如下图所示,以投资银行为例。比如把投行的前台、中台、后台的定义映射到互联网或者系统上,可以简单理解为前台赚钱,后台支持赚钱,中台支持赚钱更快。建设大数据中台的本质,就是把原来在后台做的工作搬到中台,进一步支持前台更高效地做数据分析。大数据平台火了,为什么要建设大数据中台?这是因为在构建大数据平台时存在各种痛点。主要有三点:大数据项目启动难:大数据平台建设周期长,成本高,人员互联网运营经验不足。大数据项目效果难以实现:大数据如何解决互联网运营问题,大数据系统建设的结果是更多的BI报表,大数据建设的ROI无法衡量。大数据项目落地难:数据来源复杂,原有系统涉及多部门协调沟通,数据治理问题。整个大数据平台依次从数据接入、计算、分析、运行开始。每一层都有各种模块和具体的操作流程,如下图所示。面对这样典型的大数据平台架构,如何提高效率呢?这里有五个注意事项。让业务回归业务,尽量避免业务人员等待技术反馈需求单的耗时过程。实现实时数据分析,满足运营商需求。更好地支持人工智能或增强智能所涵盖的流行算法。数据治理应该在业务端进行,而不是在技术端进行。让业务人员和数据科学家直接看到反馈,而不是传统的软件处理方式。从大数据平台到数据中心,是技术到业务的飞跃。以前我们只看技术,到了中期,我们从业务端看技术。技术大数据中台参考模型的建立与思考大致可以分为大中台和深中台两种模式,如下图所示。类BAT的大数据中台称为大中台,是更广义的数据中台。底层配备LaaS和PaaS,各业务线在此基础上进行二次开发。但是对于小厂来说,没有那么多的人力去开发一个通用的中台来支撑各个业务线,各个业务线只能围绕自己的需求来开发。这种情况称为深中台。说到深中台模型,这里需要提到的就是数据河流理论。那么什么是数据河理论?数据河理论是相对于数据湖而言的。数据湖就是把过去各种渠道的所有数据汇集起来,为相关的计算提供便利。但是,随着时间的推移,它会逐渐变成数据沼泽,数据操作会越来越困难。数据河流的出现就是为了方便数据运营,让越来越少的数据失去数据口径,失去数据治理。单一的数据模型在数据河流中流动,产生的数据直接实时流向用户。不同的数据河流支撑着企业内部的数据水生态。深中台模型其实就是数据河流模型,让数据直接流动起来。数据河流的抽象概念可以在IOTA架构中实现,如下图所示。IOTA是典型的ETL-free深度中台架构,数据模型固定,数据产生时规则原子口径,将业务口径返回给业务人员,支持边缘计算和即时反馈。下图为易观ARGO-free用户数据中台示例结构图。本次易观ARGO免用户数据中台示例中,免费非核心部分开源,支持私有化部署和跨终端用户账号。开放、实时的复杂计算和下钻分析,二次开发。和IOTA架构一样,在数据产生的时候,技术人员调节原子口径,通过自定义指标实时查询,将业务口径返回给业务人员。大中小型前台场景,技术人员应该做什么,你可能会有疑问。随着数据中台的盛行,大数据工程师、数据分析师等从事数据相关岗位的人的趋势在哪里?数据中台的出现,实现了人员技术与业务的结合与飞跃,让数据技术人员不仅增加了数据技术的广度,也加强了对前端业务的理解,成为新的交叉领域。战地“龙”种——数据中心工程师。数据中心工程师必备的基本技能主要有三项,即:业务模型、流量模型和数据分析系统。商业模式包括注意力运营、交易运营和利益运营。注意力运营,这类产品是试图最大化用户花在产品上的时间,比如媒体、游戏,以及任何通过广告变现的产品。关注的指标是粘性,比如UV、PV、访问时长、访问频率、用户访问周期、访问间隔等。交易操作,此类产品帮助用户做出购买决策,例如:电商平台、各类交易平台、生活服务、SaaS等。关注的指标是交易和交易活跃度,例如新品占比、占比搜索的产品数量、GMV和ARPU。效率运营,这类产品帮助用户创建一种简单可靠的方式来完成现有的任务或工作流,例如:工具、B2B等。重点指标是用户使用深度的指标,例如完成的工作流数量用户和用户完成工作流程所需的时间。下图展示了数据中心工程师必备技能的流量格局。当我们分析一个网站时,我们可以按照这张图。横轴是变现能力,纵轴是导流能力。有各种各样的角色。一般来说,金融类流动性强,游玩类导流能力强,旅游类导流能力强。下图展示了数据中心工程师必备技能的数据分析体系。每个产品从开始MVP验证、种子用户获取、产品质量提升、用户体验提升、新获取实现营收、规模化实现利润最大化,每个阶段都需要进行分析。、参与分析、渠道分析、构成分析、收入分析等。而每个阶段都需要分析系统对业务进行研究,因此技术人员需要补充数据分析能力和数据分析系统相关的知识。以新数据平台为例,迭代验证周期是几个小时到几天的迭代周期。技术人员只需要建立原子口径,业务人员进行实时业务数据分析,支撑业务分析。在建设数据中台之前,你需要思考这些步骤:首先是和技术/业务经理讨论你是否真的需要一个中台;二是选择中台型号,深中台好还是浅中台好;三是数据中台的选择,不管你做哪种选择,最终的结果一定是让业务人员直接进行相关的数据分析,让业务回归业务,让技术做技术;四是人员和观念的转变。
