十年经验,详解阿里数据中台,新手也看得懂你过过数据中台吗?”我:“……(什么是中心??)”抱歉,你的采访到此结束,IT行业的人可能对“创想”这个词并不陌生,中文博大精深,我佩服能发明新名词、新概念的人。这些词简单准确,能为大众所接受,为专家所玩。例如,“中台”一词就是其中之一。自从阿里提出“大、中、小”frontdesks”,各种中台的概念被创造出来,鱼龙混杂;很多老架构也被改造包装成各种中台……这不禁让我们深深怀疑:难道这东西靠谱吗?回答这个问题之前,我们先来看看数据中心应该怎么理解?是工具?是方法?还是组织结构?我的回答是:是的,但不是全部。企业属于不同的行业,有业务策略不同,所以数据场景也大不相同。政变导致企业人员使用数据的能力参差不齐,这就导致了每个企业数据中心的独特性,不是购买所谓的数据中心工具就能解决的。数据中心的本质是“数据仓库+数据服务中间件”。在中台构建这种服务时,考虑了可重用性。每个服务就像一块积木,可以随意组合,非常灵活。一些个性化需求在前台解决,避免重复施工,节省时间,省力,省钱。图片来自网络。我举一个生动的例子:一个小渔村的改革自强之路。1.海边有个小渔村。打算发展市场经济,把村子发展成鱼塘。你可以把这条“鱼”想象成“数据”。2、由于每个村民的捕捞技巧和喜好不同,从大鱼塘里捕捞的海鲜种类也不同,所以产生了最原始的业务数据积累。同时,烂海鲜是业务数据多源异构,质量和时效参差不齐的问题。3、全村生意越来越好,不少邻村主动上门采购,“数据需求”开始出现卖方市场迹象。于是,村长决定将海鲜市场进行销售批发,并成立了专门的运输队。这样既保证了时效的统一保证,又减少了大家货物的损坏。这可以理解为数据平台的建立。4、村长还发现,由于客户的做法不同,有些客户不太在意海鲜的新鲜度,于是他决定建一个大型冷库,也就是我们常说的数据仓库的建设.5、全村奔小康,贸易更加频繁,市场发展迅速。为此,该村铺设了符合国家标准的铁轨,修建了车站,建成了满足万吨级船舶通航要求的国际港口。这是中台提供的标准数据接口,不仅进行数据访问,还提供数据订阅和数据消费。数据中心的三大能力1、在中心的能力和资源(包括业务知识、技术能力、人才积累)足够的情况下,提供数据产品和数据服务。一般来说,数据应用是一个上层概念,用户可以使用的无非是:决策支持类:主题报告(月/季/年/专),大屏数据可视化展示数据分析类:BI业务智能、OLAP分析、数据挖掘、数据驱动机器学习数据检索类:全文检索、日志分析、数据血缘分析、数据地图数据共享开放类:实时数据订阅、离线数据联系、数据API接入2.在国内平台业务能力和人力资源不足,但系统相对成熟(包括数据体系和技术体系)时,提供平台级能力,包括数据平台能力、技术平台能力、建模平台能力、等等,甚至是数据本身。以前,当我们可以提供一个比较完善的数据仓库/集市时,就产生了自助式BI分析,解决了业务人员的需求报表,但技术人员来不及做就很尴尬;现在我们也应该搭建这样一个中台,通过这样的能力为业务人员提供一个自助的、一站式的、从数据产生到价值产生的完整路径。3.在中台对业务领域的人力资源和知识了解不充分,平台级能力不能满足要求的情况下,作为算力基础平台提供服务。当提供这种能力时,数据中心的人力投入应该是最低的,但需要对资源进行日常监控和任务管理。数据中心和数据平台是什么关系?对于这一点,很多人都会疑惑。这也是一件很受欢迎的事情。大数据平台和数据中心有什么区别?其实数据中台和大数据平台最本质的区别就是数据中台有业务属性,输入是原始数据,输出是指标。如果把数据中心比作汽车工厂,那么大数据平台就是工厂里的设备,Hadoop集群就是工厂运转所必需的水、电、煤。Hadoop提供了大数据生产所必需的计算和存储资源。大数据平台使数据开发者有能力处理和处理数据,但不能提供产品。如此多的原始数据必须遵循一定的方法论。良好的组织和处理可以产生最终的指标。看完这篇文章,我想问你一个直击心灵的问题:不做中台会死吗?你怎么认为?
