2016年,大数据这个词一如既往的火爆,不同于往年的概念和趋势层面,今年是大数据领域里程碑式的变革之年。无论是互联网行业还是传统行业,都开始将大数据深度应用到业务领域来驱动业务变革,并朝着数据驱动的方向发展。 随着各行业与大数据相关的技术体系日趋完善,自助式、自动化、灵活的大数据分析工具和解决方案越来越受到广大企业级客户的重视。2017年这一趋势仍将延续,机器学习、人工智能、物联网技术应用的深入,将继续推动大数据领域新一轮爆发式发展;而中国大数据行业的竞争也将越来越激烈,拥抱客户数据产品快速迭代已是大势所趋。 吴军在《浪潮之巅》一书中指出,科学技术的发展不是均匀的,而是以波浪的形式出现的。在中国企业互联网化的历史车轮中,除了现状和机遇,一些具有核心技术和资源优势的有远见的企业走在了时代的前沿,在互联网时代留下了深刻的烙印。我们今天处于什么样的浪潮中? Gartner预测,到2020年,大数据将成为主流的嵌入式技术,被视为常规产品的一部分。相关数据显示,随着大数据意识的普遍提升和互联网企业数据的几何级数增长,我国约有25%的企业正在努力寻找大数据的价值。显然,任何违反“新标准”的企业都??将濒临衰退。 互联网化20年:从“拍脑袋”到“数据驱动” 回顾过去二十年,我国企业互联网化生态圈展现出巨大的发展潜力。互联网在企业生产资源配置优化整合中发挥着关键作用。一般来说,中国企业的互联网化分为信息化建设和数据化建设两个阶段。 2000-2015年是中国企业的信息化建设时期。在此期间,企业为企业经营管理建立和配备了工作平台,如网站建设、数据库建设、ERP系统选型等。当时涌现出的一批优秀的企业管理软件厂商,如用友、金蝶等,如今已是我国民族管理软件行业的佼佼者。 相比2000-2010年的高速发展,未来五年,我国企业信息化建设趋于稳定。市场越来越成熟和相对饱和,与此同时,中国企业开始迈向下一阶段——数字化建设阶段。 2015年以来,我国企业进入互联网化新阶段——数字化建设阶段。随着“互联网+”的引入,在信息化基本完成后,企业的重心逐渐转移到如何高效应用企业内外产生的数据上,让企业决策不再依赖“拍脑袋””而是“数据驱动”。 纵观互联网化发展趋势,信息化建设是数据化建设的基础,数据化建设是信息化建设的高级阶段。如果说信息化建设解决的是企业管理难题,那么数据化建设解决的是经营决策的科学化问题。 采集缺失、埋点乱,折射出数据建设之痛 国外数据建设阶段比我国早十几年。当中国企业信息化还处于起步阶段时,国外企业已经迈出了数据建设的步伐。当时国内只有BAT(百度、阿里、腾讯)率先吸收了硅谷的先进理念,认识到“数据”和“计算”的重要性,将大数据提升为企业战略。如今,这些先行者已经拥有海量数据并开始尝试使用,大数据系统和工具也日趋成熟。 三巨头中的BAT,数据应用思路大相径庭,其中百度是技术第一。庆幸的是,我是一个“吃过猪肉,见过猪跑”的人——在百度的八年时间里,我见证并投入了百度大数据的建设。我负责的团队搭建了百度用户行为分析大数据平台,涵盖数据采集、传输、建模、查询分析、数据可视化等前沿技术。 除了BAT之外,我国大部分企业的数据建设还处于起步阶段,面临着数据采集不足或埋点乱、数据分析能力不足等诸多挑战。2015年从百度辞职,创办神策数据。目的是为中国企业的数据采集和建模搭建数据基础,让数据驱动的企业真正在中国企业落地生根。 夯实数据基础——AI战场“主力军”的通关技术大规模涌现。目前市场上的大数据初创企业主要分为三种类型:掌握和应用数据源的公司、提供数据分析工具的公司和探索数据的公司。 随着机器学习和自然语言处理技术在金融、媒体、零售等领域的广泛应用,预计从2017年开始,AI(人工智能)公司将不断涌现。根据Markets&Markets,全球第二大市场研究咨询公司,2020年人工智能市场规模将达到50.5亿美元。 AI作为新贵行业,是大数据发展的高级形态,其成就是基于能力企业应用大数据。它面临着大数据基础设施建设的诸多挑战: 1。能否全面实时获取数据? 2。能否区分并使用正确的数据指标提取有效数据? 3。能否应对数据量和数据类型的急剧增加,驱动数据变现? 4。能否解决数据隐私和数据安全问题?会被“误导”。因此,与其他两类企业合作是人工智能企业发展的必然选择。合作的目的,一方面是为了解决数据来源和数据基础的问题。这样,我们就可以避免被数据预处理工作拖入泥潭,深入挖掘大数据的商业价值;另一方面,另外两类大数据公司为AI公司提供了丰富的应用场景,让AI价值不再是“空中楼阁”。 Gartner《2017十大技术趋势》报告称,2020年,人工智能智能化将成为服务商的主战场,只有具备良好数据基础的企业,才能成为AI主战场上的“主力军”。 不要让安全顾虑阻挡企业数据化进程 在企业大数据建设的过程中,安全问题一直是企业最关心的问题,神策数据一切的出发点都是客户的需求,而不是神策人的意愿。因此,相对于轻量级的SaaS服务模式市面上大数据创业公司选择的神策数据,采用的是“私有化部署+PaaS”的企业服务模式。 在我看来,私有化部署并不是企业级服务模式的倒退,客户的硒安全问题不应成为企业数据化进程中的“绊脚石”。 2017年,一些大中型互联网企业、国有企业,甚至传统企业都开始接受先进的数据分析理念,积极寻找基于大数据技术的决策驱动解决方案。这些新锐企业在数据建设道路上的开放包容态度远超我的想象:一些产品线丰富、业务流程复杂、信息化程度高的企业,比如聚美优品、融 、中国资源万家、中邮钱包等,经过层层专业筛选,最终选择了神策数据这家“小而美”的年轻企业。 打造中国的“PayPal大佬” 在过去的一年里,借助专业的资料,我对联想、PayPal、Google这三个公司进行了深入的研究。我想通了几个问题:谷歌为什么能够聚集业内顶尖人才?联想这个个人电脑时代的乘风破浪者,影响其发展的企业基因是什么?“PayPal帮”是如何称霸硅谷的? 联想的迅速崛起,得益于公司敏锐的洞察力、保守的冒险精神和善于学习的精神;谷歌依靠海量的前沿科学资源和浓厚的学术氛围,吸引了越来越多聪明、好奇的业界人士***大咖加盟。希望每一位Shecurser都成为中国的“支付宝大佬”: 聚能影响中国数据发展进程; 分散可以创建自己的独角兽王国。 2016年4月19日,神策数据宣布获得2600万A轮融资,并公布了神策分析(SensorsAnalytics,神策数据产品)的新功能,这是中国共产党的官方声音。在红杉中国和铭实资本的资本背书下,随着产品价值得到越来越多企业的认可,神策数据在时隔半年多的今天,已经赢得了200多家付费客户。 吴军在书中说:“每个人都应该看清浪潮,追赶浪潮,如果真是这样,这一生就没有白过。”大数据的价值正在渗透到互联网企业的各个环节,大数据驱动能力将成为企业的重要变革和核心竞争力。从2017年到未来,神策数据将在用户行为分析领域不断深耕,将这一件事做到尽善尽美。这是神策数据跟风引领浪潮的内生动力。 作者简介: 桑文峰,神策数据创始人兼CEO,浙江大学计算机科学与技术硕士,曾在百度工作8年,从无到有打造了百度用户日志大数据平台,涵盖数据采集、传输、元数据管理、作业流调度、海量数据查询引擎和数据可视化等。2015年4月离职后创立神策数据,帮助互联网企业实现数据驱动。
