在不久的将来,我们将迎来一大批集分布式处理、机器学习和分析于一体的“预打包”解决方案。类型的应用程序。过去几年,我们一直在积极讨论大数据,而这一切的驱动因素就是当初的Hadoop和现在的Spark。下一波热潮将围绕将机器学习引入大数据展开,但如果不继续使用上述流行语,仍然很难让人们接受人工智能和分析解决方案。事实上,大数据时代目前正在迅速接近其生命周期的尾声。你可能已经注意到,各大媒体对大数据技术的相关报道正在减少——在我看来,这意味着Gartner著名的炒作周期由此走向低价甚至破灭。今天,大数据的概念已经进入“终结”的拐点,但这项技术的实际应用将开始兴起。对于整个行业来说,这意味着“我们上线看看效果如何”的项目会越来越少。决策者会采取更理性的解决方案,以实际业务问题为切入点——这显然更符合科学的实施思维。也就是说,就连平台厂商本身也开始更加关注“解决方案”。针对特定问题的标准化解决方案的另一个重要下一步是分析问题、寻找模式并创建实际解决这些问题的打包解决方案。我们见证了很多金融行业的公司封装和应用各种分布式欺诈检测方案。欺诈检测软件并不是什么新鲜事,但在Hadoop和/或云规模上分发它是一种前所未有的新思维方式。当然,在金融业发展迅速的同时,欺诈活动的组织者也在快速发展。多年来,金融业并没有真正跟上恶意行为者的发展步伐。但现在他们拥有反击所需的武器,而Hadoop、Spark和其他现代工具将成为他们武器库中最值得信赖的新成员。仅仅采用下一代技术解决方案还不足以让定制化解决方案具备无所不能的能力。信用卡的欺诈检测机制与其他发票、保险或其他常见业务应用程序没有根本区别。下一波的核心不是为特定行业编写高度专业化的应用,而是思考如何利用“分布式大数据模型”解决现有多个业务线的各种共性问题。当然,构建自定义解决方案以帮助每个用户以不同方式解决类似问题的做法将持续相当长的一段时间。但是,未来我们需要逐步找到共同的开发模式,推广到各个业务线——具体来说,就是大规模分布式的应用这种新技术,扩展到能够带来经济优势的规模,淘汰后部署盲区。最终我们会成功实现定制化调整,使用正确的表达方式并添加必要的调整,但同时保证软件中的访问算法在面对不同的具体问题时不需要反复重写——这就大了数据技术实现目标的最佳方式。我们以前经历过类似的情况。几十年前,会计软件是一个热门话题。虽然您仍然偶尔会遇到针对特定业务领域的专业会计软件,但大多数大公司都使用打包解决方案,其中只有某些部分是定制的或插件的,以满足不同行业的特定需求。经验丰富的CIO和CTO很少会为特定业务线编写专门的会计工具包,并将其应用范围限制在单个企业。他们更倾向于购买现成的产品,即使选择的种类不是很丰富。下一个巨大的飞跃将以“数据驱动”的形式,将“机器学习”技术引入一系列的软件包购买和独立的功能集成中。从后端的角度来看,整个过程可能是由大数据驱动的,但“大数据”本身就像一张以太网卡:它会成为一个前提,但不再是一个热门的、常规的技术话题。原文链接:http://www.infoworld.com/article/2907872/big-data/big-data-is-dead-long-live-big-data.html?nsdr=true原标题:大数据已死——-大数据万岁
