除了Hadoop,Luigi在云端打通大数据管道Netflix和Spotify(音乐流媒体服务)等公司也贡献了一些优秀的大数据分析开源工具(Suro和Luigi)。近期,初创公司Mortar将Spotify开发的开源大数据工具Luigi搬上云端,在亚马逊云上提供涉及大量工具和数据库的复杂大数据流水线处理服务。无论是否使用Hadoop,用户都可以使用Luigi来管理复杂的数据。大数据工作流。Mortar最初的产品是提供一个简单的框架来编写和启动Hadoop作业,运行在亚马逊的弹性MapReduce云服务上。2012年,Mortar开始开源部分产品代码,并分享部分Hadoop任务模板。2013年,Mortar与一群优秀的数据科学家合作,帮助用户开发推荐引擎,并期望找出在Mortar平台上运行这些任务的过程。如今,Mortar的产品战略已经扩展到Hadoop之外,希望用户通过Mortar管理的应用不再局限于Hadoop圈。MortarCEOKYoung指出:虽然Hadoop很受客户欢迎,但仍有很多重要数据不需要Hadoop,或者根本不适用。通过将Luigi工具作为云服务提供,Mortar的用户现在可以使用Python开发和可视化通往任何数据库或处理环境的大数据管道,只要它们支持API访问即可。Young还认为,云版琉璃将帮助用户更快地完成从原型到产品的过渡。Mortar也不打算放弃Hadoop,因为当今的大数据应用程序需要与多个处理环境交互,而开发人员需要一种更简单的方法来管理流程。“事实上,很多大数据项目搁浅并不是因为大数据技术的复杂性,也不是因为数据科学家的缺乏,最大的问题是如何将数据从它所在的地方转移到需要(处理)的地方。”杨说。本文来自:http://www.ctocio.com/ccnews/16988.html
