Cloudera和Microsoft开发Livy以简化Spark应用程序我们与Microsoft一起致力于简化使用Spark的应用程序开发人员的工作。Cloudera与Microsoft和其他开源贡献者一起创建了一个新的Apache许可的、基于REST的开源Spark服务,称为Livy。Livy仍处于早期开发阶段。 Livy为应用程序提供了一种简单的方法来以编程方式连接到Spark、交付作业和检索结果。Livy的核心是一个用于提交、运行和管理Spark任务和环境的REST服务器。其客户端API允许同步或异步细粒度Spark作业交付和结果检索。客户可以将Spark用作多租户服务,而无需担心实施、配置或监控。Livy以多租户服务的形式为Spark提供会话隔离、安全性和用户身份模拟。 Livy的核心优势包括: 减少了使用Spark的麻烦——每个Spark客户端无需经过Spark安装或配置过程即可启动。所需要的只是一个与HTTP端点通信的轻量级客户端。 允许第三方应用程序使用Spark——应用程序可以通过基于Java、Scala和PythonREST客户端的API构建,以实现细粒度的Spark作业交付、结果检索和SparkContexts管理。Spark可以被不同框架编写的程序调用,例如Python的Django、Scala或Java的Play等。另外,由于这是基于REST的,Livy也可以被Node.js或Go等语言编写的应用调用稍作修改。 允许新型架构——Livy将Spark集成到主要通过REST进行交互的面向服务(或基于微服务)的架构中。 “微软专注于简化大数据和高级分析,使ApacheHadoop和Spark等技术可供所有人使用,”微软数据平台高级营销总监TiffanyWissner说。“在Livy项目上的合作可以让开发人员更容易地通过REST网络服务与Spark交互,并使Spark成为运行交互式笔记本电脑的强大的企业级后端。” “Spark通过通用的灵活API带来了快速的大数据处理。我们在客户和合作伙伴社区看到了一个自然趋势——他们希望充分利用可以与Spark交互的客户端应用程序Spark功能。Livy出自Cloudera高级产品经理AnandIyer说。“Livy将使Spark面向更多用例,我们希望这将吸引开发人员社区不仅在Livy之上构建应用程序,而且为其做出贡献,帮助塑造其API并改进其功能。目前这是一个新兴项目,因此任何贡献都会产生巨大的影响。”
