六个鲜为人知但迅速崛起的Apache大数据项目应用软件不再支持优化的数据分析和洞察。这正是新一批大数据应用软件所要解决的问题,Apache软件基金会(ASF)近期将一批值得关注的开源大数据项目升级为Apache***项目。这意味着这些项目将得到积极的发展和强大的社区支持。(图片来源:CreativeCommonsZero)大多数人都听说过ApacheSpark,这是一个大数据处理框架,内置了用于数据流、SQL、机器学习和图形处理的模块。IBM和其他公司正在为Spark项目的开发投入数十亿美元,NASA和SETI研究所正在合作使用Spark的机器学习能力来分析来自外太空的TB级复杂无线信号,寻找可能存在的迹象智能外星生命的模式。不过,最近晋升为顶级项目的其他几个Apache大数据项目也值得关注。事实上,他们中的一些人已经创建了在活动和开发方面可以与Spark相媲美的生态系统。本文介绍几个你应该知道的Apache大数据项目。以下是六个快速崛起的项目:KylinApache近日宣布,脱胎于eBay的开源大数据项目Kylin项目晋升为一流项目。Kylin是一个开源分布式分析引擎,旨在提供基于ApacheHadoop的SQL接口和支持超大数据集的多维分析(OLAP)。它仍然被eBay和其他几个组织广泛使用。ApacheKylin副总裁LukeHan表示:“ApacheKylin的孵化之旅展示了Apache软件基金会(ASF)开源治理的价值以及围绕该项目构建开源社区和生态系统的力量。我们的社区正以Apache的方式积极参与世界上最大的本地开发人员社区。”作为基于Hadoop的OLAP解决方案,ApacheKylin旨在填补大数据探索和人类消费之间的空白,”让分析师、最终用户、开发人员和数据爱好者能够以低于1-第二次延迟,”根据开发人员的说法。他们补充说:“ApacheKylin将商业智能(BI)带回ApacheHadoop,以释放大数据的价值。”TLP)。根据公告:“ApacheLens是一个统一的分析平台。它为统一视图的分析查询提供了一个全面的执行环境。ApacheLens旨在通过针对多个分层数据存储系统来提供单一的数据视图。”,从而消除数据分析孤岛。”“通过提供基于数据的联机分析处理(OLAP)模型,Lens将ApacheHadoop和传统数据仓库作为一个整体无缝集成。查询提供查询历史和分析统计,还提供查询生命周期管理。”ApacheLens副总裁AmareshwariSriramadasu表示:“在ASF孵化ApacheLens是一次神奇的经历。ApacheLens专注于最终用户,解决了大数据分析领域中一个非常关键的问题。它允许业务用户、分析师、数据科学家、开发人员和其他用户轻松处理复杂的分析,而无需了解底层数据布局。”IgniteApache软件基金会还宣布ApacheIngite成为一个独家项目。这个开源项目旨在构建内存数据结构。据Apache社区成员介绍:“ApacheIgnite是一种高性能、集成的分布式内存数据架构,能够对大规模数据集进行实时计算和处理,速度比传统的基于磁盘或闪存的技术。“数量级。它旨在在负担得起的行业标准硬件上轻松支持分布式大规模并行架构中的新旧应用程序。”布鲁克林Apache软件基金会宣布ApacheBrooklyn现在是Top10项目(TLP),“这表明该项目的社区和产品在基金会的精英流程和原则下得到了良好的管理。”Brooklyn是一个应用蓝图和管理平台,用于跨多个数据中心集成服务,并在云端集成许多软件。根据Brooklyn的公告:“由于现代应用程序由许多组件组成,并且微服务架构越来越受欢迎,因此部署应用程序和对已部署应用程序进行日常改进是一个越来越困难的问题。ApacheBrooklyn的蓝图提供了一种清晰简洁的方法在部署到公有云或私有基础设施之前,指定应用程序、组件、配置以及组件之间的关系。基于策略的管理建立在自主计算的理论之上,持续评估正在运行的应用程序,并对其进行更改以保持应用程序的平稳运行和针对成本和响应能力等指标进行了优化。”Brooklyn现在被一些知名企业组织使用,云服务提供商Canopy和Virtustream开发了基于Brooklyn的产品。IBM也广泛使用ApacheBrooklyn将大型工作负载从AWS迁移到IBMSoftlayer。Apex今年4月,ApacheSoftwareFoundation将Apex项目提升为国家级项目,号称是“面向ApacheHadoop生态系统的大规模、高吞吐量、低延迟、容错、统一的大数据流和批处理平台”。与ApacheHadoopYARN结合,这是一个Hadoop集群的资源管理平台。Tajo***,ApacheTajo是另一个需要了解的新大数据项目,ApacheHadoop中的一个高级开源数据仓库系统。Apache声称Tajo提供对Hadoop部署、第三方数据库和商业商业智能工具的更多信息的快速访问。显然,虽然ApacheSpark受到了很多关注,但它并不是oApache必须提供的唯一引人注目的大数据工具。今年,Apache可能会将更受瞩目的大数据项目提升到榜首,受益于优化的开发资源等。原标题:OntheRise:Apache6个不为人知的大数据项目[.com独家翻译,合作站点转载,转载请注明出处]
