当前位置: 首页 > 科技观察

MongoDB迎来原生数据分析功能

时间:2023-03-12 08:55:43 科技观察

【经典翻译】为了方便大家将分析机制引入到自己的大数据存储系统中,Pentaho今天宣布其业务分析与数据集成最新版本平台正式进入通用阶段。Pentaho5.1版本旨在弥合“数据和分析的两个独立领域”之间的差距,从而支持所有Pentaho用户——从开发人员到数据科学家再到业务分析师。Pentaho5.1为MongoDB数据存储系统带来了无需代码直接运行的分析机制,并利用新的数据科学工具包作为相关专业人士的“私人助理”。此外,新版本还可以全面支持ApacheHadoop2.0YARN架构进行资源管理。Pentaho执行副总裁兼首席产品官ChristopherDziekan表示:“Pentaho5.1中的新功能可以支持我们接下来的战略规划,包括最困难的大数据分析速度提升、简化和可访问性改进等。”“随着5.1版本的发布,Pentaho可以进一步实现大规模响应分析功能,不仅可以满足大数据驱动型企业的实际需求,也可以为中小企业和新兴厂商带来竞争优势与传统巨头公平竞争——即使没有专业的开发团队,大家也可以在大数据的舞台上一试身手。数据集成平台使MongoDB数据的原生分析成为可能。Pentaho平台之前的版本已经允许用户将其与IntegratedwithMongoDB相结合,使用后者作为数据源并提供针对MongoDB数据的报告。现在新版本的Pentaho更进一步,将原生的分析机制直接带到MongoDB中的数据中,而不涉及电子传输层处理或编码操作。MongoDB数据集可以直接在源头进行分析,从而减少得出结论的时间消耗和对用户专业知识的要求。Dziekan指出,医疗成本解决方案提供商MultiPlan目前有约90万家医疗供应商作为合作伙伴,每年需要处理超过4000万笔交易。Dziekan指出,MultiPlan从它自己的门户中获取JSON源文件,并将它们存储在MongoDB中。他们使用了PentahoAnalyzer插件,这是一套基于MongoDB的拖放式OLAP查看工具,旨在拆分和细化数据并创建相关的仪表板和报告。“在处理半结构化或非结构化数据时,传统的RDBMS(关系数据库管理系统)分析机制通常非常复杂、怪异和笨拙,”MultiPlan的首席软件架构师ChrisPalm说。“Pentaho5.1平台可以满足这一市场需求,让用户可以直接在MongoDB内部实现数据分析工作。我们看到了新版本带来的更准确的分析结果,而这一切不再受无法处理所有数据的限制。“我们现在可以将更完整的数据集纳入分析,让我们的记录系统获得更全面的分析结论。”数据科学家迎来个人助理Pentaho还在Pentaho5.1包中包含了新的数据科学工具,让用户可以更轻松地完成数据分析任务,帮助数据科学家快速建立360全面的客户视角和数据源混合机制,包括社交网络和MongoDB。该工具包在Pentaho数据集成(PDI)功能中增加了一个R脚本执行器,允许用户使用R脚本作为PDI转换过程的一部分,从而大大简化了数据准备的负担。该工具包还引入了Weka评分工具,允许用户使用分类、聚类和回归模型。此外,它还添加了Weka预测,以帮助用户使用预测模型在Weka中创建时间序列分析和预测环境。“数据科学家正在获得自己的个人助手,”Dziekan说。“这个数据科学工具包提供了大量开箱即用且熟悉的工具Pentaho5.1平台还增加了完整的YARN集成功能,允许开发人员更轻松地利用Pentaho数据集成功能利用Hadoop的强大功能,而无需编写复杂的MapReduce代码。Dziekan表示,YARN支持的加入使得PDI作业可以弹性地使用Hadoop资源,并且可以根据数据大小和处理需求的变化自由扩展和收缩。他还指出,对YARN高级资源管理功能的支持,可以整合多种工作负载场景,从而带来期待已久的持续数据转换和分析机制。原文链接:http://www.cio.com/article/2375115/business-intelligence/native-data-analysis-comes-to-mongodb.html原文标题:NativeDataAnalysisComestoMongoDB