当前位置: 首页 > 科技观察

25Java机器学习工具和库

时间:2023-03-13 05:45:25 科技观察

1.Weka集成了用于数据挖掘工作的机器学习算法。这些算法可以直接应用于数据集,或者您可以编写自己的代码来调用它们。Weka包含了数据预处理、分类、回归、聚类、关联规则、可视化等一系列工具。2.MassiveOnlineAnalysis(MOA)是一个流行的数据流挖掘开源框架,拥有一个非常活跃的增长社区。它包括一系列机器学习算法(分类、回归、聚类、异常检测、概念漂移检测和推荐系统)和评估工具。MOA与WEKA项目相关联,也是用Java编写的,更具可扩展性。3.MEKA项目提供了多标签学习和评估方法的开源实现。在多标签分类中,我们希望为每个输入实例预测多个输出变量。这与仅涉及单个目标变量的“正常”情况不同。此外,MEKA基于WEKA的机器学习工具包。4.AdvancedDataminingAndMacinelearningSystem(ADAMS)是一种新型的灵活工作流引擎,旨在快速建立和维护现实世界中复杂的知识流。它基于GPLv3发布。5.KDD-ApplicationsSupportedbyIndex-Structure(ELKI)开发环境是一个基于Java的开源(AGPLv3)数据挖掘软件。ELKI主要专注于算法研究,专注于聚类分析中的无监督方法和异常检测。6.Mallet是一个基于Java的文本文件机器学习工具包。Mallet支持***熵、朴素贝叶斯和决策树分类等分类算法。7.Encog是一个先进的机器学习框架,它集成了支持向量机(SVM)、人工神经网络、遗传算法、贝叶斯网络、隐马尔可夫模型(HMM)、遗传规划和遗传算法。8.Datumbox机器学习框架是一个用Java编写的开源框架,可以快速开发机器学习和统计应用程序。该框架的核心重点包括范围广泛的机器学习算法和统计测试,能够处理中等规模的数据集。9.Deeplearning4j是第一个用Java和Scala编写的商业级开源分布式深度学习库。它旨在用于商业环境,而不是作为研究工具。10.Mahout是一个内置算法的机器学习框架。Mahout-Samsara帮助人们创建自己的数学,并提供一些现成的算法实现。11.RapidMiner由德国多特蒙德技术大学开发。它为开发人员提供了GUI(图形用户界面)和JavaAPI来开发应用程序。它还提供了一些用于数据处理、可视化和建模的机器学习算法。12.ApacheSAMOA是一个机器学习(ML)框架,它嵌入了分布式流ML算法的编程抽象,并允许处理底层分布式流处理引擎(DSPEe,如ApacheStorm、ApacheS4和Apachesamza)的复杂性,而无需直接下一个,开发新的ML算法。用户可以开发可在多个DSPE上执行的分布式流式ML算法。13.Neuroph通过提供支持神经网络创建、训练和保存的Java网络库和GUI工具来简化神经网络开发。14.Oryx2是基于ApacheSpark和ApacheKafka构建的Lambda架构实现,但逐渐开始专注于实时大规模机器学习。这是一个用于构建应用程序的框架,但也包括用于协作过滤、分类、回归和集群的打包和端到端应用程序。15.StanfordClassifier是一种机器学习工具,可以将数据项归类。概率分类器(例如这个分类器)给出数据项的类别分配的概率分布。该软件是最新熵分类器的Java实现。16.io是一种RetinaAPI,具有快速准确的类脑自然语言处理算法。17.JSAT是一个快速入门的机器学习库。这个库是我在业余时间开发的,并在GPL3下发布。库中的部分内容可以自主学习,比如所有的代码都是独立的。JSAT没有外部依赖,是用纯Java编写的。18.N-DimensionalArraysforJava(ND4J)是JVM的科学计算库。它们旨在用于生产,这意味着这些例程旨在以最少的内存要求运行。19、JavaMachineLearningLibrary(Java机器学习库)是一系列机器学习算法的相关实现。算法,包括源代码和文档,都写得很好。它的主要语言是Java。20.Java-ML是用Java编写的一系列机器学习算法的JavaAPI。它只提供一个标准的算法接口。21.MLlib(Spark)是ApacheSpark的可扩展机器学习库。虽然是Java,但该库还支持Java、Scala和Python与平台的绑定。这个库是独一无二的,有很多算法。22.H2O是一种用于智能应用程序的机器学习API。它在大数据上扩展统计、机器学习和数学。H2O是可扩展的,开发人员可以在核心使用简单的数学。23.WalnutiQ是人脑部分的面向对象模型,具有理论上常用的学习算法(正在向简单而强大的情感人工智能模型方向研究)。24.RankLib是一个排名学习算法库。到目前为止,已经实施了八种流行的算法。25.htm.java(HierarchicalTemporalMemory算法的基于Java的实现)是用于智能计算的Numenta平台的Java接口。源代码