本文简单介绍了Quora上网友推荐的10个人工智能和机器学习领域的开源项目。GraphLabGraphLab是一个新的机器学习并行框架。GraphLab提供了一个完整的平台,允许组织使用可扩展的机器学习系统来构建大数据来分析产品。公司客户包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,他们从其他应用程序或服务中心抓取数据,通过系统模型将大数据概念转化为可用于生产环境的预测应用程序例如推荐系统、欺诈检测系统以及情感和社交网络分析系统。(详情)项目主页:http://graphlab.org/VowpalWabbitVowpalWabbit(FastOnlineLearning)最初是雅虎研究院搭建的机器学习平台,目前项目在微软研究院。这是一个由JohnLangford发起并领导的项目。项目地址:http://hunch.net/~vw/scikits.learnscikit-learn是一个构建在SciPy之上的用于机器学习的开源Python模块。它包括用于数据挖掘和数据分析的简单高效的工具,适用于任何人,可在各种情况下重复使用,构建在NumPy、SciPy和matplotlib之上,并遵循BSD许可证。(详情)项目地址:http://scikit-learn.org/stableTheanoTheano是一个用于定义、优化和模拟数学表达式计算的python库,高效解决多维数组的计算问题。它使编写深度学习模型变得更加容易,同时还提供了一些在GPU上训练它们的选项。(详情)项目地址:http://deeplearning.net/software/theano/MahoutMahout是Apache软件基金会(ASF)下的一个开源项目,提供机器学习领域经典算法的一些可扩展的实现,旨在帮助开发人员更轻松、更快速地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤和频繁子项挖掘。此外,可以使用ApacheHadoop库将Mahout有效地扩展到云中。项目主页:http://mahout.apache.org/pybrainpybrain是Python的一个机器学习模块,其目标是为机器学习任务提供灵活、适应性强、功能强大的机器学习算法。pybrain包括神经网络、强化学习(以及两者的组合)、无监督学习和进化算法。以神经网络为核心,所有的训练方法都以神经网络为实例。项目主页:http://pybrain.org/OpenCVOpenCV是一个基于(开源)发行版的跨平台计算机视觉库,可以运行在Linux、Windows和MacOS操作系统上。轻量高效——由一系列C函数和少量C++类组成,并为Python、Ruby、MATLAB等语言提供接口,实现图像处理、计算机视觉等诸多通用算法.(详情)项目主页:http://opencv.org/OrangeOrange是一个基于组件的数据挖掘和机器学习软件套件,是一款友好、强大、快速、多功能的可视化编程前端,用于浏览数据分析和可视化,与用于脚本开发的Python绑定。它包含一套完整的数据预处理组件,并提供数据核算、转换、建模、模式评估和探索等功能。项目主页:http://orange.biolab.si/NLTKNLTK(naturallanguagetoolkit)是python的自然语言处理工具包。它于2001年推出,迄今为止一直非常活跃。它的主要功能是教学。迄今为止,它已在20多个国家的60多所大学中使用。包括大量的词语料库,以及自然语言处理中算法的实现:分词、词根计算、分类、语义分析等。项目主页:http://nltk.org/NupicNupic是开源的人工智能平台。该项目由Grok(以前称为Numenta)开发,包括该公司的算法和软件架构。NuPIC的运作方式接近于人脑,“当模式改变时,它会忘记旧模式,记住新模式”。与人脑一样,CLA算法能够适应新的变化。(详情)项目主页:http://numenta.org/nupic.html以上是小编整理的人工智能和机器学习领域的10个开源项目。有关更多项目,请参阅此列表:http://deeplearning.net/software_links/
