人工智能是目前最热门的研究领域之一。IBM、谷歌、微软、Facebook、亚马逊等大公司不仅加大了对研究部门发展的资金投入,而且在机器学习、神经网络、自然语言和人工智能等领域也开始取得一些小成果。图像处理。初创公司。鉴于当前人工智能研究领域的火爆,斯坦福大学的教授不久前做了这样一篇报告:“人工智能软件的作用越来越强大,对人工智能产生强烈影响的软件人类社会和经济将在2030年前释放”。国外网站Datamation今天整理了15款流行的开源人工智能软件。编译和介绍如下:1.CaffeCaffe软件是由加州大学伯克利分校的博士生开发的。它是一个基于表达式架构和可扩展编码的深度学习框架。它以其出色的处理速度而广受科研人员和企业的喜爱。根据其主页介绍,该软件仅使用一个NVIDIAK40GPU,每天可以处理超过6000万张图像。Caffe软件项目由BVLC运营,NVIDIA和亚马逊等公司为其开发研究提供资金。2、CNTKCNTK是ComputationalNetworkToolkit(计算网络工具包)的缩写,是微软开源的人工智能软件之一。它的突出特点是无论是单CPU,还是单GPU,多GPU,多GPU多机,性能都非常出色。虽然微软主要将其用于语音识别研究,但它也可以进行机器翻译、图像识别、图像捕捉、文本处理、语音识别和语言建模等。3.Deeplearning4jDeeplearning4j是一款JVM开源的深度学习库软件。它可以在分布式环境中运行,并集成了hadoop和ApacheSpark。这允许它配置深度神经网络并运行Java、Scala和其他JVM语言。Deeplearning4j软件项目由Skymind商业公司运营,Skymind负责项目的资金支持、人员培训和产品推广。4.DMTK与CNTK相同。DMTK是DistributedMachineLearningToolkit(分布式机器学习工具)的缩写,是微软旗下的又一款开源人工智能软件。专为大数据研究而设计,旨在缩短人工智能系统的训练时间。DMTK包括三个主要部分:DMTK框架、LightLDA模型算法和分布式(多义)词嵌入算法。为了说明DMTK的处理速度,微软声称它可以通过一个8节点的计算机集群处理一个包含100万个主题和1000万个词(共10万亿个参数)的文档集合中超过1000亿个标签的文档。主题模型,这是同类软件无法比拟的。5、更注重企业体验而非科研的H2O,已经获得了CapitalOne、Cisco、NielsenCatalina、PayPal、Transamerica等大公司的订单。Oxdata表示,任何人都可以使用H2O的机器学习和预测分析功能来解决业务问题。H2O还可用于预测建模、欺诈和风险分析、保险分析、广告技术、医疗保健和客户情报。H2O有两个开源版本:标准版H2O和SparklingWater版H2O,两个版本都集成在ApacheSpark中,Oxdata将为付费企业提供技术支持。6.MahoutMahout是ASF(ApacheSoftwareFoundation)下的一个开源项目,提供一个开源的机器学习框架。根据其官方主页介绍,Mahout具有三个主要特点:可扩展的算法编程环境、使用Spark和H2O等工具预先编写的算法,以及称为“Samsara”的内置向量计算环境。Mahout用户包括Adob??e、Accenture、Foursquare、Intel、LinkedIn、Twitter和Yahoo。7.MLlibApacheSpark以处理速度着称,已经成为大数据处理中最常用的软件之一。MLlib算法是一个可扩展的Spark机器学习库。它与Hadoop集成,并与NumPy和NumPy.R跨平台运行。它涵盖了大量的机器学习算法类型,包括:分类、回归、决策树、建议、聚合、主题建模、特征转换、模型评估、ML管道构建、ML持久性、生存分析、频繁集、序列模式挖掘、离散线性代数和数据统计分析。8.NuPICNuPIC由Numenta公司运营,是一个基于HTM(HierarchicalTemporalMemory)理论的开源人工智能项目。实际上,HTM理论是根据人脑新皮层的结构设计计算机系统,旨在创造一台“在处理认知任务方面接近或超过人类能力”的计算机。》Numenta不仅拥有NuPic的开源许可,还拥有其商业授权和专利证书。9.OpenNNOpenNN是一款面向研究人员和开发人员的高级人工智能软件,提供了一个可以运行神经网络的C++编程库。其主要特点在于深度框架和高效的性能。OpenNN官网对神经网络的运行有详细的介绍。OpenNN客户的技术支持是来自西班牙的Artelnics(主要专注于预测分析研究)。10.OpenCycopencyc是开发的一款OpenCyc软件byCycorp内置的Cyc知识库和常识推理引擎包括239,000个词条,约209.3万个三元组,约69,000种网络本体语言,就像一个外部语义数据库。具有丰富的领域建模、语义数据融合、文本理解,特定领域的专家系统和游戏人工智能非常有效。有两个OpenCyc的版本:一个是研究人员的免费非开源版本,一个是企业的收费版本。11.Oryx2Oryx2是基于ApacheBuiltwithSpark和Kafka,是一款专注于大规模机器学习的开发框架软件。它使用独特的三层lambda架构。开发人员可以使用Oryx2开发新的软件,它内置了用于一些常见的大规模数据任务的程序,例如协同过滤、分类、归化和聚类等。大数据工具提供商Cloudera开发了原始的Oryx1项目,并且仍在继续研究和开发。12.PredictionIO早在今年2月份,Salesforce就收购了PredictionIO软件项目。PredictionIO软件项目作为一个孵化项目,为ASF提供了一个新的平台和商标。尽管Salesforce通过PredictionIO软件项目开发了自己的机器学习技术,但它仍然是开源的。它可以使用机器学习来部署相关的网络服务,通过实时响应页面动态请求帮助用户构建预测引擎。13.SystemMLSystemML最初由IBM开发,后来被ASF收购作为其大数据项目。SystemML是一个高度可扩展的平台,可以执行高级数学运算,执行R或类Python语句。SystemML运行在Spark或Hadoop上,可用于4S店车辆维修、机场空域管控、银行客户社交媒体数据采集等客户回访。14.TensorFlowTensorFlow是谷歌开源的人工智能软件之一。它提供了一个使用数据流图的数值计算库,可以运行在单/多CPU或GPU系统甚至移动设备上。Google声称TensorFlow非常灵活,真正可移植,具有自动识别能力,支持Python和C++平台。15.TorchTorch这样描述自己:“拥有科学的计算框架,支持可以优先使用GPU的机器学习算法。”Torch以其出色的灵活性和出众的处理速度为特点,在处理机器学习、计算机视觉、信号处理、并行处理、图像、视频、音频和计算机网络等方面非常得心应手。它是用LuaJIT语言编写的,LuaJIT语言是一种基于Lua语言的脚本语言。
