当前位置: 首页 > 科技观察

15款顶级开源人工智能工具

时间:2023-03-12 16:17:02 科技观察

人工智能,AI是技术研究中最热门的方向之一。IBM、谷歌、微软、Facebook和亚马逊等公司都在大力投资研发或收购在机器学习、神经网络、自然语言和图像处理等领域取得进展的初创公司。鉴于人们的兴趣程度,如果斯坦福大学的专家在一份关于人工智能的报告中得出结论:“人工智能日益强大的应用可能对我们的社会和经济产生深远影响。积极影响,将在这段时间内发生从现在到2030年。”在最近的一篇文章中,我们概述了45个非常有趣或有前途的人工智能项目。在本文中,我们将重点关注开源人工智能工具,并详细了解15个最著名的开源人工智能项目。以下开源AI1.Caffe由贾扬清在加州大学伯克利分校攻读博士时创建,Caffe是一个基于富有表现力的架构和可扩展代码的深度学习框架。是它的速度,这使得它受到研究人员和企业用户的一致好评。据其网站介绍,它仅需一个NVIDIAK40GPU即可在一天内处理超过6000万张图像。它由伯克利视觉和学习中心(BVLC)管理),并得到了NVIDIA和Amazon等公司的资助支持其发展。2.CNTK是ComputationalNetworkToolkit的缩写,CNTK是一个开源的人工智能工具微软的智能工具。它在单个CPU、单个GPU、多个GPU或具有多个GPU的多台机器上表现良好。微软主要将其用于语音识别研究,但在机器翻译、图像识别、图像字幕、文本处理、语言理解和语言建模方面也有很好的应用。3.Deeplearning4jDeeplearning4j是用于Java虚拟机(JVM)的开源深度学习库。它在分布式环境中运行,并与Hadoop和ApacheSpark集成。这使得配置深度神经网络成为可能,并且它与Java、Scala和其他JVM语言兼容。该项目由一家名为Skymind的商业公司管理,该公司为该项目提供支持、培训和企业分发。4、DMTKDMTK是DistributedMachineLearningToolkit的缩写,与CNTK一样,是微软开源的人工智能工具。作为旨在处理大数据的应用程序,其目标是更快地训练人工智能系统。它包括三个主要组件:DMTK框架、LightLDA主题模型算法和分布式(多义)词嵌入算法。为了展示其速度,微软声称在一台八集群机器上,它可以“训练一个具有100万个主题和1000万个单词词汇表(总计10万亿个参数)的主题模型,收集10000亿个符号”。这一成就是其他工具无法比拟的。5、H20与科研相比,H2O更注重用AI服务企业用户,因此H2O拥有大量的企业客户,如第一资本金融公司、思科、NielsenCatalina、PayPal和PanAm。它声称任何人都可以利用机器学习和预测分析的力量来解决业务问题。它可用于预测建模、风险和欺诈分析、保险分析、广告技术、医疗保健和客户情报。它有两个开源版本:标准版H2O和集成在ApacheSpark中的SparkingWater版。还支持付费企业用户。6.Mahout是一个ApacheFoundation项目,Mahout是一个开源的机器学习框架。根据其网站,它具有三个主要功能:用于构建可扩展算法的编程环境、Spark和H2O等预构建算法工具,以及称为Samsara的矢量数学实验环境。使用Mahout的公司包括Adob??e、Accenture、Foursquare、Intel、LinkedIn、Twitter、Yahoo等等。其网站列出了第三方专业支持。7.MLlib由于其速度,ApacheSpark已成为最流行的大数据处理工具之一。MLlib是Spark的可扩展机器学习库。它与Hadoop集成,与NumPy和R互操作。它包括许多机器学习算法,例如分类、回归、决策树、推荐、聚类、主题建模、特征转换、模型评估、ML管道架构、ML持久性、生存分析、频繁项目集和顺序模式挖掘,分布式线性代数和统计。8.NuPICNumenta管理的NuPIC是一个基于HierarchicalTemporalMemory,HTM理论的开源人工智能项目。从本质上讲,HTM是一种尝试创建模仿人类大脑皮层的计算机系统的尝试。他们的目标是创造一种“在许多认知任务上接近或超过人类认知能力”的机器。除了开源许可,Numenta还提供NuPic的商业许可协议,它还提供技术专利的许可。9.OpenNN是一种为开发人员和研究人员设计的具有先进理解力的人工智能。OpenNN是一个实现神经网络算法的C++编程库。其主要特点包括深度架构和快速性能。其网站上提供了大量文档,包括解释神经网络基础知识的介绍性教程。OpenNN的付费支持由从事预测分析的西班牙公司Artelnics提供。10.OpenCycOpenCyc,由Cycorp开发,提供对Cyc知识库和常识推理引擎的访问。它有超过239,000个条目,大约2,093,000个三元组和大约69,000个猫头鹰:一种类似于链接到外部语义库的命名空间。它在丰富的领域模型、语义数据集成、文本理解、特定领域的专家系统和游戏AI方面有很好的应用。该公司还提供另外两个版本的Cyc:一个是免费用于研究但不是开源的,另一个是供企业使用但需要付费的。11.Oryx2Oryx2建立在ApacheSpark和Kafka之上,是一个用于大规模机器学习的应用程序开发框架。它采用独特的三层lambda架构。开发人员可以使用Orys2创建新的应用程序,它也有一些预构建的应用程序用于常见的大数据任务,如协同过滤、分类、回归和聚类。大数据工具提供商Cloudera创建了最初的Oryx1项目,并一直积极参与持续开发。12.PredictionIO今年2月,Salesforce收购了PredictionIO,随后在7月,将平台和商标贡献给Apache基金会,Apache基金会将其列为孵化计划。因此,当Salesforce利用PredictionIO技术提高其机器学习能力时,结果将出现在开源版本中。它帮助用户创建具有机器学习能力的预测引擎,可用于部署可实时动态查询的网络服务。13.最初由IBM开发,SystemML现在是Apache大数据项目。它为高级数学运算提供了一个高度可扩展的平台,其算法是用R或类似python的语法编写的。企业已经在使用它来跟踪汽车维修客户服务、规划机场交通以及将社交媒体数据与银行客户联系起来。它可以在Spark或Hadoop上运行。14.TensorFlowTensorFlow是谷歌开源的人工智能工具。它提供了一个使用数据流图进行数值计算的库。它可以在具有单个或多个CPU和GPU的许多不同系统上运行,甚至可以在移动设备上运行。它具有高度的灵活性、真正的可移植性、自动微分,并支持Python和C++。它的网站有一个非常详细的教程列表,可以帮助开发人员和研究人员沉浸在使用或扩展其功能中。15.TorchTorch将自己描述为:“一个GPU优先的科学计算框架,广泛支持机器学习算法”,其特点是灵活性和速度。此外,它可以很容易地用于机器学习、计算机视觉、信号处理、并行处理、图像、视频、音频和网络的软件包中。它依赖于一种名为LuaJIT的脚本语言,该语言基于Lua。