【.com快速翻译】如果你想知道哪些不断增长的编程语言库和工具是实现机器学习模型的好选择,这里有帮助。O'Reilly的一项新调查发现,主要来自技术、金融和医疗保健行业的1,300多人披露了他们在公司使用的机器学习技术。本文介绍了数据科学界的宠儿Python、大数据平台和处理机器学习管道每个阶段的基于云的服务的软件框架和库。当谈到使用机器学习,或报告中所说的AI时,大多数公司仍处于评估阶段,最常用的工具是“模型可视化”和“自动模型搜索和超参数调整”。不出所料,最常见的机器学习类型之一是监督学习,它使用大量标记数据来训练机器学习模型。例如,一个负责在视频中发现人物的计算机视觉模型可以在带注释的图像上进行训练,以指示图像中是否有人。图片来源:O'Reilly以下是公司声称用于机器学习的库、框架、大数据平台和云服务。软件库和框架1.TensorFlow谷歌广泛使用的机器学习框架,旨在处理训练机器学习模型所需的数值计算,可以在CPU、GPU和专用芯片(如谷歌的张量处理单元或TPU)之间划分计算任务.2.scikit-learn是一个流行的用于数据挖掘和数据分析的Python库,使用了很多机器学习算法。3.Pytorch是一种开源深度学习框架,比TensorFlow等竞争框架更容易学习,旨在用于机器学习管道的每个阶段。4.Keras是一种用于处理神经网络(支持深度学习的受大脑启发的数学模型)的深度学习框架,旨在比竞争框架更易于使用。Keras用Python编写,能够在TensorFlow、MicrosoftCognitiveToolkit(CNTK)和Python库Theano上运行。CloudSuite5.MicrosoftAzureMLStudio这套服务旨在帮助企业在微软的Azure云和靠近网络边缘的计算设备上构建、训练和部署机器学习模型。工具有助于自动化识别和调整适当机器学习模型的过程,并有助于扩展基础计算以满足需求。6.GoogleCloudMachineLearningEngine与AzureMLStudio类似,GoogleCloudMachineLearningEngine也提供了用于训练、评估、调整和部署机器学习模型的工具。7.AmazonSageMakerAmazonSageMaker还提供构建、训练和部署机器学习模型的服务,使模型能够以更低的成本更快地部署到生产环境。大数据平台工具8.H20这是一个开源内存平台,可跨分布式系统扩展机器学习工作负载。该平台旨在支持最广泛使用的统计和机器学习算法,并提供一定程度的自动化,以帮助数据科学家识别和调整合适的机器学习模型。9.ProdigyProdigy旨在简化训练和评估机器学习模型的过程。该工具可以帮助数据科学家正确标记训练数据集。10.SparkNLPSparkNLP提供了一个自然语言处理(NLP)库,旨在处理运行ApacheSpark的分布式系统,ApacheSpark是一个内存大数据平台。11.OpenAIGym该工具包用于开发和比较强化学习算法,强化学习算法是一种机器学习,在这种算法中,软件代理通过获得预期结果的奖励来学习如何执行任务。12.AnalyticsZooAnalyticsZoo将一系列大数据和机器学习技术结合到一个统一的分析和人工智能平台中。该平台集成了Spark、TensorFlow、Keras和深度学习库BigDL,可以跨分布式Hadoop和Spark集群扩展机器学习模型以进行训练和推理。13.AllenNLP旨在简化针对自然语言处理问题设计和评估新深度学习模型的过程。该库包括针对核心NLP问题和NLP应用程序的高质量模型的参考实现。14.RiseLabRay是一个跨分布式系统运行机器学习模型的框架,提供高性能和容错能力,同时仍然具有可扩展性。原标题:Mostpopularprogramminglanguageframeworksandtoolsformachinelearning,作者:NickHeath
