当前位置: 首页 > 科技观察

AWS云上机器学习输出的黄金工具:AmazonSageMaker在中国正式上线

时间:2023-03-12 10:07:45 科技观察

本文转载自雷锋网。我们正在迎来机器学习的黄金时代。”AWS首席云计算企业战略顾问张霞博士表示,之前阻碍机器学习在现实世界中应用的诸多限制开始消失。世界各地的公司,从初创企业到大型企业,部署机器学习应用是几乎是一个普遍的优先事项。几乎每个行业和细分市场都开始将机器学习应用于其工作负载,以从数据中获取更多价值,获得洞察力并改善业务。机器学习的黄金时代也是AWS的黄金时代。机器学习黄金时代的AWS“目前全球有数以万计的各类企业选择AWS来运行机器学习负载。据我们所知,使用AWS机器学习的客户数量至少是任何其他供应商的两倍。”AWS首席云计算企业战略顾问张霞表示,人工智能大概率成为确定性事件,越来越多的企业开始在内部运行深度学习、机器学习等负载,亚马逊是第一批企业。自电子商务时代开始,亚马逊的商品推荐、搜索、物流配送服务都融入了机器学习,诞生了送货机器人、AmazonEcho、AmazonGO等产品和服务。相对而言,机器学习对企业来说仍然是一项非常复杂的工作,大部分企业不具备自主研发机器学习模型的能力,而AWS等厂商则扮演着“梯子”的角色。例如,开发者和数据科学家首先要进行可视化、转化、在数据变成算法可用于训练模型的格式之前对数据进行预处理;训练模式的所有阶段l、从算法的选择和优化,到影响模型精度的数百万参数的调优,需要大量的人力和猜测;在应用程序中部署培训找到好的模型后,客户需要在应用程序设计和分布式系统方面具备另一套专业知识。此外,随着数据集和变量数量的增加,模型变得过时,客户必须一次又一次地重新训练模型,以便模型从新信息中学习和进化。所有这些任务都需要大量的专业知识,并在计算能力、数据存储和时间方面消耗巨大的成本。而且,由于没有针对整个机器学习工作流程的集成工具,机器学习模型的传统开发复杂、繁琐且成本高昂。AWS提供的机器学习解决方案是一个包括三层的服务栈。底层是机器学习框架和基础设施。AWS支持TensorFlow、PyTorch、ApacheMXNet、Chainer、Gluon、Horovod和Keras等机器学习框架。在基础设施方面,AWS虚拟机提供了多种实例,还有现成的亚马逊机器映像AMI(AmazonMachineImage)。张霞说,“我们的策略是全方位支持各种开源框架,因为不同的框架有不同的特点,不同的使用场景,所以我们不局限于某个框架,而是全方位的支持。”AWS机器学习解决方案的上层是经过训练的人工智能服务,主要解决与人类认知相关的典型问题。图片或视频。个性化推荐服务可以从库存向消费者推荐多种产品和服务。客户可以在他们的应用程序中直接调用AWS提供的这些人工智能服务,而无需关注服务背后的机器学习模型。中间层是机器learningservice,主要目标是去掉机器学习过程中的繁重工作,更容易开发出高质量的模型,它依托于AmazonSageMaker托管服务,这也是AWS此次的重点。据Zhang介绍在中国推出AmazonSageMaker的夏先生,三个因素制约了应用程序的广泛应用人工智能的应用,导致缺乏低成本、易用、可扩展的人工智能产品和服务。人工智能技术产品难以拓展;在生产经营中部署人工智能应用既费时又费钱。AmazonSageMaker旨在消除机器学习每一步的繁重工作。5月12日,AWS宣布AmazonSageMaker在西云数据运营的AWS中国(宁夏)区域和光环新网运营的AWS中国(北京)区域正式上线。AmazonSageMaker通过预设笔记本、针对PB级数据集优化的常用算法以及自动模型调优,降低了模型构建和训练的难度。此外,AmazonSageMaker通过自动预置和管理基础设施来训练模型和运行推理,从而简化并加快了模型训练过程。同时,AWS最近宣布了多项重要功能和高级特性,使客户能够更轻松地构建、训练、调整和部署机器学习模型。这些功能包括:用于机器学习的集成开发环境(IDE):AmazonSageMakerStudio集中了机器学习的所有组件,开发人员可以在AmazonSageMakerStudioAssets中查看和组织源代码、依赖项、文档和其他应用程序,AmazonSageMakerStudio使构建、训练、解释、检查、监控、调试和运行机器学习模型更加容易和快速。ElasticNotebook:AmazonSageMakerNotebooks提供一键式JupyterNotebook,具备秒级弹性计算升级能力,让开发者可以轻松增减Notebook所需的计算能力(包括GPU加速)。这些调整是在后台自动进行的,不会中断开发人员的工作。AmazonSageMakerNotebook还可以自动复制特定的环境和库依赖,实现一键共享Notebooks。实验管理:AmazonSageMakerExperiments帮助开发人员组织和跟踪机器学习模型的迭代。AmazonSageMakerExperiments自动捕获输入参数、配置和结果并将它们存储为“实验”,帮助开发人员管理这些迭代。AmazonSageMakerExperiments使开发人员可以更轻松地快速迭代并开发高质量模型。调试和分析:AmazonSageMakerDebugger用于调试和分析模型训练,提高准确性,减少训练时间,让开发者更好地理解模型。使用AmazonSageMakerDebugger,在AmazonSageMaker中训练的模型将自动发出收集到的关键指标。AmazonSageMakerDebugger还可以帮助开发人员解释模型的工作原理,迈出神经网络可解释性的第一步。自动构建模型:AmazonSageMakerAutopilot是业界首个自动化机器学习功能,可让开发人员保持对其模型的控制和可见性。AmazonSageMakerAutopilot将自动检查原始数据、应用特征处理器、选择最佳算法集、训练多个模型、调整它们、跟踪它们的性能,然后根据模型的性能对模型进行排名。开发者可以根据应用场景进行选择。最佳模型,并且可以考虑具有不同优化因子的多个候选模型。概念漂移检测:AmazonSageMakerModelMonitor允许开发人员检测和纠正概念漂移(conceptdrift)。开发人员可以使用AmazonSageMakerModelMonitor的开箱即用功能来检测漂移,或者他们可以为AmazonSageMakerModelMonitor编写自己的规则以进行监控。AmazonSageMakerModelMonitor使开发人员可以更轻松地调整训练数据或算法以解决概念漂移问题。IDC报告指出,中国人工智能市场已成为全球第二大人工智能单一市场,市场规模仍在高速增长。目前,40%的企业数字化转型项目将使用人工智能,人工智能将成为所有业务部门不可或缺的一部分,驱动大规模创新,实现巨大的商业价值。