AWS宣布对其ML平台SageMaker进行九项重大更新SageMaker旨在提供一种机器学习服务,可用于为几乎任何用例构建、训练和部署ML模型。在今年的re:Invent大会上,AWS发布了几项公告,进一步提升SageMaker的能力。AWS亚马逊机器学习副总裁SwamiSivasubramanian表示:“成千上万的日常开发人员和数据科学家已经在使用我们行业领先的机器学习服务AmazonSageMaker来消除构建、培训和部署自定义机器学习模型的障碍。”.像SageMaker这样被广泛采用的服务最好的部分之一是我们获得了大量的客户输入,这些输入推动了我们的下一批可交付成果。今天,我们宣布推出一组工具,使开发人员可以更轻松地构建端到端机器学习管道,以准备、构建、训练、解释、检查、监控、调试和运行具有更高可见性的自定义机器学习模型、可解释性和大规模自动化。”第一个公告是DataWrangler,该功能旨在自动为机器学习准备数据。DataWrangler使客户能够从各种数据存储中选择他们需要的数据,并通过单击将其导入。包括300多个内置数据转换器,帮助客户标准化、转换和组合功能,而无需编写一行代码。DeloitteAI生态系统和平台负责人FrankFarrall评论道:“SageMakerDataWrangler使我们能够通过一套丰富的转换工具来开拓我们的数据准备需求,从而加快将新产品推向市场所需的时间。机器学习数据准备过程。反过来,我们的客户受益于我们扩展部署的速度,使我们能够在几天而不是几个月内交付可衡量的、可持续的结果来满足客户的需求。”第二个公告是功能商店。AmazonSageMakerFeatureStore提供了一个新的存储库,用于轻松存储、更新、检索和共享用于训练和推理的机器学习功能。FeatureStore旨在克服存储映射到多个模型的特征的问题。专用功能库可帮助开发人员访问和共享功能,从而更轻松地在开发人员和数据科学家团队之间命名、组织、查找和共享功能集。由于它在SageMakerStudio中——靠近ML模型运行的地方——AWS声称它提供了个位数的毫秒推理延迟。“在发布AmazonSageMakerFeatureStore之前,我们与AWS密切合作,我们对完全托管的FeatureStore的前景感到兴奋,因此我们不再需要在我们的组织内维护多个Fe??atureStore,”Intuit的副总裁MammadZadeh说数据平台工程总裁。存储库。我们的数据科学家将能够在中央存储中使用现有功能,并推动跨团队和模型的标准化和功能重用。”接下来,我们有SageMakerPipelines,它声称是第一个专门构建的、易于使用的持续集成和持续交付(CI/CD)服务。开发人员可以定义端到端机器学习工作流程的每个步骤,包括数据加载步骤、使用AmazonSageMakerDataWrangler进行的转换、存储在AmazonSageMakerFeatureStore中的特征、训练配置和算法设置、调试步骤和优化步骤。.鉴于正在进行的活动,SageMakerClarify可能是本周最重要的AWS功能之一。Clarify旨在在整个机器学习工作流程中提供偏差检测,使开发人员能够在他们的ML模型中构建更大的公平性和透明度。开发人员可以使用集成解决方案快速尝试和响应模型中的任何偏差,而不是使用通常耗时的开源工具。DFL集团数字创新执行副总裁AndreasHeyden表示:“AmazonSageMakerClarify与德甲MatchFacts数字平台的其余部分无缝集成,是我们在AmazonSageMaker上标准化机器学习工作流程的长期战略的关键部分。通过使用来自AWS的创新技术,如机器学习,提供更深入的洞察力,让球迷更好地理解球场上的瞬间决策,德甲直播让观众能够洞察每场比赛的关键决策。”AmazonSageMaker的深度剖析自动监控系统资源利用率,并在需要时针对检测到的任何训练瓶颈提供警报。该功能跨框架(PyTorch、ApacheMXNet和TensorFlow)工作,并自动收集系统和训练指标,无需在训练脚本中更改任何代码。接下来,我们在SageMaker上进行了分布式训练,AWS声称这使得训练大型复杂深度学习模型的速度比当前方法快两倍成为可能。Turbine的首席技术官KristófSzalay评论说:“我们使用机器学习来训练基于专有网络架构的人体细胞计算机模型,称为模拟细胞。通过在分子水平上准确预测各种干预措施,SimulatedCell帮助我们发现新的癌症药物和寻找现有疗法的联合伙伴。模拟训练是我们迭代地做的事情,但在一台机器上,每次训练需要几天时间,从而阻碍了我们快速迭代新想法的能力。我们对AmazonSageMaker上的分布式训练感到非常兴奋,我们希望将其训练时间减少90%,并帮助我们专注于我们的主要任务:为细胞模型训练编写一流的代码库。最终,AmazonSageMaker可以使我们更有效地完成我们的主要任务:识别并为患者开发新的抗癌药物。”SageMaker的数据并行引擎将训练工作量从单个GPU扩展到数十万个,从而将训练时间减少40%。随着边缘计算的进步迅速成倍增长,AWS与SageMakerEdgeManager保持同步。EdgeManager帮助开发人员优化、保护、监控和维护部署在边缘设备队列上的ML模型。除了帮助优化ML模型和管理边缘设备外,EdgeManager还提供对模型进行加密签名、将预测数据从设备上传到SageMaker以进行监控和分析以及查看可以跟踪的报告的能力并提供有关操作的可视化报告。仪表板功能。SageMaker控制台中的部署模型。联想PC和智能设备云和软件副总裁IgorBergman评论道:“SageMakerEdgeManager将有助于消除优化所需的手动工作,监控并在部署后不断改进模型。有了它,我们希望我们的模型能够胜过其他类似的模型机器学习平台运行速度更快,内存消耗更少。随着我们将AI扩展到整个联想服务组合的新应用程序,我们将继续需要一个在云端和数百万边缘设备上都灵活且可扩展的高性能管道。这就是我们选择AmazonSageMaker平台的原因。凭借其丰富的边缘到云端和CI/CD工作流功能,我们可以高效地将机器学习模型引入任何设备工作流,以提高生产力。“最后,SageMakerJumpStart旨在让在部署机器学习方面经验不足的开发人员更容易上手。JumpStart为开发人员提供了一个易于使用、可搜索的界面,以查找一流的解决方案、算法和示例笔记本。开发人员可以从多个端到端机器学习模板(例如欺诈检测、流失预测或预测)中进行选择,并将它们直接部署到他们的SageMakerStudio环境中。AWS在过去一年中一直在改进SageMaker超过50种新功能可用.保险杠功能下降后,我们可能不应该再期待2020年了。
