本文经AI新媒体量子比特(公众号ID:QbitAI)授权转载,转载请联系出处。不写代码能做机器学习吗?!这是亚马逊云科技在最近的亚马逊云科技re:Invent大会上宣布的一个新工具,用于实现无代码的视觉机器学习。亚马逊云科技re:Invent大会可谓是云计算行业的“春晚”。是IT技术领域的风向标级盛会。就连他们自己的西雅图总部大楼也相应地改成了会议名称。强大的品牌影响力可见一斑。在过去的10年里,无数云计算乃至AI行业的标杆产品在这次盛会中诞生,例如AmazonMechanicalTurk、AmazonRekognition、AmazonSageMaker等。今年的AmazonCloudTechnologyre:Invent2021信息量也很大。最有意思的是,亚马逊云科技的机器学习平台服务AmazonSageMaker迎来了“大爆发”。不仅有不用代码开发机器学习模型这道“菜”,在整个AI餐桌上,亚马逊云科技的12款产品已经覆盖了整个AI产业链,纵向——横向,从为个人开发者准备的,从入门的免费算力池,到各大厂专业人士所需的AI模型优化工具,也都有相应的发布。甚至,考虑到AI在中国市场的快速发展,亚马逊云科技还在B站提供了中文字幕的发布会实录。在现场演讲中,CEO还特意强调:“亚马逊云科技将提供最广泛的以及完整的全栈机器学习服务。”不妨跟随我们一起回顾一下全程的精彩看点,全面了解亚马逊云科技的AI产品阵容吧对于无代码机器学习,我们先来探索一下开头提到的无代码机器学习预测服务,看看它是否真的可以被不懂代码的人使用。据官方介绍,这款产品名为AmazonSageMakerCanvas,面向机器学习零经验人群。他们中有些人可能是业务分析师,有些人可能从事人力资源、财务或市场营销。可以预见的是,上述人群中的大部分人都没有机器学习的经验,甚至对代码一窍不通,但他们肯定有衡量当前策略、通过数据预测市场趋势的需求。AmazonSageMakerCanvas将机器学习模型的许多步骤可视化为交互式UI,旨在解决他们的业务问题。它声称无需编写一行代码即可快速生成机器学习预测模型。为了证明其有效性,亚马逊云技术的AI/ML部门自己分享了一个案例。其中,该部门的产品营销经理想通过AmazonSageMakerCanvas评估当前的营销活动,以确定它们是否具有足够的影响力和有效性。只需打开AmazonSageMakerCanvas并上传您的数据。在此过程中,平台还可以自动修正上传的数据错误,例如补充缺失值或删除重复的行和列。毫不奇怪,它的技术也来自于它自己的AI/ML。接下来指定模型预测的目标,然后点击“快速生成”,就可以训练出需要的模型了。从结果来看,渲染效果确实是可视化图表,模型准确率达到93%。模型生成后,还可以共享给数据科学家等合作伙伴,帮助业务人员进一步检查或优化这些模型。看完官方案例,可视化界面确实有两把刷子——那么小伙伴的体验呢?目前,宝马集团已将亚马逊云科技AI/ML技术应用于实际业务流程中的600多个应用,涵盖从生产线到销售端的多个场景。此外,宝马有1500万辆联网汽车参与其中,产生了超过数百万公里的数据,由AmazonSageMakerCanvas进行分析和预测。西门子能源也是最早吃螃蟹的公司之一。他们使用AmazonSageMakerCanvas作为他们自己的机器学习工具包的补充。应用部门的一位数据科学团队负责人表示:Canvas使我们能够与数据科学团队共享和协作,这有助于产生更多的机器学习模型,并确保模型符合质量标准和规范。还有很多不知名的大牛也是Canvas的体验者。例如,全球最大的私营企业科赫集团旗下的英威达也使用了AmazonSageMakerCanvas来协助处理业务流程中的数据科学问题。看了多方评测和视觉展示的结果,可以大致判断出这款AmazonSageMakerCanvas确实值得期待。毕竟,图形界面比代码更能释放生产力、创造价值的规律在过去已经被反复证明。免费上线AILab前面提到,亚马逊云科技在一年一度的大型会议上放下豪言壮语:提供最广泛最完善的全栈机器学习服务。既然是“最广泛最全”,仅仅一个亚马逊发布的SageMakerCanvas肯定是不够的——对于广大高校研究机构、AI爱好者、尖端科技巨头来说也需要对得起自己的口号.总结一下,三个字,降低门槛。最直观的就是提供计算资源。近年来,高昂的硬件价格和复杂的软件配置一直阻碍着初学者入门AI,也是制约行业发展和让更多人熟悉AI的巨大障碍。亚马逊云技术发布功能AmazonSagemakerStudioLab提供了一大群可以挤的“羊毛”。无需额外配置环境和注册账号,直接通过邮箱登录即可的在线实验室。在这个环境下,任何人创建的项目,都可以直接拥有12小时的CPU计算时间,4小时的GPU计算时间,15GB的存储空间:这样的配置在整个行业确实很到位。需要注意的是,经典ML算法训练使用Pandas或者XGBoost进行数据预处理时,12小时的CPU时间基本足够了。对于深度学习训练,可选的GPU后端可以获得4小时的计算时间,这些时间足以在较小的数据集上训练或微调模型。也就是说,对于初学者阶段的AI模型,基本上可以用上面的资源免费训练。同时,最流行的机器学习工具、框架和库也被预先打包提供给注册者,他们可以定制Conda环境并安装开源的JupyterLab和JupyterServer扩展。上述实验室环境与GitHub紧密集成,使创建的项目可以轻松复制和保存。除了免费的“在线实验室”和算力资源,另一部分“羊毛”更直观——奖学金。此次,亚马逊云科技斥资1000万美元推出亚马逊云科技AI&ML奖学金计划,旨在帮助16岁以上的高中生和大学生,帮助他们为机器相关的职业铺平道路学习。此外,亚马逊云科技的1:18比例自动驾驶汽车AmazonDeepRacer也针对自动驾驶和机器学习爱好者,提供了一种更有趣和低门槛的方式帮助他们入门机器学习和训练可靠的自身强化学习模型。AmazonDeepRacer由强化学习驱动,可以将算法部署在云端的3D赛车模拟器中,或者通过实体赛车体验现实世界中赛车的快感。当然,表现优秀的学生也有机会直接获得奖学金。不仅闪耀,亚马逊云科技还拉来了英特尔和优达学城发起联合活动,向16岁以上经济困难、残疾等弱势群体发放2500份奖学金。这些弱势群体除了获得资金支持外,还可以获得优达学城导师、亚马逊云技术和英特尔技术专家一年的指导和帮助。机器学习的“产业化”重塑无论是零代码机器学习的发布,还是更广泛人群的包容,背后都有技术支撑。毕竟功能开发需要深入的场景理解和技术积累,而“普惠”二字考验着科技公司的降本水平。与以上两者相比,亚马逊云科技re:Invent2021为专业从业者发布了AmazonSageMaker的各项新特性,更直观地展示了亚马逊云科技的技术水平,从中可以看出这家科技巨头对于AI/毫升。对于大多数MLer来说,一个完整的机器学习过程包括数据准备、数据标注、训练、推理和部署。最终模型推理的效果如何,不仅取决于开发者个人的水平,还取决于架构、算力、数据等外部因素。亚马逊云科技之所以这样做,是为了减少个人层面的影响。用他们的话说:让AI/ML从手工作坊走向产业化。具体来说,为了一揽子解决问题,AmazonSageMaker提供了一套涵盖机器学习全流程的组合拳:在数据准备阶段,数据工程师往往需要离开当前的开发环境,手动配置一个模型,满足运行模型或分析要求。簇。为此,AmazonSageMakerStudio与AmazonEMR集成,以直接从AmazonSageMakerStudioNotebook使用SparkUI监控和调试在AmazonECR集群上运行的Spark作业。这是向理想的完全集成开发环境迈出的一步,因为数据预处理、开发和模型部署不必离开环境。数据标注阶段也在告别劳动密集型和人工智能:这项工作过去需要人工或通过数据标注程序进行人工标注,但现在,在给出原始数据和要求后,AmazonSageMakerGroundTruthPlus将结合机器学习辅助的预标注,辅助人类专家进行标注。这种方法可以降低错误率并降低40%的标签成本,从而更有效地检测错误,避免低质量标签的出现。训练阶段的提升更为关键。与业界经典的深度学习模型BERT一样强大,拥有数十亿参数的复杂神经网络需要数千小时的GPU训练。即使优化了参数,仍然需要几天的时间来训练。但是现在,亚马逊云科技提供的机器学习模型优化编译器AmazonSageMakerTrainingCompiler,可以在不增加太多代码的情况下提高GPU实例的训练速度。在这个编译器的帮助下,很多经典的深度学习模型包括BERT-base-cased、BERT-base-uncased、distilBERT-base-uncased都可以直接提升50%的训练速度。△添加两行代码使用AmazonSageMaker训练编译器,最后在推理阶段进行改进。亚马逊云科技提出了一举成名的“serverless”概念,并提供了一套具有serverless推理功能的ServerlessInference。该功能可以将资源分配到云端,针对数据计算量波动较大的情况,享受弹性资源空间服务。让程序员专注于高级语言而不是底层硬件,让专业人士专注于自己擅长的事情。考虑到在现实中,很多客户都有特殊的需求,但很难判断多少计算资源合适。另一个功能,AmazonSageMakerInferenceRecommender,在推理阶段提供配置和实际操作参数建议,以找到成本和速度之间的最佳平衡点。观点。从数据准备到推理,上述过程的产品功能发布为一个完整的机器学习周期服务,而不是拼凑的单点。目的是帮助企业实现机器学习的规模化应用。AI/ML工业规模应用流程。那么这套组合拳的效果如何呢?可以看出,在案例中,美国最大的基金管理公司之一Vanguard将部署时间缩短了96%,制药巨头阿斯利康在5分钟内完成了机器学习环境的部署,而金融管理公司NerdWallet在原有培训需求增加的前提下,降低了75%的成本。%。此外,亚马逊云技术对AI/ML的深度挖掘,也可以看到更多样的落地场景。例如,RDS的DevOpsGuru可用于帮助开发人员检测、诊断和解决AmazonAurora中的性能和操作问题。例如,CodeGuruReviewer可以识别源代码中的密码、API密钥、SSH密钥和访问令牌,提高代码审查效率,帮助传统软件行业提升绩效。有意思的是,在亚马逊云科技re:Invent2021大会期间,CTOWernerVogels也在百忙之中发布了一篇博客,暴露了技术男对AI/ML行业的厚望:软件开发将开始从人力密集型转变,支持人工智能的软件开发将占据主导地位。最后,在硬件方面,亚马逊云科技还发布了自研芯片,一口气推出了三款机型。其中,CPU芯片Graviton3的特点是机器学习。还有机器学习定制训练芯片Trainium,支持Trn1实例,可以为用户提供更低成本、更快速的云端深度学习模型训练。无论是打通AI/ML产业规模应用流程,还是硬件自研芯片的发布,从更宏观的角度——上述发布动作,可见亚马逊云技术在AI/ML领域的延伸商业。亚马逊云技术正在拓展AI的边界。据IDC数据显示,2013年至2020年的七年间,全球AI/ML年度支出规模从0迅速扩大至约500亿美元。这个增长率几乎与亚马逊云技术的增长速度相同。是云计算的2倍。单从这个趋势来看,亚马逊云科技的多方出击似乎在所难免。从无代码机器学习、Serverless应用深度AI/ML,到底层算力的不断升级,乃至诸多普惠计划……琳琅满目的发布无不表明亚马逊云技术正在重新定义机器学习新前沿.虽然上述公告尚未落地,但大众所展现的价值可能一时半会还肉眼看不到,但从另一个角度来看,所谓追求长期价值,所谓的-所谓重视基础设施布局,都清楚地写进了亚马逊云技术的DNA中。?回想一下,1997年,贝佐斯发表了著名的《致股东的信》。当时,互联网泡沫正在第一代积累,“快钱”对很多人来说还是一个新概念。当时亚马逊提出,客户、销量、品牌增长都是为了长期价值服务,也是为了长期价值。贝索斯强调了“对系统和其他基础设施进行持续投资”的重要性。此后,AmazonWebServices独立运营,将云计算从一个“概念”变成了真正的产业,AmazonRedshift和AmazonLambda带出了云原生数据仓库和Serverless开发……一切似乎都早早的写了序幕。现在亚马逊云科技以同样的心态继续押注AI/ML领域,这本身并不令人意外。这不仅是身为科技巨头的责任,也确实是一件值得期待的事情。呼应了今年亚马逊云科技re:Invent2021的Slogan:引领潮流,重塑未来。我们已经可以看到,AI/ML领域的人员覆盖面在扩大,行业场景在扩展,技术也在不断探索。这一进程仍在行业技术探路者的推动下。未来,AI/ML的版图有多大?亚马逊云技术正在一点一点地勾勒出新的轮廓。
