当前位置: 首页 > 科技观察

成功实施MLOps的一些最佳实践

时间:2023-03-18 13:16:06 科技观察

Translator|布加迪规划|LiangCeSunShujuan您可能已经熟悉机器学习及其在当今世界的应用。人工智能(AI)和机器学习(ML)促进了智能软件的开发,这些软件可以准确预测结果并自动执行通常由人类执行的任务。虽然将机器学习纳入应用程序至关重要,但对于组织而言,确保机器学习平稳运行更为重要。为此,许多公司利用了一组称为“机器学习操作”(MLOps)的最佳实践。MLOps对任何企业的未来繁荣都变得至关重要。据德勤称,到2025年,该市场可能会扩大40亿美元,自2019年以来增长近12倍。尽管机器学习为许多业务流程带来了好处,但许多公司仍在努力实施机器学习方法来提高生产力。MLOps最佳实践以及如何应用它们?不要假设只需与新的SaaS提供商签约或创建新的云计算实例就能让MLOps发挥作用。它需要精心准备和跨团队和部门的统一方法。以下是成功实施MLOps的一些最佳实践。1.跨多个细分市场验证模型模型可以重复使用,但软件不能。模型的有用性会逐渐降低,因此需要重新训练。每种新情况都需要调整模型并训练管道来完成此任务。虽然实验监控可以帮助我们管理模型版本控制和可重复性,但在使用模型之前验证模型也很重要。离线或在线验证是企业可以根据其优先级使用的选项。使用测试数据集评估模型是否适合实现业务目标,重点关注精度和准确性等指标。在做出升级决定之前,应将指标与当前生产/基线模型进行比较。如果您的实验在元数据方面得到很好的跟踪和管理,则可以轻松执行升级或回滚。本文着眼于使用A/B测试来验证在线模型,看看它是否对真实数据表现良好。机器学习系统越来越意识到可以从数据中提取的偏差。这方面的一个例子是Twitter的图像裁剪工具,它对某些用户不起作用。通过比较模型与不同用户组的性能,可以发现并修复这种不准确性。模型的性能还应该在各种数据集上进行测试,以确认其满足要求。2.尝试新事物并跟踪结果超参数搜索和特征工程是不断发展的领域。ML团队的目标是根据最先进的技术和不断变化的数据模式生成一个最佳系统。但是,这需要跟上最新的趋势和标准。此外,测试这些概念以查看它们是否有助于您的机器学习系统更好地执行。数据、代码和超参数都可以用于实验。每个可能的变量组合都会产生一个度量,可以与其他实验的结果进行比较。进行调查的环境也可能改变结果。您可能还想部署时间跟踪软件以确保及时的结果并跟踪每个项目花费的时间。3.了解MLOps成熟度微软和谷歌等领先的云提供商使用MLOps采用的成熟度模型。实施MLOps需要组织变革和新的工作实践。随着组织的系统和程序开始改进,这种情况会逐渐发生。任何成功的MLOps实施都需要对组织的MLOps成熟度进度进行诚实的评估。在进行有效的成熟度评估后,公司可以学习迈向新的成熟度水平。更改部署流程(例如实施DevOps或引入新的团队成员)是其中的一部分。有多种方法可以为机器学习存储数据,例如特征存储。特征存储对于拥有完善的数据基础架构的组织很有帮助。他们需要确保不同的数据团队使用相同的功能并减少重复工作。如果组织只有少数数据科学家或分析师,那么特征存储可能不值得付出努力。组织可以利用MLOps成熟度模型让技术、流程和团队一起成熟。它确保了在实施之前迭代和测试工具的可能性。4.进行成本效益分析确保您了解MLOps可以为您的组织做什么。如果您在进行另一次购买时遵循策略,则可以有效地处理每笔交易。假设您是一位想要挑选汽车的购车者。摆在你面前的选择很多,跑车、SUV、紧凑型轿车和豪华轿车。您首先要选择最适合您需求的类别,确保您购买的汽车符合您的需求,然后根据您的预算分析不同类别和车型。在为您的公司选择最佳MLOps技术时也是如此。例如,跑车和SUV各有优缺点。同理可以分析几种MLOps工具的优劣。要做出明智的战略决策,您必须考虑多个变量,包括您公司的预算和目标、预期的MLOps活动、您打算处理的数据集的来源和格式,以及您的团队的能力。5.保持沟通渠道畅通。产品经理和用户体验设计师会影响支持系统的产品与客户交互的方式。机器学习工程师、DevOps工程师、数据科学家、数据可视化专家和软件开发人员需要共同努力来实施和管理长期的机器学习系统。员工绩效由经理和企业主审查和认证,而合规专业人员则验证活动是否符合公司政策和监管标准。如果机器学习系统要在面对不断变化的用户、数据模式和期望的情况下继续满足业务目标,就需要相互连接。6.将自动化整合到工作流中由于广泛和先进的自动化,公司的MLOps成熟度可能会提高。许多机器学习任务必须在缺乏MLOps的环境中手动执行。这包括特征工程、数据清理和转换、将训练和测试数据拆分成更小的块、构建模型训练代码等等。数据科学家手动执行这些任务,播下了错误的种子,浪费了本可以用于探索的时间。持续再训练是自动化实际应用的一个经典示例,数据分析师可以在其中构建用于验证、数据摄取、特征工程、实验和模型测试的管道。持续再训练可防止模型漂移,通常被视为自动化机器学习的早期步骤。原文链接:https://www.kdnuggets.com/2022/04/mlops-best-practices-apply.html