当企业首次开始部署人工智能和启动机器学习项目时,重点通常放在理论层面。是否有模型可以提供必要的结果?如何构建该模型?如何训练它?但是数据科学家用来开发这些概念证明的工具通常不能很好地转化为生产系统。因此,据IDC称,部署人工智能或机器学习解决方案平均需要九个月多一点的时间。IDC分析师SriramSubramanian说:“我们称之为‘模型速度’,即模型从开始到结束所花费的时间。”这就是MLOps可以提供帮助的地方。MLOps(机器学习操作)是最佳实践、框架和工具的集合,可帮助组织管理数据、模型、部署、监控以及进行理论概念验证和使用AI系统的其他方面。“MLOps可以将模型速度降低到几周——有时是几天,”Subramanian说。“就像使用DevOps来减少开发应用程序的平均时间一样,您需要使用MLOps。”他说,通过使用MLOps,企业可以构建更多模型、更快地创新并处理更多用例。“价值主张非常明确,”他说。IDC预测,到2024年,60%的企业将在其机器学习工作流程中使用MLOps。Subramanian表示,在调查企业在使用人工智能和机器学习技术时面临的挑战时,缺乏MLOps已经成为企业采用人工智能和机器学习技术的主要障碍,仅次于成本。在这里,我们研究什么是MLOP,它们是如何演变的,以及哪些组织需要使用并牢记以充分利用这种新兴方法来实施AI技术。MLOps的演变几年前EugenioZuccarelli刚开始设计机器学习项目时,MLOps只是最佳实践的集合。从那时起,Zuccarelli就在多家公司从事人工智能项目,包括一些医疗保健和金融服务公司,随着时间的推移,他通过MLOps发展到涵盖多种工具和平台。现在,MLOps可以为实施AI技术提供一个相当强大的框架,Zuccarelli说,他现在是CVSHealth的创新数据科学家。例如,Zuccarelli引用了他之前参与的一个项目,该项目旨在开发一款可以预测不良结果(例如再住院或疾病进展)的应用程序。“我们正在研究数据集和模型,并与医生交谈以找出最佳模型的特征,”他说。“但要让这些模型真正有用,我们需要将这些模型放在真实用户面前。”这意味着开发可靠、快速且稳定的移动应用程序,并通过API系统在后端建立机器学习连接。“如果没有MLOps,我们将无法保证这一点,”他说。他的团队使用H2OMLOps平台和其他工具为模型创建了一个健康仪表板。“你不希望对该模型进行重大更改,”他说。“而且你不想引入偏见。健康仪表板让我们知道系统是否有变化。”使用MLOps平台还允许我们对生产系统进行更新。“在不停止应用程序的情况下很难替换文件,”Zuccarelli说。“MLOps工具允许在系统处于生产状态时更换系统,而对系统本身的干扰最小。”他说,随着MLOps平台的成熟,它们将加快整个模型开发过程,因为企业不必浪费时间为每个项目做一些重复性工作。数据管道管理能力对于实施AI也至关重要。“如果我们有多个数据源需要相互通信,那么MLOps就可以发挥作用,”他说。“您希望流入机器学习模型的所有数据都是一致且高质量的。正如他们所说,垃圾进,垃圾出。如果模型获得的信息很差,那么它的预测本身也会很差。”MLOps基本原理:移动目标但是不要认为仅仅因为现在有一些平台和工具可用,就可以忽略MLOps的核心原则。刚起步的企业在这个领域的人应该记住,MLOps的核心是在数据科学和数据工程之间建立牢固的联系。“要使MLOps项目取得成功,您需要在同一个团队中拥有数据工程师和数据科学家,”Zuccarelli说。此外,配备必要的工具来防止偏见、确保透明度、提供可解释性并支持道德平台——这些工具仍在开发中,他说。“这肯定需要做很多工作,因为它是一个全新的场地。”因此,如果没有可用的完整交钥匙解决方案,公司必须精通所有方面,才能在实施AI技术时如此高效地实现MLOps。这意味着在工作中学习专业知识,位于坦佩的技术咨询公司InsightTechnologyConsulting的AI团队全国实践经理MeaganGentry说。MLOps涵盖从数据收集、验证和分析到管理机器资源和跟踪模型性能的所有内容。一些可以帮助企业的工具可以部署在本地、云端或边缘。这些工具可以是开源的或专有的。但精通技术只是等式的一部分。Gentry说,MLOps还借鉴了开发运营(DevOps)中的敏捷方法和迭代开发原则。此外,与敏捷开发相关的领域一样,沟通也很关键。“每个角色之间的沟通至关重要,”她说。“数据科学家和数据工程师之间的沟通。与DevOps的沟通,以及与更大的IT团队的沟通。”对于刚起步的公司,MLOps会让您感到困惑。可以看到一些通用原则,有几十家供应商,甚至还有更多的开源工具包。CapgeminiAmericas企业架构高级经理HelenRistov说:“这里存在陷阱。”“很多这些陷阱都存在于开发过程中。没有一套正式的指导方针,就像你在开发运营(DevOps)中看到的那样。这是一项新兴技术,一些指导方针和政策需要时间来制定。”Ristov建议企业从他们的数据平台开始他们的MLOps之旅。“也许他们有多个数据集,但这些数据集位于不同的地方,并且没有非常紧密相连的环境,”她说。公司不需要将所有数据移动到一个平台,但他们确实需要一种方法来从不同来源引入数据,这可能因应用程序而异,她说。例如,数据湖非常适合需要低成本存储并进行频繁、大容量分析的公司。她说,MLOps平台通常会提供工具来构建和管理数据管道,同时记录不同版本的训练数据,但这不是一劳永逸的事情。然后,它还提供模型创建、版本管理、日志记录、测量功能集以及管理模型本身的其他方面。“这涉及大量编码,”Ristoff说,并补充说构建一个MLOps平台可能需要几个月的时间,而且在集成方面,平台供应商还有很多工作要做。.“在不同的方向上有很多发展,”她说。“有很多工具正在开发中,生态系统很大,人们只是在挑选他们需要的东西。MLOps还处于起步阶段。大多数组织仍在寻找最佳配置。了解MLOps格局据IDC的Subramanian称,MLOps市场预计将从2020年的约1.85亿美元增长到2025年的约7亿美元。这一数字被低估了,因为MLOps产品通常与更大的平台捆绑在一起。他表示,到2025年,这个市场的真实规模可能会超过20亿美元。Subramanian表示,MLOps供应商通常分为三类,首先是大型云提供商,包括提供MLOps的AmazonWebServices(AWS)、AzureCloud和GoogleCloud能力即服务。然后是一些机器学习平台厂商,比如DataRobot、Dataiku、Iguazio等。“第三类是他们过去所说的数据管理供应商,”他说。“像Cloudera、SAS和DataBricks这样的公司。他们的优势是数据管理能力和数据操作,然后他们扩展到机器学习能力,最终扩展到MLOps能力。Subramanian说,这三者都在爆炸式增长,并补充说,区分MLOps供应商的关键是他们支持本地和云部署模型的能力,他们实施可信和负责任的AI的能力,他们能否提供即插即用的解决方案,他们的解决方案能否轻松扩展。”这就是不同供应商之间的差异所在。“根据IDC最近的一项调查,缺乏实施负责任的人工智能的方法是使用人工智能和机器学习技术的三大障碍之一,并列第二位,缺乏MLOps本身。Gartner咨询公司AI和机器学习技术研究分析师SumitAgarwal表示,这主要是因为除了使用MLOps别无选择。“其他一切都是手动的,”他说。“所以,真的没有其他选择。如果你想扩展,你需要自动化。您需要代码、数据和模型的可追溯性。根据咨询公司Gartner最近的一项调查,模型从概念验证到生产所需的平均时间已从9个月减少到7.3个月。“组织有很多机会利用MLOps,”Garhwal说。“将组织文化转变为MLOpsMLOps还需要组织的AI团队进行文化转变,”Genpact全球分析实践负责人AmareshTripathy说。“数据科学家的一个常见形象是疯狂科学家试图大海捞针,”他说。“数据科学家是发现者和探索者,而不是生产小部件的工厂车间。但这就是你需要做的“真的要扩大规模。企业往往会低估他们需要付出的努力,”他说,“人们对软件工程有更好的理解,”他说,“围绕用户体验和需求有很多规则。”但是不知何故,人们并不认为他们自己部署模型时必须经历相同的过程。还有一种误解,认为所有擅长在测试环境中工作的数据科学家都会自然而然地部署某个模型。模型,或者他们可以派一些IT同事来完成这项工作。人们对他们需要做的工作缺乏了解。“企业还没有意识到MLOps会对公司的其他部门产生连锁反应,通常是戏剧性的变化。”您可以在c中部署MLOps所有中心和平均响应时间实际上会增加,因为一些简单的任务由机器、AI处理,而交给人类的任务实际上需要更长的时间,因为它们更复杂。“所以你需要重新考虑你要做什么样的工作,你需要什么样的人,你应该拥有什么样的技能,”他说。如今,组织中只有不到5%的决策是由算法驱动的,但这种情况正在迅速改变,他说。驾驶。我们检查的每一项统计数据都表明,我们正处于AI快速扩张的转折点。他说,MLOps是一个关键因素。“百分之一百,”他说。“没有MLOps,你就无法维持人工智能。”MLOps是在企业中扩大AI使用的催化剂。“
