企业要成为机器学习信息工厂,需要从精益制造中学习这六大精髓。取得成功至关重要。98%的IT领导者认为机器学习操作(MLOps)将为他们的公司带来决定性的竞争优势。然而,只有6%的公司认为他们的机器学习操作(MLOps)能力足够成熟,可以从中受益。机器学习(ML)和机器学习操作(MLOps)究竟是什么?要找出答案,请从术语的定义开始。机器学习(ML)是一种人工智能,无需人工干预即可从数据中学习。力求成功的企业正在使用机器学习(ML)来优化其业务的各个方面:提高员工生产力、提高客户满意度和增加收入。虽然数据量在过去几年几乎呈指数级增长,但使用机器学习(ML)组织和分析数据的能力却明显滞后。这成为一个挑战。更大的挑战是将机器学习(ML)模型投入生产以使应用程序更加智能。Forrester在其调查中发现,只有14%的受访者将机器学习(ML)模型应用于可重复且可靠的生产流程。许多企业正在采用的一种方法是采用机器学习操作(MLOps)。机器学习操作(MLOps)是数据科学家和操作团队在整个机器学习生命周期中协作和沟通的实践。在许多方面,机器学习运营(MLOps)正在努力获得DevOps在敏捷软件开发中实现的相同机器学习生产力、效率和质量优势。简单地采用机器学习操作(MLOps)并不能解决尝试实施机器学习(ML)的企业所面临的问题。这是第一步,也是重要的一步,但还需要做更多的工作。成功采用机器学习(ML)功能的组织通过关键流程、工具和持续改进实践增强了机器学习操作(MLOps)。其中一些做法听起来很耳熟,因为它们直接来自工业制造行业的经验教训。精益制造的6个精髓50多年来,世界各地的制造公司一直在使用6Sigma和精益制造技术来解决质量问题。如今,许多企业正在使用其中一些技术从数据中创造价值,并在本质上成为信息工厂。(1)自动化(Jidoka)自动化在现代生产工程中起着至关重要的作用——提高产品质量、生产率和产量。Jidoka是一个日语术语,描述了具有人类智能的自动化,它使机器和操作员能够在发现问题并立即解决问题时停止工作,而不是等待生产线停止或生产结束。自动化(Jidoka)的概念可以对分析生产线做同样的事情。自动化自助服务(Jidoka)可以为机器学习(ML)过程中涉及的每个角色提供基础设施、工具和数据需求。这种类型的自动化可以提高效率并确保符合标准。因此,时间不再浪费在等待访问适当的环境或尝试配置从Internet下载的新工具上。机器学习过程的每个阶段都可以自动安排,使整个系统可预测且高效。(2)工具(Tooling)工具在现代生产设备中起着基础性的作用。明智地使用工具可以帮助实现规模化。它减少了所需的劳动力技能,同时提高了质量,缩短了实现价值的时间,提高了生产力和速度。今天的信息工厂需要一系列工具来适应每个角色并满足每个生产阶段的需要。随着新的、更具挑战性的业务问题得到解决,将需要新的工具。这就引出了信息工厂的下一个基本要素:研发实验室。(3)研发实验室到目前为止,大多数机器学习(ML)工具几乎都专注于模型开发,但这种情况正在改变。新的机器学习(ML)工具解决了操作流程和模型生命周期管理问题。这些新工具可以提高机器学习(ML)模型的效率,并支持下游操作、标准规范和模型治理。使用R&DLabs,数据科学家可以评估新工具、记录最佳实践并评估安全和可管理环境中的潜在优势。一旦被更广泛的团队使用,新工具就可以集成到应用程序目录中,可以在自助服务配置过程中使用。(4)改进(Kaizen)日语术语Kaizen的意思是为了更好的改变或持续改进。它更多的是一种理念而不是工作实践,它可以确保更高的质量、消除浪费并提高效率。随着越来越多的企业开始扩展其数据科学能力,新的需求将会出现。这些可能包括使流程更加标准化或自动化的机会。信息工厂和相关团队(包括DataOps、数据科学、MLOps、DevOps、运营和商业智能)中工作的集成性质有助于Kaizen实践。每个人对面临的挑战都有不同的看法,因此应该鼓励他们不断评估如何改进信息工厂的流程。(5)供应链(Supplychain)多年来,制造商通过使用准时制(JIT)方法进行零件交付来优化他们的供应链。准时制(JIT)将库存保持在最低限度,并消除了将零件移入和移出库存的时间和精力。信息工厂需要以同样的方式处理数据。尽管大多数企业在多个数据仓库、运营数据存储和数据湖中拥有大量数据,但发现和访问有用数据通常是首要挑战。在许多情况下,数据科学家需要数据工程师来帮助复制大型数据集,因为需要读写访问权限才能转换数据并使其适合构建机器学习(ML)模型。这种延迟与理想的准时制(JIT)相去甚远。机器学习(ML)竞赛的获胜公司将专注于数据供应链,提供全面的数据目录和业务术语表。他们还定期评估和报告数据质量。大多数还使用只读快照而不是复制数据。许多人现在正在探索机器学习(ML)特定的特征存储,这通过标准化数据准备方式大大加快了模型开发。(6)防错(Poka-yoke)最后一个是Poka-yoke,日语名词,意思是防错。一个很好的例子是手机中的SIM卡,制造商会从SIM卡上去掉一个小角,以防止插入错误。Poka-yoke有助于防止错误发生。这种类型的防错是上述持续改进过程(Kaizen)的一部分。虽然防错的想法有些微不足道,但想象一下,如果它被嵌入到人们接触的每个过程中。随着数据科学家使用更多自动化工具来执行更复杂的任务,防错将变得非常宝贵。价值。通过流程、工具和人才使机器学习(ML)取得成功机器学习(ML)和机器学习操作(MLOps)对组织的业务成功至关重要,但大多数组织未能实现其目标。解决这一挑战的第一步是实施机器学习操作(MLOps)。但是,仅仅依靠机器学习操作(MLOps)是不够的。把握以上六大精髓,企业可以从数据中创造价值,取得更大的成功。原标题:成为ML信息工厂——我们可以从精益制造中学到的6课,作者:DougCackett
