当前位置: 首页 > 科技观察

企业在机器学习应用中需要吸取的经验和教训

时间:2023-03-12 22:50:46 科技观察

在商业世界中,围绕机器学习(ML)应用程序的持续炒作和炒作是有正当理由的。机器学习(ML)可能是当今人工智能(AI)最普遍的领域。虽然密切相关,但人工智能和机器学习不是可互换的术语。机器学习已经融入到许多业务应用程序和面向客户的服务中,并且可以自行学习的机器听起来很酷。企业在机器学习应用中的经验教训但是,正如许多IT高管所说,采用新技术可能会导致一些不切实际的期望。为此,一些机器学习和数据科学专家分享了企业和团队在采用机器学习技术时需要学习的经验和教训。1.没有建立合适的团队企业可能拥有足够的数据量和计算能力,但如果团队中没有合适的人才,也会影响业务发展。“我经常强调的一件事是,公司需要建立跨学科团队,密切合作以构建机器学习产品,”Very数据科学实践负责人JennGamble博士说。“数据科学家很少自己做这件事。”机器学习(ML)的成功应用需要额外的能力和技能,Gamble将以下内容确定为关键技能:机器学习建模数据管道开发后端/API开发前端开发用户界面(UI)和用户体验(UX)产品管理Gamble说:“没有人拥有这些领域的所有技能,因此有必要将具有不同技能的人聚集在一起,并鼓励他们在整个过程中紧密合作。”2.业务期望和技术现实之间没有桥梁。为了搭建桥梁,Gamble还建议负责实施机器学习(ML)计划的团队还包括与行业专家和最终用户密切合作的员工,他们不一定是技术人员。Gamble说,“重要的是要有人担任AI产品经理,就像传统的产品经理一样,他们的工作将专注于如何使用终极机器学习技术:谁是最终用户,他们的工作流程是什么,以及他们的工作流程是什么?就是他们会根据提供的信息做出什么样的决定。”大多数IT专业人员,无论他们的特定技能如何,都可以理解这个问题:在企业期望机器学习(ML)做什么和它做什么之间可能存在差距。一些差距(或巨大的差距)。“来自机器从学习建模的角度来看,将业务理解、数据理解和可能的东西结合在一起也增加了复杂性,”Gamble说。就像很多优秀的产品经理都是软件工程师一样,我认为很多优秀的AI产品经理也是数据科学家,虽然这是一个新领域,走这条路的人并不多,但正如我们将看到的,对这个角色的需求将持续成长。3.真相有太多版本机器学习的一个基本现实:模型或算法仅取决于输入的数据。对于人工智能和机器学习,人们最好把它看成一只非常聪明的鹦鹉,它对给它的训练输入数据非常敏感,从而学会了预期的任务。“但这会导致不同的学习方式:人们(甚至是同一团队的成员)对特定业务流程或服务的看法可能存在很大差异。Indico使客户能够让多人参与模型建模。流程标记训练数据。他将其视为投票:每个利益相关者在过程或任务中都有发言权。该公司的一个客户最近有六个人参与数据标记过程,虽然在短期内Nei最终失败了,但收获颇丰长期收益。”一旦他们建立了模型,他们发现模型的性能很差,经过进一步调查,他们发现六个人对如何标记训练样本的想法完全不同。这反过来又迫使他们就特定任务进行非常有价值的对话,并使他们能够更好地理解特定用例的“基本事实”。4.认为训练数据就是终点在生产过程中,公司可能会发现他们对最初的训练数据过于自信,最终又回到了起点。SigOpt的工程总监JimBlomo认为,即使是好的训练数据也不一定能表现得更好。“你不能只训练一个模型并相信它会表现,”Blomo说。需要运行一个高度迭代的科学过程才能使其正确,即便如此,您仍可能会看到生产中的高度可变性。这同样适用于模拟和验证过程以及持续的性能评估。“企业经常发现用于预测生产模型性能的基线实际上需要在模型开发过程中进行更改和调整。建模人员首先要学习的事情之一是定义正确的指标是最重要的任务之一,而且,通常次,跟踪多个指标对于理解更完整的模型行为至关重要。5.重复传统软件开发错误机器学习也容易出现困扰其他IT部门的相同问题。公司是否在无法协同工作的职能孤岛中建立AI/ML团队?这将产生许多与传统软件项目相同的问题:扩展的考虑、延长的期限、损坏的工具以及对企业文化的不利影响。Algorithmia创始人KennyDaniel表示:“许多公司花费数年时间收集大量数据,聘请数据科学家团队,尽管投入了大量人力和物力,但未能将任何模型投入生产。错误的做法是让数据科学家让实施团队编写程序代码并期望数据科学家成为DevOps专家也是错误的。那么什么是正确的做法呢?采用与您用于现代化和优化机器学习软件管道相同的思维方式(例如DevOps思维方式)。Daniel说:“建议企业从传统软件的DevOps经验和教训中吸取教训世界:创建自动化、可重复的管道和工具,并将底层实现细节容器化和抽象化。”Gamble说:“企业在构建机器学习开发产品时,仍然需要从软件开发中吸取的所有相同原则和经验教训,例如DevOps原则,以用户为中心的设计等。许多数据科学家花费大量时间学习机器学习,但他们可能不像软件工程师。、产品经理或设计师都精通这些主题。”正如DevOps可以被视为对传统软件开发所面临问题的广泛回应一样,机器学习和人工智能的其他方面也出现了新的方法。“由于在将机器学习纳入传统产品开发组合时还需要考虑其他因素,因此MLops、DataOps、DataViz和MLUX(机器学习用户体验)等新领域正在蓬勃发展,试图填补这一空白,”Gamble说。