当前位置: 首页 > 科技观察

如何解决企业AI的大挑战

时间:2023-03-17 19:20:45 科技观察

90%的现有数据都是在过去两年产生的。每天产生750TB的数据——每人约147,000GB。这些数字令人震惊,但可以预见:世界在发展,机器经济呈指数级增长。这并不是说所有这些数据都立即有用。组织不能在没有大量预处理的情况下简单地利用这些资源,但是有人在工作吗?Forrester报告称,在企业内部,仍有73%的数据未用于分析。业务战略和数据战略之间仍然存在很大差距——您的组织的预测解决方案只会与最初的问题陈述一样强大。根据Gartner的说法,组织需要建立特定的用例并部署具有可衡量结果的技术,以实现AI的价值。数据是一个大问题的比喻仍然存在——数据是新的石油(尽管可能不是那么“新”,因为这个词是在2006年才创造的)。在原始状态下绝对值得。精炼之后就更值钱了。但是当它变成了专门为解决特定问题而设计的产品时,它的应用领域就会层出不穷,价值也会飙升。数据也是如此:组织需要记住,这里的最终目标不是收集尽可能多的数据。他们需要从数据中提取价值并将其应用于特定的业务问题。观察数据、从中学习,然后根据反馈自动执行工作的想法是机器学习的核心。>来自giphyML的GIF并没有朝着证明“终结者假说”的方向发展,尽管好莱坞经常描绘它。了解机器学习在任何组织成为数据驱动者之前,了解基础知识非常重要。人们通常认为机器学习的最终目标是将显示在实时仪表板上的数据图形化和可视化。机器学习是关于自动化任务(而不是替换工作),而不仅仅是显示统计数据。从广义上讲,机器学习教计算机了解世界,以便机器可以使用这些知识来执行其他任务。另一方面,统计数据可以教会人们一些关于世界的知识,这样他们就可以看到更大的图景并做出明智的决定。据埃森哲称,与追求概念验证的公司相比,战略性扩展人工智能的公司报告的人工智能投资回报率几乎是其三倍。显然,ML不是一些愚蠢的仪表板;事实上,它可以帮助您的组织构建可以模仿、扩展和增强人类智能的智能系统,以实现某种“机器智能”,从而使您组织中的人员可以专注于解决更多的人类问题。然而,大多数组织都在努力实施可扩展的AI解决方案,并且没有从中获益(参见:金钱)。问题?你的组织不缺人才,缺的是战略。不相信?让我们看一些数字。可扩展的解决方案数据科学工作需求自2015年以来增长了344%。我们可以清楚地看到,组织正在投资发展他们的数据科学团队,给人的印象是,如果他们继续雇用数据科学家,创新和数字化转型将自动成为副产品产品。然而,只有27%的企业数据被使用,如果考虑到外部数据,则更令人震惊——世界上所有可用数据中只有不到1%用于分析。所有这些数据都有一个临界点。公司可以花费数百万美元建立庞大的数据团队来搜索互联网以寻找和准备数据的方法——但这绝不是一个可扩展的解决方案,而且缺乏管理策略会造成瓶颈。公司需要什么来部署AI和ML?那么,该过程从哪里开始,组织如何实际构建和部署成功的机器学习项目?(1)以终为始。你必须清楚地了解你面临的问题和你想要实现的解决方案。在保龄球中,一个球可以击倒十个球瓶,但如果你把球扔向正确的方向,那将是一场完美的比赛。使用ML,您需要知道自己的目标。组织是目标驱动的,他们一直在寻求增加收入和改进KPI-如果您的问题没有解决这些目标,您可能会偏离轨道。(2)提出正确的问题。大多数企业在尝试解决ML问题之前并没有提出正确的问题。分析并了解您可以回答和不能回答的问题,然后弄清楚您的预测系统如何真正使最终用户受益。要问的一个关键问题:“我的项目是否会深深地受到它可以为组织创造的价值的驱动?”(3)定义业务战略。必须使用将应用于其他项目的数据和ML项目来实施相同的战略制定细节。您需要具体的、可衡量的和可实现的目标、实施计划以及有助于跟踪项目成功的指标。仅在技术层面上看项目是不够的,您需要能够将解决方案连接到您的组织。例如,实施该模型后,贵公司是否会增加收入或在市场上获得稳固的竞争优势?(4)建立正确的团队。组织通常无法雇用合适的候选人,因为他们要么不知道自己想要实现什么,要么对数据科学家的角色有相互矛盾的看法。数据团队由更多角色组成,而不仅仅是数据科学家,如果认为一个角色可以构建和维护仓库、设计数据工作流、编写完美优化的机器学习算法并对所有内容进行分析,那将是无知的。为了为项目填补合适的角色,您需要明确定义您的目标,了解每个技术角色/团队结构的细微差别,并确保在您的职位发布中列出所有这些。下图显示了核心技能对于数据科学中新兴角色的相对重要性:>数据科学中技能重要性图表(5)创建数据战略路线图。数据是ML项目中训练模型的关键资产。按照人工智能领域先驱吴恩达的说法,最大、最成功的产品拥有最多的用户。拥有最多的用户通常意味着你可以获得最多的数据,而对于现代ML,拥有最多的数据通常意味着你可以创造出优秀的AI。下图描述了以上概念:(6)利用第三方软件。不要试图彻底改变现状并建立内部数据管道。对于一家成功的AI初创公司来说,选择合适的工具非常重要,这些工具可以帮助您的组织完成在采购、抓取、标准化、优化和集成数据方面可以自动化的任务。代表Alegion进行的维度研究报告发现,最终,71%的团队将培训数据和其他机器学习项目活动外包。在“构建还是购买”的争论中,选择“构建”的公司会花费更多的时间和金钱。请记住,您不是在雇用数据管理员,而是在雇用数据科学家。采用DataOps工具并寻找方法来自动化数据生命周期的准备和处理阶段将减少获得洞察力的时间。这从来都不容易,但也不必那么难。一些企业没有足够的数据,而另一些企业则挣扎于十多年来无法使用的价值。拥有数据并不自动意味着可以从中得出见解。组织未能确定从数据中获得洞察力所需的必要准备工作,因此出现了越来越多的创新和增长瓶颈。不是没有数据,而是有数据。数据是创建预测性和智能解决方案的重要因素,但它不仅仅是数据。找到问题,找到合适的人来解决它,并为他们提供有效解决问题和衡量其有效性所需的工具——这些是成功的ML的要求。