企业使用AI的一个复杂因素是这个话题包含了多种不同的底层技术。这些技术中的大多数都具有许多替代功能。技术与功能的组合非常复杂,表1-1列出了7项关键技术,包括对每项技术的简要描述,以及它们可以实现的一些典型功能或应用。表1-1人工智能的关键技术本文将更深入地描述该表中的各项技术及其作用。我还将讨论每种技术在商业AI世界中的流行程度。在我的日常工作中,我是一所商学院的教授(并与许多不同的公司合作过),但我也是德勤战略和分析实践的高级顾问,该实践整合了人工智能方面的咨询工作。下面是对每项技术及其作用的深入描述。01~03StatisticalMachineLearning,NeuralNetworks,andDeepLearning机器学习是一种自动将模型拟合到数据并通过训练模型从数据中“学习”的技术。机器学习是人工智能最常见的形式之一。在2017年德勤对250名公司已经在探索人工智能的经理进行的“理解认知”调查中,58%的受访公司在其业务中采用了机器学习。它是很多人工智能方法的核心技术,有很多版本。公司内部和外部数据(尤其是这些外部数据)的爆炸式增长,使他们有必要使用机器学习来充分理解这些数据。神经网络是1960年代出现的一种更复杂的机器学习形式,用于分类应用,例如确定信贷交易是否存在欺诈。它根据输入、输出、可变权重或将输入与输出相关联的“特征”来分析问题。它类似于神经元处理信号的方式,但将其与大脑进行比较有点牵强。最复杂的机器学习形式将涉及深度学习,或通过多层次特征和变量预测结果的神经网络模型。由于当前计算机体系结构的处理速度更快,此类模型能够处理数以万计的特征。与早期形式的统计分析不同,深度学习模型中的每个特征通常对人类观察者来说意义不大。这样做的结果是模型难以使用或解释。德勤调查的人中只有34%使用深度学习技术。深度学习模型使用一种称为反向传播的技术通过模型进行预测或对输出进行分类。AI技术推动了该领域的许多最新进展,从在围棋比赛中击败人类专家到使用反向传播的深度学习对互联网图像进行分类。多伦多大学和谷歌的GeoffreyHinton通常被称为深度学习之父,部分原因是他早期在反向传播方面的工作。机器学习采用了数百种可能的算法,其中大部分都有些深奥。它们的范围从梯度提升(一种构建模型的方法,解决先前模型的错误,从而增强预测或分类能力)到随机森林(充当决策树模型集合的模型)。越来越多的软件工具(包括DataRobot、SAS和Google的AutoML)支持机器学习模型的自动构建,这些模型尝试许多不同的算法以找到最成功的算法。一旦通过训练数据找到能够进行预测或分类的最佳模型,就可以部署它并对新数据进行预测或分类(有时称为评分过程)。除了使用的算法之外,机器学习的另一个关键是模型的学习方式。监督学习模型(迄今为止在商业中最常用的类型)使用一组输出被标记的训练数据进行学习。例如,一个试图预测银行欺诈的机器学习模型需要在一个明显构成欺诈案例的系统上进行训练。这并不容易做到,因为实际欺诈的频率可能低至十万分之一(有时称为不平衡分类问题)。监督学习与评分模型中部署的传统分析方法(如回归分析)非常相似。在回归分析中,目标是创建一个模型,该模型使用一组与输出相关且其值已知的输入变量来预测已知结果。一旦开发出模型,它就可以用于根据相同输入变量的已知值预测未知结果。例如,根据患者的年龄、体力活动水平、热量消耗和体重指数,我们可以开发一个回归模型来预测他患糖尿病的可能性。我们对被诊断患有或未患有糖尿病的患者建立模型(通常使用所有可用数据来建立回归模型)。一旦找到合适的预测回归模型,它就可以用于根据一组新数据预测未知结果(当输入变量达到一定水平时患者患糖尿病的可能性)。随后的活动(在回归分析和机器学习中)称为评分。回归过程与监督机器学习相同,除了:在机器学习中,用于开发(训练)模型的数据称为训练数据,它可以是明确保留用于训练目的的数据的子集;在机器学习回归中,通常针对预测已知的另一数据子集验证经过训练的模型;在回归中,可能没有必要使用模型来预测未知结果,而在机器学习中,对结果做出假设;有许多不同的算法类型可用于机器学习,而不是简单的回归分析。通常更难开发无监督模型来检测未标记数据中的模式并预测未知结果。强化学习是第三种变体,这意味着机器学习系统有一个目标,并且在朝着目标迈出的每一步中都会以某种形式得到奖励。它在玩游戏时非常有用,但也需要大量的数据(很多情况下,太多的数据对这种方法没有用)。需要指出的是,监督机器学习模型通常不会持续学习。他们从一组训练数据中学习并继续使用相同的模型,除非使用一组新的训练数据来训练新模型。机器学习模型是基于统计的,应该将它们与传统分析进行比较,以阐明它们的增量价值。它们往往比基于人为假设和回归分析的传统“手动”分析模型更准确,但也更复杂且难以解释。与传统的统计分析相比,自动化机器学习模型更容易创建,并且可以揭示更多数据细节。考虑到学习所需的数据量,深度学习模型在图像和语音识别等任务中表现出色(在这些任务上远远优于以前的自动化方法,并且在某些领域接近或超过人类的能力)。04自然语言处理自1950年代以来,理解人类语言一直是人工智能研究人员的目标。该领域称为自然语言处理(NLP),包括语音识别、文本分析、翻译、生成的应用程序和其他与语言相关的目标。在UnderstandingCognition调查中,53%的公司正在使用NLP。NLP有两种基本方法:统计NLP和语义NLP。统计NLP基于机器学习,其性能比语义NLP提高得更快。它需要一个大的“语料库”或语言系统来学习。例如,在翻译中需要大量的翻译文本,而通过统计分析可以发现,西班牙语和葡萄牙语中的amor与英语中的love一词在统计上高度相关。这是一种有点“蛮力”的方法,但它通常非常有效。语义NLP是近十年来唯一现实的选择,如果系统可以利用单词、语法和概念之间的关系进行有效训练,那么它是非常有效的。语言培训和知识工程(通常是指为特定领域创建的知识图谱)可能会消耗大量的人力和时间。然而,它需要开发知识体或单词和短语之间关系的模型。虽然创建语义NLP模型很困难,但一些智能代理系统已经在使用这种方法。NLP系统的性能应该通过两种方式来衡量。一是看它能听懂多少百分比的口语。随着深度学习技术的发展,这个指标在不断提高,经常超过95%。另一种衡量NLP的方法是看它能回答多少种不同类型的问题,或者它能解决多少种问题。这通常需要语义NLP,但由于这方面没有重大的技术突破,问答系统和问题解决系统都是上下文相关的,必须进行训练。IBMWatson擅长回答《危险边缘》,但它不能回答《命运之轮》(命运之轮,一档综艺节目),除非它被训练(通常是劳动密集型的方式)。也许将来深度学习会应用到问答上,但现在还没有。05基于规则的专家系统20世纪80年代,人工智能的主导技术是基于“if-then”规则集的专家系统,在那个时代广泛应用于商业领域。现在人们往往认为它不那么先进,但2017年德勤的一项“理解认知”研究发现,49%的引入人工智能的美国公司使用了这项技术。专家系统需要人类专家和知识工程师在特定知识领域构建一套规则。例如,它们通常用于保险承保和银行信贷承保(但也用于Folgers的咖啡烘焙或金宝汤罐头的原料制作等深奥领域)。专家系统在一定程度上工作得很好并且很容易理解。然而,当规则数量很大(通常超过几百个)并且规则开始相互冲突时,它们往往会崩溃。而且,如果知识领域发生变化,更改规则将既困难又费时。基于规则的系统自早期鼎盛时期以来并没有太大改进,但大量使用它们的行业,如保险和银行业,都希望有新一代基于规则的技术。研究人员和供应商已经开始谈论“自适应规则引擎”,它会根据新数据或规则引擎和机器学习的组合不断修改规则,但它们实际上还没有广泛应用。06物理机器人物理机器人已经广为人知,全球每年安装的工业机器人超过200,000台。在美国UnderstandingCognition调查中,32%的公司在一定程度上使用了实体机器人。他们在工厂和仓库等场所执行提升、重新定位、焊接或组装产品等任务。从历史上看,这些机器人一直由精密的计算机程序控制以执行特定任务。然而,今天的机器人与人类的合作能力越来越强,也更容易训练,只需要根据预定的任务移动机器人的部件即可。随着其他人工智能功能嵌入他们的“大脑”(实际上是他们的操作系统),他们也变得更聪明。随着时间的推移,我们在AI的其他领域看到的改进很可能会被整合到物理??机器人中。07机器人流程自动化机器人流程自动化(RPA)技术执行结构化数字任务(即涉及信息系统的任务),就好像人类用户根据脚本或规则工作一样。关于RPA是否属于人工智能/认知技术的范畴存在争议,因为它不是很智能。但由于RPA系统非常流行,自动化程度越来越高,而且越来越智能,我也认为它是AI世界的一部分。一些人将它们称为“数字化劳动力”,与其他形式的人工智能相比,它们价格低廉、易于编程且行为透明。如果你会鼠标操作,懂流程图,懂一些if-then业务规则,那么你就可以理解甚至开发RPA。这些系统也比其他方法更容易配置和实施,例如用编程语言开发您自己的程序。RPA并不真正涉及机器人,它只是服务器上的计算机程序。它依赖于工作流、业务规则和信息系统集成的“表示层”的组合,作为系统的半智能用户工作。有些人将RPA与电子表格中的宏进行比较,但我认为这种比较不公平,RPA可以执行更复杂的任务。它还与业务流程管理(BPM)工具进行了比较,业务流程管理(BPM)工具可能具有一些工作流功能,但通常旨在记录和分析业务流程,而不是实际将其自动化。一些RPA系统已经具有一定程度的智能。他们可以“观察”他们的人类同事所做的事情(例如回答常见的客户问题),然后模仿他们的行为。其他人将过程自动化与机器视觉结合起来。与物理机器人一样,RPA系统正慢慢变得更加智能,其他类型的AI技术也被用来指导它们的行为。我分别描述了这些技术,但实际上它们正在越来越多地结合和集成。但是,就目前而言,对于业务决策者来说,了解什么技术可以完成什么任务是非常重要的。GlobalInc.首席信息官KrishnaNathan指出,他2018年的主要优先事项之一是“帮助我的利益相关者了解AI能做什么和不能做什么,以便我们能够以正确的方式使用它”。也许在未来,这些技术将如此混杂在一起,以至于这样的理解将不再是必要的,甚至是不可行的。
