自人工智能诞生以来,研究人员一直试图通过让机器系统与人类玩游戏来测试它们的智能。人类智能的标志之一通常被认为是创造性思考的能力——考虑多种可能性并做出短期决策,同时牢记长期目标。如果计算机可以像人类一样解决困难的游戏,那么它们肯定可以处理更复杂的任务。从20世纪50年代出现的早期跳棋机器人,到深度学习技术支持的新型AI,智能系统已经能够在国际象棋、围棋、《DOTA》等游戏中击败世界顶尖的人类棋手。从这个角度来看,单纯根据解谜能力来判断机器智能水平的想法已经过时了。要衡量人工智能的极限,我们必须找到更可靠的方法。因此,组织在开发AI解决方案时采用的核心模式之一就是目标驱动系统模式。与其他人工智能模型一样,这种形式的人工智能可以解决一系列需要人类认知能力才能解决的常见问题。在这种特定模式下,机器的任务非常明确——找到解决问题的最佳方法。具体问题可能是在迷宫中找到一条平滑的路径、优化供应链或优化驾驶路线和空闲时间。无论实际需求如何,我们对AI系统的期望是通过反复试验来学习并找到解决问题的最佳(即使不那么直观)方法。强化学习和实验性试错学习强化学习是一种未被充分利用但最有趣的机器学习形式。与监督学习方法(人类先标记数据,然后机器使用标记数据完成学习)或无监督学习方法(机器自主尝试对信息进行分组和聚类以完成学习)相反,强化学习主要通过反复试验来学习,并且在迭代过程中不断匹配环境反馈和总体目??标,最终达到理想的性能。在不使用人工智能的情况下,组织依靠人类来创建程序和基于规则的系统来指导软件和硬件系统的流动。程序和规则虽然可以有效地管理资金、人员、时间等各类资源,但往往存在严重的弱点和刚性的局限性。这些系统的能力上限牢牢地受制于人类制定的规则水平;也就是说,这类机器根本无法真正学习,而只是以规则的形式重新理解人类的智能,以保证系统的正常工作。另一方面,目标学习人工智能系统的规则数量非常有限,我们可以通过迭代来帮助系统学习如何独立工作。基于此,人工智能可以全面优化整个系统,而无需依赖人类设定的脆弱规则。目标驱动系统在这方面已经证明了自己的价值,表明该系统完全有能力从极具挑战性的问题中发现“潜规则”并高效解决。也正是因为如此,目标驱动系统才在需要资源优化的领域爆发出巨大的能量。AI技术可以有效实现场景模拟和资源优化。通过应用这种通用的学习方法,我们可以引导人工智能系统学习如何针对特定目标或解决方案进行优化,并找到许多即使是具有多年经验的经验丰富的人类专家也难以检测到的解决方案。因此,目标驱动系统模式虽然不如识别、预测分析或对话模式等其他模式普遍,但显示出在广泛行业中的巨大增长潜力。在金融领域,基于强化学习的目标驱动系统也在蓬勃发展。以“机器人咨询”为例,这是一个自行学习以发现满足个人特定需求的众多储蓄和投资计划的程序。目标驱动系统模型还可以起到控制红绿灯系统的作用,找到保证最大通行能力的控制方法。供应链和物流行业也在使用此类系统来寻找包装和配送货物的最佳方式。此外,训练物理机器人和创建可以命令机器人行走和跳跃的算法也是目标驱动系统模型的理想阶段。目标驱动系统甚至被应用在电子商务和广告中,负责帮助客户找到最优的商品价格,并自动给出广告展示区的报价。目标驱动系统甚至在制药行业计算蛋白质折叠并寻找发现疾病的创新方法。这些系统选择最佳试剂和反应参数以设计所需产品的能力也使它们成为高度复杂的制药或治疗工作流程中的新资产。目标驱动的系统模式能否成为实现通用人工智能(AGI)的关键?实验和反复试验是一种行之有效的好方法,并且可能适用于几乎所有问题。值得一提的是,DeepMind是一家致力于将机器智能变为现实的机构。该机构成功解决了一系列人们认为机器永远无法解决的难题。在他们看来,基于强化学习的目标驱动系统很可能是解锁机器人终极形态的关键——一种可以学习一切并完成任何任务的机器。“通用智能”的概念类似于人脑,这意味着通用人工智能不再像现有的真实AI系统那样只能专注于狭隘的单一学习任务,而是可以将一个领域的所有知识和经验学习到另一个领域域-两者之间无需进行广泛的再培训。DeepMind成立于英国,2014年被谷歌收购。他们希望超越目标驱动系统和其他AI模型的能力,解决最复杂的机器智能问题。从专业围棋AI系统AlphaGo的设计开始,DeepMind迅速开发出AlphaZero,它可以从零开始学习任何棋局,并迅速获得远超常人的技术水平。过去,AlphaGo需要几个月的时间才能学会棋艺,而现在基于强化学习的AlphaZero只需几天就可以完成。从零开始,以提高胜率为唯一目标,AlphaZero在多达100场测试赛中击败了AlphaGo。正如科技行业的从业者乐于使用新兴成果一样,DeepMind也在努力将新发现转化为可能的实际应用。AlphaZero是使用当时最前沿的技术创建的,已被用于推进神经科学和行为心理学等领域的研究。此外,人们也在利用这些技术开发强大的通用学习算法,或许再过几年人工智能领域就会真正取得突破。对于整个人工智能行业来说,机器学习可以说是发展过程中的一个十字路口。目前应用最广泛的算法主要负责解决重要但相对简单的问题。尽管机器已经证明自己能够识别图像、理解语音、发现模式、识别异常并做出预测,但此类算法在准确执行之前仍然需要大量的训练数据和有限的学习任务。在这种情况下,机器学习需要大量的数据和相当大的计算资源。如果你要解决的任务足够复杂,你可能需要准备PB甚至更高的训练数据,投入数十万美元租用GPU密集型计算资源,等待几个月。很明显,单靠这种蛮力方法,我们永远无法实现通用人工智能。目标驱动系统模型是七种主流人工智能模型中使用频率最低的一种,但也是最有可能突破数据和计算密集型壁垒的关键。好消息是,如今目标驱动的系统越来越多地在具有实际用例的项目中实施。凭借其光明的发展前景,它也成为最受关注和最期待的模式之一。
