1956年,由数学系年轻助理教授约翰·麦卡锡带领的科学家团队聚集在新罕布什尔州的达特茅斯学院,计划进行一项雄心勃勃的为期六周的项目:创建一个可以“使用语言”的系统,形式化的抽象和概念,帮助人类解决各种存在的问题和自我完善”的计算机。随着项目大幕的拉开,人工智能(AI)领域正式出现在世界上。当时的科学家认为,“仅仅2个月加10名研究人员”就足以解决AI难题中的核心问题,在第一份AI提案中,赫然写着“只要能组织一批精挑细选的科学家一起研究”一个夏天,我们可以在一个或多个问题上取得重大进展。”然而,经过六十多年的探索,真正的人工智能时代还很遥远。我们还没有制造出具有思维能力的机器。h具有与人类儿童相同的思维和解决问题的能力,更不用说成人了。然而,探索的脚步从未停止,突破不断。如今,人工智能领域呈现出通用人工智能(AGI)与狭义人工智能(ANI)并立的局面。通用AI与狭义AI有何不同?正如麦卡锡及其同事所设想的那样,人工智能代表了一种人工智能系统,能够在没有人类明确指示如何去做的情况下学习任务和解决问题。这样的系统需要能够推理和抽象,并轻松地将获得的知识从一个领域转移到另一个领域。研究人员经过几十年的努力,认识到人工智能系统要满足上述所有条件确实很难。能够模仿人类思维过程的计算机人工智能的最初愿景也被更名为“通用人工智能”。根据维基百科,AGI是指“能够理解或学习人类方式并完成任意智能任务的机器”。目前,科学家、研究人员和意见领袖的普遍看法是,我们距离真正的AGI至少还有几个月的时间。十年发展。但在实现创造思维机器这一梦想的持续努力中,科学家们已经设法发明了各种有用的技术。狭义人工智能是这类技术的总称。所谓狭义人工智能,是指那些特别擅长处理单一任务或特定范围工作的系统。在大多数情况下,它们在某些领域的表现远好于人类。然而,一旦他们遇到的问题超出适用范围,效果就急转直下。换句话说,他们无法将知识从一个领域转移到另一个领域。比如谷歌旗下AI研究实验室DeepMind开发的机器人,可以在即时战略游戏中屠杀人类玩家《星际争霸2》;一旦对抗平台被其他类似的游戏如《魔兽争霸》或《命令与征服》取代,其竞技水平将会降低。一下子就降到了弱智级别。狭义人工智能虽然不能完全完成需要人类智能的任务,但在某些场景下还是非常有用的,已经在很多应用中发挥了作用。谷歌搜索查询现在可以使用窄人工智能算法来回答问题;narrowAI系统会在YouTube和Netflix中推荐用户可能感兴趣的视频,并在Spotify中按喜好整理每周音乐列表。事实上,在大多数情况下,每当我们听到一家公司“使用AI来解决一些问题”,或者在头条新闻中看到与AI相关的新闻时,他们指的都是狭义人工智能。不同类型的狭义人工智能技术目前市场上的狭义人工智能技术大致可以分为两类:符号人工智能和机器学习。符号人工智能(SymbolicAI,又称传统AI,GOFAI)长期以来一直是学术界研究的主要领域。符号人工智能需要程序员仔细定义规则来指导智能系统的行为。符号人工智能适用于规则可预测、清晰的应用场景。尽管符号AI在过去几年中受到的关注较少,但我们目前的大多数应用程序仍然基于此类方案。机器学习是狭义人工智能的另一个分支,通过实例构建智能系统。机器学习系统的开发人员负责创建模型并为其提供大量示例以完成“训练”过程。机器学习算法处理这些示例,并通过数据中的数学表示建立执行预测和分类任务的能力。例如,经过训练的机器学习算法可以从数以千计的银行交易及其结果(合法的和欺诈的)中学习,并预测新的银行交易是否涉嫌欺诈。机器学习的流派也包括许多不同的风格。深度学习是机器学习中的一种特殊类型,在过去几年中受到了全世界的关注。深度学习特别擅长执行数据内容杂乱的任务,例如计算机视觉和自然语言处理。强化学习是机器学习的另一个子集,大多数游戏机器人使用的正是这种狭义的AI类型。它的核心是通过反复试验来解决问题。为什么我们长期停留在狭隘的AI阶段?符号人工智能和机器学习只能反映人类智能的一个方面,不能将所有必要的部分结合起来共同建立一个涵盖人类完整智能的人工智能系统。也正是因为如此,我们长期停留在狭隘的AI阶段,难以前行。符号操作是人类思维过程的重要组成部分。但是,仅靠符号操作还不足以反映出完整的思想体系。我们在童年学习多种技能(走路、跑步、系鞋带、提东西、刷牙等),潜意识掌握了它。符号人工智能系统是非常脆弱的,开发者需要对他们面临的每一项任务给予精确的指导,系统只能在严格遵守定义规则的范围内运行。另一方面,机器学习算法更擅长模仿符号推理无法捕获的行为,例如人脸和语音识别,通过实例掌握人类熟悉的各种技能。在这方面,深度神经网络(深度学习算法中使用的结构)表现特别出色。它吸收大量数据并开发数学模型来表征其中的模式。但同样,人类的学习过程不能简单地概括为纯粹的模式匹配。例如,我们只需要看几张小猫的图片就可以认出我们在生活中见过的各种各样的小猫。对于人类来说,从认识猫是什么到准确识别猫是一个一站式的过程,但AI系统远远做不到,必须在学习中引入很多符号操纵因素(猫有四条腿,一条尾巴,体表大部分覆盖着毛皮,尖耳朵,三角鼻子等)。符号操作的缺失限制了深度学习和其他机器学习算法的能力。深度学习算法需要大量数据来执行人类仅需几个示例即可学习的任务。具体来说,用于计算机视觉的卷积神经网络(CNN)往往需要经过数以万计的图像才能完成对各种物体的识别训练。即便如此,当遇到新的光照条件或同一物体的不同视角时,这些模型很快就会失败。AlphaGo、AlphaStar和OpenAIFive等人工智能游戏系统必须经过数百万场比赛或数千小时的训练才能弄清楚特定比赛的确切运作方式。单从训练强度来看,这个量已经远远超过了任何一个人(甚至十个人)的一生游戏时间。机器学习系统也严格限制在其训练示例中涉及的上下文范围,这就是狭义AI一词的来源。例如,自动驾驶汽车中使用的计算机视觉算法在遇到异常情况时很容易做出错误的决定,例如消防车停放不当或汽车翻倒。狭义人工智能之后,下一步是什么?科学家们一致认为,我们目前拥有的任何AI技术都不包含人工通用智能的任何必要部分。更重要的是,对于人工智能下一步应该走向何方,大家甚至存在分歧。让我们看看扩展狭义人工智能的几个主流想法:认知科学家GaryMarcus提出,应该将基于规则的系统与神经网络相结合,构建混合AI系统。已经有一些工作示例表明,神经符号AI系统确实有望克服狭义AI所面临的数据限制。Marcus写道,“构建架构的第一步是将符号方法的优势与机器学习的洞察相结合,以开发更强大的技术来提取和概括抽象知识。”计算机科学家理查德·萨顿(RichardSutton)与人合着了一本关于强化学习技术的开创性书籍,他认为超越狭义AI的解决方案是可以进一步扩展的学习算法。萨顿认为,AI行业的进步很大程度上归功于“单位计算成本呈指数下降的持续趋势”,而不是我们实际上找到了更好地将人类知识和推理编码到计算机软件中的方法。深度学习先驱YoshuaBengio在去年的NeurIPS大会上谈到了System2深度学习算法。根据Bengio的说法,System2深度学习算法将能够执行某种形式的变量操作,而无需集成符号AI元素。Bengio指出,“我们要建造能够理解现实世界的机器,建立一个良好的环境模型,使其能够理解因果关系,并在这样一个真实的环境中采取行动来获取知识。”另一位深度学习先驱LeCunYann在今年的AAAI大会上谈到了自监督学习。自监督学习AI应该能够通过观察世界来学习,不再需要大量的标记数据。LeCun在会上解释说,“我认为自监督学习代表了未来。它将把我们的AI系统,尤其是深度学习系统带到一个新的水平,期望通过观察来学习关于现实世界的背景知识,甚至加深某种认知常识。”我们如何判断自己是否跨过了狭义AI的“坎”?目前,人工智能面临的一大挑战是人们总是为其持续发展设定目标。只要还有未解决的问题,我们就不能盲目断言通用智能的野心已经实现。从另一个角度来说,只要所有的问题都能解决,那么计算机就拥有了真正的人工智能。但矛盾的是,对于机器可以解决的问题,我们往往认为解决问题不需要智能。一个典型的例子是国际象棋,这种游戏曾被认为是人工智能领域的试金石,其重要性可与20世纪初导致基因研究取得突破的果蝇基因破译相媲美。但在1996年,计算机“深蓝”在棋盘上战胜了国际象棋世界冠军加里·卡斯帕罗夫。从那时起,人们开始认为国际象棋不足以证明计算机是否具有真正的智能——相反,它使用纯粹的计算能力来检查所有可能的棋步并选择对获胜最有利的选项。这限制了人工智能系统在原则层面的重要性,同样的问题也存在于目前擅长特定任务的狭义人工智能系统,例如在餐厅接听预订电话的聊天机器人。狭义人工智能的发展已经在很多方面证明了,我们原先认为必须由人类智能解决的问题,其实可以拆分成数学方程和简单的算法。就在最近,人们开始更多地通过更常规、更普遍的问题来衡量人工智能系统的能力。对此,我向大家推荐弗朗索瓦·肖莱写的《关于智能的度量(On the Measure of Intelligence)》。这篇论文是Keras深度学习库的创建者带给全人类的又一宝贵财富。在论文中,Chollet探讨了一个核心问题,即如何衡量AI系统解决未明确训练或指导的问题的能力。在本文中,Chollet提出了抽象推理语料库(ARC),用于能力假设的一系列问题式测试。就在今年早些时候,由谷歌组织的数据科学和机器学习竞赛平台Kaggle也发起了针对ARC数据集的挑战项目。虽然问题难度过高,几乎没有人能够在短时间内克服困难并获得资助,但该项目的提出仍然给了我们衡量AI真正智能水平的重要标尺。从狭义的人工智能到可以与人类竞争的真正思考机器,我们要走多远?这个问题的解决方案也是通用人工智能的关键基石。
