当前位置: 首页 > 科技观察

Bengio、LeCun等联合发布NeuroAI白皮书:智能的本质是感觉运动能力,AI迎来了具身图灵测试的挑战

时间:2023-03-12 03:31:40 科技观察

神经科学在历史上一直是人工智能发展的关键驱动力和灵感,尤其是视觉、基于奖励的学习、与物理世界的互动以及语言,人类和其他动物擅长的领域在这些领域取得了长足的进步。但近年来,人工智能的研究方法似乎正在远离神经科学。与此同时,人工智能正在努力追赶人类智能。在此背景下,人工智能回归神经科学的热潮正在形成。近日,一份白皮书发表了“NeuroAI将催化下一代人工智能革命”的宣言。这份名为《迈向下一代人工智能:催化神经人工智能革命》的白皮书汇集了两位图灵奖获得者YoshuaBengio和YannLeCun,以及一群致力于机器学习和神经科学结合的科学家。他们呼吁:为加速人工智能的进步,发挥其巨大潜力,必须致力于NeuroAI的基础研究。白皮书首先提出,生物智能的基本要素在于动物与世界进行感觉运动互动的能力。从这个前提出发,他们提出了TheEmbodiedTuringTest(具身图灵测试)作为NeuroAI的终极挑战。它的核心在于先进的感觉运动能力,具体包括与世界的互动、动物行为的灵活性和能源效率等特征。.同时,白皮书还设想了一条应对具身图灵测试的路线,将人工智能系统的具身图灵测试从进化史的角度分解为从中低级生物到智能的具身图灵测试更复杂的生物体。1NeuroAI:智能的本质在于感觉运动人工智能向神经科学的回归是必然的。几十年前,计算神经科学就播下了人工智能革命的种子,当时神经科学家McCulloch和Pitts在1943年首次提出了神经元特性的数学表示,当时他们试图了解大脑是如何计算的。冯·诺依曼发明的“冯·诺依曼计算机体系结构”实际上起源于最早构建“人工大脑”的工作。他从1940年代非常有限的大脑知识中汲取灵感。推动最新AI浪潮的深度卷积网络建立在人工神经网络(ANN)之上,其灵感直接来自对猫视觉处理电路的研究。同样,强化学习(RL)的发展直接从动物在学习过程中的神经活动中汲取灵感。几十年后,人工神经网络和强化学习成为人工智能的主流技术,“通用人工智能”的远景目标似乎触手可及。然而,与这种乐观主义相反的是,许多一线AI研究人员认为,我们仍然需要取得重大的新突破,才能构建出可以做人类所做的一切事情的人工系统,不仅是人类,甚至包括老鼠。如此简单的动物。目前的人工智能还远远没有达到这个目标:人工智能可以在象棋、围棋等游戏中轻松击败任何人类对手,但不够稳健,面对新事物时常遇到困难;不能做“走到架子上,移开棋盘,排列棋子,在游戏中移动棋子”这样简单的动作;人工智能的感觉运动能力还不能与四岁儿童相比,甚至更简单的动物也不能。没有比较;人工智能缺乏与不可预测的世界互动和处理新情况的能力,这是所有动物不费吹灰之力就能获得的基本能力。因此,越来越多的人工智能研究者怀疑,如果继续沿用目前的路径,将难以解决上述问题。由于我们的目标是让AI更加自然智能,因此我们可能需要从自然智能系统中获得新的灵感。虽然卷积人工神经网络和强化学习等事物受到神经科学的启发,但当前的大多数机器学习研究都在走另一条路,使用的方法受到几十年前神经科学发现的启发,例如,基于大脑注意力机制的神经网络。现代神经科学确实还在影响着AI,但是影响还是很小的。这是一个错失的机会。在过去的几十年里,我们积累了大量关于大脑的知识,这使我们能够深入了解支撑自然智能的解剖学和功能结构。正是在这样的背景下,这些科学家在这份白皮书中发表声明:NeuroAI是神经科学与人工智能交叉领域的一个新兴领域,其前提是更好地理解神经计算将揭示智能的基本组成部分,并且它将催化人工智能的下一次革命,最终实现能力媲美甚至超越人类的人工智能代理。他们认为,现在是开展大规模工作以识别和理解生物智能原理并将其抽象出来用于计算机和机器人系统的合适时机。那么,生物智能最重要的元素是什么?他们认为,适应性、灵活性和从稀疏观察中做出一般推论的能力是智力的基本要素,这些要素已经以某种形式存在于我们经过数亿年进化的基本感觉运动回路中。尽管抽象思维和推理通常被认为是人类独有的智能行为,但正如人工智能先驱Moravec所说,抽象思维只是“一种新技能,也许还不到10万年......,更强大,但通常是无意识的感觉运动知识。”这当然是个好消息,因为大鼠、小鼠和非人灵长类动物可以作为自然智能实验中更容易处理的模型,如果人工智能能够匹配它们的感知和运动能力,那么人类智能的步伐将小得多。因此,如果我们弄清楚所有动物在与世界的特定感觉运动交互中所具有的核心能力,NeuroAI肯定会带来重大进步。2NeuroAIGrandChallenge:TheEmbodiedTuringTest1950年,AlanTuring提出了“模仿游戏”,用于测试机器表现出与人类相同或无法区分的智能行为的能力。在那场比赛中,人类评委必须评估真人与经过训练以模仿人类反应的机器之间的自然语言对话。图灵提出,相对于“机器是否会思考”这个无法回答的问题,我们可以确定的是机器的对话能力是否可以与人的对话能力区分开来。这里隐含的一点是,语言代表了人类智能的巅峰,因此会说话的机器一定是智能的。一方面,图灵是对的,但另一方面他又错了。虽然没有人工智能通过图灵测试,但最近在大型文本语料库上训练的语言系统取得了令人信服的对话成功,这也在一定程度上揭示了将智能、代理甚至意识结合起来是多么容易。归因于对话者。但与此同时,这些系统在某些推理任务上继续表现不佳,突显出图灵忽视了一个事实,即智能超越语言能力。当前自然语言处理(NLP)系统所犯的许多错误也说明了AI从根本上缺乏语义、因果推理和常识。对于这些模型,单词的意义在于它们的统计共现而不是它们的现实世界基础,因此即使是最先进的语言Commonsense仍然表现不佳。最初的图灵测试并没有探索人工智能以动物共有的灵活方式理解物理世界的能力,而是建立了一个简单的定性标准来判断我们在构建人工智能方面的进展。而这方面的理解和能力,可能是基于人类的感知和运动能力,经过无数代的自然选择磨练出来的。对此,作者在白皮书中提出了一种扩展的“具身图灵测试”(TheEmbodiedTuringTest),其中包括高级感觉运动能力,可以对人工智能与人类和其他动物的交互进行基准测试和比较。以动物为例,每一种动物都有自己独特的一套能力,所以它们也定义了自己的具身图灵测试,比如测试人造河狸建坝的能力、松鼠跳树的能力等等。其中,许多核心感觉运动能力几乎为所有动物所共有,而动物能够快速进化出适应新环境所需的感觉运动技能,也表明这些核心技能为它们提供了坚实的基础。以下是白皮书中描述的感觉运动能力的一些共同特征。与世界互动有目的地四处走动并与环境互动是动物的特征。尽管机器人技术最近取得了一些进展,例如最优控制、强化学习和模仿学习,但它距离动物水平的身体控制和物体操纵还很远。作者指出,由于神经科学可以提供模块化和分层架构的指导,当这些架构应用于人工智能时,人工智能也可以具备这些能力。不仅如此,神经科学还为我们设计AI系统提供了一些原则性的指导,例如部分自主(层级中的低层模块如何在没有高层模块输入的情况下半自主地行动)和阶段控制(最初由慢速控制)计划过程产生的运动如何最终转移到快速反射系统)等。了解特定的神经网络如何参与不同的任务——例如运动、四肢、手和手指的精细控制、感知和动作选择-可能为如何在机器人技术中实施此类系统提供途径,并且可能其他形式的“智能”在更多认知领域提供解决方案。例如,将电路原理纳入低级运动控制有助于为AI的高级运动规划提供更好的基础。动物行为的灵活性理解特定神经网络的另一个目标是开发人工智能系统,该系统可以以与个体动物产生的行为范围相呼应的方式参与大量灵活多样的任务。如今,AI只需使用屏幕上的像素和游戏分数,就可以轻松学会在《霹雳火》等视频游戏中超越人类。然而,与人类玩家不同的是,这些人工智能很脆弱,对小扰动非常敏感,稍微改变游戏规则或输入几个像素可能会导致灾难性的糟糕表现。那是因为AI学习了像素到动作的映射,不涉及对游戏中的代理、对象和控制它们的物理的理解。同样,自动驾驶汽车本身并不了解箱子从它前面的卡车上掉下来的危险,除非它确实看到箱子从卡车上掉下来导致糟糕结果的情况。即使它接受过板条箱掉落危险方面的训练,系统也可能认为从前面的汽车上吹下来的空塑料袋是一个不惜一切代价要避免的障碍,那是因为它实际上并不知道塑料袋是什么,或者它对身体的威胁有多大。这种无法处理训练数据中未出现的场景是对广泛依赖的AI系统的主要挑战。要想在不可预测和不断变化的世界中取得成功,代理人必须灵活并通过正常情况掌握新的变化,这就是动物所做的。由于动物在现实世界的互动中打下了坚实的基础,因此随着它们的进化和发展,它们天生就具备了茁壮成长所需的大部分技能,或者从有限的经验中迅速获得这些技能。所以很明显,从头开始训练特定任务并不是动物获得技能的方式。动物不会进入白板世界,然后依靠大量标记的训练集来学习。尽管机器学习已经找到了避免这种“空白状态”的方法,包括自我监督学习、迁移学习、持续学习、元学习、一次性学习和模仿学习,但这些方法并没有接近机器学习中发现的灵活性。动物。为此,作者认为,理解构成现实世界(即使是简单动物)行为灵活性基础的神经回路级原理,有可能大大提高人工智能的灵活性和实用性。也就是说,我们可以通过利用进化已经参与的优化过程,大大加快对现实世界交互的通用电路的搜索。能源效率目前,我们的大脑已经克服的人工智能面临的主要挑战之一是能源效率。例如,训练GPT-3等大型语言模型需要超过1,000兆瓦时,足以为一个小镇供电一天。与生物系统的能源效率相比,例如人脑使用约20瓦,用于训练AI的能源总量很大且增长迅速。大脑和计算机之间对功率需求的差异源于信息处理的差异。在算法层面,现代大规模人工神经网络(如大规模语言模型)依赖于大型前馈架构和随着时间的推移自我关注过程序列,往往忽略了递归处理连续信息的潜在力量。目前,由于我们没有在循环网络中进行信用分配的有效计算机制,大脑利用灵活的循环架构处理长期序列的方式显然可以有效地解决时间信用分配问题——甚至比当前的人工神经网络使用的更有效前馈信用分配机制更有效。如果我们能用大脑来指导如何为循环回路设计高效的训练机制,我们或许能够提高我们处理顺序数据的能力,同时进一步提高系统的能效。其次,在实现层面,生物神经元主要通过传递动作电位(脉冲信号)进行交互,这是一种异步通信协议。就像传统数字元素之间的相互作用一样,神经元的输出可以看作是一串0和1,但与数字计算机不同的是,“1”(即峰值)比“0”消耗的能量多几个百分点.数量级。因为生物电路以稀疏尖峰运行——即使是非常活跃的神经元也很少超过10%的占空比,而且大多数以较低的速率运行——它们的能效要高得多。此外,其他因素也可能有助于生物网络的能源效率。例如,即使某些组件非常不可靠或“嘈杂”,也可以有效地计算生物网络。突触放电——神经元交流的方式——可能非常不可靠,以至于每10条信息中只有1条被传递。电路的组织方式使得尖峰序列高度可变,这种特性可能允许神经电路执行概率推理。这是一种在不确定性下非常稳健的计算形式,虽然目前正在进行大量研究以利用峰值网络的潜力,但到目前为止还没有可以与生物电路的能源效率相媲美的“杀手级应用”。手头的主要问题是“神经形态芯片”既不复制先天神经回路功能,也不易训练,因此虽然它们更节能,但不如耗电的数字芯片有用。在这样的情况下,作者提出要在AI中实现更高的能效,不仅可以借鉴稀疏尖峰网络的思想,还可以提供具有神经回路功能和学习规则的神经形态芯片。3如何应对EmbodiedTuringTest那么,我们如何开发满足EmbodiedTuringTest的AI呢?作者提出,或许可以从进化史的角度,一步一步来。例如,让绝大多数动物进行有目标的运动,例如靠近食物和远离威胁。最重要的是更复杂的技能,包括结合不同的感官,如视觉或嗅觉,使用不同的感官信息来区分食物和威胁,导航到以前的位置,测量刺激和威胁以实现目标,以及以准确的方式与世界互动互动服务于目标等等。这些复杂的能力存在于蠕虫等简单的生物体中,也存在于鱼类和哺乳动物等更复杂的动物中,这些能力被设计为与新策略相结合,以实现更强大的行为策略。这种进化观点提出了一种解决图灵测试的策略,方法是将其分解为一系列相互依赖的增量挑战,并迭代优化这一系列。此外,蠕虫、苍蝇、鱼类、啮齿动物和灵长类动物等代表低级和中级挑战的生物体是神经科学研究中广泛使用的系统,我们可以借鉴先前关于行为模式背后的回路和机制的知识这些动物。等知识积累,利用虚拟环境和虚拟生物在计算机上进行相关研究。为了达到预期的行为灵活性水平,通过图灵测试的人工智能将面临一系列针对物种的测试,以探索自我监督学习、持续学习、迁移学习、元学习和终身记忆等,这也可以通过标准化进行测试,因此我们可以衡量研究进展。最终,成功的虚拟有机体可以通过机器人的努力适应物理世界,并用于解决现实世界的问题。要实现上述目标,需要大量的资源和非传统人工智能和神经科学领域的成果,如心理学、工程学和语言学。除了简单地利用这些学科的现有专业知识外,我们的当务之急是培养擅长工程/计算科学和神经科学的新一代人工智能研究人员。这些研究人员将利用数十年的神经科学工作来为人工智能研究制定全新的方向。最大的挑战将是确定如何利用神经科学、计算科学和其他相关领域的协同作用来推进探索,即确定大脑回路、生物物理学和化学的哪些细节是重要的,哪些细节可以用于人工智能应用程序。忽视。因此,我们迫切需要在不同领域受过一定训练的研究人员,能够以计算机友好的方式抽象神经科学知识,帮助设计实验,从而产生新的与人工智能相关的神经生物学研究成果。其次,我们需要创建一个能够开发和测试这些虚拟代理的共享平台。在创建迭代、体现图灵测试和进化人造有机体以满足这一需求的过程中,我们将面临的最大技术挑战之一是计算能力。目前,在专门的分布式硬件上,为单个特定任务(例如控制3D身体)训练大型神经网络模型可能需要数天时间。第三,支持神经计算的基础理论和实验研究。在过去的几十年里,我们对大脑有了很多了解,我们开始越来越多地了解它的单个细胞、神经元,以及这些东西作为简单电路的一部分如何发挥作用。有了这些模块的知识,我们的下一步就是将我们的精力转化为??探索大脑的集成智能系统是如何工作的。探索这个整体需要深入了解1000种不同类型的1000亿个神经元是如何连接在一起的,并且需要了解每个神经元与其他数千个神经元之间灵活和适应性强的关系。计算机的连接也需要理解计算能力,也就是智能。因此,我们必须对大脑进行逆向工程,并抽象出其工作原理。请注意,虚拟代理的发展将大大加速这一过程,因为虚拟代理允许直接比较真实动物和计算机模拟动物的实验,这将揭示稳健的控制、灵活的行为、能源效率以及神经回路级特性和机制的内在特性对智能行为至关重要。利用神经科学和人工智能之间强大的协同作用需要项目和基础设施支持来组织和实现跨学科的大规模研究。4结论尽管神经科学在推进AI方面有着悠久的历史及其未来增长的巨大潜力,但AI社区中的大多数工程师和计算科学家并没有意识到神经科学可以利用它。典型的计算机科学课程很少提及神经科学对冯诺依曼、图灵和其他计算理论巨匠思想的影响;NeurIPS等前沿人工智能会议已被用于分享关于计算神经科学和机器学习的演讲。学习的最新成果,但现在参加会议的人几乎只关注机器学习而忽略了神经科学。“工程师研究鸟类不是为了制造更好的飞机”是一句俗语。但这个类比不成立,部分原因是航空先驱确实研究过鸟类,而今天学者们仍在研究它们。而且,这个类比在更根本的层面上是失败的:现代航空工程的目标不是实现“鸟级”飞行,人工智能的主要目标是实现或超越“人级”智能。正如计算机在许多方面(例如计算素数的能力)超过人类一样,飞机在速度、航程和载货量方面也超过鸟类。如果航空工程师的目标确实是打造一台具备“鸟级”能力的机器,可以穿过茂密的森林,轻轻降落在树枝上,那么这些工程师就不得不密切关注鸟类的情况了。做吧。同样,如果人工智能的目标是实现动物级别的常识感觉运动智能,研究人员最好向动物学习以及动物在这个不可预测的世界中进化的行为方式。