当前位置: 首页 > 科技观察

Hinton预言的「AI将拥有常识」如何实现?剑桥最新研究:从小狗学起

时间:2023-03-14 20:28:38 科技观察

辛顿“人工智能将具有常识”的预言如何实现?剑桥最新研究:从小狗身上学习常识一直是困扰人工智能发展的难题。即使AI能在围棋比赛中打败人类,像GPT-3一样机智却无法理解“太阳有几只眼睛”这个问题是违反直觉的。而最近,来自谷歌DeepMind、帝国理工学院和剑桥大学的研究人员率先提出了人工智能可以从动物身上学习常识的想法!以后可以像小狗一样训练agent。GeofferyHinton曾预言,十年之内我们将拥有具有常识的计算机。这些计算机没有灵魂,它们只是知道人类世界是如何运作的,熟悉我们的日常生活。他们知道炉子很热,人们通常不会买12个烤箱等。什么是常识?最通俗的解释是指无需特殊学习而具有的与生俱来的判断能力,或者是人人皆知的知识,无需解释或论证。几十年来,常识一??直是困扰人工智能发展的无解之谜。AI就算能在围棋、雅达利游戏中打败人类,但和GPT-3一样聪明,也无法理解“太阳有几只眼睛?”这个问题。这是违反常识的。在寻找如何让人工智能具备常识的漫长过程中,研究人员往往从婴幼儿入手,从神经科学和行为科学中寻找灵感和答案。最近,谷歌DeepMind、伦敦帝国理工学院和剑桥大学的人工智能研究人员率先提出人工智能可以从动物身上学习常识!这不是人工智能第一次向动物学习。AI大师YannLeCun曾说过:“家猫的常识比最聪明的机器要多得多。”人类的常识是基于许多其他动物所拥有的一系列知识。在基本能力之上,通过深度强化学习,agent或许可以从动物身上学到很多东西。该团队在《 CellPress Reviews 》期刊上发表的论文《人工智能与动物常识》(人工智能与动物常识)中写道:“动物认知提供了一种易于理解的、非语言的、智能行为的概要,提出了一种实验方法,作为评估基准,指导环境和任务的设计。”向小狗学习?像训练宠物一样训练智能体在著名的伊索寓言中,实验者让鸟类将物体扔进装有水和漂浮食物的玻璃管中,提高水位以获得食物。训练动物的过程通常涉及目标和奖励。比如在训练小狗时,如果动作正确,就奖励它食物。这类似于使用深度强化学习来训练代理的方式。相比之下,其他形式的人工智能,例如助手Alexa或Siri,则不具备这种在迷宫中寻找奖励或食物的能力。此前,认知行为科学家发现了比之前认为的智力水平更高的动物,包括乌鸦的复仇能力和海豚的自我意识。(孩子们要到一岁半才能意识到自己在镜子中的形象。)很多时候,动物甚至会采取欺骗或诡计来达到目的。例如,黑猩猩通过将视线从想要的物体上移开来迷惑竞争对手,而松鸦则通过假装将食物存放在错误的位置来保护它们隐藏的食物。在实验中,研究人员将测试场景中的动物与强化学习智能体进行对比,使用一种新的方法来测试人工智能系统的认知能力。文章《人工智能与动物常识》详细介绍了鸟类和灵长类动物的认知实验。这个实验的最初目的是确定鸟类是否能够区分与任务相关的功能性和非功能性物体,并探索它们对相关因果关系的理解程度。会做饭才能吃得好,学会明因果,先试错!松鼠会想方设法撬开坚果壳,把里面的果实挖出来;有些鹦鹉还非常善于从各种容器中取出食物;打开它”的反应。这是为什么?这是因为他们的意识中有“因果”的概念。即“只要我打开它,就会有食物。”这也是其中的一部分要训??练的AI。作者想到了训练动物的方法,发现“试错法”非常有效。起源于动物认知实验,用于测试强化学习代理获得的常识.如上图所示,(A)使用四种不同形式的管道来测试物理认知能力,如果棒子从错误的一端拔出,食物就会丢失。通过试错适应不同的情况(i),只学会了表面联想的动物往往在迁移任务[变体](ii)到(iv))]中表现不佳],而获得因果理解的动物往往在测试中第一次表现良好时表现不佳。(B)一个看不见的位移任务被用来测试理解对象永久性的ng。用食物做诱饵后,将杯子移动到右侧所示的最终排列。然后动物们必须选择装有食物的杯子。当然,杯子是不透明的,但是食物的位置却一清二楚。能够理解这种看不见的位移的动物在所有四种不同情况下都表现出色,即使它以前从未见过所讨论的物体。足够逼真的3D世界模拟是训练的必要条件,包括可能破裂或被撬开的贝壳、无法拧开或撬开的瓶盖、可撕开的包装盒等等。训练RL智能体的3D环境(A)和DeepMind游戏室环境(B)与前者相同,但智能体可以在场景中移动并从智能体的角度推动物体。在游戏室设置中,智能体还可以拾取和放下物体,成功执行自然语言命令(例如“将泰迪熊放在蓝色立方体上”)会得到奖励。在动物AI环境中,代理人通过移动绿色球体获得奖励。更有趣的是,为了准确模拟动物与食物的因果关系。研究人员将绿色物体定位为“食物”,触摸时会产生积极的奖励,然后会像被吃掉一样消失。更高层次的常识:类比和隐喻,AI:我太难了总之,常识是人类独有的吗?不,根据研究人员的说法,常识取决于一些基本概念。例如,你面前的物体是什么?它会占用多少空间?以及因果关系。而且,这些理解深深地铭刻在脑海中,不会随着时间而改变。然而,动物表现出的常识可能包括对奖励的认可。“如何构建这样的人工智能技术仍然没有答案。但我们提倡一种方法,让RL代理通过与丰富的虚拟环境的扩展交互来获得他们想要的东西。”因此,通过在适当的任务上训练智能体,很可能将常识传授给人工智能。当然,常识不仅限于这些。物理学只是常识的一个领域。我们忽略了一些心理概念(例如相信某事或表达不快乐)和相关的常识性社会概念(例如与某人或某物在一起,或给某人某物)。从物理上讲,上述实验集中在固体上。更完整的还应该包括液体(水坑、溪流、瓶装酒)、气态物质(烟、雾、火焰)和颗粒物(泥土、沙子),甚至可以变形的物体(海绵、纸、绳子、衣服、树叶)、树枝、动物身体)和空间(洞、门道、入口)等。从这个意义上说,常识可以看作是一组相互关联的基本原理和抽象概念。在更高和更抽象的层面上,它还包括类比和隐喻的使用。“理想情况下,我们希望建立一种人工智能技术,能够掌握这些(关于认知的)相互关联的原则和概念,并具有人类水平的概括和创新能力,”论文总结道。看来要让AI具备常识,还有很长的路要走。