当前位置: 首页 > 科技观察

DeepMind首席科学家:比起机器智能,我更担心人类智能造成的灾难

时间:2023-03-14 12:35:31 科技观察

DeepMind首席科学家:比起机器智能Word,我更担心人类智能带来的灾难。Silver小时候曾参加过全国拼字游戏比赛,之后继续在剑桥学习并与他人共同创立了一家视频游戏公司。后来,获得博士学位后。在人工智能方面,他带领DeepMind团队开发了AlphaGo,这是第一个在围棋比赛中击败世界冠军的人工智能程序。对于Silver来说,游戏是了解人类和人工大脑如何通过自身学习来实现目标的试验场。对于围棋AIAlphaGo来说,给程序提供人类在不同位置的决策信息,然后让AI去模仿,这种学习叫做“监督学习”。意识到AI程序从玩游戏中学习被称为“强化学习”。然后,在AlphaGo与世界冠军的关键对决中,西尔弗突然想到:也许,机器的决策根本不应该受到人类的影响。这个想法最终成为了AlphaGoZero的开始,也就是AlphaGo的继承者。完全不接受人类知识,仅靠强化学习从棋局规则中学习如何下围棋。后来,AlphaGoZero和AlphaGo对弈了100回合,封了自己的“老大哥”。2020年4月,大卫·西尔弗(DavidSilver)因“计算机游戏的突破性进步”而获得2019年ACM计算奖。在颁奖典礼上,时任ACM主席的CherriM.Pancake表示:“很少有其他研究人员像DavidSilver这样在AI领域造成如此多激动人心的成果。他对深度强化学习的见解已经从游戏扩展到现在广泛应用于许多领域,包括提高电网效率、降低数据中心的功耗,以及为欧洲航天局规划太空探测器的轨迹。”此外,Silver还是英国皇家学会的Fellow,也是人工智能领域第一位获得门萨基金会最佳科学发现奖的科学家,Silver的明星气质与他安静、谦逊的性格形成了鲜明的对比。在这次采访中,Silver谈到了游戏、创造力意味着什么,以及人工智能在避免气候变化、病原体感染、大规模贫困和环境灾难方面的潜力。采访内容如下:您玩游戏的方式与其他孩子不同吗当你还是个孩子的时候?当时我在国立学校拼字游戏,我记得一些有趣的时刻。有一次,在最后一局结束时,我问我的对手,“你确定要拼那个字吗?你为什么不拼一个得分更高的字呢?”他改变了他的拼写,赢得了比赛和冠军,这让我很高兴。我更着迷于拥有一场更好的比赛而不是赢得比赛意味着什么。你是如何将对游戏的热爱变成一份真正的工作的?后来接触了国际象棋,认识了DemisHassabis(DeepMind的联合创始人,当时他是世界上同龄最强的年轻棋手,零用钱不够的时候,他会来我的小镇,参加比赛,带走50英镑,然后回家。我们在剑桥相遇,创办了一家游戏公司Elixir,现在我们回到了DeepMind。这种对游戏的痴迷教会你如何解决问题一方面,我们认为我们有一种特殊的能力叫做“创造力”,而AI算法却没有这种能力。其实这是一种谬论。现在,我们已经看到了AI创造力的端倪。2016年在2010年AlphaGo和李世石的第二场比赛,AlphaGo执黑下第37手,围棋界认为它充满了创意,甚至超出了当时人类职业棋手的理解能力。这说明AI确实尝试了一些非常像以前一样新的东西。但是人类可以将这种广泛的创造力应用于任何事物吗?不只是游戏?试错学习的整个过程,就像自己想办法想办法,或者让AI自己想办法解决问题一样,是一个创造性的过程。人工智能开始时一无所知。然后它会发现一个新事物、一个创造性的飞跃、一个新模式或一个新想法,这可以帮助您比以往更好地实现您的目标。现在,您掌握了玩游戏、解决难题或与人互动的新方法。这个过程实际上是成千上万个小发现的积累。这就是“创造力”的本质。如果AI算法没有创意,那就麻烦了。人工智能需要能够为自己尝试新的想法——那些人类没有告诉过它们的想法。这应该是未来研究的方向,继续推动一种通过自己尝试而产生“新想法”的系统。许多人认为计算机只能在业余人类水平下围棋。你有没有怀疑过自己提高的能力?当我到达韩国参加2016年AlphaGo比赛时,我看到一排排摄像头,我听说当时有超过2亿人在线观看,我想我在想“等等,这真的行得通吗?”对手LeeSedol是一位天才的世界冠军,他会尝试任何事情,将AI程序带入通常不会发生的奇怪情况。我很幸运我们幸免于难。然后我问自己:“是否有可能回到基础并理解系统真正为自己学习意味着什么?”为了找到更纯粹的东西,我们抛弃了AI模型中的人类知识,开发了AlphaZero。几千年来,人类为围棋游戏制定了众所周知的策略。当AlphaZero迅速发现并拒绝这些有利策略时,你有什么感受?我们设置了原始AlphaGo错误的地方(与人类专家相比)。如果我们能找到一个新版本,让AI自己找到正确的位置,我们就认为它是成功的。一开始,我们取得了很大的进步,但后来似乎就落伍了。我们认为AI没有自己找到正确的20-30个手位。与我们合作的职业选手范辉花了几个小时研究这些动作。最后他说职业选手错了,AlphaZero是对的。人工智能找到了解决方案,重新评估最初被归为“错误”的动作。我意识到我们有能力推翻人类认为的标准知识。之后你主持AlphaStar的开发,让AI玩《星际争霸2》。你为什么从围棋跳到电子游戏?Go是一个相对较小的领域。从围棋开始扩展到人脑的能力需要大量的步骤。我们尝试更复杂的维度,大量人类做得好的领域,但AI做得不好。从AlphaGo到AlphaStar,其实是一种自然发展。与人类一样,人工智能系统只能看到地图的特定部分。这不像下围棋或国际象棋那样,您可以看到对手和自己的所有棋子。游戏只能看到被控对象附近的信息,需要侦察才能获取信息。这更接近现实世界中发生的事情。最终目标是什么?我认为人工智能代理的能力与人脑一样广泛。虽然我们还不知道如何完全实现大脑的功能,但在人脑中已经有证据表明它的存在。人脑的完整复制品?你真的认为这是现实的吗?我不相信对大脑的神奇、神秘的解释。在某种程度上,人脑是一种算法,它以强大而通用的方式接受输入并产生输出。我们理解和构建人工智能的能力是有限的,但这种理解正在迅速增长。今天,我们拥有可以破解围棋等狭窄领域的人工智能,以及可以理解和生成自然语言的模型。那么,你认为人类人工智能的能力没有上限吗?现在我们才刚刚开始。想象一下,如果我们再经历40亿年的进化,我们会是什么样子?也许我们会拥有更复杂的智能,可以做得更好。人工智能有点像,这个过程没有限制,因为世界本质上是无限复杂的。那么,会有上限吗?物理限制在某些时候确实存在,因此没有边界。最终,您将用尽宇宙中的所有能量和所有原子来构建计算设备。但比起现在,其实也可以算是无穷大了。超越人类智能,这个范围非常广泛。斯蒂芬霍金担心机器智能会带来可怕的意外后果。你有类似的顾虑吗?我更担心人类智慧的意外后果,例如气候变化、病原体、大规模贫困和环境灾难。对人工智能的追求应该会带来新技术、更深入的理解和更明智的决策。有一天,人工智能可能会成为我们避免此类灾难的最佳工具。然而,我们应该谨慎行事并制定明确的规则,禁止不可接受的人工智能应用,例如自主武器的开发。现在,你已经通过游戏AI的成功迎接了这些巨大的挑战,但你有没有失望过?好吧,监督学习产生了巨大的主流影响。谷歌的大多数大型应用程序都在系统的某个地方使用监督学习。到目前为止,我的失望之一是我们还没有看到通过强化学习对自学系统产生这种程度的影响。在未来,我希望看到能够以实际实现我们目标的方式与虚拟世界中的人互动的自学系统。例如,可以自行学习实现目标的最佳方式的数字助理。那将是一个美丽的成就。你有工作的个人目标吗?在与李世石的AlphaGo比赛中,我走到场外,发现一位围棋选手在哭泣。我以为他很伤心,但他没有。在他所专注的这个领域,AlphaGo正在下棋,这是他以前没有意识到的。这让他感受到了一种深邃的美感。以我的围棋水平,还不足以完全体会到这一点。但我们应该努力在我们感觉到的任何地方建立类似的智能。我觉得AI智能应该这样发展,不是因为AI做了什么,或者AI能帮到我们多少,而是因为智能本身就是一个非常美好的东西。