当前位置: 首页 > 科技观察

GPT-3之外,DeepMind推出新宠Gato,却被质疑“换汤不换药”

时间:2023-03-22 13:36:06 科技观察

在大规模语言建模的启发下,DeepMind应用类似的方法构建了一个单一的“通才”智能体Gato,它它具有多模式、多任务、多体现的特点,可以执行600多种不同的任务。这种人工智能可以说是世界上最令人印象深刻的一体化机器学习套件。DeepMind在官方博客中解释道:“Gato是一个多模式、多任务、多组件的通用人工智能。在相同的网络条件下,你可以玩Atari游戏、给图片添加字幕、与人聊天、控制A机械臂堆叠积木等,它根据当前情况决定是否输出文本、转动机械臂、按下按钮或做其他标记。”虽然Gato的表现如何还有待观察,但它似乎比GPT-3希望的要好。所取得的一切以及更多。图片来源:Gato真的在DeepMind官网超越了GPT-3吗?GPT-3是由资金雄厚的通用人工智能(AGI)公司OpenAI制作的大型语言模型(LLM)。它不仅得到了微软数十亿美元的支持,而且基本上可以在美国政府监管方面做任何事情。它重点研究的通用人工智能(AGI)是一种具有人类智能的人工智能,可以完成人类可以完成的任何智力任务。一些研究人员将通用人工智能称为强人工智能(strongAI)或全人工智能(fullAI),或者说机器具有执行一般智能动作的能力。与弱人工智能(weakAI)相比,强人工智能具有全方位的人类认知能力。本来,OpenAI的使命是开发和控制AGI,但现实情况是,该公司所创造的一切都是非常花哨的LLM,这有点偏离其“初衷”。虽然GPT-3与DeepMind的Gato一样令人印象深刻,但大众评判它们的标准需要一些细微差别。因为OpenAI在AGI的道路上走的是LLM路线,原因很简单:没有人知道如何让AGI发挥作用。正如从“发现火”到“发明内燃机”之间花了很多时间一样,弄清楚如何从深度学习到AGI也不是一蹴而就的。尽管如此,GPT-3仍然可以做一些看起来像人类的事情,例如生成文本。而标榜自己为“通用人工智能”的Gato,其功能几乎与GPT-3相同。它只是将一些类似于LLM的东西集成到一个可以做600多个技巧的“魔术师”中。它的亮点是使用单一的序列模型来解决所有的任务,但是需要增加训练数据的数量和多样性。Gato的多任务处理能力更像是一个可以存储600种不同游戏的控制台,而不是一个你可以用600种不同方式玩的游戏。正如介绍中所说,它不是一般的人工智能,而是一堆预先训练好的窄模型整齐地捆绑在一起。图片来源:DeepMind官网正如KnivesandPaintbrushes研究小组的MikeCook最近告诉TechCrunch的KyleWiggers:“令人兴奋的是,像Gato这样的AI可以完成所有这些听起来非常不同的任务,因为对我们来说,编写文本和控制机器人声音非常不一样。但实际上,这与GPT-3理解纯英文文本和Python代码并没有太大区别。并不是说这很容易做,但在外人看来,AI可能听起来像是可以轻松泡茶或学习另外十个或五十个任务,但实际上,它做不到。总而言之,Gato和GPT-3都是强大的人工智能系统,但都不具备通用智能的能力。AGI时代何时到来?DeepMind已经朝AGI方向发展了十多年,而OpenAI从2015年起步。但都没有解决AGI道路上的第一个问题:构建无需训练就能学习新事物的AI。除非你赌AGI的出现是运气的结果,否则是时候重新评估这些公司在AGI领域的进展了。或许,Gato可以成为世界上最先进的多模态人工智能系统。但DeepMind采取了与OpenAI一样让AGI走入死胡同的理念,只是为了让它更有市场。通过营销,Gato可能比Alexa、Siri或GoogleAssistant更能赢得消费者市场。然而,Gato和GPT-3并不是比上述虚拟助手更可行的AGI切入点。如果这正是您正在寻找的AI类型,那么这并不是一件坏事。但是Gato随附的研究论文中根本没有证据表明它是AGI的正确方向,更不用说是AGI的垫脚石了。