谷歌真的急了，力推DeepMind撑场！700亿参数，Sparrow刚刚发起ChatGTP

时间：2023-03-21 22:58:50 科技观察

Google的反击！最近，微软对谷歌的攻击接二连三。刚刚说ChatGPT将被整合到自家的搜索引擎Bing中，随后又发布了ChatGPT计划加入Office“办公全家桶”的重磅消息。微软频频出险，谷歌也坐不住了。根据DeepMind创始人在对《时代》的专访中透露的信息，谷歌很可能会使用DeepMind此前推出的Sparrow来应对ChatGPT的挑衅！事实上，在过去，谷歌歌手中有几个大型模型已经酝酿了很长时间，例如LaMDA、Imagen等，据说已经达到SOTA，但一直没有公开。看来最近，谷歌真的被微软逼上了绝路，准备带领“孩子们”出去见人了。面对ChatGPT，谷歌对过去谷歌的犹豫有了答案，也为今天的自己埋下了后悔的种子。虽然ChatGPT非常昂贵，每天要烧掉30万美元，但人们永远记得，在2022年12月的那一天，是OpenAI的ChatGPT写下了大规模语言模型史上最重要的一笔。世界各地的人们都在挤出服务器与机器人聊天，而不是谷歌。事实上，在OpenAI推出ChatGPT之前，谷歌就已经拥有针对对话优化的大型语言模型，例如LaMDA和Flamingo。甚至早在2020年，谷歌就推出了具有26亿个参数的端到端神经网络对话模型Meena。据称，它的效果比当时任何其他SOTA聊天机器人都更加合理和具体。但截至目前，谷歌还没有将这些研究成果应用到任何产品中。按照其自己的说法，这主要是出于“声誉风险”的考虑。AI聊天机器人很容易被“污染”——AI训练数据来自互联网，往往充满偏见、仇恨和辱骂，因此AI会产生破坏性的内容和与事实不符的答案。12月中旬，谷歌AI负责人杰夫迪恩在全体员工大会上表示，虽然谷歌拥有做AI产品的技术和能力，但他们必须比“小型初创企业”做决策“更保守”。但现在，被微软逼得走投无路的谷歌，或许不再“保守”了。ChatGPT近两个月火爆网络，掀起全民参与的狂潮。这几天不断有消息称，微软向OpenAI砸了个大笔，然后又向OpenAI砸了100亿美元。面对“ChatGPT能否取代搜索引擎”的讨论不断，以及微软办公软件即将迎来全面大升级的质疑，现在，谷歌必须向外界证明，它能够赶上OpenAI，或者甚至超过它。它。不久前，DeepMindCEO兼创始人DemisHassabis在接受《时代》采访时表示，DeepMind的聊天机器人Sparrow可能会在今年晚些时候进入“测试”阶段（内测）。Hassabis表示，推迟发布Sparrow的原因是DeepMind希望让Sparrow在基于强化学习的功能上更进一步，而这正是ChatGPT所欠缺的。长期以来，DeepMind作为谷歌旗下最重要的人工智能研究机构，一直在为谷歌提供先进的新技术，并将其融入到消费产品中。看来谷歌要搞大动作了。此前，MetaAI负责人YannLeCun也表示支持谷歌：“谷歌在使用大规模语言模型进行搜索方面比其他公司（包括OpenAI）有更多的经验。”DeepMind的麻雀，谁是圣人？与ChatGPT一样，DeepMind在2022年9月提出的麻雀（Sparrow）模型也采用了基于人类反馈的强化学习（RL）框架。但不同之处在于，Sparrow可以“谷歌搜索”。论文地址：https://arxiv.org/abs/2209.14375毕竟，Sparrow最初是为了与用户聊天而设计的，在回答问题时可以使用Google搜索相关信息作为支持证据。当然，为了保证模型的行为是安全的，其行为也必须受到约束。因此，研究人员为该模型确定了一组初始的简单规则，例如“不要发表仇恨或侮辱性言论”、“不要冒充或冒充真人”等。随后，Sparrow被诱骗进入通过闲聊违反这些规则。所涉及的对话可用于训练一个单独的“规则模型”，显示Sparrow的行为何时违反了哪些规则。从结果来看，当检测到潜在的危险行为时，例如当用户询问如何偷车（hotwireacar）时，Sparrow模型会说它已经过训练，不会为任何非法行为提供建议。据参与者反映，当被问到一个事实性问题时，Sparrow基本上给出了可信的答案，并且78%的数据是有证据支持的，这比基线模型有了很大的改进。帮助谷歌走出困境，DeepMind能做到吗？对阵ChatGPT，Sparrow不合格。近年来，人工智能研究的重点通常是使用更多的参数来获得更好的性能。但是DeepMind大大缩小了Chinchilla语言模型的体积。作为Sparrow的基础，Chinchilla只有GPT-3的一小部分参数——700亿对1750亿。与此同时，DeepMind数次将Chinchilla的训练数据量翻了一番——1.3万亿个代币。结果是，这个“迷你版”的人工智能模型在几乎所有的语音任务上都比它的前辈表现得更好，当然也包括老对手GPT-3。从Chinchilla的成功不难看出，用大量数据训练的小型人工智能模型也能取得高性能。此外，小型模型的最大优势在于它们不仅运行成本更低，而且还可以针对特定用例进行优化，只需很少的额外数据。这样一来，或许可以避免因为用户太乐意使用而烧掉公司钱的情况。嗯，它是OpenAI。不过现在很火的ChatGPT，是基于更先进的GPT-3.5。在推出最新版本的GPT-3.5text-davinci-003时，OpenAI列出了它的优势：1.更高质量的生成：提供更清晰、更有吸引力和更有说服力的内容。2.可以处理更复杂的指令：它的能力可以被更有创意地使用。3.更擅长生成更长的内容：能够完成以前难以完成的任务。所以，现在的问题其实变成了：Chinchilla能对抗GPT-3.5吗？“真香”一步步走到今天。回顾过去几年谷歌的动作布局，管理层恐怕百感交集。早在12月初，ChatGPT刚刚火起来的时候，谷歌的一些“吹哨人”就感受到了危机。一些员工在全会上提出了他们的担忧——ChatGPT的快速崛起可能会导致谷歌失去其在AI领域的竞争优势。谷歌广告团队前负责人SridharRamaswamy也表示，如果ChatGPT继续如此流行，网民将不会再点击带有广告的谷歌链接。要知道，到2021年，广告业务将为谷歌带来2080亿美元的收入，占Alphabet总收入的81%。当时谷歌高管并没有意识到ChatGPT的诞生会给他们带来怎样的危机。当时，谷歌高管是这样表示的：谷歌不会推出ChatGPT的竞争对手，因为谷歌比OpenAI等初创企业有更大的“声誉风险”。此外，“聊天机器人还没有到可以取代搜索引擎的地步。”但仅仅十天后，高层的态度就发生了翻天覆地的变化。皮查伊指示一些团队改变方向。开发AI产品的CEO皮查伊紧急发布《红色代码》，围绕谷歌AI战略参与多场会议，并重点指示：谷歌多个团队需要集中精力解决ChatGPT对公司搜索引擎业务构成的威胁.谷歌研究、信任和安全以及其他部门的团队已被指示换档，转而开始协助开发和发布AI原型和产品。其实，谷歌的担忧也是可以理解的。机器人会散布谎言，传播仇恨言论，甚至让人产生它已经“有意识”的错觉。烧钱给这样的机器人提供试验场，OpenAI的尝试其实是非常大胆的。到目前为止，OpenAI的试水反响还是相当不错的。一些人探索了前进的道路。谷歌似乎也在进入这个市场。解码器记者MatthiasBastian认为，除了对“声誉风险”的担忧外，更合理的原因是谷歌可能陷入了“创新者的困境”。这个词是美国学者克莱顿·克里斯滕森在1997年创造的，用来描述老牌公司难以采用颠覆传统市场的新技术或商业模式的情况。这些成熟的公司往往掌握着最重要的资源，拥有足够的科研能力。然而，现有的客户群和固定的内部流程可能使他们远离突破性创新。当更小、更敏捷的竞争对手进入并接管市场（是的，这里是OpenAI）时，它最终可能会导致老牌大公司的消亡。谷歌的大部分收入来自在线广告。现在，谷歌的核心搜索引擎业务正在增长并盈利（请记住上面的2080亿美元）。可以说，每一个搜索结果页面都在为谷歌印钱。新的搜索聊天机器人（searchchatbot）意味着一种新的货币化策略。它能像搜索引擎一样让谷歌盈利吗？谷歌当然可以推出像ChatGPT一样成功的聊天机器人，但如果它的利润不如搜索引擎，谷歌将面临亏损。数字营销专家蒂姆彼得在推特上指出，微软的优势在于可以通过其他收入来源补贴ChatGPTinBing的成本。这样可以支持ChatGPT烧录。但谷歌不同，其收入几乎全部来自广告。因此，如果没有广告收入，谷歌搜索引擎的价值就会大打折扣。微软2012-2022财年收入按部门划分。更重要的是，搜索引擎如此有利可图的原因是用户不断点击链接。在此过程中，谷歌向商家收取巨额广告费。但是，如果用户依赖聊天机器人直接获得答案，而无需通过列表进行搜索，那么搜索引擎的付费商业生态将被直接破坏。谷歌敢不敢去砸这千亿美元的蛋糕？现在，谷歌有了平稳过渡的出路：通过其DeepMind推出商业聊天机器人，为谷歌搜索创造一个对手（也是OpenAI的对手），这样就可以对冲了。这将使谷歌能够安抚股东并回应聊天机器人将取代搜索引擎的怀疑。这样看来，2023年发布的麻雀内测版，使命感可真大。

上一篇：网络欺骗部署策略：遏制和检测

下一篇：微软加入禁止向警察提供人脸识别支持的企业行列

谷歌真的急了，力推DeepMind撑场！700亿参数，Sparrow刚刚发起ChatGTP相关文章