当前位置: 首页 > 科技观察

学过的知识!谷歌是如何从AI老大哥一步步跌落神坛的?

时间:2023-03-15 15:53:03 科技观察

谷歌肠子都后悔了。多年来被一心一意崇拜的虚拟现实,现在似乎成了一个伪神。既然竞争对手微软和OpenAI凭借ChatGPT引起了广泛关注,谷歌也赶紧转变战略,加速人工智能研发。具有讽刺意味的是,这一切的发生都是因为谷歌认为自己垄断了AI市场。谷歌确实有理由这么认为。2017年,谷歌研究人员发表了著名论文《Attentionisallyouneed》,引入了Transformer的概念,大大提升了机器学习模型的潜在能力。总结Transformer的巨大影响力,说这句话就够了:它就是GPT中的“T”。你可能会问:谷歌为什么要免费开源这么好的东西?大型私人研究机构曾因隐藏工作而饱受诟病,但近年来,开源已成为一种趋势。因为这是一场声望游戏,是对那些希望雇主不要掩盖他们的研究人员的让步。当然,这其中有傲慢的成分:谷歌作为这项技术的发明者,怎么可能不是它的最佳用户呢?我们都知道故事的其余部分。这场ChatGPT的热潮来得并不意外。学习理解和使用新工具需要时间。现在,每一家大型科技公司都在探索人工智能新时代将带来什么,以及他们需要做什么才能实现这一目标。而做出了ChatGPT基础设施Transformer的谷歌后悔了。可以理解的是,谷歌不想通过过早地将搜索与他们现有的半生不熟的通用LLM模型合并来杀死金鹅。他们已经成为部署高度专业化的人工智能任务模型的专家,这些模型可以完成一两件事。但是当涉及到大动作时,他们舒适的姿势使他们的背部产生惯性。谷歌倒闭了吗?当然不是,在不久的将来,它仍将是默认的、利润丰厚的大型科技公司。它只是看起来有点滑稽。精益求精的Assistant,有点白费了毫无疑问,谷歌在AI领域做出了非凡的贡献。在过去几年中,它在设计AI计算硬件方面取得了重大进展,为开发人员构建了有用的平台来测试和开发机器学习模型,并发表了大量论文,从模型微调到语音合成。2018年5月8日,谷歌CEOSundarPichai在谷歌I/O2018大会上发表主题演讲。但该公司也面临着严重的问题。很多人都从谷歌员工和其他业内人士那里听到过这样的轶事,谷歌的运作方式太封建了。这里似乎有一种传统智慧,即让项目在现有产品(如地图或助手)的支持下运行是一种可靠的赚钱方式。因此,尽管该公司储备了许多世界上最优秀的人工智能研究人员,但他们的才能似乎都停留在企业战略的轨道上。这样做的后果是什么?让我们看看下面的时间表。2018年,谷歌的成果是改进了GoogleAssistant流程、照片(例如为单色图像着色)、带有“视觉优先版Assistant”的智能显示器(有人见过吗?)、地图助手、AI辅助的Google新闻和MLKit。谷歌助手即将登陆谷歌地图2019年,谷歌展示了其更为知名的更大智能显示屏、增强现实搜索结果、增强现实地图、谷歌镜头更新、网络双工(有人记得双工吗?)、获取东西的能力在本地完成和更多工作中的压缩版GoogleAssistant、Waze中的Assistant、驾驶模式中的Assistant、实时字幕、实时广播(语音识别),以及一个旨在更好地了解有语言障碍的人的项目。当然,可以肯定地说其中一些产品很棒!然而,它们中的大多数只是现成的东西,差异是由人工智能推动的。Google推出了MLKit,这是一个SDK,可以轻松地将AI添加到iOS和Android应用程序现在回想起来,许多人会觉得Google确实有点畏缩。像谷歌这样的大公司,应该能够顺应潮流,推动潮流。谷歌推出了Duplex,这是一款AI驱动的客户服务工具,旨在帮助餐馆和美发沙龙等小型企业接听更多电话、回答常见问题和安排预订,而在2019年2月,OpenAI有这样一条消息:《OpenAI构建了一个非常好的文本生成器,但因为太危险,所以不能发布》.这个消息与GPT-3无关,与GPT-3.5无关……与GPT-2无关。2020年,谷歌做了一个人工智能驱动的Pinterest克隆,然后在12月解雇了TimnitGebru——AI伦理领域的主要声音之一,因为他写了一篇论文指出这项技术的局限性和危险性。虽然我们现在看到了ChatGPT的火爆,但事实上,OpenAI的联合创始人SamAltman不得不亲自压制对GPT-3的炒作,因为它超出了可接受的水平。而在2021年,谷歌的大语言模型LaMDA登场,但谷歌并没有真正将其推向市场。除了减少Assistant抛出的错误数量,谷歌还在寻找它存在的理由。OpenAI的2021年始于DALL-E,这是一个很快成为家喻户晓的文本到图像模型。OpenAI已经证明,借助CLIP等系统,LLM不仅可以执行语言任务,还可以充当通用解释和生成引擎。2022年,谷歌所做的是对Assistant进行更多调整,更多智能显示器,更多AR地图,以及1亿美元收购AI生成的个人资料图片(收购Alter)。同年,OpenAI在4月发布了DALL-E2,在12月发布了ChatGPT。也许在2022年初的某个时候,当谷歌高管睁开眼睛时,他们被眼前的景象吓坏了。可以想象,困惑的谷歌高管们匆忙发送电子邮件询问为什么一些充满活力的初创公司围绕着OpenAI运行。证据是Imagen在DALL-E2发布一个月后就退出了,退出与否真的没什么区别,就像谷歌发表的其他AI研究一样,没有任何人可以测试它,更别说连接到API了。然后,在Meta于9月发布Make-A-Video后,谷歌在一周后以ImagenVideo做出回应。然后Riffusion在生成音乐中掀起了波澜,一个月后MusicLM出现了(同样,我们仍然不能使用它)。但可以肯定的是,谷歌其他公司纷纷效仿,正是因为ChatGPT给谷歌领导层带来了焦虑,所以他们只能全力以赴。但业内人士都知道,ChatGPT与Google投资了十年的Assistant产品有很大的不同,后者实际上是伪装成的伪AI(实际上只是一组API的自然语言前端)。但谷歌被生存竞赛吓坏了。时代造就英雄然而,将必应称为谷歌搜索的“竞争对手”还为时过早。毕竟,与谷歌的92%相比,Bing的全球份额只有3%。但该搜索引擎成功地将微软的创新需求与大规模语言模型的核心竞争力结合起来,从而促成了最新的GPT模型与Bing和Edge的整合。谷歌见状显然急了,于是在微软发布ChatGPT的前一天用一篇空洞的博文试图吸引眼球。但由于发布太仓促,谷歌在两天后的“搜索与人工智能”活动中甚至没有过多提及Bard。此外,用于宣传巴德的图片还包含一个不小的错误:詹姆斯·韦伯太空望远镜“拍摄了系外行星的第一张照片”。显然,这是错误的。更令人震惊的是,谷歌内部没有人发现,甚至没有人关心。当然,ChatGPT也有自己的问题。但谷歌匆匆忙忙,绊倒得如此明显。它只是表明谷歌甚至在有限的实验水平上也没有做好准备,更不用说像微软这样的全球推广已经开始了。谷歌还是那个谷歌那么,这是否意味着谷歌的衰落?当然不会,在不久的将来,它仍将是我们的默认搜索引擎,也是一家利润丰厚的公司。不过,从随后股价的大幅下跌也可以看出,投资者的信心受到了动摇。事实证明,在过去的几年里,谷歌并没有做出任何有意义的创新。这可能不是出于智慧,而是出于骄傲。但是,在新技术还没有像大家想象的那样证明自己有价值的时候,我们也不能做太多的预测。