当前位置: 首页 > 科技观察

今年的谷歌I-O大会超级“硬”,还展示了下一代AI模型

时间:2023-03-20 14:07:35 科技观察

2022谷歌I/O大会,礼堂终于坐满了人,虽然大部分都是谷歌自己的员工。“去年我们分享了计算机科学的最新进展,我们的目标一直是让全世界的信息都能为所有人所用,”谷歌首席执行官桑达尔·皮查伊在开场时说道。在今天的发布会上,谷歌展示的大多是人们可以使用的免费应用,很快就会安装。如今,机器学习工具已在很大程度上使这一愿景成为现实。谷歌翻译中实用的机器学习模型可以自行学习新的语言,无需双语语料库。翻译系统是人工智能最经典的任务之一。谷歌的机器翻译在多年的发展中一直保持着领先地位,也催生了transformer预训练模型等重要的AI技术。在I/O大会上,谷歌宣布其翻译系统新增了24种语言,其中包括一些小众的美洲原住民语言,总共覆盖了3亿人。在计算机视觉领域,谷歌地图通过3D重建技术实现了完全自由的沉浸式视图。天空看起来像实时天气,甚至可以让你“走进”一家餐厅:就像在手机上玩模拟现实一样。环境游戏。在视频网站YouTube上,经过DeepMind训练的AI现在已经自动将章节分成8000万个视频,让观众自动跳转到最有趣的部分,有16个自动翻译字幕。最先进的预训练大型模型现在已成为日常工作的一部分。“当你有一份25页的文件你还没有读过,但你要开始与某人讨论时,你会怎么做?”皮查伊说。GoogleDocs现在有一个自动摘要功能,可以将几十页的文档摘要成几句话。除了文档,Google的AI还可以提供聊天内容的摘要,GoogleMeet也引入了自动转录和摘要功能,以后再也不用写会议纪要了。谷歌副总裁PrabhakarRaghavan向我们介绍了谷歌核心业务搜索的改进:未来的搜索应该是随时随地,使用任何输入法。谷歌搜索不再满足于输入关键字,而是通过更自然、更具逻辑性的语言,以及语音和视频。上个月,Google推出了Multisearch,它允许您通过拍照和提问在Google应用程序中进行搜索。这是一个强大的想法,可以让你搜索无法描述的东西,比如用手机拍照,“我想买这个,我在哪里可以买到这个?”。或者“我怎样才能让我的花看起来像这样?”PrabhakarRaghavan表示,未来Multisearch还将增强本地搜索功能,今年晚些时候将覆盖更多国家并推出多语言版本。这不仅仅是简单的拍照和搜索描述文字。APP会通过算法将视频中的场景拼接在一起,然后通过知识图谱分析图像的内容。谷歌可以给出准确的物体识别并提供有用的建议。如果你扫描一个货架,它会显示用户对每种巧克力的评分。这种被称为SceneExploration的能力,可能是迄今为止AR领域最好的演示。这就像为现实世界安装了Ctrl+F快捷键。在促进算法公平性方面,谷歌和哈佛大学蒙克教授开发了一种肤色量表(MonkSkinToneScale),可以更准确地在搜索结果中反映人的肤色。在谷歌的NestHub上,一款带屏幕的智能音箱,现在已经不用每次都用SayheyGoogle了。新增凝视功能,就像人与人交流时的眼神交流,可以避免看着说话者说话时的唤醒词。QuickPhrases功能更直接:只需说出关灯、拉窗帘等祈使句即可命令GoogleAssistant完成任务。为了让人与语音助手之间的交流更顺畅,现在更多的机器学习模型在本地运行,大大减少了响应延迟。一切都在朝着人性化的方向发展。在下一代AI模型的应用下,谷歌一直在探索人工智能的最前沿。谷歌的对话AI模型LaMDA今年升级到了第二代。新模型显着提高了对话质量。在AI测验厨房里,可以连续选择题目,让模型自动生成故事。它还可以用来为您提供建议。现场展示了“如何培育小花园”的话题。AI可以不断提出建议,你也可以选择自己想了解的方向,越走越深。“它展示了语言模型的未来潜力,它可以帮助你在搬到一个新城市后解决很多问题,”Pichai说。去年,JeffDean带领的团队提出了“下一代通用AI架构”Pathways,旨在用一个架构同时处理多个任务,使其能够快速学习新任务并更好地理解世界。在今年4月提交的论文《PaLM: Scaling Language Modeling with Pathways》中,谷歌研究人员使用Pathways系统训练了一个5400亿参数的大规模语言模型——PaLM(PathwaysLanguageModel)。这是一个只有解码器的密集型Transformer模型。可以完成的任务包括自动生成代码、解决数学问题、修复错误、解释笑话的要点等等。皮查伊说,语言模型的优势在于它可以区分因果关系并理解上下文中的概念组合。使用这种方法,该模型在数学问题上的准确率提高到58%,接近60%的9至12岁儿童解决问题的水平。PaLM现在可以用孟加拉语提问和正确回答问题,这个模型没有在相应的语料库上训练,没有接受过用新语言回答问题的训练,甚至根本不是为翻译而设计的。JeffDean理想的通用AI模型是否已成为现实?全新Android13系统:定制你的体验每一年,I/O大会都是展示新版Android系统的舞台。今年的重点是全终端覆盖,谷歌也把所有的硬件都造好了。多年来,Android已成为世界上最受欢迎的操作系统。仅去年一年,消费者就激活了10亿部新的Android手机。随着机器学习的进步,手机可以帮助我们做比我们想象的更多的事情。虽然手机仍然是最流行的计算方式,但人们越来越多地将各种互联技术添加到他们的生活中,例如汽车、电视和手表。人们希望这些设备兼容、简单且无忧。谷歌I/O大会上,Android13系统终于问世。它具有以下三个新特点:让你实现更多,以手机为中心;它从手机扩展到各种形式的计算设备,例如手表和平板电脑。ETC。;使设备更好地协同工作。让我们先看看移动设备。Android13以更多方式适应用户的风格,所有应用图标都可以融入自己的颜色主题。Android13还有一个新的媒体空间,用户可以在其中根据正在收听的音乐自定义外观。此外,用户还可以为每个应用程序设置不同的语言来个性化体验。Android13还增加了许多安全和隐私功能。当您向他人发送消息时,您还需要确保他人的隐私和安全。为此,Android13将短信升级为名为“RCS”的新标准,让端到端加密等重要的隐私保护成为可能。这是移动生态系统向前迈出的一大步。目前,谷歌的消息应用拥有5亿RCS月活跃用户。谷歌希望每个移动设备都能升级这个RCS标准。手机和钱包是人们日常生活中的必备品,那么问题来了:手机能代替钱包吗?谷歌推出了新一代的谷歌钱包,这是一款安卓数字钱包,可以让你快速安全地获取每天所需的一切。Google电子钱包会安全地存储您的信用卡信息,因此您可以在任何接受GooglePlay的地方一键付款。Google电子钱包不仅仅可以支付。你可以用它来出示你的学生证,办理登机手续,启动你的汽车,并用它作为去迪斯尼乐园的门票。同时,谷歌也将在今年晚些时候将数字身份证引入电子钱包。从驾照开始,无需将手机交给他人,只需通过NFC轻触或扫描二维码,即可共享身份信息。谷歌钱包将在未来几周内在全球范围内推广到Android和WearOS设备。此外,今年晚些时候,Android13将为WearOS设备带来紧急求救功能,这样你就可以立即联系可信赖的家人和朋友,或者直接从你的手表拨打紧急电话。Android13的地震预警系统也将延伸至全球高危地区,实现预警。除了手机,谷歌还致力于在平板电脑和手表等个人设备上提供精彩的Android体验。WearOS设备比去年增加了两倍,大屏幕上有2.7亿活跃用户。值得注意的是,Android是目前唯一可以将类似平板电脑体验放在口袋里的系统,而可折叠设备提供了大屏幕设备的所有优点和手机的便携性。下一步是使多个设备兼容并协同工作。为此,谷歌开发了FastPair技术,让用户无需管理任何设置即可轻松配对手机、平板和电视,实现与耳机和智能设备的即时互联。然而,想要将如此便捷的互联功能普及到家中的所有设备,就需要用到“物”了。这是一个开放的行业标准,将于今年秋季发布,它将谷歌硬件与数百种受支持的产品(如灯泡、门锁和智能插头)连接起来。这些支持物质的设备只需几秒钟即可进入您的家庭、网络和GoogleHome,通过快速配对对接您喜爱的应用程序。谷歌新手机:Pixel6a和Pixel7/7Pro2021年10月,谷歌推出了新手机Pixel6和6Pro,首次采用了自研的Tensor芯片。Tensor芯片的命名方式让人联想到谷歌提出的深度学习框架TensorFlow,以及谷歌服务器芯片TPU,旨在将谷歌领先的AI技术直接带到手机上。在I/O大会上,谷歌发布了一款价格适中的新手机Pixel6a,售价仅为449美元。谷歌表示,“这是该价位有史以来最好的智能手机。”Pixel6a提供炭黑、粉白、青柠绿三种配色。预订将于7月21日开始,购买将于7月28日开始。Pixel6a外观与Pixel6系列一脉相承,独特的双色外观,窄边框,6.1英寸AMOLED1080p显示屏,IP67防尘防水,60Hz刷新率。在摄像头方面,Pixel6a搭载双后置摄像头系统,包括一个12兆像素主镜头和一个超广角镜头。前置自拍相机为8兆像素。更重要的是,Pixel6a搭载了与Pixel6/6Pro相同的Tensor处理器和TitanM2安全芯片,支持5G连接。Pixel6a以更低的价格提供更好的性能和更丰富的AI驱动体验,让用户享受与Pixel6/6Pro相同的出色安卓体验,以及摄影、语音和安全等独家功能。除了Pixel6a,谷歌还透露了将于今年秋季发布的Pixel7和7Pro系列,搭载谷歌下一代自研Tensor芯片,带来更多AI驱动的突破以及语音、摄影、视频和安全方面的突破.非常个人化的体验。当然,Pixel7/7Pro将预装Android13系统,享受最新手机操作系统的诸多好处。其中,Pixel7Pro将铝材质延伸至整个摄像头,是Pixel设计语言的进一步进化。它的三摄像头系统在摄影、性能和设计方面树立了全新的标准。好的手机当然是好的耳机,在I/O大会上发布了新款无线耳机PixelBudsPro。BudsPro不仅嵌入了谷歌设计的最佳移动音频硬件,而且还是第一款具有主动降噪功能的耳机。谷歌表示,由于其围绕新的定制音频处理器的设计,它拥有当今耳机中最好的噪音消除功能之一。每个人的耳朵都是独一无二的,所以耳尖并不总是能形成完美的密封,可能会导致声音从外面漏进来。为解决这个问题,Google的主动降噪功能使用新的SilentSeal技术来补偿音频泄漏,有助于最大限度地消除噪音,从而在不受干扰的情况下提供身临其境的高质量声音。不过,有时您真的很想听到周围发生的事情,这就是透明模式发挥作用的时候。它让外界声音进入,让您体验周围的世界,就好像您根本没有戴耳机一样。定制音频芯片专为提高能效而打造,因此PixelBudsPro的电池续航时间可达11小时,在降噪模式下可达7小时。耳机还提供有用的免提体验,能够向助手询问各种事情,比如获得40多种语言的实时翻译。同时支持多点连接,在兼容的手机、平板电脑、笔记本电脑和电视之间切换。它还将在今年晚些时候进行更新,支持空间音频,让您在兼容的Pixel手机上观看电影或电视时获得身临其境的体验。新款PixelBudsPro提供四种颜色,售价199美元,7月21日预购,7月28日上市。下面是传闻已久的GooglePixelWatch,将于今年秋季与Pixel7手机一同发售。作为第一款完全由谷歌设计的智能手表,它拥有最好的WearOS体验,拥有语言助手、NFC等功能,并且可以独立实现导航等功能,最重要的是它不像很多同级产品那样体积过大等级。拨号。手机、手表、无线蓝牙耳机一应俱全,最后少了一块大屏。谷歌宣布将于2023年推出Pixel平板电脑,这些设备发布后,谷歌将像目前的各大手机厂商一样,建立一个相对完整的生态系统。