5月19日凌晨,一年一度的谷歌I/O大会在线上举行了开幕主题演讲在谷歌园区户外举行,该公司发布了一系列引人注目的新产品。“我们的目标一直是建立一个帮助所有人的谷歌,”谷歌首席执行官桑达尔皮查伊说。用人工智能赋能更多人是谷歌今天活动的主题。在长达数小时的会议中,首先要知道的黑科技就是全息视频聊天技术ProjectStarline。疫情期间,很多人无法与亲朋好友相聚,而谷歌推出的“聊天室”,让你近距离见面、打招呼、眼神交流,仿佛真的看到了对方.这看起来有点像实时3D电影,也有点像在《美国队长:内战》里放映童年回忆的钢铁侠。事实上,这是一个由高分辨率传感器、数十个深度扫描传感器和一个65英寸“光场显示器”重新生成的实时3D模型。谷歌表示,该项目已经开发了数年,其背后有大量计算机视觉、机器学习、空间音频和数据压缩技术。谷歌还为此开发了突破性的光场系统,让人们无需佩戴眼镜或耳机也能体验到逼真的体积感和深度感。谷歌计划在今年晚些时候小规模推出ProjectStarline。除了问候亲友,这类技术更多的应用场景应该是远程会议。习惯zoom的我们,以后会体验到“人坐在家里,领导飞过来”。Starline当然只是I/O众多新技术中的一小部分。20年前,谷歌率先将机器学习技术应用于搜索。10年前,谷歌大脑团队QuocV.Le、JeffDean、吴恩达等人发表了著名的“识别猫”论文,论文中研究人员使用了1000台计算机的16000个处理器核心训练了一个神经网络进行图像识别,被许多人看到作为深度学习技术爆炸式增长的标志。如今,谷歌的AI能力正在让更多“不可能”成为现实,他们不得不在量子计算等技术上取得更多突破。TPUv4,性能提升十倍2016年,谷歌发布了首款定制AI芯片TPU。与传统的CPU+GPU组合相比,这类专用芯片在搜索、翻译、语音助手、图像识别等AI任务上更具优势。数量级的性能优势。这些芯片的应用为谷歌的业务带来了优势,进而可以被开发者用作云服务计算能力的一部分。谷歌在2018年和2019年陆续推出了TPUv2和v3,谷歌TPU虽然算不上外卖,但一直被认为是人工智能时代机器学习专用加速芯片的典范。在今天的I/O大会上,谷歌推出了最新最好的芯片版本。如果只看芯片的数据,TPUv4的计算能力是v3的两倍,而如果看实际性能,v4其实是上一代的十倍。谷歌表示,这主要是由于系统内部互联。速度和架构改进。皮查伊表示,新的TPU在计算性能上实现了里程碑式的突破。要达到1exaFLOP级别的计算能力(每秒1018次浮点运算),我们过去需要超级计算机和大量的GPU,但现在只需要一台由一组4096个TPU组成的服务器就足够了。如今,世界超级计算机500强榜单——性能最高的日本“富岳”仅占一半。与英伟达等芯片公司提出的新一代AI加速器类似,谷歌TPU效率提升的秘诀在于极速的芯片间互连技术,可以将数百个独立的芯片变成一个紧密集成的单一系统使用。Pichai表示:“TPUpod中所有芯片之间的大规模互连带宽是任何其他网络技术的十倍。”TPUv4已经部署在谷歌的数据中心,芯片实例将在今年晚些时候向人们开放。此外,谷歌表示,TPUv4计算效率更高的好处是更加环保。在未来部署的数据中心中,TPU将使用近90%的无碳可再生能源运行。MUM,一个比BERT强大1000倍的多模态、多语言大型模型在I/O大会上,谷歌展示了使用TPUv4的AI应用程序。我们知道现在很多AI应用都是基于Transformer的。该模型由谷歌研究人员于2017年提出,用全注意力结构替代了LSTM,在翻译任务中取得了更好的效果。该技术随后导致了预训练模型的技术突破。很多人都知道阅读理解模型BERT,其中T是Transformer;Google正在开发的搜索模型T5,其中T是Transformer;如果你知道OpenAI提出的世界上最大的预训练AI模型GPT-3,T也代表Transformer。Google目前正在研究的模型是MUM(MultitaskUnifiedModel,多任务统一模型)。谷歌表示,虽然也是基于Transformer架构,但MUM比BERT强1000倍。从名字就可以看出,MUM是一种多模态模型,可以同时处理网页、图片等多种数据(未来还可能扩展到音频、视频等)。这种多模式设计使其成为搜索的理想选择。谷歌表示,如今的搜索引擎不够智能,无法通过单个问题提供更全面的信息,因此人们需要多次搜索。但是有了MUM,这个问题就可以得到缓解。例如,如果您以前徒步过亚当斯山,现在想去富士山,您就想知道如何做好准备。这种情况下,你只需要将“我需要做什么准备”这个问题丢给搜索引擎,它背后的MUM就能明白你所谓的“准备”包括什么,比如两座山的区别,需要做什么锻炼、带什么装备、去哪里远足等,然后指向来自网络的有用文章、视频和图像。这种多模式还允许您使用文本以外的信息进行搜索,例如给您的鞋子拍照并询问“我可以穿这双鞋去富士山吗?”此外,MUM也是多语言的,使用75种语言进行语言培训。这使它能够在不同语言之间传递知识。还是以上面的问题为例,很多关于“富士山”的资料都是日文的,不过有了MUM的加持,你也可以用英文或其他语言搜索。LaMDA:无限聊天的语言模型除了MUM,谷歌在本次I/O大会上还公布了另一个基于Transformer的语言模型:LaMDA(LanguageModelforDialogueApplications)。与MUM不同,LaMDA是专为对话而构建的,它是一种开放域对话。谷歌表示,LaMDA可以在无穷无尽的话题变化中与人聊天。在对话训练的过程中,它掌握了公开对话和其他语言的细微差别,尤其是“感性”(合理的)和特异性。例如,如果你对某人说,“我刚开始上吉他课”,人的反应可能是:“真令人兴奋!我妈妈有一把她喜欢弹的老式马丁琴”。在这段对话中,“Howexciting”是一个合理的回答,但同时我们也注意到,这句话几乎是通用的(就像“我不知道”),所以并不完整,充分体现了对话机器人。而后一句“MymomhasavintageMartinthatshelovestoplay”是人类对话更重要的特征:上下文和特定。谷歌说这是他们的LaMDA学到的。谷歌还表示,LaMDA是基于他们在2020年进行的一项研究。研究链接:https://ai.googleblog.com/2020/01/towards-conversational-agent-that-c??an.html“拍一拍”诊断皮肤病除了用手机拍照,还可以翻译,做数学题,测试空气质量。我现在仍然可以去看医生。利用AI诊断疾病是过去几年很多公司努力的方向。在本次I/O上,谷歌也分享了他们在结核病等方面的进展。但更有趣的是,他们将一些疾病的诊断直接与手机摄像头结合起来,帮助你及时了解与皮肤、头发和指甲相关的问题。谷歌表示,开发该应用程序是因为他们每年看到近100亿次针对皮肤、指甲和头发问题的搜索。全世界有20亿人患有皮肤病,皮肤科医生根本不够用。为了训练该模型,他们使用了大约65,000张诊断皮肤状况的图像和脱敏数据、数百万张精心制作的皮肤相关图像,以及来自不同年龄、性别和种族群体的数千个健康皮肤样本。在此之前,他们对皮肤病的研究已经发表在《自然 · 医学》等期刊上。当然,这些诊断结果只是初步判断,患者仍需咨询医生进行后续治疗。谷歌表示他们将在今年晚些时候推出试用版。拥有100万物理比特的量子计算机早在2019年,谷歌量子计算实验室实现“量子优越性”的消息就登上了《自然》的封面。谷歌使用54量子比特的量子计算机来完成传统架构的计算机无法完成的任务。在当时世界上第一台超级计算机的万年实验中,谷歌的量子计算机只用了3分20秒。尽管这项研究一经发表就遭到了IBM等同行的质疑,量子计算的实际应用还面临着种种挑战,但毫无疑问,在摩尔定律逐渐失效的今天,它变得越来越紧迫寻找未来的计算机体系结构。量子计算机是最有前途的方向之一。在I/O大会上,谷歌展示了更大的野心:他们想用100万个物理量子比特来构建具有纠错能力的量子计算机。与如今不到100个物理位的量子计算机相比,这个想法实在是太大胆了。资料来源:https://www.cnet.com/news/quantum-computer-makers-like-their-odds-for-big-progress-soon/根据计划,这些量子比特仍将在接近绝对零的温度下运行向下。谷歌乐观地认为,它会在这个十年结束前实现这个想法。众所周知,虽然量子计算机存在一些问题(如大数分解和无序数据库搜索),但其计算能力远超经典计算机。然而,存储量子信息的物理系统不可避免地会与环境相互作用,受到噪声的影响而失去量子特性,从而失去精确计算的能力。这里的噪音可能只是一点点热量。为了纠正一个量子位的错误,我们需要围绕该量子位的许多其他物理量子位。这些物理量子比特可以组成一个“逻辑量子比特”。谷歌表示,他们将通过将1,000个物理量子位连接在一起来构建这个逻辑量子位,以实现纠错。如果可以做到这一点,我们将拥有一个可以像普通计算机一样连续工作的“完美量子位”。这将是一个重要的里程碑。有了一个能够纠错的量子比特,我们就可以组合两个(或更多)这些逻辑量子比特,就像量子时代的晶体管一样。构建1,000个逻辑量子位可能需要数百万个物理位,整个机器可能占满一个房间。在本次I/O大会上,谷歌推出了他们的“量子AI公园”来实现这一愿景。该园区位于加利福尼亚州圣巴巴拉,拥有谷歌的第一个量子数据中心、一个量子硬件研究实验室和他们自己的量子处理器芯片制造设施。谷歌表示,建造这样一台量子计算机的目的是为了拥有前所未有的计算能力,以解决新药研发等问题。Android12和WearOS尽管Android12的特性在之前的开发者预览版中已经曝光了不少,但谷歌在I/O大会上发布的实质性更新提供了正式版的更多细节。对于用户来说,最明显的更新就是新的主题。Android12将采用全新的“MaterialYou”设计,提供大量自定义样式和功能。谷歌在原有的黑白颜色基础上增加了动态主题颜色,可以根据用户选择的壁纸选择相应的特殊颜色。此外,所有按钮、滑块和所有其他UI小部件都进行了重塑和重新排列。此外,Android12还出现了全新的滚动列表设计,就像三星手机上的OneUI一样。在台式机上,谷歌正在向苹果学习。新的标准化小部件包含许多详细内容,例如应用程序的大“图标”。这种设计可以在当今手机普遍较大的屏幕上显示更多内容。此外,谷歌还在新的安卓系统中提供了大量的隐私保护功能。目前,Android12Beta版本已经正式上线,支持11家手机厂商的设备。在IO大会上,谷歌还发布了最新版WearOS的消息。虽然据统计,2020年全球可穿戴设备出货量已达1.93亿台,智能手表和手环出现在人们生活中的频率也越来越高,但AndroidWearOS在手表行业的存在感一直比较单薄。WearOS的上一次重大设计变更是在2018年,新版本的WearOS更名为Wear,并获得了更多厂商的支持。三星下一代智能手表GalaxyWatch4将采用基于该架构的Tizen系统,让应用程序运行速度更快,更省电。此外,谷歌还发布了协同办公套件Smartcanvas等一系列工具,并首次在GoogleMap中加入了详细的自行车导航功能,并对GoogleMeets进行了大量的技术更新。关于本次I/O大会的更多详情,可以参考谷歌I/O专题界面或观看回放。专题页面地址:https://www.blog.google/
