当前位置: 首页 > 科技观察

跨越算力鸿沟:百度推出全新AI计算架构结合飞桨优化计算能力

时间:2023-03-21 13:18:21 科技观察

“技术前沿,覆盖面广。”“物超所值”分论坛”...7月3日下午,“百度创造2019”百度AI开发者大会百度大脑论坛如期举行。在上午的主论坛上,百度首席技术官王海峰正式发布了百度大脑5.0,实现了跨越式升级。集成AI量产平台。吸睛的“机械臂倒碗茶”、任性的“中英畅谈”、智能语音芯片“百度鸿鹄”……都给观众留下了深刻的印象,拉近了AI科技的距离和人。这背后隐藏着哪些先进技术?百度大脑5.0为什么被称为软硬件一体化的大规模AI生产平台?充满“技术风”的百度大脑论坛一一揭晓。语音、视觉、语言、知识AI算法创新齐头并进。重磅升级的百度大脑5.0,从基础层的深度学习技术,到通用AI能力、应用技术解决方案,再到定制化模型,以及后期部署集成。人工智能产业化应用全过程实现了人工智能技术的标准化、自动化和模块化。百度大脑语音科技此次展示了其在语音识别、语音合成、远场语音交互芯片等方面的成果。百度语音技术部高级总监高亮介绍,在识别方面,百度提出了流式多级截断注意力模型SMLTA,实现了超越整句注意力模型的局部注意力建模,也是首次在全球范围内实现在线语音注意力模型的大规模使用。SMLTA在大大提高识别速度的同时,也提高了识别准确率。有效输入法产品相对准确率提升15%,有效音箱产品相对准确率提升20%。在合成方面,针对现阶段风格迁移、音色模拟和情感拟人化三大挑战,百度推出了语音合成技术Meitron,可以将语音中的音色、风格、情感等元素映射到不同的子空间。不同的元素可以任意组合,灵活控制合成语音的风格。同时降低了语言合成的门槛,只需20句话就可以打造出一个人的专属声音。端侧落地应用需求巨大,百度大脑语音团队研发了远场语音交互芯片——百度鸿鹄芯片。鸿鹄芯片的设计改变了传统的芯片设计方式,遵循“软件定义芯片”的全新设计思路。芯片采用双核HiFi4架构,2.8M大内存,台积电40nm工艺。基于该硬件规格,约100mw的平均工作功耗即可支持远场语音交互核心的阵列信号处理和语音唤醒能力。同时,鸿鹄芯片按照车规级标准打造,满足非常严苛的要求,将为车载语音交互、智能家居等场景带来更大的想象空间。鸿鹄芯片流片的同时,实现了量产。百度视觉科技开启了2019年国际重大赛事的“开挂”模式,在不久前结束的CVPR上,在视频理解、人脸活体、车辆REID等领域取得了骄人的成绩。、DWAN2019等比赛也屡屡夺冠。百度视觉技术部及增强现实技术部总监吴忠勤介绍,5G时代,越来越多的物理设备将连接到高可靠、低时延的网络空间,这将彻底改变人与物的交互方式。环境和设备。此次全新发布的视觉语义平台2.0,正在推动视觉技术从“看得清楚”到“互动”的升级。视觉语义平台2.0在交互升级和软硬件结合两个方面实现了突破。交互升级包括一体化人机交互系统和大场景物理世界交互系统。简单地说,集成人机交互系统就是人、机器和虚拟环境的自然交互和融合。本系统适用于直播、小视频、特效小程序等实现AR特效的场景。已应用于各种百度视频应用。.大场景物理世界交互系统是视觉定位与AR技术的突破性结合,实现大规模虚拟信息与物理世界的精准叠加,从而建立AI时代的全新交互系统。目前,软硬件结合可以满足应用场景中更高效的视觉计算需求,更低时延的体验,同时保护数据隐私。百度视界的软硬件结合主要集中在模型压缩平台PaddleSlim、多模态FaceID开发组件、软硬件一体化解决方案AI相机三部分。FaceID覆盖的设备数量已超过1200万。视觉语义平台2.0更新了许多先进的感知技术,也在机器人技术上取得了新的突破。百度三维视觉首席科学家杨瑞刚介绍,机器人是一种智能体。智能体除了感知技术外,还需要决策和行动相关的技术,实现从环境感知到主动感知。目前,百度研究的智能车身技术主要集中在自动驾驶Apollo、工程机械和服务机器人三个方面。在上午的主论坛上,机械臂“茶博士”不仅会说话,还完成了传统的长嘴茶壶倒茶工作,这就依赖于服务机器人的解决方案。基于百度3D视觉,机器人可以检测并跟踪茶杯的位置。通过机器人运动规划和控制,机械臂可以对工作空间进行碰撞检测,避开障碍物;实时规划运动后,自动生成倒茶轨迹;然后,感应水流变化,实时调整倒茶位置。语音语义联动技术的分析,使机器人像“人”一样,听得懂,说得好,做得准。在语言和知识技术方面,百度大脑也宣布了一系列的创新和突破。百度AI技术平台系统执行总监吴天介绍,百度设计并实现了知识增强语义理解框架——ERNIE,具有可持续的学习能力,不断提升核心模型能力。目前,ERNIE积累了超过10亿条知识,全面刷新了中文NLP任务指标,并在众多百度产品应用中提升了效果。机器同声传译也有新的发展,如在翻译过程中纠正语音识别结果错误的联合词向量编码技术,可以解决多轮翻译的一致性和连贯性的文本翻译模型等,结合先进的语音技术,百度大脑实现了高精度、低延迟的机器同声传译技术。知识可以帮助人工智能更深入地理解现实世界。在主论坛上,王海峰用最近火爆的音乐纪录片《大河唱》,展示了结合百度知识图谱技术的视频语义理解能力。该技术通过对视频的多模态知识分析,在多个异构知识图谱上建立关联,通过计算推理建立对视频的深度语义理解。此外,吴天还正式发布了行业知识图谱平台和智造平台2.0。行业知识图谱平台旨在满足各行各业构建和应用知识图谱的需求,助力智能化。行业知识图谱平台基于优秀的知识图谱核心技术,提供智能高效的知识生产流程、低成本启动和跨行业迁移能力,帮助行业开发者定制和应用行业知识图谱。全新智能创作平台,实时热点追踪,关联丰富素材。已经具备完善的创作辅助能力,可以轻松解决传统内容创作面临的问题,全程助力创作者。吴天还宣布,将于10月邀请测试多模式自动创作功能。目前,百度已建成百度大脑·语言知识技术开放平台,不仅拥有丰富的基础技术,还形成了智能创作平台、翻译开放平台、UNIT平台、知识图谱构建与应用平台。该平台为不同领域提供百度先进的语言和知识技术。夯实基础实力,聚焦AI计算,挖掘数据价值百度大脑5.0不仅包括算法层面的创新,在计算能力上也实现了重大突破。近年来,对算法算力的需求增长了近30万倍,而芯片的计算性能仅增长了30倍。两者之间有着巨大的差距。百度副总裁侯振宇为现场观众分享了百度下一代AI计算架构。面对AI计算的挑战,需要能够提供端到端的AI计算能力。这就要求计算系统从过去追求海量数据处理能力和峰值IO,转变为满足IO密集型和计算密集型、通信密集型需求,以及AI推理功能的高吞吐量和低时延需求。侯振宇认为,在即将到来的AI+5G时代,计算将无处不在。真正的计算将发生在设备(Device)、边缘(Edge)和云端(Cloud),因此D-E-C场景将是下一个需要研究的问题;同时,包括芯片之间、系统之间、设备之间的互联互通,将有助于将不同场景下的计算连接在一起,产生更大的算力。在底层芯片和上层应用之间,需要承载操作系统。王海峰认为,深度学习框架是智能时代的操作系统。百度自主研发的国产全功能深度学习平台“飞桨”,是中国自己的“AI操作系统”。在主论坛上,官方宣布百度飞桨与华为麒麟芯片深度互联。先进的端侧AI芯片和深度学习平台,共同为端侧AI提供强大的算力,打造高速的深度学习运行效率。很多开发者都非常熟悉飞桨。百度深度学习技术平台部总监马延军详细介绍了飞桨的5大核心优势。在核心框架层面,FlyingPaddle同时支持动态图和静态图,兼顾灵活性和效率;飞桨官方提供了70多个达到工业级应用效果的模型;FlyingPaddle支持大规模分布式训练和End-to-end部署;针对中国开发者,Paddle提供系统的深度学习技术服务,中文支持非常全面。马延军还在现场表示,技术界的“奥斯卡”已经成功举办了15年。Sai是一个基于飞桨的目标检测任务。为了降低建模成本,提高建模效率,减少对大数据的依赖,减少人工干预,百度开发了AutoDL自动建模技术。论坛上,百度大数据实验室主任桓军正式发布了AutoDL3.0,在设计、迁移、适配等方面进行了全面升级,并分享了多个实际案例。目前已经通过Paddle正式开源。源自行业实践的深度学习平台飞桨也在反哺行业。百度地图事业部总经理李颖以交通领域为例,介绍了百度地图基于飞桨提高了ETA的开发调试便利性和训练效率,完成了日级百亿级数据训练;提升ETA部署和预测性能,支持日级百亿调用。ETA是地图路线规划的主要特征,是用户出行决策的主要参考因素。对用户而言,飞桨助力的百度地图ETA可实现出行时间智能预估,出行前提前预测路况,避开拥堵时段,了解拥堵时长,避开拥堵路线,合理规划出行时间。数据是AI时代的核心生产资料。当前大数据产业发展面临两大问题:数据资产安全和数据价值发现成本高。百度大数据部高级总监郭谢介绍,百度点石大数据技术开放平台作为一个成功的大数据iPaaS平台,着眼于大数据行业发展中的安全和效率两大问题。同时,点石拥有安全的数据融合处理环境、多层次开放可定制的组件、功能集成的大数据开发平台三大核心特性,可以帮助开发者安全高效地发现大数据的价值。百度希望通过点石加速大数据生态建设,帮助开发者深度挖掘数据价值,点石成金。创新的百度大脑5.0集AI算法、计算架构、应用场景于一体,成为软硬件一体化的大规模AI生产平台。下午在百度大脑论坛上近三个小时的分享,只是百度大脑技术的“冰山一角”。除了先进的技术,百度大脑还将持续开放赋能。目前已经发布了210多项先进的AI技术能力。平台调用量同比增长108%。定制平台模型的数量正在快速增长。参加人数已达130万人。王海峰说,“授人以鱼不如授人以渔”。百度在发展AI技术的同时,也致力于开放优秀的AI技术。百度大脑5.0助力各行各业的工业开发者,加速工业智能化。