“技术前沿,覆盖面广,这是一个没有缺点的长篇分论坛”“详细的技术讲解,充足的落地案例,是一场“‘物超所值’的分论坛”……7月3日下午,“百度创造”百度AI开发者大会百度大脑论坛如期举行。
在上午的论坛上,百度首席技术官弗拉基米尔·王海峰正式发布了百度大脑5.0,基于算法突破和计算架构升级,实现了AI算法、计算的融合和创新。
架构和应用场景,成为集软硬件于一体的大型AI生产平台。
..都给观众留下了深刻的印象,拉近了AI技术与人之间的距离。
这背后隐藏着哪些顶尖技术?为什么百度大脑5.0被称为软硬件一体化的AI大生产平台?下午,充满“技术风”的百度大脑论坛一一揭晓。
语音、视觉、语言和知识人工智能算法创新齐头并进。
百度大脑5.0的重大升级,打通了从基础层深度学习技术到通用AI能力、应用技术解决方案,再到定制模型,以及最终部署集成的一切。
人工智能产业化应用的全过程实现了人工智能技术的标准化、自动化和模块化。
一直引领行业创新的百度大脑语音技术,展示了在语音识别、语音合成、远场语音交互芯片等方面的成果。
百度语音技术部高级总监高亮介绍,在识别方面,百度提出了流式多级截断注意力模型SMLTA。
这是全球首次局部注意力模型超过整个句子的注意力模型,也是全球首次实现。
大规模使用注意力模型的在线语音。
SMLTA不仅大大提高了识别速度,还提高了识别准确率。
有效输入法产品相对准确度提升15%,有效说话者产品相对准确度提升20%。
在合成方面,针对现阶段面临的风格迁移、音色模拟和情感拟人三大挑战,百度推出了Meitron语音合成技术,可以将语音中的音色、风格、情感等元素映射到不同的子空间。
不同元素可以任意组合,灵活控制合成语音的风格。
同时降低了语言合成的门槛,只需20句话就可以发出一个人独特的声音。
百度语音技术部高级总监高亮显示出对设备端应用的巨大需求。
百度大脑语音团队研发了一款用于远场语音交互的芯片——百度鸿鹄芯片。
鸿鹄芯片的设计改变了传统的芯片设计方法,遵循“软件定义芯片”的全新设计思想。
该芯片采用双核HiFi4架构,2.8M大内存,台积电40nm工艺。
基于该硬件规格,平均运行功耗约为MW,可支持远场语音交互核心的阵列信号处理和语音唤醒能力。
同时,鸿鹄芯片按照汽车级标准打造,满足极其严格的要求,将为车载语音交互、智能家居等场景带来更大的想象空间。
鸿鹄芯片流片的同时实现量产。
百度视觉科技今年在重大国际赛事中推出“作弊”模式。
在刚刚结束的CVPR上,它在视频理解、人脸生活、车载REID等领域获得了第一名。
上半年在NTRIE、ICME、ICDAR中获得第一名,在DWAN等比赛中也多次获得冠军。
百度视觉技术部及增强现实技术部总监吴忠钦表示,5G时代,越来越多的物理设备将连接到高可靠、低延迟的网络空间,这将彻底改变人们与现实世界的交互方式。
环境和设备。
全新发布的视觉语义平台2.0,正在推动视觉技术从“看得清楚、懂懂”向“互动”升级。
视觉语义平台2.0在交互升级和软硬件集成两大方面实现突破。
百度视觉技术部和增强现实技术部总监吴忠钦表示,交互升级包括一体化人机交互系统和大场景物理世界交互系统。
简单地说,一体化的人机交互系统就是人、机器、虚拟环境的自然交互和融合。
该系统适用于直播、短视频、特效小程序等实现AR特效的场景。
已在众多百度视频应用中使用。
。
大场景物理世界交互系统是视觉定位与AR技术的突破性结合,实现大范围的虚拟信息与物理世界的精准叠加,从而建立AI时代的全新交互系统。
目前,软硬件结合可以满足应用场景对更高效的视觉计算和更低延迟的体验的需求,同时保护数据隐私。
百度视觉的软硬件结合主要集中在三个部分:模型压缩平台PaddleSlim、多模态FaceID开发组件、软硬件一体化解决方案AI摄像头。
FaceID覆盖的设备数量已超过10000台。
视觉语义平台2.0更新了多项先进感知技术,也实现了机器人技术的新突破。
百度3D视觉首席科学家杨瑞刚介绍,机器人是一个智能体。
除了感知技术之外,智能体还需要决策和行动相关的技术来实现从环境感知到主动感知。
目前,百度在智能技术方面的研究主要集中在自动驾驶Apollo、工程机械和服务机器人三大方面。
上午在主论坛上引起关注的机械臂“茶医生”不仅能言善辩,还完成了向长口壶倒茶的传统任务。
其背后是服务机器人解决方案。
基于百度3D视觉,机器人可以检测并跟踪茶杯的位置。
通过机器人运动规划和控制,机械臂可以检测工作空间内的碰撞并避开障碍物;实时规划运动后,可自动生成倒茶轨迹;然后,它可以感知水流的变化,实时调整倒茶位置。
语音语义联动技术分析,让机器人像“人”一样,能听懂、能说、能准确做事。
百度3D视觉、百度大脑首席科学家杨瑞刚也宣布了在语言和知识技术方面的一系列创新和突破。
百度AI技术平台体系执行总监吴天介绍,百度设计并实现了知识增强语义理解框架——ERNIE,具有可持续学习能力,不断提升核心模型能力。
目前,ERNIE 已学习超过 10 亿条知识,全面刷新中文 NLP 任务指标,并在多个百度产品应用中提升成绩。
机器同声传译也有最新进展,如在翻译过程中对语音识别结果进行校正的联合词向量编码技术、能够解决多轮翻译的一致性和连贯性问题的语篇翻译模型等,并结合先进的语音技术方面,百度大脑实现了高精度、低延迟的机器同声传译技术。
吴天,百度AI技术平台系统执行总监,能够帮助AI更深入地理解现实世界。
主论坛上,王海峰利用近期发布的音乐纪录片《大河唱》生动地展示了百度知识图谱技术的视频语义理解能力。
该技术分析视频的多模态知识,在多个异构知识图谱上建立关联,通过计算推理建立对视频的深度语义理解。
此外,吴天还正式发布了行业知识图谱平台和智能创作平台2.0。
行业知识图谱平台旨在满足各行业构建和应用知识图谱助力智能化的需求。
行业知识图谱平台基于领先的知识图谱核心技术,提供智能高效的知识生产流程、低成本启动和跨行业迁移。
能够帮助行业开发者定制和应用行业知识图谱。
全新的智能创作平台集成了实时热点追踪和相关丰富素材。
它已经具备全面的创作辅助能力,可以轻松解决传统内容创作面临的问题,全程辅助创作者。
吴天还宣布将于10月份进行邀请测试。
多模态自动创建功能。
目前,百度已建成百度大脑·语言与知识技术开放平台,不仅拥有丰富的基础技术,还形成了包括智能创作平台、UNIT平台、知识图谱构建与应用平台在内的翻译开放平台,共有四个应用级别。
该平台为不同领域提供百度领先的语言和知识技术。
强化基础实力,聚焦AI计算,挖掘数据价值。
百度大脑5.0不仅包括算法层面的创新,还在算力方面实现了重大突破。
近年来,算法的计算能力要求增长了近 , 倍,而芯片的计算性能仅增长了 30 倍。
两者之间存在着巨大的差距。
百度副总裁侯振宇与观众分享了百度新一代AI计算架构。
面对AI计算的挑战,需要能够提供端到端的AI计算能力。
这就要求计算系统从原来追求海量数据处理能力、高IO峰值,转变为满足IO密集、高速的AI训练功能。
计算密集型和通信密集型需求,以及AI推理功能的大吞吐量和低延迟需求。
百度副总裁侯振宇侯振宇认为,在即将到来的AIG时代,计算将无处不在。
真正的计算将发生在设备(Device)、边缘(Edge)和云(Cloud),因此D-E-C场景将是下一步研究重点;同时,包括芯片之间、系统之间、设备之间的互联,将有助于连接不同场景下的计算,产生更大的算力。
操作系统还需要连接底层芯片和上层应用程序。
王海峰认为,深度学习框架是智能时代的操作系统。
“飞桨”是百度研发的国内唯一全功能深度学习平台,是中国自己的“人工智能操作系统”。
主论坛上,正式宣布百度飞桨与华为麒麟芯片深度连接。
全球领先的端侧AI芯片和深度学习平台,将共同为端侧AI提供最强大的算力,创造最佳的深度学习运行效率。
许多开发者对飞桨非常熟悉。
百度深度学习技术平台部总监马彦军详细介绍了飞桨的5大核心优势。
在核心框架层面,飞桨同时支持动态和静态图像,兼顾灵活性和效率;飞桨提供70多个官方模型,达到工业级应用效果; Flying Paddle支持大规模分布式训练和端到端部署;针对中国开发者,飞票提供系统的深度学习技术服务,中文支持非常全面。
马彦军在现场还表示,科技界的“奥斯卡”已经成功举办了15年。
经典活动“百度之星”即日起开始报名。
其中,百度之星编程大赛的任务是开发飞桨核心框架;百度之星开发大赛,是一个基于飞桨的目标检测任务。
百度深度学习技术平台部总监马彦军表示,为了降低建模成本、提高建模效率、减少对大数据的依赖、减少人工干预,百度开发了AutoDL自动化建模技术。
论坛上,百度大数据实验室主任焕军正式发布了AutoDL 3.0,从设计、迁移、适配三个方面进行了全面升级,并分享了多个实际案例。
目前已通过 Fei Paddle 正式开源。
百度大数据实验室主任焕军开发了飞票这个源于行业实践的深度学习平台,也在反哺行业。
以交通领域为例,百度地图事业部总经理李颖介绍,百度地图基于飞桨提高了ETA开发调试的便捷性和训练效率,日均完成百亿数据训练基础;它改进了 ETA 的部署和预测性能,支持每天数百亿次呼叫。
ETA是地图路线规划的主要特征,也是用户出行决策的主要参考因素。
对于用户来说,飞桨搭载的百度地图预计到达时间可以实现智能预估出行时间,出行前提前预测交通状况,避开拥堵时段,了解拥堵持续时间,避开拥堵路线,合理规划出行时间。
百度地图事业部总经理李颖 数据是AI时代的核心生产资料。
当前,大数据产业发展面临两大问题:数据资产安全和数据价值挖掘成本高。
百度大数据部高级总监郭燮表示,百度点石大数据技术开放平台作为国内首个大数据iPaaS平台,重点关注大数据产业发展过程中的安全和效率两大问题。
同时,点石拥有安全的数据融合处理环境、多级开放可定制组件、功能集成的大数据开发平台三大核心特性,可以帮助开发者安全高效地挖掘大数据的价值。
。
百度希望通过点石成金加速大数据生态发展,帮助开发者深度挖掘数据价值,点石成金。
百度大数据部高级总监郭燮表示,创新的百度大脑5.0融合了AI算法、计算架构和应用场景,成为软硬件一体化的AI大规模生产平台。
下午百度大脑论坛近三个小时的分享,只是百度大脑技术的“冰山一角”。
除了顶级技术之外,百度大脑还将持续开放赋能。
目前已开放10余项领先的AI技术能力。
平台来电量同比增长1%。
定制平台模型的数量正在快速增长。
平台开发者数量已达1万人。
王海峰说:“授人以鱼,不如授人以渔”。
百度研发顶尖人工智能技术,并致力于开放顶尖人工智能技术。
百度大脑5.0帮助各行各业的工业开发者加速工业智能化。