当前位置: 首页 > 科技观察

百度王海峰:多模态深度语义理解将让AI更深地理解真实世界

时间:2023-03-21 13:33:17 科技观察

百度王海峰:多模态深度语义理解将让AI更好理解现实世界百度王海峰总经理发布百度大脑3.0,并指出百度大脑3.0的核心是“多模态深度语义理解”,包括数据,知识的语义,以及图像、视频、声音、语音等方面的理解。多模态深度语义理解如何在技术上实现?它有多少能量?它将如何应用于改变我们的生活?在当天下午的百度大脑论坛上,百度大脑3.0的核心技术被一一“揭开面纱”,为开发者带来了一场科技盛宴。可容纳1000人的会场座无虚席,开发者甚至席地而坐,或站在会场旁聆听整个分享。一位开发者表示,“干货太多,时间太少,回去得找回放视频消化一下。”听得清楚,看得清楚,才能更好地理解背后的含义,深入了解现实世界,进而更好地支持各种应用。”王海峰说。视觉语义可以让机器从看得见的视频中理解视频,提取结构化的语义知识百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤介绍,视觉语义技术首先对人、物体、场景进行识别,同时捕捉它们之间的行为和关系,形成语义。知识,最后结合领域和场景进行智能推理,实现行业应用。比如在零售领域,可以准确判断每个人的动作和行为,真正实现顾客提货走人。未来,视觉语义技术可以进一步扩展,它结合了新的传感器和AI芯片,可以大幅度提高感知水平和计算水平;结合手机,可以给用户带来更好的体验。未来,百度视觉语义技术将在百度AI开放平台向开发者开放。语音技术的升级让机器更好地理解世界。百度语音技术部总监高亮表示,百度在基于远场的语音语义融合技术上取得了重大突破,为业界提供了更先进的远场语音技术。语音语义融合,将远场交互中的中高频查询识别准确率提升10个点,普通查询识别率保持不变;基于DeepPeak2的多语言混合声学建模,大大提高了中英文混合查询的识别准确率和相对错误率,比业界领先的竞品低20%;全新升级的TTS技术是业界首创的传统拼接技术与Wavenet技术的融合方案,在保证合成质量的同时大幅降低成本,实现大规模应用。此外,百度发布低成本远场语音技术解决方案“度小云”,基于DeepPeakV2语音识别技术、语音语义融合技术和LSTM-VAD深度学习语音分割技术,实现行业领先五项先进的唤醒技术,并拥有基于Wavenet的精美音色库,支持远场优化的音频通信技术。未来,开发者可以一站式平等便捷地获取百度的远场语音能力。机器要像人类一样智能,将语言转化为知识是必不可少的。百度AI技术平台系统执行总监吴添表示,经过多年发展,百度自然语言处理技术已形成全面、前沿的格局。百度知识图谱已经发展成为一个复杂、多样、综合的多语义知识图谱,包括实体图谱、行业图谱、事件图谱、焦点图谱和多媒体图谱,其中实体图谱已经可以覆盖90%的实体及其属性一般要求。在阅读理解技术方面,百度大脑阅读了数千亿篇文章,相当于中国国家图书馆的6万册图书,积累了数十亿实体、数千亿事实的知识。每天产生的知识在实际应用中不断优化。在对话理解方面,百度理解交互技术平台UNIT升级至2.0,进一步增强冷启动能力,支持像人一样在对话中学习。开发人员无缝连接到云。百度将持续开源新技术,提供更加灵活便捷的解决方案,推动自然语言理解技术的创新发展。基础扎实:数据、算法、算力齐头并进数据、算法、算力是影响人工智能技术发展的重要因素。在主论坛上,王海峰表示,百度大脑3.0***将芯片融入技术体系,带动百度大脑算力爆发式增长。百度自主研发的国内首款云端全功能AI芯片“昆仑”也在大会上亮相。未来,AI芯片将与百度自主研发的PaddlePaddle深度学习框架相结合,推动AI产业生态的快速发展。PaddlePaddle于2016年由百度正式开源,是最适合中国开发者的深度学习框架。在主论坛,王海峰发布了PaddlePaddle3.0。下午,百度AI技术生态部总经理余友平进行了详细解读。PaddlePaddle3.0包含完整的核心框架,以及AIStudio、AutoDL、EasyDL等平台,让开发者平等、便捷地获得高级AI能力。PaddlePaddle3.0核心框架对服务器版和移动版进行了全面优化。PaddlePaddleFluid提供了丰富的API,满足常见的主流模型构建需求,支持广泛的模型构建,训练运行时可满足各类模型训练需求;PaddlePaddleServing可灵活适配多种预测引擎;PaddlePaddleMobile融合了百度在移动预测方面的实践经验,提供多平台支持。在PaddlePaddle3.0中,AutoDL备受关注。据百度大数据(北京)实验室主任焕军介绍,AutoDL可以更高效地自动搜索神经网络结构,开发者无需特殊硬件设备即可快速获得高质量模型。AutoDL提供了多种能力来支持新的深度学习网络结构的设计,以及对现有深度学习网络结构和参数的优化,同时能够适应特定的任务场景。随着海量数据的爆发式增长,挖掘数据的价值成为众多行业的共同需求。百度大数据部总监郭谢表示,百度已经形成了从数据到数据工程、数据科学、数据产品再到行业解决方案的大数据产品技术栈。基于大数据的特点,从生产资料和生产工具两个方面推动产业发展。.为最大程度保障数据安全,百度正式发布大数据智慧开放平台“丹石”,基于全球领先的百度AI技术,全面保障数据安全,逐步开放工具能力,为行业数据安全赋能。现场,百度展开多项竞赛。百度之星开发者大赛将如期回归。此外,还有基于PaddlePaddle的中国大学生计算机大赛人工智能创意赛、KG-知识抽取赛、交通预测赛、无人车系列赛,以及商业标志分类检测、人工智能大数据智能加速器应用与设计等竞赛。百度方面表示,欢迎各界专家前来挑战,共同努力,通过大赛推动整个人工智能产业的发展。业内人士评价,百度在推动技术落地的同时,不断反哺技术升级,现已成为中国人工智能领域的领跑者。百度大脑升级到3.0,也标志着百度AI技术的跨越式升级。正如王海峰在开篇所强调的,“百度AI能力的核心是百度大脑,百度大脑3.0是百度AI能力的集大成者”。基于百度大脑不断突破的技术实力,百度有能力为中国的开发者和企业提供最新的AI技术,让每一位开发者和企业都能平等获得最新的AI能力,进而让AI在中国普及.遍地开花。