当前位置: 首页 > 科技赋能

在一篇文章中阅读它!百度AI在李彦宏的带领下如何开花结果?

时间:2024-05-22 10:09:55 科技赋能

7月4日,北京国家会议中心,这是百度转型AI战略以来举办的第二届百度AI开发者大会。

与第一届相比,技术配方和味道更加纯粹,今年的焦点不再是举旗造势,更多的是对技术成果的解读和商业化的讨论。

过去一段时间,很多人都有过这样的疑问?先是陆奇亲自帮助百度理顺了AI通道,然后淡定地离开了游戏。

对百度影响大吗?之前大胆设定的目标路径还能维持吗?其次,百度一直说自己是一家AI公司。

其主营AI业务的真实情况如何?如何实现业务转型和技术变现?因此,李彦宏特意利用一次AI开发者大会交出一份长长的答卷,用答卷证明陆奇的离开对于百度来说不会是一个严重的问题,并且他可以带领一批技术高管实现AI的落地。

以健全且令人印象深刻的方式制定战略。

无人驾驶汽车量产、AI开放平台和芯片、智能小程序的推出……一步一个脚印,一次一个亮点,一步步形成技术体系和商业生态的闭环将形成。

AI全栈技术布局:多模态深度语义理解+“昆仑”芯片 百度高级副总裁、AI技术平台体系(AIG)总总监王海峰详细解读百度大脑3.0,从芯片开始到深度学习框架,百度大脑已经形成了技术、平台、生态的全栈AI技术布局。

发布会上,李彦宏播放了一段电话录音。

一位即将参加开发者大会的嘉宾与百度智能客服进行了多轮对话。

问题和答案都很自然。

后来有消息透露,录音中的客服人员并非人类。

它就是AI,背后是百度大脑的自然语言理解、语音识别和合成技术。

王海峰指出,百度AI能力的核心是百度大脑,百度大脑3.0是百度AI能力的巅峰之作。

八年前,基于多年的搜索技术积累,百度开始布局AI。

今年9月,正式发布“百度大脑”。

如今,百度大脑的能力已经从1.0进阶到3.0。

百度大脑1.0已完成基础能力建设和核心技术初步开放。

2.0已经形成了完整的技术体系,开放了60多项AI核心能力。

3.0的核心是“多模态深度语义理解”,同时开放。

多重AI能力覆盖算法层、感知层、认知层、平台层。

百度大脑3.0提出“多模态深度语义理解”。

“多模态深度语义理解”是指对文本、声音、图片、视频等多模态数据和信息进行深度、多维度的语义理解,包括数据语义、知识语义等多种语义理解技术、视觉语义、语音语义集成、自然语言语义。

王海峰表示,“多模态深度语义理解不仅能让机器听清楚、看清楚,还能理解背后的含义,深刻理解现实世界,从而更好地支持各种应用。

“数据语义技术可以将全球多样化、异构性、多模态的三维空间大数据转化为包含千亿节点、万亿关系的庞大数据语义网络,从中总结规则、提炼知识、帮助经济社会发展,比如在新能源充电桩的智能运维方面,结合百度的大数据、深度学习等技术进行设备监控和故障诊断,可以显着提高效率、节省成本。

构建了包含亿万实体、千亿事实的庞大知识图谱,除了由实体、属性、关系组成的基础实体图谱外,我们还构建了针对不同应用场景和知识形态的焦点图谱和焦点图谱。

事件图、多媒体图、行业知识图等构成了百度大脑的基础。

视觉语义可以使机器清晰地理解视频并提取结构化的视觉语义知识。

该技术应用于世界杯视频分析,可全面识别视频中的球员、裁判、球、球门、场线等人、物、场景,可捕捉射门、进球、角球、任意球、换人等情况。

基于这些的事件。

语义知识不仅可以完成机器人自动讲解,还可以进行精彩片段采集和各种数据统计分析。

在现实超市购物场景中,百度视觉语义技术可以识别人、动作、物品。

将时间序列关联起来,将数字视频转化为结构化语义知识,不仅可以为顾客提供完整的无人超市购物体验,还可以利用语音语义集成和自然语言理解技术帮助商店经营者分析和优化商店运营。

它可以让机器准确地识别和理解人所说的话,实现更自然的人机对话。

王海峰现场对百度地图讲了一长串绕口令般的导航要求。

百度地图语音智能助手完美识别并给出最佳路线。

其中,李彦宏在智能客服电话开始向参会者播放的片段,也得到了这些领先的AI技术的支持。

王海峰介绍,百度免提语音识别在高噪声环境下的准确率提升了10个百分点,语音语义得到改善。

集成技术使远场语音识别准确率提高10个百分点;在语音合成方面,WaveNet+拼接情感语音合成技术也大幅提升了流畅度和自然度。

王海峰以会话理解和阅读理解为例。

我们引入了百度领先的自然语言理解技术。

百度的对话理解技术已经有多年的积累。

通过开发最新的深度注意力匹配模型,它比阅读理解技术中最知名的结果提高了 4.1%。

,百度大脑阅读了数千亿篇文章,相当于中国国家图书馆的6万册图书,从而积累了数十亿实体和数千亿事实的知识。

“通过知识的不断获取和积累,百度大脑的理解能力不断升级,智能化水平显着提升,能够更好地服务用户。

”王海峰说道。

百度大脑3.0提出“多模态深度语义理解”。

其背后是百度自主研发的深度学习框架PaddlePaddle。

目前也迭代到3.0版本,包括完整的核心框架以及AIStudio、AutoDL、EasyDL等,可以成为开发者轻松获取百度AI能力的平台。

PaddlePaddle3.0核心框架对服务器版和移动版进行了全面优化,可以灵活适应广泛的开发需求。

AutoDL可以更高效地自动搜索神经网络结构,开发者无需特殊硬件设备即可快速获得高质量模型; EasyDL可以帮助开发者零算法基础训练业务定制模型,无需了解深度学习即可操作可视化; AI studio具有云集成、易用、运行高效、资源免费等特点,是集“数据、算法、算力”于一体的PaddlePaddle培训平台,满足用户学习、技术进步、学术研究的需求一站。

百度大脑3.0首次将芯片纳入技术体系。

它使百度大脑能够整合软硬件能力,旨在驱动百度大脑的算力实现倍增。

百度自主研发的云端全功能AI芯片“昆仑”在大会上首次公开亮相。

“该AI芯片将与百度自主研发的PaddlePaddle深度学习框架深度融合,推动AI技术生态的快速发展。

”王海峰说道。

“昆仑”定位为云端全功能AI芯片。

采用14nm三星工艺,拥有顶级性能、GB/s内存带宽、+Watt功耗设计。

针对语音、NLP、图像等专门优化,同等性能下成本降低。

速度提高 10 倍,并支持多种深度学习框架。

就像谷歌选择TPU一样,百度自造AI芯片也是必然。

从2018年开始,为了满足深度学习计算的需求,百度开始研发基于FPGA的AI加速器。

与此同时,它开始使用GPU。

过去几年,百度在FPGA方面投入巨资。

GPU已经大规模部署。

AI应用的爆发对计算能力提出了越来越高的要求,基于传统芯片的AI计算加速已经不能满足需求。

在大规模AI计算的实践探索中,百度研发了专门针对大规模AI计算的芯片“昆仑”。

据称,其算力比最新基于FPGA的AI加速器高出近30倍。

王海峰表示,百度大脑每天被调用超过4000亿次。

来电者中有AI工程师、“AI”零基础的初学者,也有希望利用AI进行业务创新转型升级的各行各业人士。

的企业。

这些开发者和合作伙伴虽然身份不同、目标不同,但都从百度找到了最适合的AI接入方式。

百度AI智能小程序,深度探索移动端。

百度副总裁、百度APP及信息流业务系统总经理沉斗发布百度智能小程序。

一方面是日益成熟的AI产业,另一方面是日益火爆的小程序热潮。

智能小程序是百度AI在移动端挖掘潜力的关键一环,进一步连接搜索+信息流。

据透露,百度智能小程序将于今年12月全面开源。

不仅将全面接入百度大脑的AI能力,还将为用户和开发者打造开放、智能的移动生态系统。

目前,包括携程、苏宁易购、唯品会、同程、春雨医生、爱奇艺、优信二手车、查违章等近百家企业已成为首批加入智能小程序生态的合作伙伴,并将陆续推出他们自己的智能小程序。

程序。

百度智能小程序的开放性体现在两个层面。

首先,开发者只需修改几行代码,就能将自己在其他平台开发的小程序接入百度智能小程序。

百度智能小程序可以在百度应用(百度App、百度贴吧、百度网盘等)和外部合作应用(哔哩哔哩、58同城等)中无缝运行,实现一端开发、多端运营。

其次,百度还将开放数千亿的全球流量来支持开发者,帮助他们快速获取精准用户。

值得注意的是,百度流量与其他平台不同的是,百度流量中天然存在大量与信息、服务、工具等相关的需求。

尤其是在百度信息流中,用户看到的内容是根据兴趣进行匹配和推荐的。

,这些内容能够激发用户的各种需求,非常适合开发者探索。

沉斗强调:“如今,AI不再是‘锦上添花’,而是一项必备技能。

百度将开放AI能力,让开发者回归到业务理解和创造力的轨道,专注于自己的业务逻辑”。

据悉,百度大脑3.0的所有AI能力将向智能应用开发者开放。

这些能力包括语音、视觉、自然语言处理、知识图谱、增强现实、态势感知等类别。

其中一些功能甚至已经被打包。

,开发者可以直接调用。

同时,得益于百度的AI技术,百度智能小程序可以基于大数据、意图识别、兴趣识别等技术,精准匹配各类智能小程序用户,从而缩短用户转化路径,进一步提升开发者和用户的业务。

伙伴。

益处。

这位官员列举了几个案例。

接入百度智能小程序后,“违章查验智能小程序”全网DAU在50天内提升%,火车票智能小程序订单转化率在20天内提升44% 。

同时,百度贴吧小程序上线以来,人均使用时长增长超过30%。

DuerOS人机交互操作系统形成闭环,探索变现方式。

百度智能生活事业群(SLG)总经理景坤发布DuerOS 3.0。

他一直想坐上新一代人机交互操作系统的宝座。

“操作系统的三个核心要素是什么?第一是交互的改变;第二是新的应用生态;第三是率先打通商业模式的闭环。

”景鲲提出了操作系统的三要素,DuerOS 3.0正在完成这三要素的闭环。

DuerOS 3.0的更新主要包括核心技术能力的提升和场景及解决方案的拓展两大方面。

核心能力方面,DuerOS 3.0带来自然语言交互技术全面升级,提供情感语音播报、声纹识别、儿童模式、极客模式、智能引导纠错、视觉搜索能力、视频理解能力,全面领先行业。

打开。

在场景和解决方案方面,DuerOS3.0可以提供20多种跨场景、跨设备解决方案,包括屏幕设备解决方案、蓝牙设备解决方案、行业解决方案。

景坤展示了只有名片大小的模块解决方案。

通过该模块解决方案,可以将合作伙伴的屏幕设备变成可以用于对话的屏幕设备。

同时,DuerOS还与创新设计集团Rococo、洛克共享设计平台合作,针对行业、场景提供从技术到设计的一整套屏幕设备产品解决方案。

基于此,每个合作伙伴都可以打造自己的“小杜在家”。

目前,DuerOS上有0多名智能语音开发者,正在为DuerOS构建各种技能。

蓝牙设备解决方案可以植入蓝牙耳机、蓝牙音箱,将数以千万计的蓝牙设备瞬间变成对话式人工智能设备,行业解决方案逐渐覆盖酒店、养老设施等场景,在现场展示的洲际酒店及度假村的智慧酒店体验案例中,客人可以控制房间设备、通过语音播放音乐、询问天气等,改善酒店行业常规宾客体验 DuerOS 3.0迭代的最大亮点是打通商业模式生态闭环的开始。

为DuerOS添加新技能的开发者可以通过技能开发来赚钱,DuerOS正在成为一个让开发者盈利的对话式AI平台。

开发者可以通过四种方式从DuerOS获得收入:技能内付费、技能付费、亿元开发者扶持计划、DuerOS对话技能大赛。

DuerOS也正式推出业务共享模式。

景鲲宣布,前6个月,将把技能收入的%返还给开发者。

同日还启动了DuerOS亿元开发者扶持计划和DuerOS对话技能大赛,鼓励开发者打造更好的技能。

景鲲还在大会上公布了DuerOS的最新数据。

截至今年6月,DuerOS智能设备激活数已突破万台,月活跃设备数突破万台。

DuerOS平台拥有超过10家生态合作伙伴,超过多种主控设备搭载DuerOS,DuerOS平台开发者数量已超过0。

平台能力和商业化已经得到市场验证。

Apollo与车企建立了良好的关系,专注于量产解决方案。

Apollo开放平台已进入量产阶段。

去年11月的百度世界大会上,李彦宏当时表示,将在今年7月实现L4级自动驾驶汽车“阿波龙”。

量产,为了证明他所说的属实,发布会还远程连线金龙客车厦门生产车间,现场直播了首辆自动驾驶客车“阿波龙”下线的场景在车间里。

金龙客车董事长谢思宇全程观看了平台代言。

“阿波罗”的内饰设计比较先进。

该车辆没有方向盘、油门和制动踏板。

搭载Apollo L4级自动驾驶解决方案系统。

李彦宏介绍,这批“阿波龙”即将发往北京、雄安、深圳、福建平潭、湖北武汉等地进行商业运营,并将与金龙客车、软银集团旗下自动驾驶公司SB联手驾驭执行的“阿波龙神龙”销往日本,实现了我国第一辆自动驾驶电动车“出海”。

此外,李彦宏还宣布了量产“惊喜”——阿波罗打造的无人工作车新石器技术赋能的自动驾驶汽车也已量产,李彦宏表示:“自动驾驶汽车将从一辆发展到数百辆、数千辆、数万辆。

如此激动人心的未来,需要开发者共同创造和定义。

”开发者可以利用Apollo开发应用,在物流、工程、环卫、农业、公共交通、共享出行等9大运营场景中进行开发和应用。

李振宇,百度副总裁、智能驾驶事业群(IDG)总经理发布Apollo 3.0的同时,百度与比亚迪宣布共同打造开放车辆认证平台,实现Apollo智能驾驶软件平台的强强联合。

为此,百度总裁张亚勤也在会上与比亚迪董事长兼总裁王传福进行了探讨和对话:“Apollo 3.0是Apollo开放的新起点。

让每一个开发者平等、便捷地获得智能驾驶能力,就是Apollo从一开始就肩负的使命。

”李振宇表示,Apollo目前已开放超过22万行代码,超过1万名开发者推荐使用Apollo的开放代码,生态合作伙伴数量也不断增加。

达到数百万。

在量产方面,Apollo 3.0发布了三套自动驾驶解决方案:自动泊车(Valet Parking)、无人运营车(MicroCar)、自动穿梭巴士(MiniBus),帮助开发者和合作伙伴在三个月内完成项目落地。

创建你自己的“阿波罗”。

基于Apollo自动泊车解决方案,百度联手熊猫汽车实施国内首个自动驾驶共享汽车示范运营,并联手现代汽车实现定点连接应用。

此外,无人作业车新石器AX1也已量产,并在雄安、常州现场运营。

自动穿梭巴士“阿波龙”已在4个城市、5大场景开展常态化运营,并获得国家乘用车质量检测中心重庆试验场的安全认证。

此外,Apollo 3.0还带来了量产车联网系统解决方案——小度车载OS,并发布汽车语义开放平台。

安全是自动驾驶量产的真正考验。

同日,百度Apollo还与国际知名自动驾驶公司Mobileye合作,集成其核心自动驾驶安全模型RSS。

Apollo 3.0带来了智能仿真系统升级版:实景AR仿真,可提供虚拟交通流与实景渲染相结合的全栈闭环仿真解决方案,帮助开发者进行“日行百万公里” ” 模拟测试。