2020年10月11日,北京金秋时节,第九届好墨AI DAY如约而至。
已安排。
今年HAOMO AI DAY的主题是“BETTER AI,BETTER HAOMO”。
豪模发布了三款“性价比极高”的千元无价车型,充分满足高、中、低价智能驾驶车型的量产需求;好墨发布业界首个自动驾驶生成大型模型DriveGPT雪湖海若公布最新成果:共筛选了超过1亿帧互联网图像数据集和1万条包含人类驾驶行为的自动驾驶4D Clips数据出去;进一步升级引入多模态大模型,获得识别万物的能力;进一步结合NeRF技术,渲染重建4D空间;借助LLM(大语言模型),自动驾驶认知决策配备了世界知识。
产品层面,搭载好魔城NOH功能的威牌蓝山将于2020年第一季度正式量产上市;小魔驼即将在2020年第四季度实现超市履约配送场景盈利。
(好墨董事长、张凯已发布三款“性价比极高”的千元HPilot产品)成立近四年来,Haomo始终引领中国自动驾驶技术潮流,HAOMOAIDAY已成为中国自动驾驶技术的一面旗帜。
飞墨在行业内率先布局大模型、大数据、大算力技术的发展方向,冲刺自动驾驶3.0时代。
(BiMo CEO顾伟豪公布DriveGPT上线日重要成果)BiMo董事长张凯表示:“BiMo一直在全力投入AI自动驾驶的技术浪潮。
BiMo在技术上坚持进取路线和长远主义投资使得毫米波车型成为中国自动驾驶发展的新范式,“三千元HPilot产品的推出将以‘极致性价比’抢占智能驾驶市场。
“2020年我国高端智能辅助驾驶市场将迎来大爆发。
”活动现场,张凯以《BETTER AI,BETTER HAOMO》为主题,分享了他对2018年智能驾驶市场竞争态势的判断以及四大大战的最新进展。
张凯介绍,目前,乘用车销量和智能指数稳步提升,而智能驾驶渗透率和价格却呈相反增长。
乘用车市场L2及以上智能驾驶渗透率已达42.4%,2020年将达到70%,并已普及到10万元至20万元的主要销售车型;城市NOA迎来量产浪潮,目前占L2及以上辅助驾驶份额17%,年内将达到70%;停车系统的硬件设计,一体机逐渐退出市场,更具性价比的一体机域控解决方案将成为主流。
为了应对智能驾驶市场的变化,在现场,海默发布了HP、HP、HP三款“性价比极高”的智能辅助驾驶产品,预计将于2019年、2020年上市分别。
(发布三千元HPilot产品)张凯表示:“海默新发布的三款二代HPilot乘用车辅助驾驶产品,在性能提升的同时降低了价格,让中级智能驾驶更实惠、更好用,让高端最终智能汽车易于使用且更便宜。
”这也是对中国“体量”智能驾驶市场的答案。
海默HP是一款“性价比极高”的元级高速汽车,可实现边停车边智能驾驶。
硬件配置方面,算力为5TOPS。
该传感器方案标配1个前视摄像头、4个鱼眼摄像头、2个后角雷达、12个超声波雷达。
可选配1个前视雷达和2个前角雷达。
场景方面,可实现高速公路、城市快速路无图停车、短距离记忆停车等功能,并获得E-NCAP五星级AEB高安全标准认证。
(海默HP) 浩默HP是一款元级“性价比极高”的城市记忆行车记忆停车设备,可实现行车停车一体的智能驾驶。
硬件配置方面,算力为32TOPS。
该传感器方案标配2个前视摄像头、2个侧视摄像头、1个后视摄像头、4个鱼眼摄像头、1个前置雷达、2个后角雷达和12个超声波传感器。
雷达,2个前角雷达可选。
场景方面,可实现高速公路、城市快速路、城市记忆驾驶、免教记忆停车、智能避障等功能。
张凯表示:“海默记忆驾驶可以算是海默城市NOH的最小集合,是对城市NOH的有力补充。
” (海默HP)海默HP是一款元级“性价比极高”的城市全场景无图NOH产品。
未来将登陆+城市。
硬件配置方面,算力可以选择72TOPS和TOPS两款芯片。
该传感器方案标配2个前视摄像头、4个侧视摄像头、1个后视摄像头、4个鱼眼摄像头、1个前置雷达、12个超声波雷达,还支持选配1个激光雷达。
场景方面,可实现城市无图NOH、全场景辅助停车、全场景智能避障、跨层免教记忆停车等功能。
张凯强调:“惠普平台的历史使命是打造业界最具性价比的高端城市智能驾驶产品。
” (豪摩HP)在发布新品的同时,张凯介绍了豪摩四大战役的最新成果。
首先是“智能驾驶装机量王者之战”。
在中国自动驾驶企业中,飞墨在中国量产自动驾驶方面排名第一。
其辅助驾驶产品HPilot已安装在20余款车型上,用户已驾驶辅助驾驶里程。
突破一万公里。
其中,搭载HPilot的最新车型有山海豹HEV版、新款摩卡Hi-4S等。
其次是“MANA大车型巅峰之战”。
DriveGPT 发布后大约几天内,就积累了数以万计的剪辑用于高质量测试。
目前生态合作伙伴已达17家,帮助生态合作伙伴提升效率90%。
2017年,DriveGPT成功入选“北京市通用人工智能产业创新合作伙伴计划”,成为首批观察员示范合作伙伴,并入选北京市人工智能首批10个行业大型示范应用案例。
此外,DriveGPT还帮助海谋荣获中国人工智能基础大模型创新企业称号。
(DriveGPT上线当天的蝴蝶成长)第三个是“城市NOH百城大战”。
具有城市NOH导航辅助驾驶功能的海默HP(原HPilot3.0)将搭载威派蓝山,并将于今年一季度正式投入量产。
产品已投放市场。
现场,一段张凯和顾伟豪首次公开测试配备惠普的城NOH威牌蓝山的视频被曝光。
保定市区12公里车程,耗时35分钟,人工接管3次。
包含21个红绿灯、7个路口转弯……强调路线感知的海默城NOH表现出了出色的表现,尤其是在面对拥堵道路、红绿灯交替、非机器混合交通等复杂场景时。
它处理得非常自然,而且它的产品是行业领先的。
带领。
最后还有“末端物流自动配送商战”。
末端物流自动配送车小魔驼3.0,售价9元,是全球首款中型末端物流自动配送车,售价9万元,可满足物流、商超、零售等用需9大场景中,小魔驼3.0产品的推出是我国自动驾驶汽车规模商用产业进程中的里程碑。
目前,小魔驼已交付超过22万份订单。
小魔驼即将在今年第四季度实现超市履约和配送场景的盈利。
从商业角度来看,好墨有能力成为全球第一家拥有规模化、盈利的L4业务的公司。
(好墨小魔驼3.0亮相)张凯在致辞中还介绍,好墨总部已落户北京顺义区。
好墨将充分发挥在自动驾驶领域的技术和产业优势,助力顺义打造中国新能源智能汽车产业高地。
DriveGPT雪湖海若:普遍感知实现“万物识别”,普遍认知装备世界知识。
历届HAOMO AI DAY的核心主题都集中在最硬核的自动驾驶AI技术上。
此次,顾伟豪以《自动驾驶 3.0 时代:大模型将重塑汽车智能化的技术路线》为主题演讲,分享了海默对自动驾驶3.0时代AI发展模式的思考以及毕默DriveGPT大模型的最新进展和实践。
顾伟豪认为,自动驾驶3.0与2.0时代相比,其发展模式和技术框架将发生颠覆性变化。
自动驾驶2.0时代,特点是小数据、小模型,以及案例任务驱动的开发模式。
自动驾驶3.0时代以大数据、大模型为特征,以数据驱动为发展模式。
(郝默提出的自动驾驶3.0时代技术架构演进趋势)与2.0时代传统的模块化框架相比,3.0时代的技术框架将发生颠覆性的变化。
首先,自动驾驶将突破云端大感知模型和大认知模型的能力,并逐步将车辆端的各种小模型统一为感知模型和认知模型,同时也将控制模块转换为AI模型。
随后,车端智能驾驶系统的演进路径也将逐步包括一方面全链路建模,另一方面大规模建模,即小模型逐渐统一为大模型。
然后,云端的大模型可以通过剪枝、蒸馏等方法逐步提高汽车的感知能力。
即使在通讯环境良好的地方,大型车型甚至可以通过车云协同实现对汽车的远程控制。
最后,未来无论是车还是云,都将是端到端的自动驾驶模式。
顾伟豪还详细介绍了海默DriveGPT大车型上市后的整体进展情况。
首先是DriveGPT训练数据规模的增加。
截至2020年10月,DriveGPT 雪湖 海若已筛选超过1亿帧互联网图像数据集和1万条包含人类驾驶行为的自动驾驶4D Clips数据。
二是总体感知能力的提升。
DriveGPT通过引入大的多模态模型,实现了文本、图片、视频等多模态信息的融合,获得了识别万物的能力。
同时,通过与NeRF技术的集成,DriveGPT实现了更强的4D空间。
重构能力,获得三维空间和时间序列的综合建模能力;最后,一般认知能力的提升,借助大语言模型,DriveGPT将世界知识引入驾驶策略中。
顾伟豪认为,未来的自动驾驶系统必须像人类驾驶员一样。
它不仅具有准确感知和测量三维空间的能力,而且能够像人类一样理解万物之间的联系、事件的逻辑以及背后的常识。
并且可以根据人类社会的这些经验制定更好的驾驶策略,真正实现完全无人驾驶。
DriveGPT如何具备识别万物的普遍感知能力和拥有世界知识的普遍认知能力?顾伟豪也给出了详细的解释。
(好墨DriveGPT升级:大模型让自动驾驶拥有世界知识)在感知阶段,DriveGPT首先通过构建大的视觉感知模型,将现实世界建模成三维空间,并加入现实物理世界的学习,实现对真实物理世界的学习。
时间序列形成4D向量空间;然后,在构建真实物理世界4D感知的基础上,海默进一步引入开源的图文多模态模型,构建更通用的语义感知模型,实现文本、图形、视频的多模态信息。
整合,从而完成4D向量空间到语义空间的对齐,实现与人类一样“识别一切”的能力。
(海默DriveGPT通用感知模型:让自动驾驶了解一切)海默通用感知能力的进化升级包括两个方面。
首先是大型视觉模型CV Backbone的不断演进。
目前基于大规模数据的自监督学习训练范式利用Transformer大模型架构实现视频生成进行训练,构建三维几何结构、图像纹理和时间序列。
信息和其他信息的4D表示空间实现了对综合物理世界的感知和预测。
第二步是构建更基础的大规模通用语义感知模型。
在大规模视觉模型的基础上,引入图文多模态模型,提高感知效果。
图文多模态模型可以对齐自然语言信息和图片视觉信息,自动在驾驶场景中对齐视觉和语言的特征空间,从而具备识别万物的能力,并且从而可以更好地完成目标检测、目标跟踪、深度预测等各种任务。
在认知阶段,基于通用语义感知模型提供的“万物识别”能力,DriveGPT通过构建驾驶语言(Drive Language),结合导航引导信息和车辆的历史动作来描述驾驶环境和驾驶意图,并且借助外部大语言模型,利用LLM的海量知识来辅助做出驾驶决策。
(浩墨DriveGPT认知大模型:让自动驾驶有了常识)由于大语言模型学习并压缩了人类社会的所有知识,因此也包括了驾驶相关的知识。
经过郝默对大语言模型的专门训练和微调,大语言模型能够更好地适应自动驾驶任务,让大语言模型真正理解驾驶环境、解释驾驶行为、做出驾驶决策。
通过将大认知模型与大语言模型相结合,自动驾驶认知决策获取人类社会的常识和推理能力,即世界知识,从而提高自动驾驶策略的可解释性和泛化性。
在分享了最新的DriveGPT大模型技术框架后,顾伟豪随后给出了基于DriveGPT大模型开发模型的七大应用实践,包括驾驶场景理解、驾驶场景标注、驾驶场景生成、驾驶场景迁移、驾驶行为解读、驾驶环境预测和车辆端模型开发。
其中,在驾驶行为解释方面,海默DriveGPT在原有场景库与人工标注方式相结合的基础上,进行了升级,引入大语言模型来解释驾驶环境,让AI能够解释自己的驾驶决策。
接下来,海谋将通过构建自动驾驶描述数据,继续对大语言模型进行微调,让大语言模型能够像驾校教练或陪练伙伴一样,对驾驶行为提供更详细的解释。
在驾驶环境预测方面,海默DriveGPT最初采用海量人类驾驶数据预训练和反馈强化学习来接管数据,完成未来纯电动汽车场景的预测生成。
现在,在此基础上,进一步引入了大语言模型,并使用了驾驶行为数据。
同时,让大语言模型对当前驾驶环境给出解释和驾驶建议,然后将驾驶解释和驾驶建议作为提示输入到生成大模型中,从而使大型自动驾驶模型获得人类知识在外部大语言模型中。
只有有了知识和常识,我们才能了解人类社会的各种显性和隐性的规则,并且像经验丰富的驾驶员一样,能够预测未来最有可能的驾驶场景,从而更好地与各种障碍物交互。
在改变车端模型的开发模式方面,飞墨正在尝试采用蒸馏的方法,即利用大模型输出的伪标签作为监督信号,让小车端模型学习预测云端大模型的结果,或者通过对齐Feature Map,让小车端模型直接学习并与云端的Feature Map进行对齐,从而提高小车端模型的能力。
基于蒸馏方法,汽车的感知效果可以提高五个百分点。
此外,DriveGPT的驾驶场景理解可以对海量驾驶场景数据进行秒级特征搜索,从而实现更高效的数据筛选,挖掘大模型的海量优质训练数据;驾驶场景标注采用open-set)场景中的Zero-Shot自动标注,可以实现对任何物体的快速准确标注。
不仅能够实现新类别的快速零样本标注,而且准确率也非常高,预标注准确率达到80%以上;对于驾驶场景生成,可以基于驾驶场景的Vincent图模型,通过文本描述批量生成平时难以获取的硬案例数据,实现无中生有的可控生成;针对驱动场景迁移,基于AIGC生成能力,可以实现多目标场景生成,可以将采集到的场景迁移到场景中不同时间、不同天气、不同光照等各种新场景,全天候可同时获取行车数据,实现高效、快速变化的场景迁移。
现场,顾伟豪还展示了支持DriveGPT的车载终端的三大测试结果:一是纯视觉自动停车测试结果。
Haimo采用视觉感知模型,利用鱼眼摄像头识别墙壁、柱子、车辆等各类边界轮廓,形成全视野动态感知。
在15米范围内可以实现30cm的测量精度,精度达到2米。
高10厘米以上。
这样的精度可以取代USS超声波雷达与视觉,从而进一步降低整体智能驾驶解决方案的成本。
二是海默对交通场景全要素识别的测试结果。
DriveGPT基于普遍感知识别万物的能力。
从原来只能识别少数类型的障碍物和车道线的感知模型,现在可以识别各种交通标志、地面箭头甚至井盖等交通场景的全元素数据。
大量高质量的道路场景全要素标注数据,可以有效帮助零偏重感知的车端感知模型提升效果,助力城市NOH加速进城。
第三个是浩魔城NOH对小目标障碍物检测的测试结果。
在目前的城市NOH测试中,海默能够在城市道路场景中,在时速高达70公里的速度下,在50米的距离处检测到高度约为35厘米的小目标障碍物,并能够在绕过障碍物或制动方面取得%的成功可以对过马路的小动物等移动障碍物起到良好的检测和保护作用。
顾伟豪还提到,海默DriveGPT大模型的应用为自动驾驶系统的开发过程带来了巨大的技术提升,使得海默的自动驾驶系统开发彻底进入了新的模式。
新的发展模式和技术架构将大大加速。
汽车智能化的演变。
全球顶级产学研机构重要嘉宾助阵,生态合作伙伴近百家。
今年的HAOMO AI DAY再次聚集了自动驾驶领域超豪华的嘉宾阵容。
张亚勤,中国工程院院士、清华大学教授、清华智能产业研究院院长;清华大学车辆与交通学院副院长、终身教授、博士生导师李胜波发表主旨演讲;戴大力,合众新能源汽车CTO;张振林,中汽创智智能驾驶CTO;穆北鹏,美团自动驾驶汽车研发总监;郭宇,达达快车产品与策划负责人;火山发动机汽车产业总经理杨利伟;车云网&电邦创始人兼CEO程力等行业领袖出席第九届好摩AIDAY高峰对话会,探讨“自动驾驶:乘风大模式,打造新范式”。
(巅峰对话——自动驾驶:乘风大模型打造新范式)张亚勤发表题为“《Big Model, Generative Al and Intelligent Driving》”的主题演讲。
他表示:“AI大模型带来了从判别式AI到生成式AI的新技术范式变化,清华AIR正在利用生成式AI打造自动驾驶仿真平台和Real2Sim2Real基础模型平台。
同时,清华AIR和浩魔智能正在利用生成式AI打造自动驾驶仿真平台和Real2Sim2Real基础模型平台。
”在数据驱动决策优化方向进行深入探索,共同推动全方位、多层次的产学研深度合作,加速人工智能技术在自动驾驶领域的应用。
”李胜波表示:“自动驾驶是人工智能皇冠上的明珠,算法的突破和数据的积累带动了汽车驾驶智能化的快速发展,这也是自动驾驶技术的重点发展方向。
”近年来,好墨智行在数据驱动的感知、预测、决策方向进行了突破性探索,取得了一系列前瞻性技术,为生成式人工智能在自动驾驶中的应用做出了有益尝试。
”。
演讲结束。
顾伟豪提到:“海默即将迎来四周年,这是一份协议,没有任何障碍。
浩默人将继续用AI连接更广阔的世界,用科技探索更广阔的未来。
” ”张凯表示:“风浩正扬帆和威摩人将始终坚守初心,保持创业者的热情,共同实现自动驾驶梦想。