当前位置: 首页 > 科技赋能

对话极岳智能软件副总裁潘云鹏:智能汽车的未来与极岳01的创新实践

时间:2024-05-19 16:38:24 科技赋能

4月25日,极岳汽车机器人携全新产品阵容亮相北京车展。

其第二款车型——AI智能纯机器人纯电动轿车极悦07在车展上首次亮相,并以其具有浓郁艺术美感的原创中国设计荣获“最美7系”称号。

极跃与NVIDIA再次强强联手,TFLOPS高性能计算平台Thor将于2020年投入量产。

同时极跃01也将升级到最新的V1.5.0版本,PPA智驾将拥有城市试用体验,再次为用户提供每月“新车”。

随后的4月26日,在极悦的工作坊上,潘云鹏分享了极悦对智能产品的深入思考和实践。

他首先区分了智力的两种形式:逻辑推理和生物灵感。

逻辑推理智能依赖于数学公式和推导,而生物启发智能则模仿大脑神经网络的信号传输,通过大量的学习和观察发现模式,类似于我们学习语言时培养语感。

潘云鹏指出,汽车产业的智能化正朝着AI定义汽车的方向发展,这要求汽车拥有更高的计算能力、更丰富的数据和更复杂的参数模型。

他引用了“Scaling Laws”(力量可以创造奇迹)的概念,强调了数据和计算能力对于提高性能的重要性。

极岳01:智能汽车的三大基本能力 极岳01被定义为具有自然沟通、自由移动、自我成长三大基本能力的汽车机器人。

自然沟通:极乐01的AI核心能力在于全设备侧的语音交互,这得益于其芯片和两个NPU的配置。

这种交互方式具有多模态识别、极快响应、隐私保护等特点。

潘云鹏提到了几个关键场景,包括车外语音停车、可视说话、离线语音控制、原生支持闻心一言等。

自由移动:极悦01的PPA(车位到车位)功能展现了高端智能驾驶的能力,尤其是其停车泊车一体化和纯视觉解决方案。

潘云鹏透露,吉月01的PPA功能将逐步扩展到全国城市。

自我成长:极月01通过Simo学习功能和数据闭环,实现产品的持续迭代和优化。

潘云鹏强调,极乐01在过去5个月里已经进行了5次OTA升级,展现了其快速迭代的能力。

纯视觉智能驾驶的决策及优势潘云鹏解释了极岳01放弃激光雷达而采用纯视觉方案的原因。

他认为人类驾驶主要依靠视觉,而极岳01的摄像头和毫米波雷达已经可以提供超越人类的视觉范围。

此外,激光雷达的高成本、环境敏感性以及与其他传感系统的冲突也是考虑因素。

他展示了极阅01在复杂场景下的表现,并强调了纯视觉方案的性能和成本优势。

潘云鹏还提到,极月01的研发并不是从零开始,而是基于百度十年智驾的积累,并通过一亿公里的数据积累证明了纯视觉方案的可行性。

极乐01的智能化进展及未来展望 潘云鹏分享了极乐01智能的几个关键进展: 视觉大模型:通过将多个小模型合并为一个大模型,极乐01实现了智驾性能的显着提升,同时降低了算力要求。

自我成长机制:吉月01通过Simo反馈系统实现问题的快速分类和解决,提高用户满意度和产品质量。

PPA功能快速普及:极阅01的PPA功能日均渗透率已达50%,并将在新版本中进一步拓展。

最后,潘云鹏展望2020年是智能汽车发展的拐点,预示着业绩和市场参与者的“崛起”。

他通过展示吉粤01与美国特斯拉的性能对比,以及吉粤01在杭州繁忙路段的实际表现,证明了吉粤01在纯视觉智能驾驶领域的领先地位。

以下为谈话实录,有部分调整和删减: 问:我想问一下,纯视觉方案在AEB和激光雷达方面的表现是否有差距,或者没有差距?潘云鹏:我们在AEB测试中发现,激光雷达对于制动距离和时间的影响并不大。

相反,它大大提高了一些转弯场景(包括快速场景)的自动包围曝光上限。

我们也在不断提高AEB的上限。

问:我想问一下,两年前,可以称为激光雷达元年。

这两年,它走向了高清地图,并发布了纯视觉路线。

您认为除了这三个趋势之外,未来的自动驾驶发展是什么样子,需要走哪条路线,还是两者兼而有之?潘云鹏:业界的看法越来越一致。

有几个关键词,一是去映射,二是激光雷达,还有一个是端到端。

大家谈论的多了,可能很长一段时间都是一样的。

有。

今年纯视觉玩家越来越多,但激光雷达也会存在。

我相信他们会长期共存。

每个公司的数据积累不同,每个公司的生态也不同。

我相信一定有多个计划。

同样的场景,并不一定说明谁比谁更好。

例如,如果谈论纯视觉解决方案,那么每个人在谈论激光雷达时都会谈论成本和可靠性。

我们纯粹的愿景降低了售后成本,但研发成本会增加。

数据量将会增加。

对算力的要求越来越大,我们尽力将整个算力扩展到2.21。

总的来说,这一定是每个企业根据自身特点选择的最合适的路线。

第二,大家体验过很多无图版本或者有精美图的版本,都可以发现一个问题,那就是体验信息越多,智驾的体验就会越好、越有保障,尤其是在一些路口场景,有些路口特别复杂,如果根本没有经验信息,可能会导致问题。

我们还是觉得体验信息的可用性对于现阶段的用户体验有非常直接的影响,所以我们讲的很多无图解决方案本质上都是混合解决方案。

有的地方没有图片,有的地方有图片,图片参考。

这是一张高精度地图。

第三,每个公司的生态不同。

百度有车道级地图。

大家应该都用过百度的车道级导航。

对于我们来说,这是一个先发优势。

虽然我们也没有地图,但一般来说,我们地图里的信息自然比普通地图要多,所以我们的智驾体验和安心都更好。

在上周的中国智驾大赛中,极悦01获得了北京站的第一名。

当时参赛的选手有吉虎、文杰、小鹏和蔚来。

我们的成绩是95分,第二名是93分。

关于有图和无图的问题,一定是一个循序渐进的过程。

即使开发出无图片的解决方案,也不可能将现有的所有带图片的解决方案去掉。

对于这一点,整个行业有着一致的判断。

最后,端到端。

它分为两种,但一般来说,其背后的基本逻辑必须有大量的高质量数据。

现在实现端到端还为时过早,还需要大量高质量数据的积累。

大家还处于探索的过程中,当然这也是界月下一步的重点。

问:我有三个问题。

第一,作为用户,现在很多公司都有智驾,而且都位于市区。

我们该如何判断智驾好不好用呢?一个普通人如何判断好坏的标准呢?第二个问题是,一旦全国范围内都可以使用,我就不再需要开车了。

如果你不太注重驾驶品质,也不是驾驶爱好者,那么对汽车底盘的要求就没有那么高。

从发展的角度来看,一个好的底盘会帮助智驾进步吗?第三,有的公司说可以全国开放,所以就全部开放。

为什么我们要开放100个席位中的50个,累计数据量是这样的?潘云鹏:我先回答第二个问题。

每个人的需求都不同。

有些人关心驾驶质量,而另一些人则不关心。

一个好的底盘肯定会对智驾的体验有帮助,包括它的刹车反应和加速反应,都是100%有帮助的。

如果是一款反应快、调教更柔和的底盘,在智驾和人类驾驶场景下肯定会有所不同。

这个比较容易判断。

不仅智驾的底盘,包括电机和电驱动对客户有直接的影响,而且从安全的角度来说,制动速度、制动响应时间延迟,速度越高,每一秒的影响就越大。

第一个问题和第三个问题放在一起:为什么人家说不用图就可以开通,可以全国开通,而我们却还在一步步走?这与我们的安全判断标准有关。

首先,我们认为它是安全的。

短时间打开对用户体验没有任何帮助。

其次,如果你打开了,每天都被迫接管,这对你的声誉不利,尤其是对于较新的品牌。

这个时候,多次吓唬用户,如果不幸发生几次事故,对品牌的损害就会更大。

我们对驾驶的标准还是很严格的,所以你可以放心。

我们主要服务于用户。

我们不是一家以营销为导向的公司。

我们仍然选择了用户数量最多的城市。

我们会在这些城市进行比较完整的测试。

因为有百度的加持,我们的地图体验信息非常丰富。

我们会挑出地图不太准确的地方,按照确保安全保障的标准逐步开放城市。

开城的总体逻辑是这样的。

一百城、两百城、三百城,本质上是一个数据迭代的过程。

数据多了,在可以很好覆盖95%的场景的基础上,可能还得花95%的精力去覆盖剩下的。

有5%的场景,此时会需要更长的时间。

凯程也遵循这个标准的逻辑,满足工程研发的规律,数据逐步迭代。

问:我以前从我们的朋友那里体验过一些 NOA 产品。

场景处理上可能还可以,但是它的起停很容易让人晕车。

我们在舒适度和控制逻辑方面如何应对? ?潘云鹏:这是一个很好的工程问题。

我们也遇到过。

很多用户都存在很多主观体感的问题。

有的用户觉得刹车太急,点头,不舒服。

有些用户觉得启动太慢,迷失了方向。

我们发现他早上想跟得近一些,但晚上刹车太急,他感觉不安全。

这是一个非常难解决的问题。

首先点头的问题是肯定可以解决的,就是刹车要不要软,包括自动停车的逻辑和方法。

对于其他问题,我们仍然通过数据算法来学习我们自己的行为。

这是克服许多主观场景的唯一方法。

问:我们很快就会开放 100 个城市。

我想问一下开放100个城市的标准是什么?标准是什么,比如覆盖率?潘云鹏:我们之前已经开通了北京、上海、杭州、深圳、广州等城市的主要城市道路,大概95%的道路都已经覆盖了。

这个标准没有改变,因为百度地图会经过高频驾驶区域,并且会覆盖这些道路。

在一个地区开通网络时,每个城市的规模是不同的。

数千公里的纯地面道路覆盖是必须的。

这是一座大城市。

Q:极月目前的纯视觉智驾路线是如何实现实时环境感知和精准决策的?现在在纯粹视觉智驾的节目中,很多车企都开始布局我们,包括小鹏等车企。

您如何看待市场竞争?另外一个就是温心一言和西莫之间的联系。

温馨一言在汽车、机械领域的覆盖范围够吗?未来哪些方向将成为其核心竞争力?潘云鹏:我们先讲愿景。

一般来说,感知分为两部分。

一部分是对周围环境的感知,即所谓的道路结构。

刚才提到,百度地图有先天的优势,经验信息多,知道的多。

第二,我们一开始做BEV,后来开始做OCC,也是为了在无法识别所有奇形障碍物的情况下避障或者避免碰撞。

OCC刚发布时,有媒体人员将装有矿泉水的塑料袋扔到车前,吉悦01绕过去。

这非常困难。

因为是透明的,所以颜色和形状都是各种怪异,但我们还是通过升级OCC算法完成了这次感知的迭代。

我们的视觉感知大模型VTA有狙击枪、手枪、匕首三种形态,从远到近,帧率从高到低,分辨率从低到高。

最低分辨率可达 5 厘米。

5厘米基本上是超声波雷达的精度要求,已经非常接近了。

关于精度问题,我们通过大量的数据训练和激光雷达来完成它的精度要求。

而且,除了摄像头之外,我们还会有毫米波雷达,它有多重保障,保证感知的高精度。

SIMO与文心艺言的整合只是一个开始。

因为百度对AI的投入越来越大,闻心一言的大模型会越来越好,就像一个智能代理一样,未来的想象空间是无限的。

这也会提高SIMO的认知能力,他的表达肯定会更加流畅,他也能够创作出越来越多的内容。

玩家越来越多,电车也越来越多。

从本质上讲,这不是一场你死我活的战斗。

技术越多样化,对于用户来说是一件好事。

最终,用户体验会说话,数据会说话。

最终,百花齐放。

纯视觉、非纯视觉、5个激光雷达、8个激光雷达,都没关系。

只要用户的成本可以接受,体验安全舒适,这都是好的。

主持人:今天就到这里。

下次见。