当前位置: 首页 > 科技观察

百度发布了一个“超同类10倍”数据量的自动驾驶数据集,有哪些亮点

时间:2023-03-18 20:33:59 科技观察

百度发布了一个“比同行多10倍的数据”的自动驾驶数据集。有哪些亮点?伯克利DeepDrive自动驾驶产业联盟。  美国时间3月8日,百度宣布Apollo自动驾驶开放平台正式加入DeepDrive深度学习自动驾驶产业联盟,并发布了Apollo自动驾驶数据集ApolloScape。  吸引百度Apollo平台积极加入这个产业联盟,可能是因为后者拥有更丰富的自动驾驶学术成果和产业资源。  如果你对UCBerkeley(加州大学伯克利分校)足够了解的话,你就知道DeepDrive是加州大学伯克利分校与汽车智能相关的两个实验室之一(另一个是InterACT)。  DeepDrive的研究成果不停留在实验室,而是与产业紧密结合。目前合作伙伴包括博世、采埃孚等一线供应商,大众、本田、现代等车企,恩智浦、英伟达等。华为等芯片厂商,以及华为、宇视等中国企业都是合作伙伴。*DeepDrive研究项目的合作伙伴  和DeepDrive深度学习自动驾驶产业联盟是由加州大学伯克利分校牵头成立的产业联盟,旨在研究应用于汽车领域的计算机视觉和机器学习前沿技术。  其成员包括:英伟达、高通、通用、福特等20家全球自动驾驶领域领先企业,研究项目涵盖感知、规划与决策、深度学习等自动驾驶关键领域.  百度加入该联盟的目的是加强自动驾驶的研发能力,携手全球领先的自动驾驶企业和顶尖的学术研究机构,共享研究成果,加速自动驾驶的技术创新和应用。.  ApolloScape:数据量是同类数据集的10倍以上  本次发布的另一个亮点是百度开放的ApolloScape数据集。  数据集一般分为两类:一类是通用数据集,是纯计算机视觉领域提出的数据集,这类数据集只是因为有“车”元素;另一个是自动驾驶数据集,不仅包括计算机视觉信息,还包括IMU、GPS等信息。比如KITTI,它是目前全球最大的自动驾驶场景下的计算机视觉算法评价数据集,其地位不容小觑。  显然,百度也希望将ApolloScape做成这样的数据集。那么,ApolloScape数据集有哪些亮点呢?  百度认为海量、高质量的真实数据是自动驾驶研发和测试不可或缺的“原材料”,因此ApolloScape中的数据量是同类数据集(如Cityscapes)的10倍以上).  其中,数据内容包括:感知、模拟场景、路网数据等数十万帧高分辨率图像数据逐像素语义分割标注。百度方面表示,从数据难度来看,ApolloScape数据集涵盖的路况更为复杂。例如,一张图像中最多有162辆车或80名行人。  另外,这个开放数据集采用了逐像素语义分割和标注的方法。百度称这是“目前环境最复杂、标注最准确、数据量最大的自动驾驶数据集”。ApolloScape标注数据示例ApolloScape深度数据示例Kitti、CityScapes和ApolloScape数据示例对比  ApolloScape的另一个特点是它包含数十万帧的高分辨率图像数据,并带有逐像素语义分割标注。  为了方便研究者更好的利用数据集的价值,百度一共定义了26个不同语义项(如汽车、自行车、行人、建筑物、路灯等)的数据实例在数据集,并将进一步涵盖更复杂的环境、天气和交通状况等。  数据  模拟所包含的各种实例的信息也是该数据集的重点项目。百度的目标是打造一个真实世界还原度最高、场景最丰富的模拟平台。  据雷锋网报道,基于Apollo仿真平台,ApolloScape计划将数十辆自动驾驶汽车放在同一个路网中。通过模拟真实复杂的驾驶场景和多车博弈过程,帮助开发者有效测试和优化预测、决策、路径规划等算法,提高自动驾驶测试的多样性。  为了盘活这个数据集,吸引更多的开发者使用ApolloScape数据集,在今年的CVPR期间,百度Apollo将与加州大学伯克利分校合作举办自动驾驶Workshop,希望能服务于全世界自动驾驶开发人员和研究人员为技术突破和应用创新提供了平台。  “大系统”和“小模块”  过去,计算机视觉一直面临的一个普遍问题是旧算法对新数据集不起作用。  “我们声称已经解决了一个问题,但我们只解决了一个数据集,这并不意味着我们真的解决了这个问题,而且这种情况经常发生。”一位国内自动驾驶公司的CTO告诉雷锋网(公众号:雷锋网)说。  比如我们可以把自动驾驶这个“大系统”分解成100个计算机视觉小问题。  但这里有两点值得深思:***,我们不知道100个问题中哪个更重要;可以说我们已经彻底解决了自动驾驶的问题。  因此,如何解决自动驾驶“大系统”与自动驾驶“小模块”之间的问题,是百度ApolloScape数据集接下来需要建立的优势,也是自动驾驶从业者与开发人员需要数据集。