在“开放数据”的道路上,百度Apollo跑在了WaymoInformative的前面,标注了驾驶数据。封闭还是开放,这是一个一直萦绕在自动驾驶行业的问题。Waymo一反常态地选择了从封闭状态转向开放共享数据。它进行了重大的战略调整,将封闭与开放的天平向开放倾斜,可以说是“思前想后”。但在数据开放问题上,百度Apollo选择一年前开放,为自动驾驶加速发展奠定基础:早在2018年3月,百度Apollo就发布了Apollo数据,正式开放ApolloScape大规模自动驾驶数据放。百度Apollo在CVPR2018上发布了自动驾驶数据集ApolloScape。Waymo此次发布的数据集包含3000条平均时长为20秒的驾驶记录。整个数据集包含60万帧数据,约2500万个3D边界框,2200万个2D边界框,以及多样的自动驾驶场景。数据放出后,Waymo无人车传感器的特性也将一目了然。Waymo公开了自动驾驶数据集,但Waymo公开数据集的做法在自动驾驶行业并非首创。2018年3月8日,百度Apollo自动驾驶开放平台正式加入美国加州大学伯克利分校DeepDrive深度学习自动驾驶产业联盟,正式开放ApolloScape大规模自动驾驶数据集。汽车工业更是如虎添翼。ApolloScape数据集中逐像素标注实例自动驾驶感知技术较多且难度较大,其主要目的是实现对场景的语义理解。以检测技术为例,其目的是在图像或点云中找到覆盖某个物体的2D或3D矩形框。现有的数据集,包括Waymo发布的数据集,主要针对这类检测技术。ApolloScape作为一个相对领先的开放数据集,是目前业界环境最复杂、标注最准确的3D自动驾驶公共数据集。更重要的是,ApolloScape为开发更多的自动驾驶感知技术提供了不同的数据集。这些数据集除了可以服务于上述物体检测技术外,还包括物体和实例级分割技术、3D姿态估计、物体轨迹跟踪技术、相机自主定位技术、深度图像估计技术等。目前,ApolloScape已经发布了场景分析、细粒度车道线、定位、3D车辆拟合和密集轨迹等五个公共数据集。ApolloScape中的场景解析(sceneparsing)数据集包括147,000帧带有逐像素语义标注的图像。与包括Waymo在内的仅具有矩形框注释的数据集相比,像素级注释提供了更详细、不受物体之间遮挡影响的场景信息,旨在促进更准确的视频场景语义理解技术。除了2D视频图像,与每一帧相关联的3D点云也被逐点标注语义信息。此外,图像逐像素标注的时间和工作量超过矩形框标注的工作量十倍以上。ApolloScape数据集中的道路线标签和深度图像示例。道路线是基本的路面元素。ApolloScape车道线数据集为28种不同的道路线分类提供逐像素和三维逐点数据集。是目前所有公开数据集都没有的标注信息。无人车需要精确的定位系统来获取自身位置、前方情况、行驶区域等一系列信息。定位精度一般需要控制在10厘米以内,避免碰撞和车道偏离。ApolloScape自定位数据集提供近300,000张图像,覆盖近28公里,具有高精度GPU/IMU信息。此外,如何利用图像快速感知周围车辆的3D姿态,对于自动驾驶也至关重要。为了推进这一问题的研究,ApolloScapeCar3D数据集应运而生。该数据集采集于中国不同城市,包括超过5277个真实驾驶场景和超过60000辆汽车的3D标注数据。除了车辆的3D姿态,百度还发布了真实的3D汽车模型和66个3D/2D车辆关键点数据。接下来,我们可能会进一步开放组件级别的、密集的3D车辆标注。ApolloScape的物体轨迹跟踪数据集提供了物体在图像和点云上的运动轨迹,涵盖了不同的光照条件和大量的车辆/人/骑行混合交通流,旨在促进物体跟踪和运动行为预测技术。轨迹数据长达2.5小时,是现有最大轨迹数据集(NGSIM)的三倍。自2018年3月发布以来,ApolloScape数据集已在全球范围内被下载了数万次。由于其重要性,计算机视觉领域的顶级期刊IEEETPAMI收录了关于该数据集的科学文章,这是目前已知的唯一一篇在TPAMI上发表的关于自动驾驶数据集的文章。基于这些数据集,百度在世界级会议(如CVPR和ECCV)和顶级平台(如Kaggle)上举办了多项比赛。这些比赛吸引了来自世界各地的数千支队伍,包括NVIDIA、斯坦福大学、旷世音响、优图等知名企业和大学。除了以上数据集之外,未来还会有更多类型和属性的数据陆续加入到ApolloScape中。百度将最大程度还原真实场景,打造最大的自动驾驶开放平台,推动行业发展。充分利用ApolloScape的高精度数据集,百度还开发了增强现实自动驾驶仿真系统,为自动驾驶汽车提供更可靠、成本更低的仿真方法,可用于大规模训练、测试和评估自动驾驶系统的感知、决策和路径规划算法。与现有仿真系统相比,该系统在真实性和可扩展性方面取得了突破性的技术进步,并发表在《科学》杂志《机器人学》的子刊上。《科学》杂志是世界上最权威的学术期刊之一,代表着人类自然科学研究的最高水平。《科学·机器人学》杂志是它的五个子期刊之一。平均每期发表的研究文章不超过4篇,发表难度很大。同时,该系统被国内外70多家主流媒体报道。在自动驾驶的研发和测试中,高质量的真实数据是必不可少的“原材料”。很少有团队有能力开发和维护适用的自动驾驶平台,定期校准和收集新数据。但是,百度却走在了行业发展的前列。最终构建了一个可供学术界和业界参考的开放数据集。这在行业发展过程中尤为可贵,为国内外研究无人车的学者和企业提供了极大的帮助。一个新兴产业的健康发展,从来不是一家公司独霸,而是要以开放的心态分享各自的技术突破,接受社会各界的交流与合作。科技无国界。百度早已掀起数据开放共享的热潮,掀起一场世界范围的协作。百度Apollo一直在为自动驾驶行业的快速发展而努力。百度Apollo开放平台秉承开放的理念,将继续以博大的胸怀向行业分享成果、提出发展战略。不仅是数据公开,百度也在构建可持续发展的行业生态发展道路上大踏步前进。
