当前位置: 首页 > 科技观察

陌陌知行:自动驾驶认知模型正式升级为DriveGPT

时间:2023-03-21 00:12:45 科技观察

2月17日,陌陌知行宣布自动驾驶认知模型正式升级为DriveGPT,并将于2023年4月在好萌日公布最新版本。进步。随着ChatGPT风靡全网,其使用的Transformer大模型和“强化学习与人类反馈(RLHF)”技术再次引起了业界的关注。在自动驾驶领域,陌陌在国内率先将Transformer大模型引入数据智能系统MANA。在2023年1月的HAOMOAIDAY上,陌陌知行CEO顾伟豪介绍,陌陌推出的人类驾驶自监督认知模型已经借鉴了ChatGPT的实现思路,采用RLHF(人类反馈强化学习)技术,通过引入真实的人类驾驶接管数据,不断优化自动驾驶的认知决策模型。陌陌的认知决策算法经历了三个阶段的演进。第一阶段是引入个别场景的端到端模仿学习,直接拟合人类驾驶行为。第二阶段是通过认知大模型引入大量正常人类驾驶数据,通过提示方法实现可控可解释的认知决策。第三阶段,也就是当前阶段,引入真实的接管数据,开始尝试在大模型中使用RLHF算法从human-driver接管数据中学习。为此,陌陌构建了包括“旧策略、接管策略、人工标签策略”的Pairwise排序模型。基于这个排序模型,陌陌构建了自动驾驶决策的奖励模型,从而在各种规划场景下做出最优决策。通过这个大模型,在识别掉头、环岛等高难度场景,场景通过率提升了30%以上。2月17日,陌陌智行正式将人类驾驶自监督认知模型升级为“DriveGPT”,这也是全球首个自动驾驶认知模型。目前DriveGPT已完成模型搭建和第一阶段数据跑通,参数规模可与GPT-2水平相媲美。接下来,DriveGPT将继续引入大规模真实接管数据,通过对人类驾驶数据反馈的强化学习,不断提升评测效果。同时,DriveGPT也将作为云端评测模型,对小车模型的驾驶效果进行评估。DriveGPT的最新重要进展将于2023年4月第八届HAOMOAIDAY公布。