陌陌知行：自动驾驶认知模型正式升级为DriveGPT

时间：2023-03-21 00:12:45 科技观察

2月17日，陌陌知行宣布自动驾驶认知模型正式升级为DriveGPT，并将于2023年4月在好萌日公布最新版本。进步。随着ChatGPT风靡全网，其使用的Transformer大模型和“强化学习与人类反馈（RLHF）”技术再次引起了业界的关注。在自动驾驶领域，陌陌在国内率先将Transformer大模型引入数据智能系统MANA。在2023年1月的HAOMOAIDAY上，陌陌知行CEO顾伟豪介绍，陌陌推出的人类驾驶自监督认知模型已经借鉴了ChatGPT的实现思路，采用RLHF（人类反馈强化学习）技术，通过引入真实的人类驾驶接管数据，不断优化自动驾驶的认知决策模型。陌陌的认知决策算法经历了三个阶段的演进。第一阶段是引入个别场景的端到端模仿学习，直接拟合人类驾驶行为。第二阶段是通过认知大模型引入大量正常人类驾驶数据，通过提示方法实现可控可解释的认知决策。第三阶段，也就是当前阶段，引入真实的接管数据，开始尝试在大模型中使用RLHF算法从human-driver接管数据中学习。为此，陌陌构建了包括“旧策略、接管策略、人工标签策略”的Pairwise排序模型。基于这个排序模型，陌陌构建了自动驾驶决策的奖励模型，从而在各种规划场景下做出最优决策。通过这个大模型，在识别掉头、环岛等高难度场景，场景通过率提升了30%以上。2月17日，陌陌智行正式将人类驾驶自监督认知模型升级为“DriveGPT”，这也是全球首个自动驾驶认知模型。目前DriveGPT已完成模型搭建和第一阶段数据跑通，参数规模可与GPT-2水平相媲美。接下来，DriveGPT将继续引入大规模真实接管数据，通过对人类驾驶数据反馈的强化学习，不断提升评测效果。同时，DriveGPT也将作为云端评测模型，对小车模型的驾驶效果进行评估。DriveGPT的最新重要进展将于2023年4月第八届HAOMOAIDAY公布。

上一篇：智慧城市乌托邦：监控技术保障我们的未来！

下一篇：知乎高赞：哪些软件是强烈不建议安装在Windows上的？网友：太流氓

陌陌知行：自动驾驶认知模型正式升级为DriveGPT相关文章