4月3日,滴滴主办的KDD杯强化学习挑战赛正式拉开帷幕,邀请全球算法高手共同挑战共享出行领域的优化问题。
KDD杯(国际知识发现与数据挖掘竞赛)由计算机器协会知识发现与数据挖掘专业委员会(ACM SIGKDD)发起。
它自2001年起每年举办一次,是数据挖掘领域国际公认的竞赛。
该竞赛向企业界和学术界开放。
每年都会吸引数据挖掘界顶尖的专家、学者、工程师、学生等参与。
它也被称为数据挖掘领域的“世界杯”。
每年都有很多优秀的学术组织和技术机构申请主办KDD杯,但最终只有具有深厚学术积累和行业实践的机构才能脱颖而出。
今年KDD杯的RL赛道(强化学习赛道)终于由滴滴主办。
在本次挑战赛中,滴滴邀请全球参赛团队聚焦按需出行平台,尝试应用机器学习解决方案提出智能策略,在保证用户体验的同时进一步提高出行效率和司机收入。
滴滴设计了两个任务:订单分配和车辆调度。
在订单分配任务中,参赛团队需要设计开发算法,指定订单派发窗口内订单与司机的匹配情况;在车辆调度任务中,参赛团队需要设计和开发调度算法,引导一群闲置的司机到达指定目的地。
两个任务可以单独开发,也有联动的空间。
比赛将主要基于滴滴盖亚数据开放计划的脱敏数据集进行。
该数据集包含滴滴平台专车和快车在一定时间内成都部分地区的脱敏轨迹数据。
此外,还将添加其他比赛辅助数据。
。
参赛队伍提交的解决方案将在测试环境中进行评估和评分。
即日起,全球企业、研究机构和学校均可在挑战赛官网组建参赛团队(截止至2020年7月17日),总奖金为0。
最终优胜团队奖将在KDD大会上正式颁发并展示结果。
滴滴在强化学习领域长期探索,并成功应用于调度、调度、运营等多种场景。
此前,滴滴AI实验室对网约车调度问题进行了半马尔可夫过程建模,并提出了方法。
基于强化学习的广义决策迭代框架创新有效地将深度强化学习、时差学习和传统组合优化方法结合起来,在保证旅客出行体验的同时进一步提高司机收入。
该单一解决方案荣获年度运筹学杰出实践奖——运筹学领域国际最高实践奖——丹尼尔·H·瓦格纳奖。
滴滴此次举办KDD杯强化学习挑战赛,也是希望能够吸引和推广全球算法高手,进一步探索强化学习的发展及其在真实业务场景中不同环境和条件下的应用,激发更多创新。