当前位置: 首页 > 科技观察

天眼实验室推荐系统校正方法论文入选NeurIPS-2020

时间:2023-03-21 20:49:09 科技观察

我们在浏览各大网站和APP时,受到推荐系统的影响,大量相似商品反复出现的情况并不少见,这不仅会导致视觉疲劳,也让我们难以做出理性的判断和购买决定。主要原因是目前主流的推荐系统都是采用大数据模型筛选的方式,会产生很大的路径依赖。对此,腾讯天眼实验室近日另辟蹊径,推出了推荐系统偏差修正法。与传统方法相比,该方法无需进行随机流量实验进行无偏估计,大大降低了无偏推荐算法的训练成本,降低了系统成本。路径依赖。目前,腾讯已就该研究成果发表论文《Information-theoretic counterfactual learning from missing-not-at-random feedback》,并成功入选NeurIPS-2020。传统的推荐系统容易产生路径依赖,导致推荐质量下降。推荐系统作为现代互联网领域的一个重点研究方向,具有非常高的商业价值。推荐系统模型需要在大量的候选物品(通常是广告、商品、短视频等)中找到用户最喜欢的,从而增加曝光率或点击广告收入。传统的推荐系统研究一般侧重于设计更好的特征交集方法以提高CTR预估的准确性,从而给出更好的排名结果并增加广告收入。通常情况下,用户看到的物品是由推荐系统选择出来的,它们在系统中生成一个存储记录,推荐模型在记录上离线更新。但是已有研究表明,这种推荐方法会产生路径依赖,即模型会严重高估自己对每个用户在暴露物品上的偏好,而低估自己对每个用户在未暴露物品上的偏好。用户的偏好。长期来看,推荐结果的多样性会急剧下降,影响推荐质量和用户留存。如下图所示,橙色代表MNAR数据的用户评分分布,蓝色代表MAR的评分。可以看出,用户对MNAR的评分要高很多,大多集中在5分,而MAR的数据则更均匀地分布在1-5分之间。随着时间的推移,MNAR的分数分布会越来越集中,拉大与MAR分数的差距。图1用户反馈对随机缺失数据和非随机缺失数据的偏差为解决这一问题,传统方法多基于逆倾向得分(IPS)对MNAR数据模型训练的目标函数进行加权修正。此类方法需要进行相当数量的随机对照试验(RandomizedControlledTrials,RCTs),即随机向用户推荐物品以获得反馈,从而获得对点击率的无偏估计。另外,IPS方式需要收集一定数量的RCT,即向用户展示相当数量的随机物品以收集反馈,这在经济效益上会造成较大的收入损失。而且,这种施加权重的方法也增加了训练的方差,有时会对结果产生负面影响。运用信息论建立模型推荐系统偏差校正方法呈现创新优势腾讯天眼实验室借鉴信息论理论建立模型。模型的原始输入会先经过一个编码器(Encoder)得到一个表征(Representation),再经过一个解码器(Decoder)将表征解码成最终的预测结果。此后,目标函数分为两部分:输入和表示之间的互信息,以及表示和输入目标之间的互信息。在优化这个目标函数时,腾讯天眼实验室团队采用了尽可能多的携带目标信息,压缩输入信息的方法。图2信息瓶颈的流程和定义形式首先,将原始输入(这里是user-itempair)分为事实域(factual)和反事实域(counterfactual)。当发现在反事实中无法获取到用户对项目的反馈,无法进行模型的监督学习时,选择该问题进行信息瓶颈建模,从而得到一个可以学习的目标函数在没有反馈的情况下反事实。图3基于信息瓶颈理论的反事实学习框架流程图事实事件和反事实事件分别为and,对应的表示为and。在此基础上,对原来的互信息项进行拆分,引入超参数,得到一个新的考虑反事实的信息瓶颈:这个新的瓶颈将原来的互信息项拆分为两个域的比较项加上事实信息项。由于上式中的互信息项不能直接优化,将其进一步拆解成可优化形式后,最终的目标函数形式为:该目标函数适用范围广,绝大多数模型都可以在不修改现有模型结构(例如MF模型)的情况下应用此目标函数来校正模型。为了验证其应用潜力,腾讯天眼实验室使用了基准测试软件YahooR3!而Coat在现场公开数据集进行测试,使用MNAR数据作为训练数据,使用MAR作为测试数据,可以有效反映推荐模型的不同方法。偏差校正效果,最终实验结果如下表所示。表1实验结果(AUC和MSE指标)表2实验结果(nDCG指标)在模型的稳健性检验中,该方法表现出较强的稳健性。对超参数的变化不敏感,非常适合实际场景部署。与传统的推荐系统相比,这种基于信息论的推荐系统校正方法呈现出几大创新:一是基于信息论和反事实理论的学习方法,无需进行在线随机流量实验,节省了大量的训练费用;二是模型参数稳健,适合工业场景实际部署;第三,该目标函数适用范围广,该领域的大部分模型都可以应用该目标函数对模型进行修正,无需对现有模型结构进行修改,兼容性强。商业应用无处不在推荐系统纠错方式重拾内容多样性从目前来看,推荐系统的商业应用无处不在,很多主流APP都应用到了推荐系统中。比如旅游类,携程、去哪儿等会推荐机票、酒店等;外卖平台类,饿了么、美团等会推荐餐厅;电商购物类,京东、淘宝、亚马逊等会推荐“可能喜欢的商品”;新闻类,今日头条、腾讯新闻等会推送用户感兴趣的新闻。APP或网站使用推荐系统,作为腾讯在医疗领域布局的技术提供方,腾讯天眼实验室主要专注于医疗健康领域AI算法的研究与落地,不断研究和拓展AI医疗的边界目前,腾讯天眼实验室主要将算法能力输出到微信支付九宫格腾讯健康小程序、QQ浏览器、微信搜一搜等。通过腾讯健康疫情问答推荐版块,提供各种关于疫情的内容和咨询服务,而不是只关注用户个人和同事主动偏好,基于信息论模型,快速模型训练,纠正推荐系统的偏差,大大节省时间和经济成本。同时,在腾讯觅影的AI导诊平台上,也将该方法应用到日常的医疗信息推荐中,为用户推荐相关内容,大大提高了推荐内容的多样性和公平性,也提升了用户体验。比如对于糖尿病患者来说,他们日常的关注点可能与糖尿病有关。如果不对推荐系统进行修正,系统会越来越倾向于向用户推荐与糖尿病相关的内容。患者推荐一些运动、睡眠等健康知识,帮助用户更全面地了解自己的健康状况。可见,推荐系统的偏差修正方法具有非常广泛的应用价值。未来,腾讯天眼实验室将不断拓展应用范围,为用户提供更优质的服务。