当前位置: 首页 > 科技观察

阿里SIGIR2017论文:GAN在信息检索领域的应用

时间:2023-03-20 14:56:14 科技观察

信息检索领域顶级会议SIGIR2017即将开幕。昨天,机器之心报道了一篇阿里被SIGIR2017录用的论文。据了解,阿里共有3篇论文被本次大会录用。本文介绍另一篇由伦敦大学、上海交通大学、阿里等合作的论文论文链接:https://arxiv.org/pdf/1705.10513.pdf信息检索(IR)的典型问题是给一些querywords(query)返回排序后的文档(documents)列表,但IR的应用范围可以扩展到文档检索、网络搜索、推荐系统、QA问答系统和个性化广告等领域。在IR领域理论或模型,有两种典型的思路(如图所示):GenerativeIRmodel:第一种思想认为documents和query之间存在隐含的随机生成(generative)过程,可以表示为:q→d,其中q表示query,d表示document,箭头表示生成方向,生成模型modelsp(d|q)。DiscriminativeIR模型:第二种思路采用机器学习的方法,将IR问题转化为判别(discriminative)问题;可以表示为:q+d→r,其中+表示query和document特征的组合,r表示相关性,如果r为0或1,则该问题是分类问题,如果r为相关性分数,则问题是回归问题;现在著名的方法是学习排序(LearningtoRank)。Learningtorank可以分为三种模型:Pointwise、Pairwise和Listwise。IR的生成模型虽然在Query和Document特征建模(如文本统计)上非常成功,但在利用其他相关信息(如链接、点击等)方面遇到了很大的困难,而这些信息主要可以在当前的互联网上观察到应用程序。同时,虽然学习排名等IR判别模型能够从大量标记和未标记数据中隐式学习检索排序函数,但目前缺乏从大量未标记数据中推导有用特征或收集有用信号的属性方法,特别是来自文本统计(来自文档和查询)或来自集合中相关文档的分布。IRGAN应用GAN的思想,引入博弈论中的minmax博弈,将生成IR模型和判别IR模型结合起来。具体来说,我们为两个模型定义了一个共同的检索函数(例如基于判别式的目标函数)。一方面,判别模型旨在通过从标记数据中学习来最大化目标函数,并为生成模型的训练提供指导信息。另一方面,生成模型充当挑战者,不断将判别器的决策边界推向极限。它迭代地为判别器提供最困难的情况,而判别器通过对抗性地最小化目标函数来重新训练自己。下面详细介绍IRGAN的方法,分别介绍GAN中对应的Discriminator(D)和Generator(G)。1.Discriminator:,其中φ是D的一个参数,D的输入是Query-Document对数据(q,d),输出是这对数据是否匹配。这相当于一个二分类问题,可以通过逻辑回归给出:同原来的GAN,D,目标是优化:2.生成器:,其中θ为G的参数。G的输入为Query,输出是与Query相关的文档的概率分布,相关性用这个概率分布来表示。由Softmax函数给出:G的目标是最小化:IRGAN的训练部分,G和D交叉更新。对于D,可以采用梯度下降更新法;对于G,由于G的输出是离散文档的概率分布,所以没办法直接用梯度下降法求G的梯度。对于这个用GAN训练离散数据的问题,可以用的方法强化学习中的PolicyGradient,奖励由D给出。整个训练过程如下图所示算法:在实验部分,做了三个不同的IR任务:WebSearch,ItemRecommendation和QuestionAnswering。实验结果表明,IRGAN模型击败了多种强基线。开源代码在:https://github.com/geek-ai/irgan。【本文为栏目组织《机器之心》原创文章,微信公众号《机器之心(id:almosthuman2014)》】点此查看作者更多好文