当前位置: 首页 > 科技观察

Zipf矩阵分解:解决推荐系统中马太效应的利器

时间:2023-03-13 07:46:24 科技观察

【.com原稿】算法公平性是近年来推荐系统的一个重要研究方向。许多研究人员和工程师在这个问题上做出了巨大的努力。因为推荐场景中的输入数据通常具有马太效应,会影响计算过程和计算结果。自2017年以来,推荐系统中的公平性问题,包括马太效应,受到了广泛关注。2020年推荐系统子领域权威会议RecSys的相关论文数量达到前所未有的水平。在SIGIR和WWW等顶级会议上也有多篇关于排名学习公平性的论文。谷歌等相关公司也有自己的推荐系统公平框架。解决推荐系统中马太效应的一个经常出现的框架是损失函数加上惩罚项。惩罚项的选择在各个研究论文中都有不同的表述,但相关性等诸多惩罚项在理论层面上并不能准确反映马太效应的程度。在刚刚结束的2021年国际学术会议ICAIBD2021中,有一篇论文ZipfMatrixFactorization:MatrixFactorizationwithMatthewEffectReductionontheMatthewEffectoftherecommendationsystem,从理论层面解决了惩罚项如何选择的问题,并通过实验结果证明推荐系统可以提高技术性能和公平性指标。Zif矩阵分解首次明确提出了一个统计指标来衡量item在推荐系统结果中的马太效应(如下图):,其中x表示item在推荐系统输出结果中的流行度排名。添加惩罚项后的损失函数如下图所示:在优化损失函数的过程中,我们不知道人气排名x的值,只能估计。作者通过使用线性方程组和无惩罚项的矩阵分解来逼近x的值,然后可以通过随机梯度下降求解损失函数(如下图):作者在MovieLens数据集上测试算法MAE为如下:可以看出,蓝线表示的Zipf矩阵分解MAE曲线的整体性能优于没有惩罚项的原始矩阵分解算法。下图可以看出,在算法性能提升的同时,马太效应也得到了提升:Zif矩阵分解算法实现简单,性能突出。是解决推荐系统马太效应的利器。随着人工智能算法的公平性越来越受到重视,人类终将走出矩阵的迷雾,迎来人机和平共处的曙光(黑客帝国)。我们有幸身处这样一个历史时刻,见证了一场伟大的科技革命正在我们身边发生。原文链接:https://arxiv.org/abs/2106.07347作者介绍王浩,技术总监/架构师,美国犹他大学本科/硕士,大学在职MBA国际商务与经济学专业。在百度、新浪、网易、豆瓣等公司拥有多年研发和技术管理经验。擅长机器学习、大数据、推荐系统、社交网络分析等技术。在TVCG、ASONAM等国际会议和期刊发表论文11篇。国际学术会议IEEESMI2008和ICBDT2020最佳论文奖。【原创稿件,合作网站转载请注明原作者和出处.com】

猜你喜欢