当前位置: 首页 > 科技观察

泊松矩阵分解:无需数据解决推荐系统冷启动问题的矩阵分解算法_0

时间:2023-03-18 11:28:16 科技观察

PoissonMatrixDecomposition:AMatrixDecompositionAlgorithmforSolvingtheCold-StartProblemofRecommenderSystemsWithoutData过去十年间,互联网行业诞生了数百万迭代版本的推荐系统模型。虽然针对不同场景优化的推荐系统模型很多,但经典模型却很少。矩阵分解是推荐系统领域早期在Netflix竞赛中出现的推荐系统算法,也是近十年来最成功的推荐系统算法。虽然到了2023年的今天,推荐系统领域早已被深度学习所统治,但矩阵分解在各大公司的研发过程中仍然被广泛应用,许多研究人员仍在从事相关算法的研究。矩阵分解算法最经典的论文是2007年的ProbabilisticMatrixFactorization,后人在此基础上进行了大量的拓展工作,如2021年的RankMat(论文下载地址:https://arxiv.org/abs/2204.13016)、ZeroMat(论文下载地址:https://arxiv.org/abs/2112.03084)和2022年的DotMat(论文下载地址:https://arxiv.org/abs/2206.00151)、KL-Mat(论文下载地址:https://arxiv.org/abs/2204.13583/代码下载地址:https://github.com/haow85/KL-Mat)等推荐系统因其简单性深受互联网行业工程师的喜爱,易用性,速度快。推荐系统的冷启动问题是今年另一个备受关注的研究热点。很多从业者解决推荐系统的思路是迁移学习和元学习。但是,这种思路有一个致命的缺点,就是需要其他知识领域的数据。而很多公司都不具备这个条件。真正不需要任何数据的冷启动算法是在2021年ZeroMat提出后出现的,代表算法有上一节提到的ZeroMat和DotMat。本文要介绍的泊松矩阵分解算法(PoissonMat)是2022年国际学术会议MLISE2022上发表的论文。论文名称为PoissonMat:RemodelingMatrixFactorizationusingPoissonDistributionandSolvingtheColdStartProblemwithoutInputData(论文下载地址:https://arxiv.org/abs/2212.10460)。我们首先回顾概率矩阵分解的MAP定义:然后我们将用户对项目评分的行为定义为泊松分布。根据泊松分布的定义,我们得到如下公式:根据泊松公式中参数的定义,我们有:根据Zipf分布,我们可以得到以下公式:结合以上公式,我们得到分析泊松矩阵分解(PoissonMat)形式:利用随机梯度下降算法求解上式,得到如下算法过程:作者随后在MovieLens100万数据集和LDOS-CoMoDa数据集上进行了算法精度和公平性的实验对比:图1MovieLens1MillionDataset上泊松矩阵分解对比实验图2LDOS-CoMoDa数据集上泊松矩阵分解对比实验根据实验对比结果,我们可以得出以下结论:泊松矩阵分解(PoissonMat)兼具精度和公平指标。优于其他算法。而难能可贵的是,泊松矩阵分解算法不使用任何输入数据。是一个完整的零样本学习算法,很好的解决了冷启动问题。最后,笔者在一款16G内存、Intel酷睿i5的联想家用笔记本上做了实验。该算法运行速度快,实现也非常简单。旨在解决推荐系统冷启动问题的零样本学习算法是目前的研究热点。真正的零样本学习算法,不需要任何数据来解决零样本学习问题,从2021年的ZeroMat算法开始。本文介绍的泊松矩阵分解算法(PoissonMat)优于ZeroMat及其后续算法,DotMat,并且是目前该领域最好的算法之一。由于相关研究尚处于起步阶段,希望引起广大科技从业者的关注和关注。笔者介绍王浩,原趣加人工智能实验室负责人,原恒昌利通大数据部负责人。美国犹他大学(UniversityofUtah)学士学位(2008)和硕士学位(2010)。对外经济贸易大学在职MBA(2016)。在推荐系统(公平/场景推荐/冷启动/解释/排序学习)、计算机图形学(几何建模/可视化)、自然语言处理(行业应用)、风控与反欺诈(金融/医疗)等directions有多年的经验和独到的见解。拥有12年互联网(豆瓣、百度、新浪、网易等)、金融科技(恒昌利通)和游戏公司(Funplus等)的技术研发和管理经验。在国际学术会议和期刊发表论文30篇,获得国际会议最佳论文奖/最佳论文报告奖3项(IEEESMI2008BestPaperAward/ICBDT2020BestOralPresentationAward/ICISCAE2021BestOralPresentationAward)。2006ACM/ICPC北美落基山区域竞赛金奖。2004年获全国大学生英语能力竞赛口语决赛铜牌。2003年,济南市高考理工科英语冠军。

猜你喜欢