[.com原稿]推荐系统是迄今为止商业化最成功的技术之一。推荐系统的基本原理是根据算法和大数据猜测用户偏好,向用户推荐感兴趣的项目。推荐系统的应用场景非常广泛,从新闻推荐、音乐推荐、电影推荐到相亲推荐。许多国内外公司都将推荐系统作为其商业产品的重要组成部分。很多互联网公司,比如今日头条、Netflix,都把推荐系统作为最重要的技术支撑业务。本文将介绍随着推荐系统的发展,技术的演进。图1.Netflix推荐系统架构1.协同过滤推荐系统经过长期发展,形成了庞大的算法和研发体系。推荐系统领域最早的算法是协同过滤,各大互联网公司基本不将其作为在线系统,只是作为算法迭代的初始对比标准。协同过滤包括基于用户的协同过滤和基于物品的协同过滤。User-basedcollaborativefiltering:算法的思想是计算用户之间的相似度,然后通过用户相似度加权计算出最接近用户的item,经过评分排序后推荐给用户。Item-basedcollaborativefiltering:算法思想与此类似,但首先计算物品与物品之间的相似度,然后通过加权排序计算用户的评分,将评分高的物品推荐给用户。为了提高推荐系统的效率,亚马逊在推荐系统的早年设计了Slope-One算法来推荐商品。2.矩阵分解模型如果说协同过滤是推荐系统发展的第一阶段,那么矩阵分解模型就是推荐系统发展的第二阶段。研究人员和工程师们开始使用SVD分解、LDA和ALS等矩阵分解模型,将用户对物品的评分矩阵分解为用户隐变量矩阵和物品隐变量矩阵,然后通过计算矢量产品。填充。由于矩阵分解模型需要计算完整的用户-项目评分矩阵,时间复杂度比较高。谷歌在2010年发表了一篇论文,介绍了GoogleNews的新闻推荐系统,该系统结合了协同过滤、矩阵分解和统计兴趣趋势。这一阶段出现了非评分矩阵的隐式反馈算法,其中比较有名的有SVD++和一类协同过滤。图2.SVD++评分计算公式3.基于逻辑回归的点击率估算2010年后,推荐系统进入发展的鼎盛时期。这一时期,国内互联网公司意识到推荐系统的重要性,开始着重投入相关研发。例如,百度专门设立了推荐和个性化部门,阿里巴巴也将产品推荐作为业务重点。与早年在国内推出推荐系统业务的豆瓣不同,这些公司由于数据量巨大,大多采用基于逻辑回归预测点击率的方法。百度在2012年和2014年的国际会议上发表了关于百度知乎推荐系统的论文,网易也在同期的***会议VLDB上发表了关于其相亲推荐系统的论文。图3.百度知乎推荐系统架构图4.网易华天婚恋推荐系统架构随着推荐系统的发展,研究人员和工程师逐渐意识到混合模型比单一模型具有更多优势。我国大型互联网公司常用的点击率估算方法主要是通过线性模型和非线性模型的叠加来完成的。国外采用相同思路设计推荐系统的有Facebook的feed流式广告推荐系统、雅虎的问答推荐系统等。在此期间,普林斯顿大学和微软研究院提出了协作主题回归等算法,考虑基于内容的推荐,采用协同过滤和矩阵分解模型相结合的算法,最终实现了纽约时报系统的新闻推荐。图5CollaborativeTopicRegression算法图解模型4.Rankinglearning2010年后,推荐系统研究领域出现了新的思潮。许多研究人员已经开始考虑学习排名推荐的方法。2010年初,推荐系统国际会议ACMRecSys集中发表了多篇使用排序学习进行推荐的论文。排序学习优化的目标包括MRR、NDCG、AUC等信息检索指标。代表算法有BayesianPersonalizedRanking、CollaborativeLessisMoreFiltering等。排序学习本身可以作为一个独立的推荐算法,也可以作为更完整的排序推荐系统的一部分。新浪微博等公司已将学习排名作为其推荐系统的一部分。图6.贝叶斯个性化排名伪代码5.深度学习近年来,随着深度学习的兴起,推荐系统也受到了人工智能大潮的洗礼。百度、谷歌、京东、阿里巴巴等公司都在逐步采用深度学习或深度强化学习来替代原有的推荐系统。KDD和RecSys中出现了许多相关的企业论文。深度学习正逐渐成为推荐系统未来发展的主流趋势。图7.YouTube深度学习推荐系统架构图8.基于GRU的深度文本推荐系统,AsktheGRU:Multi-TaskLearningforDeepTextRecommendations,ACMRecSys2016同时,推荐系统催生了一批创业公司,2013年和2014年,国外掀起了一股推荐系统创业的热潮。在中国企业苦苦寻找推荐系统的商业模式后,一家以推荐系统为最大卖点的互联网公司诞生了——今日头条。总之,推荐系统是一个技术领域,无数技术人员都投入了大量心血。我们预计在不久的将来,推荐系统领域将陆续迎来新的创新高峰,催生出一批新兴的商业公司。王浩,恒昌力通大数据部负责人,犹他大学硕士,在百度、新浪、网易、豆瓣等公司有多年研发和技术管理经验,擅长机器学习、大数据、推荐系统、社交网络分析等技术。在TVCG、ASONAM等国际会议和期刊发表论文5篇。本科毕业论文获得IEEESMI2008国际会议最佳论文奖。【原创稿件,合作网站转载请注明原作者及出处.com】
