当前位置: 首页 > 科技观察

推荐系统详解——个性化推荐与非个性化推荐

时间:2023-03-20 21:16:39 科技观察

【.com原稿】一、引言随着大数据资源的爆发式增长和互联网软件技术的不断更新,各个企业和数亿用户随时随地交换信息,产生海量的交互信息。这些互动信息不仅数量庞大,而且具有形式多样的特点。所以对于用户而言,这些产生交互信息的用户在享受网络资源带来的极大便利的同时,也为海量碎片化信息和过载的数据信息所困扰。面对如此复杂的数据信息,这些用户无法或难以找到真正符合自己需求的内容或真正对自己有益的信息,给客户带来的是无效信息的轰炸。对于企业来说,面对庞大的用户信息数据,如何对这些数据进行有效的管理和分析,挖掘有效的信息,为企业服务的用户提供他们可能感兴趣的内容是非常重要的。因此,推荐系统应运而生,它是互联网和电子商务发展的产物,也是基于海量数据挖掘的智能业务服务平台。经常会用到做各种决定的过程,比如买什么,听什么音乐,或者在网站上浏览什么网站和新闻。2、推荐重点和分类:“item”是推荐的一个重要重点,是系统向用户推荐的内容的总称。推荐系统通常专注于特定类型的物品(电子、书籍、化妆品等),因此其设计的核心是为特定类型的物品提供有效的推荐以供定制。推荐系统分为两类:个性化推荐和非个性化推荐。推荐系统的性能主要取决于个性化推荐,而个性化推荐是推广系统不断优化的核心。个性化推荐可以为用户推荐个性化的服务和感兴趣的产品,不断提升用户体验,并在此基础上提高企业平台的吸引力和用户粘性,增加企业产品的销售和推广,从而实现互惠互利。益处。赢。一般情况下,非个性化推荐就是推送热销商品的数据或者周期榜单的数据。通过结合两种不同的推荐方法,我们可以更好的完成不同用户在不同场景下的推荐。下面,我将主要阐述这两个建议。因为非个性化推荐的内容比较固定,推荐的数据不需要过多的算法内容。因此,我将从非个性化推荐开始,逐步引导到个性化推荐。2.1非个性化推荐非个性化推荐,顾名思义,不考虑每个用户的特点,不考虑用户的历史行为,向销量可观的用户推荐相对简单粗暴的商品数据(销量前十榜单),ETC。)。就这种推荐方式而言,更适合冷启动模块的用户推荐。我在之前的一家互联网公司也用过这种推荐方式,完成了冷启动用户(近一个月不活跃或者活跃近一年的用户或者新注册的用户)的推荐,可以产生可观的PV和UV点击率和购买量。速度。下面结合本人在这方面的工作经验,简单介绍一下冷启动用户模块推荐商品数据的来源和处理。(1)公司前台会形成产品采购单数据表,通过产品采购量形成对应的热度评分表,通过产品采购成交额形成产品评分表;(2)根据产品热度评分表和评分表Table形成列表数据;(3)对获取的list数据表进行无效商品过滤、性别匹配过滤、四级商品组打乱,将固定数量的商品数据推送给kafka实时刷新展示。实际问题?在这种推荐过程中,很多公司可能会面临冷启动用户量过大的问题。如果他们要一次性向这些用户推送产品数据,可能会超过公司平台的负载能力。经过考虑,发现冷启动用户的活跃度比较低,近一个月的活跃用户数很少,也就是说我们的推送任务已经积累了一定的推送时间。对于该模块的用户数据推送,我们不需要一次性推荐所有用户(当然如果贵公司的平台负载能力足够大,则不存在这个问题),我们可以根据我们公司的平台每隔一段时间推送不同尾号的用户数据,比如把用户按照尾号(01、23、45、67、89)分成5等份,然后把日期除以5得到余数推送(余数为0推送尾号为0和1的用户,尾号为1的用户和尾号为2和3的用户...)这种推送可以充分考虑到用户的有效性产品数据,同时满足公司平台承载能力。因为完美的推荐系统效果永远是未知的,也是不断优化的结果。只有考虑到影响推荐系统的因素,在不同的场景下权衡这些因素,才能找到适合自己需求的推荐效果。2.2个性化推荐个性化推荐,顾名思义,就是根据用户特有的属性(历史行为、相关偏好等),挖掘用户可能感兴趣的信息数据,完成实时推送。个性化推荐的效果基本上决定了整个推荐系统的推荐效果。我们日常生活中所说的推荐系统,基本上都是个性化的推荐系统,所以下面统称为推荐系统。因为引入推荐系统也是引入了个性化推荐。3推荐系统的功能及效果评价3.1推荐系统的功能推荐系统的功能很多,主要分为以下几类:(1)增加商品的销量。无疑,这是任何公司推荐系统时首先要考虑的因素。可以说,不能增加商品销量的推荐系统不叫推荐系统,因为它的存在没有实质意义。虽然这么说比较势利,但也是基础,因为企业的发展基本上是以盈利为基础的,这是任何推荐系统都不能忽视的因素;(2)卖更多种类的商品,很多人你会问,这个功能和上面的功能不一样吗?事实上,它不是。如果你仔细看,你会发现还是有一些区别的。第一个函数是商品的销售数量,第二个函数更关心销售商品的种类。也就是说,你的推荐系统不仅要增加某个品类或品牌产品的销量,还要推荐更多种类或品牌的产品。这也是为了解决推荐过程中的长尾效应(后面会讲到长尾效应)。比如你的推荐系统,提升了格力空调的销量和营业额,但是你不能一直推荐格力空调。公司还需要您推荐其他格力品牌电器(冰箱、电风扇等)。或者需要推荐其他品牌的空调(美的、海尔等),这样更有利于公司平台的运营,挖掘用户的潜在兴趣,不至于把用户需求做的具体化.(3)提高用户满意度。这个指标很难从一个确切的数字来判断。只能通过调查问卷或推荐产品评论来粗略衡量。并且不同用户之间的体验是感官性的,很难用数字量化,存在恶意评论等用户。所以基本上这个用户满意度的提升只能粗略的考虑。(4)提高用户忠诚度。这个功能基本反映了用户的满意度,但不能直接相等。用户忠诚度可以通过用户买买买、阅读看看、买看再看等数据表来概括。3.2推荐系统效果评价推荐系统是把一个产品给喜欢这个产品或者有兴趣购买这个产品的人,所以用户可以分为两部分,一个是有意的,一个是无意的,所以这样的问题是称为分类问题。同时,在感兴趣的用户群体中,有非常感兴趣的,也有不太感兴趣的。数字对应的问题就是回归问题。因此,推荐系统的运行过程可以看作是一个分类或回归问题,也就是说可以通过分类/回归的相关指标来衡量推荐系统的性能,主要包括以下参数:(1)均方根误差(RMSE):(2)平均绝对误差(MAE):(3)精度(Precision):(使用推荐产品的比例)(4)召回(Recall):(使用推荐产品的比例)(5)ROC曲线:(未使用产品推荐比例)真阳性数(tp)假阴性数(fn)假阳性数(fp)真阴性数(tn)不推荐)Normal07.8lbs02falsefalsefalseEN-USZH-CNX-NONE/*样式定义*/table.MsoNormalTable{mso-style-name:Normaltable;mso-tstyle-rowband-size:0;mso-tstyle-colband-size:0;mso-style-noshow:yes;mso-style-priority:99;mso-style-parent:"";mso-padding-alt:0cm5.4pt0cm5.4pt;mso-para-margin:0cm;mso-para-margin-bottom:.0001pt;mso-pagination:widow-orphan;font-size:10.0pt;font-family:"TimesNewRoman",serif;}table.MsoTableGrid{mso-style-name:gridtype;mso-tstyle-rowband-size:0;mso-tstyle-colband-size:0;mso-style-unhide:no;border:solidwindowtext1.0pt;mso-border-alt:solidwindowtext.5pt;mso-padding-alt:0cm5.4pt0cm5.4pt;mso-border-insideh:.5ptsolidwindowtext;mso-border-insidev:.5ptsolidwindowtext;mso-para-margin:0cm;mso-para-margin-bottom:.0001pt;text-align:justify;text-justify:inter-ideograph;mso-pagination:none;font-size:10.0pt;font-family:"TimesNewRoman",serif;}Truepositivenumber(tp):推荐产品被用户使用,即推荐有效;假负数(fn):使用过的产品不推荐,即推荐不足;误报数(fp):推荐的商品没有被用户使用,即推荐无效;真负数(tn):未使用,不做推荐4.概要个性化推荐提供的实时推送信息数据满足用户实时需求,该类目主要针对日活跃用户完成推荐,通过历史偏好信息和活跃用户的行为,制定用户满意的推荐数据;非个性化推荐是对个性化推荐的补充和延续,主要针对冷启动用户模块,达到锦上添花的效果。因此,任何推荐系统都必须将它们结合起来,不断优化推荐类型的比例,并考虑不同的应用场景,从而设计出更符合实际情况的更令人满意的推荐系统。【原创稿件,合作网站转载请注明原作者和出处为.com】