当前位置: 首页 > 网络应用技术

推荐系统中的时间表,Zhang Fuguo等。ESWA 2017

时间:2023-03-07 11:28:59 网络应用技术

  推荐系统中的时间表

  首先,本文提出了一种称为及时性的新测量标准,以衡量市场上新清单或长期销售的程度。$ $ $ talpha = frac {1} {1} {kalpha} sum {iin ualpha}(t_ {t_ {ialpha} -t0)ag {1} $ $,$ kalpha $指示有多少用户选择项目$ alpha $;这是项目$ alpha $的用户集合;$ t {ialpha} $是用户$ i $ selected项目$ alpha $的时间;$ t_0 $是数据集的最早数据。根据该定义,如果一个项目出现很久以前,但最近已被许多用户选择,其及时性仍然很高。因此,该项目的时间性质在可以评估用户$ i $的建议列表作为评估建议结果的指标。$ ti ti(l)= frac {1} {l} {l} sum {alpha in o^i} talpha ag {2} $ o$ talpha $是物品$ alpha $的及时性;$ o_i $代表用户$ i $推荐列表;$ l $是推荐列表的长度。推荐算法的及时性是由所有用户的$ t_i(l)$获得的。建议用户$ i $的所有项目的及时算术平均值。

  使用以上两个指标,将建议算法定义为建议算法$ i $ alpha $ $ $ f {ialpha} $的分数。在大多数算法中,它的改进非常直接,并且表示为:$ $ ilde {f {ialpha}} = f {ialpha} imes talpha ag {3} $。$。此外,改进的建议评分指数不涉及该算法的详细信息,因此可以在几乎所有类似建议的应用程序中使用。

  此外,考虑项目的时间顺序不合适,然后使用随机分割来分配数据集。替换方法是按时间轴排序,较早的数据为训练集,然后延迟到测试集中。根据实际情况,分区比率可以为91分(即Zhang等,2017)等。

  以下指标全部用于TOPL(即TOPN,用于统一表达式)建议列表

  一个经典指标之一。对于目标用户$ i $,其推荐列表中的项目$ alpha $的顺序表示为$ r_ {i alpha} $,所有前所未有的项目的数量为$ ni $。$ ialpha $指示一个用户项目,正确,有:$ $ rs {ialpha} = frac {r_ {ialpha}}} {n_i} ag {4} $ $用于计算整个测试set.rs = frac {1} {1} {|ep |} sum {ep} rs {ialpha} ag {5} $ $的sum {ialpha显然,$ rs $的值越小,推荐算法的准确性就越高

  实际上,推荐系统仅显示每个用户最相关的对象的简短列表。因此,这是一个更实用的问题,是否符合用户的利益。准确性(P)指标旨在评估在这方面,建议算法的准确性。对于单个用户$ i $的推荐列表,有:$ $ p_i(l)= frac {d_i(l)} {l} {l} ag {6} $d_i(l)$代表用户$ i $。在TOPL建议列表中选择的项目数量。总体精度是通过计算所有个人准确性获得的。

  多样性有几种不同的措施。

  个性化和个性化程度衡量了两个用户的建议列表之间的差异。通常,锤距可用于测量,两个不同的用户$ i $和$ j $,带有$ c,{ij}(l)$表示两个不同建议列表中相同项目的数量。距离计算公式为:$ $ d {ij} = 1-frac {c {ij}(l)} {l} agg {7} $ $ d {ij} $范围$ lbrack 0,1的值 在奶头$上,所有用户之间的距离等于整个测试集$ d(l)$的个性化程度。个性化程度越高,建议结果的建议结果越好

  意外和惊喜测量推荐列表中物品的平均普及。由于用户可能已经从其他渠道中知道了这种流行物品,如果出现的话,可能根本不会有很多惊喜。因此,惊喜实际上可以衡量发掘的能力非广泛项目的非广泛项目。$ oi $表示用户$ i $的建议列表;$ kalpha $表示生产$ alpha $或已连接的用户数量。显然,$ k_alpha $ the the较大,是受欢迎的物品。Ag {8}总体惊喜和计算平均得出。

  本文中使用的数据来自Grouplens和Netflix。在某些数据进行预处理后,在上述各种指标上,根据及时以及两种不同的数据集除法方法,对多种不同的经典TOPL建议算法进行了测试。

  结果表明: