概述图模型通常应用于问题本身具有多个相互关联的变量的场景,并为您提供基于图的表达来对这些连接进行建模以揭示潜在的因果关系。在本文中,我们创新地将概率图模型应用于淘宝平台藏品作弊行为检测任务,取得了远优于传统分类模型(召回Top1%记录中60%的作弊行为)的结果。在本文中,我们将从作弊行为分析、模型构建和模型求解三个部分详细介绍这项工作。目前文章已被WWW2018录用(录用率14.8%)。背景介绍随着网上购物网站的发展,网上购物正逐渐取代传统的购物方式。根据2016年普华永道的一项调查,54%的购物者每周或每月在线购物,34%的购物者认为手机是他们的主要购物工具。在购物网站中,搜索引擎是用户寻找特定产品、款式或品牌的主要入口。借助搜索引擎,用户可以方便地在购物网站上完成一系列的加购、收藏、购买,而这些用户行为数据本身也蕴含着巨大的价值,对优化购物网站的推荐和搜索起到重要作用.起到了非常重要的作用。“收藏”是淘宝的一项重要功能,可以方便用户收藏一些暂时不想购买的商品。同时,商品“收藏”的数量,也就是人气,也是淘宝搜索引擎提供的一种可选的排序策略;而对于默认的综合排序,往往会引入人气值作为参数进去。一些恶意商家为了提高商品或店铺的排名和知名度,采取虚假作弊行为来增加销量,主要包括虚假促销行为(收藏夹)、额外购买和转发)和虚假评论。目前,淘宝作弊的地下产业日趋成熟,尤其是随着众包平台的发展,商家可以根据自己的需要轻松发布作弊任务,吸引众多参与者完成作弊活动,从而快速高效地实现产品或商店的促销。以虚假收藏为例,恶意商家通过发布任务快速提升商品的热度,进而影响淘宝的推荐和搜索排名策略,进一步提升商品销量。这种借助众包平台作弊,可以在短时间内产生大量的异常数据,而且难以察觉,对用户和购物网站本身都会造成不好的影响。因此,如何快速有效地发现这些作弊活动,对于淘宝来说非常重要。作弊活动运作模式通过调查灰产平台提供的收藏作弊服务,我们总结出如下图所示的作弊模式:一、商家通过平台发布作弊任务,指定商品、搜索关键词、任务时间和佣金.除了这些基本信息外,商家还会提出一些特殊要求,比如在搜索结果页面浏览x分钟以上,在搜索结果中随机点击y件商品,然后点击指定商品保存。参与者满足一定的等级要求。平台用户看到任务后会申请任务,根据任务中的要求进行搜索、浏览、点击、收藏等一系列操作,最后需要截图才能申请平台上的佣金。这类平台的用户大多是兼职黑客,作弊只是他们在淘宝平台上的一部分行为。此外,收藏作为一种私人行为,无法被公众察觉,缺乏“对我有用”、“***回答”等明确指标。因此,这种新兴的作弊任务很难用现有的方法检测出来。为了识别此类作弊行为,我们在作弊平台上收集了一个月的任务来标记用户行为。同时,我们从用户属性、商品属性、行为属性三个角度对收藏作弊进行了深入分析。我们将这些属性以及用户与产品之间的关系与因子图模型结合起来,并在此基础上设计了一个分类模型来检测集合中可能存在的作弊行为。用户、商品、行为属性对比分析行为属性分析首先,我们对作弊采集行为与正常采集行为的属性差异进行了详细对比。从追加购买的角度来看,只有6%的作弊收藏行为有追加购买行为,而正常收藏行为则有8%。这种差异主要是因为在极少数的收藏作弊任务中有添加购物车的需求。再加上作弊合集中的商品本身并不是用户想要的,加购的意愿自然也就少了。在搜索过程中,用户可以使用一些过滤条件(发货地、价格范围等)来更有效地找到产品。此处作弊合集与正常合集相比,使用过滤器的比例较低。至于采集前(当前搜索过程中)是否有其他产品点击,作弊采集行为明显高于正常采集行为。这主要是因为许多作弊任务需要更多的物品。从时间上看,作弊多发生在周末,这可能与作弊用户的兼职有关。在下图中,我们比较了更多的行为属性,包括搜索关键词的长度、搜索结果页的浏览深度、搜索结果页的停留时间、点击商品详情页的停留时间。通过上面的分析我们可以看出,作弊收款行为和正常收款行为在除了之前商品的点击之外其他属性上并没有太大区别,这进一步印证了但是从行为本身来区分作弊和非作弊是非常困难。用户属性分析在下面的分析中,我们将收集到的作弊样本中涉及的用户定义为作弊用户,其余用户定义为正常用户。与作弊样品相似的产品成为作弊产品,其余产品成为正常产品。从上表可以看出,作弊用户的行为(收藏、加购、购买、评论)明显少于正常用户。这些行为可以反映用户对平台的投入时间。显然,作弊用户的活跃度远低于正常用户。我们带了一位作弊用户来观察他们收款行为的持久性。结果如上图所示,作弊用户会在连续一段时间内(前半个月)收集到一定数量的作弊产品。这个数据表明,作弊用户会在一定的连续时间窗口内收集作弊产品。产品属性分析和用户属性分析类似,我们也会比较作弊产品和正常产品的区别。数据见下表。显然,作弊产品的行为数据远低于正常产品,这也反映出通常只有表现不佳的产品才会寻求作弊,而这些作弊产品也很难吸引到正常用户。我们选择了一款作弊产品和一款正常产品,观察他们收藏的持久性。结果如下图所示。可以看出,作弊产品上的作弊行为集中在一个很短的时间窗口内,这个时间窗口可能是对应任务指定的时间。作弊采集检测模型定义根据对作弊活动的分析,提取区分特征,将提取的特征因子和关联因子集成到概率图模型框架(ActivityFactorGraphModel,AFGM)中,进行虚假采集活动识别。在AFGM模型中,我们一共引入了三个特征因子,包括行为特征、用户特征和产品特征,并引入了基于用户和产品的相关因子,即对于一个固定的时间窗口,同一个用户或者同一个product生成的两条集合记录建立边关系,具体模型如下图所示。从模型求解的实验结果可以看出,传统方法在作弊检测问题上基本无效,而使用概率图模型可以获得更好的结果。对比之下,我们发现即使不考虑产品属性因素和用户属性因素,模型也已经能够取得不错的结果,加入这些因素也只是对最终结果略有提升。上图展示了不同概率图模型在topk%的检测效率。可以看出,在top10%中,我们可以检测到近80%的作弊行为,AFGM和AFGM-UP这两个模型的表现非常接近。.这可能是由于相关因子已经包含足够的信息来检测作弊行为。AFGM-CP的性能是四个模型中最差的,这表明项目相关因子在检测作弊中更为重要。小结在本文中,我们从多个角度对淘宝点评的收藏作弊行为进行了深入分析,揭示了作弊行为与正常行为的区别。通过这些分析,我们提取了多种特征,并提出了AFGM来推断收藏行为是否为作弊。实验结果表明,AFGM可以召回top1%记录中超过60%的作弊行为。通过不同模型之间的比较,我们还发现商品相关性因素在检测作弊行为中更为重要。虽然我们提出的检测模型具有很高的效率,但必须指出的是,目前的算法只能整体识别一个时间段内的作弊行为,无法实时判断行为。这将是未来的一个研究方向。作者:苏宁,刘益群,李超,刘玉丽因为涉及的公式太多,没有错误,附上PDF,请点击查看!
