当前位置: 首页 > 科技观察

电商黄牛,你被小红书盯上了

时间:2023-03-17 16:13:45 科技观察

随着小红书社区电商业务的发展,营销的种类不断丰富,覆盖的用户数量和场景也随之增加,黄牛的抢购补的方法也逐渐变得复杂多样。除了长期存在的聚众抢购爆款方式外,还有一种众包抢购的形式——即邀请真实用户代购分红产品,转发后转账到货获取商品和差价。.这种倒票行为不仅会给平台带来损失,还会继续影响普通用户和商户的权益。为保护用户和商家的利益,小红书反作弊团队通过各种手段不断打击黄牛,沉淀出高效、可执行、可实现的图计算算法模型。在进行交锋之前,我们需要明确交锋的目标是谁,我们会遇到什么困难:黄牛往往以团伙的形式出现,这就需要我们借助其他的特征来准确判断用户的身份。黄牛主要分为两类:与人类黄牛一样:通过海量注册和买卖账户囤积资源,定期操作,交易时通过切换账户规避风控拦截。众包黄牛:通过分发任务的方式进行交易,账户真实性高,与普通用户在设备或行为上的差异较小,难以区分。电商业务瞬息万变,黄牛针对的产品种类和作弊手段也在不断变化。反作弊需要不断优化更新,在满足业务精细化需求的同时,防止新的黄牛突破。Q:为什么要用图计算?A:在回答这个问题之前,我们可以先了解一下图是什么。图由一组节点和一组可以连接两个节点的边组成。节点之间建立的边可以描述不同的关联关系。例如,在电商场景中,有两个不同属性的节点,购买者和商品,它们之间的边可以代表用户的浏览关系、购买关系、评论关系;以及用户在交易中使用的手机号码和设备。可以作为不同属性的节点连接买家,通过边描述其使用或持有关系。这种关系可以通过图数据结构进行存储,实现电商推荐、搜索、风控等多哥领域的大数据化。分析和模型训练。图计算的主要优势是图数据结构可以存储的数据特征维度更加丰富:相对于传统的表存储,可以更好地描述不同主体之间的复杂关系,在电子商务领域,可以更好地突出作弊群体和不同群体之间的关联,使这些关联更直接、更直观、更容易理解。图数据库具有更高的查询分析效率和更好的性能:例如在社会关系数据中,随着社会关系(即朋友的朋友)深度的加深,关系数据库和图数据库的查询性能差异越来越大。图数据库可以更方便地使用数据进行建模:图数据库的重要性往往体现在当前电子商务交易场景中重要的“数据关系”。就像人际关系一样,数据的价值也在于人际关系的优越性。与单纯的节点数据分析相比,对这种关系型数据进行建模分析往往能带来更多收益。Q:如何利用图计算来防范和对抗黄牛风险?A:我介绍了两种主要的黄牛风险:粉丝黄牛和众包黄牛。我们团队从这两类黄牛风险的作弊特性出发,设计了两种有针对性的图计算模型。2.1电商同人黄牛算法斗人黄牛图的设计理念:在平台交易对抗中,同人黄牛往往采用特殊手段更换资源绕过传统策略,在交易的特征维度上存在多跳关系。限制将被放大;而交易环节对时效性要求极高。我们需要实时识别和打击账户间或行为间的聚合黑产,保障平台商户和用户的交易安全。为了应对这一挑战,我们开发了一种更直观、更具描述性和实时性的迭代剥头皮算法,并通过以下过程构建了它:通过在线数据实时消费Kafka交易行为日志,并通过反序列化方法提取用户UID、设备指纹参数、IP地址、商品ID等信息。将对象视为不同的节点并在它们之间建立边。在构建节点和边的过程中,它们被赋予了固有的多维特征,并将这种异构的拓扑关联图写入到Nebula图数据库中。建边方法包括但不限于:a.用户注册登录行为中的绑定关系如:用户→绑定账号等b.用户交易行为中的使用关系如:用户→设备、IP等。c.用户交易行为中的购买关系e.g.:用户→商品,商家等。利用这个关系图,我们可以实时使用多跳关联采样子图,进行强实体挖掘和弱标签传播,发现粉丝黄牛群体,并更新异常群体到风险种子库,实时保障交易安全。2.2电商众包黄牛社区发现算法Q:什么是社区发现算法?A:社区发现算法是基于模块化的。通过不断遍历邻居节点,将自己的社区标签更新为模块化增量最大的邻居标签,直到没有增益,找到每个节点所属的社区。Q:如何使用社区发现算法对抗众包黄牛?A:针对电商场景下众包黄牛的群聚行为,我们利用社区发现算法建立电商异常社区发现模型,建立用户与购买商品的关系,构建一个用户与用户之间的关系。之间的二分图。在建立模型的过程中,我们通过数据预处理过滤掉对模型影响较大的异常数据,并使用自定义的距离算法量化用户之间购买的相似度:其中k代表购买的商品数量两个用户CA和CB分别表示对应用户购买商品的数量,Wpurchase和Wreceive分别表示用户购买和收货的相似度,随时间窗口和促销期间自适应变化。R(A,B)越高,表示用户购买的相关性越大,对应边建立的权重越大,从而构建用户之间的购买关系。通过建立的用户-购买关系图,我们使用社区发现算法来合并社区。得到划分好的社群后,我们进一步描述不同社群用户的特征,自动筛选,从而得到我们真正要找的可疑点。高众包黄牛党和团伙。除了上面主要介绍的两类图算法,小红书反作弊团队还在不断积累和研发多种打击黄牛的方法。例如,我们根据众包黄牛的特点,利用黄牛邀请真实用户的过程,在技术层面设计了一整套识别、拦截和数据沉淀的流程,通过用户标签->拦截->商品识别->沉淀商品和用户数据-->回溯识别风险用户-->更新标签,形成闭环监控。这个过程帮助我们根据拦截率制定预警,使我们能够实时监控并及时发现抢购情况。后面我们也会用它积累用户黑产品画像、分红产品、黄牛地址等多维数据。在业务层面,我们根据商品类型和销售模式制定了个??性化的限购方案——通过理解商家针对特定商品的限购业务的业务逻辑,抽象出不同类型的限购需求进行利润分成直播间营销,结合汉谟拉比风格。控制引擎,构建累积因子,定制限购风控策略,同时持续与业务交互,实现精细化运营。这类风控方式不需要依赖用户之间的关系,而是利用积累的数据进行垂直截取,与图算法模型相辅相成。付达,小红书安全技术部算法工程师,老皮,小红书安全技术部,数据分析师,史颖,小红书安全技术部,产品经理