在信用卡、消费贷等金融服务场景中,#消费住#需要识别客户是否存在欺诈行为,是否存在欺诈贷款行为,以及审批情况系统需要根据用户行为判断,给出拒绝、接受、人工审核的结论。在电商促销、权益发放等消费场景中,需要判断用户是羊毛党还是恶意用户。推广系统需要根据用户性质的判断,给出发放或拒绝的结论。在入侵检测、上网行为识别等信息安全场景中,需要判断上网用户是否存在潜在的安全风险,并根据用户行为的判断给出允许或阻断的结论。……以上这些场景都涉及欺诈行为的识别,即判断用户的行为是否合法,并根据判断结果响应用户的请求。本文提出了一种基于图特征和客户标签的欺诈识别架构,如下图所示。欺诈行为识别架构该架构包括用户应用、消息传递、图特征生成、标签特征生成、模型运行、规则判断、业务管理反馈等,涉及Kafka消息队列、知识图谱平台、标签管理平台、机器学习建模平台、决策引擎平台、业务管理系统等平台和系统。用户申请用户通过促销活动、贷款申请、浏览器等入口申请权益、资金或访问指定网站。消息由于上述场景往往涉及到很多用户的集中应用,短时间内有多个应用行为,系统需要实时反馈用户行为,所以用户的应用行为,应用信息,连同信息比如时间、地点、设备一起,通过Kafka消息队列向下传递。图特征生成的架构充分考虑了欺诈行为之间的相关性,即相邻的欺诈行为或用户之间存在内在联系,例如地址和设备。因此,通过知识图谱平台,实时分析相邻应用行为之间的相关性,生成图特征,如IP地址段内的客户数量、相似账户的客户数量等。标签特征生成如果说图特征关注的是应用行为之间的关系,那么标签特征更关注的是申请者的特征及其行为,比如是否黑名单,是否白账号,是否首次访问,等等,这些标签共同表征了用户的行为特征,而这些特征是基于一个通用的实时标签管理平台生成的。机器学习建模在该架构中,图特征和标签特征不直接用于欺诈识别。二是结合这两组特征,采用有监督或无监督的学习方法,构建欺诈客户识别模型。当新的客户特征进来时,运行模型并给出该行为是欺诈的概率。#机械学习#当然也可以根据需要直接使用图特征和标签特征进行判断。规则判断将用户行为的欺诈概率作为规则。当概率高于某个阈值时,则认为是欺诈行为,否则认为不存在,将此规则部署在决策引擎平台上。当一个新的应用行为被机器学习模型判断时,会产生判断概率,再通过决策引擎的规则进行判断。业务反馈通过决策引擎后,业务管理系统会得到申请行为的反馈结果,如通过、拒绝、接受、允许等,并将结果反馈给申请用户。以上介绍了一种基于图特征和标签特征的实时欺诈检测架构,融合了实时计算、知识图谱、客户标签、机器学习建模、决策引擎等AI技术,实现了平台的组合应用企业数据中的组件,作为实际的业务应用和框架应用,具有一定的意义。
