京东(金融)白条是大数据应用的一个很好的例子。经过京东6.18的大促,京东白条的人气再次上了一个台阶,人们的关注度也随之提升。比如它和我们的信用卡分期有什么区别,为什么说白条是基于大数据的产品,在面对交易风险时,如何控制等等。带着这些疑问,记者专访京东云平台高级架构师、京东支付研发负责人唐志雄,看他如何从多角度分析大数据的应用和整体风控架构的设计。【受访者简介】京东支付研发负责人唐志雄是一名5岁的京东员工,曾负责京东金融、交易、支付、虚拟资金、结算等核心系统。京东金融成立后,加入金融研发团队。现负责京东消费金融(京东白条)和京东保险的技术研发工作。对电子商务、互联网金融等新兴领域有着丰富的经验和独到的理解。【采访内容】:您一直说白条是基于大数据的产品,能不能多给我们介绍一下?唐志雄:京东白条从一开始就充分利用了大数据的力量。与传统信用卡相比,无需填写繁琐的申请表和各种证明。通过用户的各种行为数据,我们可以评估用户的风险等级。具体来说,主要是用户信用和交易风控两个方面:信用是从千万级用户中识别出优质用户和风险用户,将优质用户引入,拒绝风险用户。利用数据的力量进行挖掘,是一项巨大且持续的投资,也是消费金融避免坏账的最佳防火墙。引入用户后,如何保护用户资产安全,如何识别用户转向低质量用户的趋势,也需要强大的发现能力。如何查明?还需要大数据的充分应用和操作人员经验的积累。我们无法预测业务,但我们可以通过数据找到规律。加速等等。这一切都是数据告诉我们的。:除了京东内部的数据挖掘和分析,京东系统之外的数据是如何采集和存储的?唐志雄:外部数据的采集是对飞京东系统用户需要享受的白条服务的补充。收集方式有很多种,可以购买也可以合作。其实外部数据的含金量要打折扣,需要花一些精力去做数据校验(真实性),数据清洗等。至于存储,是多级存储,最高层必须使用我们的大数据存储中心,通??常在京东云上。清洗检查后,会放到白条自己的数据环境中。:您认为大数据在金融领域的应用会是什么?唐志雄:现在互联网金融很火,互联网公司开始向金融渗透,金融公司开始向互联网发展。大数据的应用可能是未来发展的一个方向。举几个例子:1、在个人征信领域,目前国内除了人民银行征信外,没有其他权威机构,但人民银行的征信仅限于个人征信行为数据。具体的金融机构,不够灵活,阿里就在这个时候跳槽了。出来说要做芝麻信用,京东也要做白条粉。为什么这两家公司要努力?因为电商领域留下了大量用户真实的行为数据。通过这些数据,完全可以分析出用户的职业、家庭情况、消费水平、兴趣爱好等。信用评估更加全面准确。2、在保险领域,比如刚刚开放费率的车险市场,如果对用户驾驶行为有准确的风险评估,可以进一步撬动保险费率差异的杠杆作用。例如,非常优质的用户可以获得保费40折或30折的优惠,而高风险司机可能需要2倍甚至更高的保费。这是为了保护有良好驾驶习惯的用户的利益。其他保险如货运保险也是如此。经常退货的用户与很少退货的用户不同。3、投资领域大的电商企业可以感知市场消费的晴雨表。哪一类产品畅销或滞销的数据也可以间接反映上游企业的发展状况,从而决定是否投资等待哪些企业。类似的场景还有很多。以前,人们可能还在想象中,但现在是各大有实力的数据公司真正挖掘商业价值的时候了。:对于京东白条来说,交易风控是必不可少的。在设计交易风控技术框架的过程中,您遇到过什么困难吗?后续解决方案是什么?未来的挑战是什么?唐志雄:白条是信用产品。我们在交易风控上确实遇到过很多问题,比如规则过于简单,误封率高,系统性能跟不上数据量和规则的增长。然后大家在摸索研究。识别“坏人”的特征是一个不断学习的过程。一开始避免了很多误判,后面就会积累经验,识别率也在不断提高。为了降低这种学习的成本,我们实现了分区隔离。一个风控规则的验证,首先是在隔离区运行(用今天的话来说就是绕过检测),然后就是调试和更新规则的过程。直到***规则包的识别率达到我们的要求,我们才切换到官方环境。该措施最有效地降低了错误阻塞的风险。说到挑战,主要是因为准确识别会增加系统的复杂度,从而降低系统的性能,但是我们也要保证系统性能对用户体验的影响是我们必须要克服的。挑战。:实时风控的规则包是在风险发生前制定并等待用户触发,或者在事件发生后将问题汇总放入规则包。基于大数据分析,规则包是如何计算和执行的?唐志雄:交易规则包只是一种人工干预策略。简单的类比就好比数学中的函数,各种风险的大数据分析是另外一个独立的系统。分析的结果可以直接应用到我们身上。策略就像函数中的各种常量。我上次分享中提到的规则包的改进,主要是从原来的串行计算升级为并行计算,处理性能有了很大的提升。这在规则包数量增加后尤其有效。:在设计白条系统架构时,从用户和商家的角度考虑了哪些问题?唐志雄:用户永远是所有产品的主角。为了提升用户体验,我们在设计系统的时候,始终将用户的问题放在首位。在与用户相关的信用激活、消费和返还支付方面,我们必须在系统组件方面保证系统的稳定性和高性能。用户数据永远不会丢失。一直保持着99%的成功率,就是一个例子。从商家的角度,我们需要打破传统的模式。在传统模式下,信用卡与商家进行促销是非常费时费力的。其中大部分是银行与商家协商后以优惠的形式呈现给用户的。效率低下,形式单一。但是白条不一样。商家可以自行参与各种营销模式,比如哪些产品/服务、什么时候可以享受白条的优惠(N元购买、免息、满减等),费用占比等,都是系统化的.直接控制,用户消费后,成本也被实时查看和浏览,为商家提供了更大的便利,也为拉动销售提供了更大的空间。:京东采用哪种机器学习模型?什么因素决定了这样的选择?唐志雄:京东白条有自己的数据分析和建模团队,大部分都是数学方面的专家。我们主要用到几个模型:随机森林、lasso回归、文本主题模型、贝叶斯网络GBDT等。还有比较传统的,比如聚类算法,逻辑回归等:在未付款或分期付款期间,对于有问题的产品,用户在退换货过程中应该经过哪些环节在技??术实践中?唐志雄:京东白条对于京东商城来说,类似于信用卡银行的角色。商品本身的售后问题由商城自行处理。如有退款,白条有相应的逆向流程,退款金额将自动抵消待处理。本金+手续费,不知各位想问下退款时的利息计算规则?这里有更多细节。总结:“白条”创新的支付方式,让京东在618大促期间在线支付的成功率大幅提升,带来了更多的新用户,增加了用户粘性。同时也给消费者带来更好的购物体验:支付更便捷,也能满足高层次的消费愿望。相信无论是消费者还是电商平台都希望以后“白条”的额度能够增加,有更灵活的额度分配方式。不过,这个愿望可能面临一个非常大的挑战:目前国内消费信息不全,个人信用难以预测。京东对此问题采取了积极的态度。据悉,京东已开始与大数据分析公司ZestFinance合作,计划将这部分用户的网购习惯构建成完整的个人信用体系,让京东白条科技得到进一步完善和发展。
