当前位置: 首页 > 科技观察

【友萌+】李丹峰:从用户行为数据洞察大数据商业代码

时间:2023-03-11 21:48:22 科技观察

【.com原稿】2016年11月25-26日,由.com主办的WOT2016大数据技术峰会在北京悦财JW万豪酒店召开酒店举行了盛大的庆典。自2012年以来,WOT品牌大会秉承“专注技术,服务技术人”的理念,已成功举办了12届。不仅积累了大量的专家资源,更得到了IT从业者和技术爱好者的认可和好评。成为行业内技术共享和网络发展的重要平台。在WOT2016大数据技术峰会实时计算环节,【友盟+】CDO李丹峰发表演讲《从用户行为数据透视大数据商业密码》。会后,记者采访了他,他介绍了大数据的相关知识。李丹峰,在美国数据分析与挖掘领域工作10余年,包括雅虎、微软、FICO等走在数据应用前沿的公司,积累了丰富的数据挖掘实战经验和机器学习。所涉及的产品在金融、保险、搜索、互联网广告和零售业都有广泛的应用。记者:各位网友大家好,这里是WOT2016大数据峰会现场,坐在我旁边的是【友盟+】CDO李丹峰。李丹峰:大家好,我是李丹峰,在【友盟+】担任CDO。在美国工作生活18年,2014年回国参与中国互联网事业。我在美国的几家公司工作过,有知名的雅虎、微软,也有稍微小一点的美国征信公司FICO和一家咨询公司。我毕业于清华大学。毕业后赴美攻读博士学位。来自伊利诺伊大学香槟分校(UIUC)。记者:您在金融行业有一定的工作经验。您认为大数据在金融行业会有哪些应用?李丹峰:金融行业大数据最重要的一个特点就是“大”。所谓大,就是覆盖率比较大。【友盟+】最大的特点就是覆盖面非常大。我们有很多连接企业的数据显示,【友盟+】的覆盖率在80%到90%以上。基于这些数据,【友盟+】在很多领域进行了探索,包括我们最近在风控领域的一些尝试。【友盟+】数据和风控的相关性表面上看不是特别直接,实际上行为数据是有内在关联的。比如,你是一个什么样的人,并不是由你在特定领域的行为特征决定的。举个简单的例子:在美国,要想骗过银行,前期应该是信用非常好的公民,按时还款,信用就会越来越高。而如果信用评分高到一定程度,就可以大量借钱,然后携款逃亡。在与风险直接相关的行为中做这些事情可以愚弄系统。但行为数据其实收集的是一个人的日常行为,除了间谍,几乎没有人能做到方方面面的伪装。这时候行为数据就有效了,某个人的特征在不经意间已经通过数据了解了。通过将这一特征与其他强相关数据相结合,可以帮助贷款公司做出更好的风险判断。这里所谓的行为大数据,是指自然人的行为,在覆盖面非常大的情况下,能够在风控领域充分发挥作用。记者:用户行为是否属于行业公认的规避金融风控?李丹峰:最近【友盟+】和融360联合建模推出了一款基于互联网用户行为的风控评分产品。大家的接受度还是不错的。在避免个人隐私的情况下,用户可以为每笔贷款签订协议:例如,很多P2P公司要求用户提供淘宝账号,了解一些基础数据,进行模型搭建。用户允许行为数据做出判断的层面风险并不大。至于目前的市场接受度,【友盟+】也拭目以待。基于【友萌+】和融360联合建模的产品,用户也在测试。当然,风控不是立竿见影的效果。我们还得耐心等待一段时间。也许明年这个时候,我们会有更好的判断。记者:数据可能离不开对用户行为的分析。用户行为数据对整个大行业有什么样的价值?李丹峰:【友盟+】在风控领域的探索意义重大、价值连城!行为数据是用户难以伪造的数据,一些不经意的行为很容易体现用户的本质。行为数据最明显的应用是在广告和营销领域。我们也期待在金融领域取得好成绩!我们也希望这些数据在其他场景中也能发挥很大的作用。比如在传统领域,我们帮助传统企业做好客户管理,更好地了解客户。今年我们尝试预测一些用户生命周期和用户流失,【友盟+】会继续在这方面发力。回到原话,【友盟+】拥有国内最大的用户行为数据,【友盟+】有责任挖掘数据的价值,从而应用到业务中,帮助企业更好的进行数据管理,记者:如何才能更好地凸显数据分析的价值和效率?李丹峰:首先要找到应用的风口。仅靠纯分析数据而不进行实际应用是本末倒置。所谓实际应用就是拥有庞大的客户群形成一个产品,而不是以咨询的形式,因为每个客户都会有不同的需求,这不是【友盟+】的目的,【友盟+】希望通过现有数据量形成平台产品,众多用户从产品中获益。这是价值挖掘最核心的东西。记者:下面我们来谈谈数据挖掘。每当提到数据挖掘,就会提到机器学习。两者之间有什么区别吗?李丹峰:我觉得两者没有区别。机器学习、人工智能和数据挖掘的定义略有不同。在实际应用中,每个人使用的方法和系统并没有本质区别。我们的职位叫数据科学家,不管是数据挖掘、机器学习还是人工智能,我们应该都适合。很少有人说你是数据挖掘科学家,你是人工智能科学家,我个人认为这两者没有区别。记者:【友盟+】如何在海量数据中做到精准分析?李丹峰:【友萌+】精准分析分为几个层次,精准度的定义也不一样。比如我经常看财经相关的新闻,但从来不点财经广告。对于广告商来说,我是金融广告方面的专家,没人感兴趣。但是对于一个新闻媒体来说,我对金融类很感兴趣,所以在这两个场景下准确的定义是完全不同的。对于新闻媒体来说,将我定义为对金融感兴趣是非常准确的。做广告就不一样了。我们需要在数据挖掘中区分不同的场景。精度对于数据科学来说,最重要的是准确定义目标。在制作任何模型之前,目标函数是非常重要的一点。在不同的场景下,定义不同的目标,就会使用不同的训练数据来训练这个模型。所以,未来【友盟+】会在这方面做的更加精准。还有一些其他的精确分析,包括:短期行为、长期行为。【有萌+】精确的好处是我们可以使用一些比较靠谱的标注数据。我们可以通过这些非常可靠的数据源,用这些相对可靠的标签数据,包括性别和年龄,来做出更好的模型。知道了。当然,最重要的是:无论是数据还是体量,明确目标和准确的实际意义,做到区别对待。不同的场景有不同的精确定义。记者:【友盟+】除了在精准分析方面与其他平台有些差异外,还有哪些优势?李丹峰:【友盟+】***有三大优势:***点,数据量确实非常大,涵盖了全域数据包括:PC、移动、线下、IoT,截至第三季度【友盟】联盟+]每天采集各类应用场景260亿条线上线下数据,每天可达全球14亿独立活跃设备;服务110万个APP应用;累计服务近600万家大中小型网站。第二个优势是【友盟+】是阿里的全资子公司,拥有强大的技术实力和数据挖掘能力。第三个优势是【友盟+】在数据行业深耕细作,在行业积累上有很强的优势!记者:谢谢李丹峰老师今天给我们带来的采访内容。【原创稿件,合作网站转载请注明原作者和出处为.com】