当前位置: 首页 > 科技观察

你担心的金融安全无监督机器学习技术可以解决

时间:2023-03-16 13:40:16 科技观察

“没有技术,就没有金融”。随着移动互联网时代的到来,科技金融模式不断创新,但欺诈手段也在不断更新换代,呈现出专业化、产业化、隐蔽性等特点。日前,全球科技开发者盛会DeveloperWeek2019评选出了VR、人工智能、金融科技等领域的获奖者。什么是无监督机器学习技术,为什么被认为具有巨大的投资价值?它在科技金融活动中能起到什么作用?它能解决金融交易中的哪些问题?科技金融创新的反欺诈工具有别于传统金融。大部分金融业务在线上进行,审核、申请、贷款等往往在几秒钟内完成,欺诈风险前所未有。据统计,我国网络犯罪造成的损失占GDP的比重为0.63%,每年损失高达4000亿元以上。国际形势不容乐观。多份市场研究报告指出,仅2016年,全球信用卡、借记卡、预付卡和自有品牌支付卡的损失就高达163.1亿美元;每年的保险欺诈(不包括健康保险))总损失预计将超过400亿美元。“随着技术的不断演进,针对金融行业的威胁和诈骗手段与以往不同。团伙犯罪、分工明确、掌握各种先进的技术工具,不断变化的威胁手段,新的挑战使其越来越受到金融公司很难招架。”DataVisor中国区总经理吴忠表示,期待金融反欺诈创新已成为行业共识。“无监督机器学习是近几年才发展起来的一种反欺诈手段,目前国内反欺诈金融服务主要是通过应用黑白名单、有监督学习和无监督机器学习来实现的。”爱信征信总经理金端峰在接受科技日报记者专访时表示。黑白名单被认为是最原始的反欺诈手段,类似于“过滤器”。比如银行征信系统,可以理解为黑白名单。信用卡多次逾期可能会被列入信用“黑名单”。.黑白名单在所有反欺诈手段中相对简单,但更新速度较慢,成本较高。监督学习需要大量标记数据来训练模型预测未标记数据。以垃圾邮件为例,如果将5000封经过人工确认的垃圾邮件输入模型,模型可以通过标题识别、邮件内容分句、关键词识别等多种分析方法,找出它们之间的内在联系。.例如,如果标题中有“福利”字样,则有90%的可能性是垃圾邮件;如果一次发送超过200封邮件,则有60%的可能性是垃圾邮件;如果回复率低于10%,则有70%的可能性是垃圾邮件的可能性...所以,当模型处理一封新邮件时,通过检测上面的子项,将每个子项乘以一个百分比相加,就可以得到垃圾邮件的可能性。但监督学习的缺点是每个模型都需要大量的训练数据和较长的训练时间。“也许你的模型还没有训练好,骗子已经完成了他们的欺诈活动,正在寻找下一个目标。”吴忠说道。无监督机器学习的主要方法是聚类和图分析。金端峰表示,无监督不需要任何训练数据和标签,利用聚类等机器学习算法模型来发现用户的共同行为以及用户与用户之间的关系,从而检测欺诈。“利用无监督机器学习分析用户的普遍行为,我们可以发现经过伪装的异常用户并将其消灭。”什么是聚类方法?比如一组用户注册事件,可以通过聚类找到满足某些共性的几个小群体:注册时间集中,使用某种操作系统,某种浏览器版本等。这个用户群的任何一个个体成员单独分析起来都非常正常,但如果遇到某种异常的一致性,就非常可疑了。比如凌晨2-3点一群人使用同一个浏览器注册同一个产品,前20个IP相同,GPS定位不到1公里,之后改了昵称和性别登记。现在的金融诈骗都是团伙作案。面对“分割成份,批量复制”的作弊方式,金端峰表示,无监督算法应用于反作弊检测还有一个优势,那就是预警。“现在的诈骗者都有一个潜伏期,以免太容易被发现。由于他们在潜伏期的行为仍然符合一定的规则,具有一定的一致性,所以他们还是会被无监督的算法抓到,防患于未然。诈骗者,这是传统方法难以实现的,这也是无监督机器学习在反欺诈检测中大放异彩的重要原因之一。及时向用户发出预警,防范欺诈开户、欺诈交易、账户盗用等行为,保障金融活动的正常进行。金端峰举例说,猛犸反欺诈公司基于无监督异常检测,将数据分解为正常趋势、随机扰动和异常情况三部分,并在此基础上做到“千人千面”;并根据用户之间的相互关系构建网络图,诈骗分子往往群体作案,其行为在网络图中具有高度的一致性和聚合性,与正常用户有明显区别,因此采用聚类和图分析来识别“一些高科技互联网公司,如蚂蚁金服、京东金融等,通过无监督机器学习等技术手段,在金融科技方面也取得了不俗的成绩。”可以具备多种功能,比如通过用户画像精准找到用户,大数据等。数据模型实现精准营销;根据个人投资者的风险承受水平等要求l、收益目标、风格偏好,运用投资组合优化等一系列智能算法和理论模型,为用户提供最终的投资参考,并根据市场动态提供资产配置调整建议;投研需要收集大量数据,进行数据分析、撰写报告等,通过机器自主捕捉相关信息,可以辅助决策,甚至可以自动生成投研报告;利用大数据人工智能技术,利用海量多维数据,塑造高度精细化的风控模型;通过学习积累金融法规,结合金融机构实际情况提供合规建议;机器还可以从海量的交易数据中学习知识和规则,发现异常行为,对洗钱行为进行预警。应用广泛可投资预测无监督机器学习技术的应用正在不断深入和扩展。航天信息是上市公司航天信息股份有限公司的全资子公司,具有突出的大数据采集、分析和应用能力,构建了以税务和企业经营数据为核心的企业征信数据库。金端峰表示,其实很多大公司都有大型数据库来存储用户数据信息。通过无监督机器学习分析用户整体数据,发现用户金融消费习惯、投资偏好等变化,自动发现市场分类,针对不同用户。集团用户推出不同的金融产品。“这样,有针对性地开拓新市场,减少了盲目投资。”此外,根据客户国籍、职业、薪资、经验、行业、信用记录等信息,利用无监督机器学习技术确定客户的信用风险评分,甚至在为客户提供任何服务之前就进行评估,加快放贷速度过程并避免耗时且必要的“尽职调查”过程。“通过使用机器学习,股票预测变得非常简单。”金端峰表示,机器学习算法会利用上市公司的资产负债表、损益表等历史数据进行分析,寻找与公司未来发展相关的有意义的迹象,并做出投资预测。