今年,业务创新进入新阶段。
商业创新快速发展的同时,也伴随着火爆趋势背后的认知沉淀和实践积累。
7月10日,由36氪、《零售老板内参》主办的新商业生态峰会在北京举行。
本次峰会以“品质”为主题,希望新商业企业能够看清新时代商业的本质,最终完成新商业的创新升级。
随着产融结合的深入发展,金融尤其是银行业的风险控制越来越受到重视。
在今天举行的“新商业生态峰会”上,智银智能CEO任亮向我们讲述了如何通过AI连接金融行业,如何利用AI发现金融领域的规律。
任亮表示,必须创造性地运用大数据和人工智能,帮助我们更好地恢复整个经济世界,更好地分析经济世界的风险和价值。
以下为任亮演讲全文: 大家好,我是知音智造CEO任亮。
许多人说,知因智这个名号是好的。
知道原因就会带来智慧。
其实我起这个名字的时候,真正的意图是知识基因或者智慧基因。
我认为整个世界是由两类基因组成,一类是推动物种进化的生命基因,另一类是推动人文经济世界发展的知识基因。
我希望通过AI发现知识基因,获得智慧。
我自己从事金融行业,所以我们希望用人工智能来发现金融领域的规则,获取知识基因,搭建行业桥梁。
中美贸易战已经打响,下半年到明年很多企业都会受到影响。
国家还提出了7000亿的定向降准。
这些钱如何流向实体产业、实体经济?我们认为最优的解决方案是当前的问题可以通过产业和金融知识图谱来解决,所以今天我会跟大家分享一下如何通过AI连接金融行业,如何通过知识图谱发现金融行业的规律。
我们先从世界杯说起。
足坛有一种非常流行的战术叫做Tiki-Taka,梅西对这种战术非常得心应手。
它强调队友之间的配合,避免单人作战,依靠队友之间的区域移动创造空档来赢得投篮机会。
我们可以看到,梅西在俱乐部踢球的时候,对手不敢对他进行包夹,因为他身边的队友有很多协同作用。
然而,梅西在国家队的时候,他的战术并不是那么完美,所以他经常陷入被包围、单打独斗的境地,所以我们可以得出一个结论:单点无法战胜网络,球星也无法战胜网络。
系统。
如果打个比方,当我们谈论知识图谱时,它可以说是人工智能领域的网络,因为它本质上是一个语义网络。
网络是通过实体和关系的聚合而建立的。
这个实体是经济世界中的不同对象。
人和企业。
同时它也是一个系统,因为它没有明确的边界,而且它可以整合我们所看到的人工智能领域的各种方法和技术,所以它是非常强大的。
去年有一篇文章叫《为什么知识图谱终于火了》。
经过这么多年的探索,你可能会发现,当人工智能、金融等需要高度专业化知识的领域落地时,知识图谱可能是最好的路径。
我们先来看看整个智能技术发展的四个阶段。
早期是专家系统,由人来判断,然后是BI商业智能,最后是感知智能。
今天我们讲的是大数据,人脸识别、图像、语音、文本等数据进入我们的模型,帮助金融机构做出判断。
接下来是认知智能,它是人工智能建立的众多标签肖像。
它识别个人和公司以判断其信用度。
但我觉得更重要的是现在一切都是互联的,人是互联的,经济也是互联的。
因此,在一个互联的世界里,我们需要通过关系来分析这个个体。
我们不能仅仅用个人或者公司自己的数据去分析它,而是要把它还原到网络上,用网络的眼睛还原个体,所以知识图谱就成为了一项核心技术。
今天我们来说说产业金融知识图谱。
核心点是建立工业世界的关系体系。
那么这个世界的核心实体是什么?就是企业。
围绕企业,企业与消费者,以及企业与员工建立。
企业之间的关系,如投资链、担保链、贸易链、供应链,企业通过这些关系建立与下游、行业、区域的关系。
这三个层次的关系的结合称为产业。
大数据是用来描述这个行业的实体及其联系类型的,而机器学习是用来细化这些实体和关系之间的模式和规则的,所以我们把这三者整合在一起,称之为行业和金融知识图谱。
我们举几个例子来看看产业金融知识图谱的表现形式。
其实是我们日常生活中最容易理解的,比如客户、控制关系、担保关系、资金关系等,这些就是我们在股权中所用到的具体表现形式包括上游、中游、下游原材料商,供应链中的批发商和制造商。
这些不同的实体有不同的经济交易。
这是一种关系。
这是知识图谱的典型例子。
更大的范围是产业链。
一个产业会通过其上下游相互建立经济依赖关系。
无论是新能源汽车还是房地产,它的原材料,上下游,我们收集数据,构建一个网络。
在金融行业,无论你分析to C还是to B,都是行业中的一个环节,一个实体。
现在困难之一是小微企业。
小微企业的收购成本非常高,风险也非常高。
我们应该做什么?我们把小微企业聚集成一个商圈、一个专业市场。
这样的话,就会更容易获得一些数据。
,这些方法都是方便我们把原来孤立的个体放到网络中,更好的进行分析。
例如,在抵押品估价中,房产本身的价格是波动的,而价格变化是由很多因素决定的,比如周边人口、经济变化、城市发展战略等,因此,可以利用这些因素来预测其住房价格。
房价的变化会影响我们金融中抵押品价值的波动。
这会影响客户的信用和用户群体的价值。
从整个链条上我们可以看到,经济世界是相互联系的。
我们的大数据和人工智能正在试图建立这样一个网络,帮助我们更好地恢复整个经济世界并分析它的风险和价值。
在产业金融知识图谱的框架内,我们要创造性地利用AI技术来帮助我们真正理解它们的规律。
我们简单总结一下这些技术,它们实际上涵盖了构建产业金融图谱的整个过程,包括大规模数据和AI算法。
比如我们需要领域知识的输入,因为我们做金融,金融必须有很多领域知识。
当我们评判一个公司或者个人的时候,我们需要一个体系来评判。
这些是领域知识图谱。
通过图计算,各种相关算法总结了各自在网络中的特点。
地图构建完成后,需要大数据来填充它们之间的关系以进行量化。
除了我们最容易理解的结构化数据和BI技术之外,现在更重要的是整合非结构化数据。
有几个嘉宾谈到图像识别,这是非结构化数据和大量文本的通道。
特别是,知音智能专注于语义识别和文本识别,将非结构化数据结构化并输入到模型中。
量化后我们做出预测。
过去,我们一直在使用概率和统计模型,但现在在这些条件下仅使用概率是不够的。
我们需要做大规模的推理、量化和预测,然后应用到金融场景中,细化金融事件,确定风险特征。
发现,做传导等等。
接下来我们看看金融场景在刚才提到的系统下是如何体现的?其实我们最早的财务评估就是记分卡,它对应的是我们的专家系统。
后来引入了西方巴塞尔协议作为内部评级方法,这就是我们的BI商业系统。
现在模型是通过万物互联和知识图谱得到的,对应的是认知时代,所以金融和人工智能高度相关。
在整个发展过程中,我们在金融方面实际上一直在向西方学习,同时又落后于西方。
但从产业知识图谱来看,中国走在了前列。
为什么?因为我们有自己的实际问题,也有我们自己的独特条件,所以我们面临的真正问题是中国的企业关系网络高度复杂,风险频发。
比如十年前的德隆集团风险事件,造成连锁风险蔓延,所以这就是我们面临的。
问题。
另外,我们在中国的数据比较集中,因为我们有强大的政府和监管,政府收集了大量的跨领域数据,这为我们建立模型创造了条件。
事实上,早在十年前,即2008年,我们就已经通过监管的领导和推动,从事相关领域的研发和推广。
我当时非常有幸参与了整个过程。
从风险群体事件发现到2009年,我们将这一系统和模式推广到商业银行机构,开始实践商业化。
我们在学术界首次提出了一套基于关系网络和行为视角的系统和模型。
模型方法,不再局限于传统的基于财务报表和评估的方法来预测风险。
多年后,我自己也一直在中科院从事相关算法的研究。
后来去了IBM探索金融大数据。
直到我正式创立智银智能,我们数据行业的成熟和我们金融客户需求的爆发也推动了我们做了很多标杆性的金融事件。
这些事件代表了我们产业金融知识图谱的方向。
它能解决的问题确实可以摆脱传统限制,在风险管理和精准商机发现方面取得更好的效果。
。
接下来我们看看工业金融知识图谱在金融场景中如何应用。
在这个系统下,底层是3K平台,KW、KE、KG,它们是知识图谱的三个核心组件。
KE解决知识的演化过程,是一个包含AI算法的建模平台; KG是一个知识可视化平台; KW是核心知识仓储。
我们一直在收集大数据,但是如何将这些数据转化为我们场景所需要的呢?核心系统称为知识仓库。
举个例子,有实体库、关系库、标签库、事件库、语料库等。
我们以前在识别一个人或者一个公司的时候,需要分析它的ID,但是如果没有ID怎么办? ?如何判断是同一家公司?比如IBM,IBM是缩写,每年裁员都是风险事件,而我们银行记录的是国商科技有限公司,这是全称。
如果这两个词不匹配,则它们不能包含在模型变量中。
实体库解决了这个问题。
我们把很多这样的内容打包在一起,称之为知识仓库。
通过这些支持建立客户谱系,我们把原来孤立的个体变成一个网络,包括行业谱系、客户谱系及其肖像和事件。
事实证明,我们是由客户经理来识别风险舆情的。
现在我们用机器来了解舆情,并将舆情纳入风险变量。
我们把整个系统称为AI盒子。
通过AI盒子我们整合这些任务,赋能它可以提供企业金融、小微金融、风险管理、大资管、大零售等具体场景。
接下来我们通过组件来了解一下整个行业和金融知识图谱的实现流程。
例如,谱系是图中的核心组成部分。
通过它,我们可以描述它的股权关系和产业关系。
这样,我们就可以完成个体恢复网络的第一步了。
接下来我们必须计算它们的传导及其影响。
当这个网络中的某一点出现问题时,会对相关点和其他点产生什么影响?然后我们必须收集金融事件。
,而要量化事件,我们必须测量传导路径,这就是我们的作用。
谱系+事件 这是我们整个K+盒子的核心内容。
举个例子,股份制银行可以通过地图为企业客户建立商机,并准确地发现、获取和沟通商机的风险。
那么通过小微金融,获取的原始数据可能只是一些碎片化的数据。
通过小微个体户行为的谱系和数据融合,建立完整的在线评价体系。
再比如,我们正在为一家电商金融公司做供应链预测。
我们准确地预测了供应链中供应商未来增长的变化及其未来的增长。
我们还需要建立一个知识图谱,将供应商与其产品和消费者群体联系起来。
消费群体和产品结构的变化,必将影响供应商及其未来的销售。
对于风险管理,我们过去常常收集数据并根据每个人做出预测。
现在我们构建他存在的网络。
当网络中的某个节点发生风险时,我们计算其影响范围。
这里的核心在于我们对连接权重参数的训练。
所以当整个供应链、产业链建立起来之后,我们就知道上游的风险会对下游产生什么样的扩散和影响。
包括资产管理在内的PE和VC产业链,通过专门实体的建设,我们可以识别出一批发展非常快、也非常活跃的PE公司,从而为金融机构提供联动或者定制化的金融产品。
整个系统包含了一些核心技术,你可以在这里列出来。
刚才提到的场景已经得到中国一些基准金融机构的验证,包括国有银行、股份制银行、金控、公募基金等。
最后但并非最不重要的一点是,我们已经将刚才提到的内容变成了集成的 K-BOX。
这个BOX将我们的算法、数据和云计算集成到知识图谱中,交付给金融机构并为他们赋能。
为其解决行业痛点和问题。