当前位置: 首页 > 科技观察

下一阶段的人工智能,为什么要看互联网巨头?

时间:2023-03-13 20:21:44 科技观察

回顾过去十年,人工智能的进步可谓“亮眼”。特别是自2015年“AlphaGo”诞生以来,人工智能行业的发展速度前所未有。归根结底,人类在人工智能领域探索了50多年,最终借助半导体技术和软件技术在机器学习领域找到了突破口。2015年以来,人工智能产业的发展主题一直是拓宽机器学习突破的“路径”。安防监控、证券自动交易、文本翻译等多个领域率先迎来了人工智能的“觉醒”,这与其自身的数据属性有很大关系:安防监控的数据都是图像;证券业本身就是一场数字游戏;人类历史上翻译过无数书籍。但随着时间的推移,人们开始改变事情——在越来越多的应用场景中,数据成为阻碍人工智能发展的最大因素。一是日益复杂的人工智能所需的数据量猛增,二是现实中的数据孤岛和数据隐私问题难以解决。这对于人工智能产业以及急需人工智能帮助升级的各行各业来说,都是无法回避的挑战。智能工业的下一阶段,必须在各种数据制约下找到继续前行的方法。目前,“联邦学习”是目前业界公认的最可靠的解决方案。通过将机器学习与其他数据技术相结合,构建完全由计算机控制的系统,高效挖掘多方数据特征的数据价值。腾讯安全近日发布的联邦学习应用服务(FLAS)是国内“联邦学习”技术在应用领域的最新成果。FLAS通过低成本、快速迭代的联合建模服务,在保护各方隐私的同时,有效释放各方大数据生产力,广泛适用于业务创新的应用场景。数据,当前人工智能发展的“隐脊”在机器学习的道路上,数据一直扮演着非常重要的角色。虽然各种应用场景有很多差异,但有两点是一致的:数据越多越好;数据的维度越多越好。对数据量的需求可以参考AlphaGo。谷歌的DeepMind一共花了两年时间,终于打造出了全面超越人类的最强围棋人工智能AlphaZero。与最早的AlphaGo使用16万人类棋局数据,能够击败入门级职业棋手相比,AlphaZero使用了286亿棋局数据,包括人类和机器生成的棋局数据,两者的区别在于18,000次。数据的维度也很重要。围棋绝对是一个高难度的挑战,但比赛实际上是在一个只有16行16列黑白棋子的半平方米棋盘上进行的。与现实世界的问题相比,围棋过于“简单”,所以在解决现实世界问题的过程中,往往会用到比简单场景大数倍的数据维度。从数据需求来看,人工智能的应用显然应该在某个维度上收集一定数量的数据,然后利用足够的计算能力将它们变成可执行的神经网络。不幸的是,这样的操作是不现实的。在现实世界中,人工智能所需的大部分数据都会以“数据孤岛”的形式分布。行业与行业之间、企业与企业之间,甚至部门与部门之间,都会存在真正的“数据鸿沟”。对于自身数字化业务过程中产生的新资产,各个主体的数据都是宝贵的,更何况还涉及到用户隐私问题。近年来,日益严格的数据监管也带来了巨大的挑战。2018年,欧盟率先制定了新的法律《通用数据保护条例》(GDPR),对企业对用户数据的使用进行了细致而全面的规定。其次是对企业的实际处罚。截至2019年9月24日,欧洲22个数据监管机构共对87起案件作出总计3.7亿欧元的行政处罚。中国也在2017年实施了《中华人民共和国网络安全法》和《中华人民共和国民法总则》,明确网络运营者不得泄露、篡改、销毁其收集的个人信息。同时,新的《个人信息保护法》和《数据安全法》也正在从草案变成法案的实施过程中。这些数据新规的实施,必然会对人工智能数据的收集和使用产生直接影响。现实中的各种情况成就了人工智能技术落地的历程,从最早的核心技术驱动,到解决应用中的实际问题,即如何克服现有的人工智能数据问题。人工智能行业其实早就给出了解决方案——“联邦学习”,即将人工智能基础机器学习的核心能力与一系列数据技术和系统逻辑架构相结合,打造出一套系统化的解决方案。利用额外的计算能力和网络资源实现多方数据价值的聚合,同时实现原始数据不从本地出来,实际应用效果可以接近直接汇总数据的机器学习.联邦学习应用服务助力银行业解决实际问题在实际应用中,金融行业成为联邦学习应用服务的重点落地领域。银行等金融机构长期以来一直面临着数据整合难的问题:作为提供资金交易和各类金融服务的商业机构,不乏数据量。但这些数据大多是用户交易数据,维度相对单一,难以挖掘数据价值。无论是识别信用卡使用异常、风险提示,还是为用户提供针对性营销建议以促进业务发展,其最终服务对象都是真实的人类客户。在现实生活中,后者其实会不断产生各种数据:社交、消费、金融、空间。为了更好地挖掘银行客户的价值,需要将这些不同类型的数据加入到分析中,进而形成对客户的整体理解。跨多个行业,很可能涉及用户隐私风险。这显然是联邦学习发挥其能力的最佳阶段。腾讯安全最新推出的“腾讯安全联邦学习应用服务”,是联邦学习应用领域最新最有潜力的“舞者”。腾讯安全联邦学习应用服务是典型的垂直联邦学习解决方案。这类方案结合多个机构对同一样本的不同观察,进行AI联合建模,最终形成一个针对异构数据机构的集合。如银行、电商等联合建模服务。采用这套应用服务,保证了最终数据提供者用户的隐私,各方数据安全更加可靠,同时,大数据生产力得到充分释放。作为覆盖众多用户应用领域的互联网巨头,以及“联邦学习”的前沿技术特性,腾讯的安全联邦学习应用服务从一开始就具有不同于当前联邦学习项目的特点。首先是“体验”。得益于腾讯众多的产品和服务,腾讯安全20多年来积累了大量的黑灰生产数据库,形成了包含100亿点、1000亿面的黑灰生产知识图谱。安全服务已覆盖中国99%的互联网用户。二是腾讯先进的云计算技术能力。腾讯安全联邦学习整套应用服务可基于公有云或私有云部署。在具体的部署方式上,也支持轻量化、便捷、易扩展、易管理的容器。技术。最后,腾讯的互联网“内功”。在打造联邦学习应用服务的过程中,腾讯充分发挥了腾讯内部的互联网产品和工程能力,在联合建模过程中专门优化了通信和稳定性:通过通信次数的优化和中间结果的压缩,降低了联合建模过程中需要传输的数据量,提高效率;另外,针对网络环境造成的传输中断,特别打造了机型的断点备份功能,即使数据传输中断,也可以中断。单击重新启动而不是再次从头开始。目前,在腾讯安全联邦学习应用服务的实际业务实践中,新联合建模模型的AUC值提升了10%-15%,最大KS值提升了50%左右。已与江苏银行、济宁银行、湖北小金、九福数科、嘉银金科等金融机构达成合作,实现数据价值的双向赋能。互联网巨头,下一阶段人工智能的领跑者?纵观人工智能整体发展趋势,2000年后取得重大突破的机器学习也将作为人工智能的主要“突破口”,而数据也将在人工智能实现的全过程中发挥关键作用.在人工智能的不断落地中,机器学习这把“大锤”的发展开始放缓。在解决了各个行业众多的“小钉子”之后,不可避免地要面对更加棘手的“大钉子”。在短时间内无法快速放大“锤子”的前提下,需要通过多人协作来维持甚至加速人工智能的发展——让多个“锤子”的操作方式一起工作。但是联邦学习毕竟只是一门技术。它需要面对一系列的先决条件。应用方需要具备:基础人工智能技术研究实力、多方联合联邦学习系统工程能力、多方积极参与实际运营、可观的前期投入和失败风险。这些对于普通公司和组织来说不可能的前提条件,对于像腾讯这样的互联网巨头来说就简单多了。就像腾讯的安全联邦学习应用服务一样,腾讯不仅为客户搭建了一条实现联邦学习的路径,还在产品服务中加入了自己有价值的安全黑灰生产库。这种开放、共享、合作的心态和行为,很可能成为未来人工智能发展的重要推动力。