当前位置: 首页 > 科技观察

5G的到来将如何影响联邦学习?

时间:2023-03-20 21:25:22 科技观察

随着世界各地的开发团队争先恐后地构建人工智能工具,在边缘设备上训练算法变得越来越普遍。联邦学习是分布式机器学习的一个子集,是一种相对较新的方法,允许企业在不直接访问原始用户数据的情况下改进他们的人工智能工具。联邦学习由谷歌于2017年构想,是一种去中心化学习模型,通过该模型可以在边缘设备上训练算法。关于谷歌的“设备上机器学习”方法,这家搜索巨头将其预测文本算法推送到Android设备,聚合数据,并将新知识的摘要发送回中央服务器。为了保护用户数据的完整性,该数据通过同态加密或差分隐私传递,这是一种向数据添加噪声以掩盖结果的做法。一般来说,通过联合学习,可以在不识别任何个人用户特定数据的情况下训练人工智能算法。事实上,原始数据永远不会离开设备本身。仅发送回聚合模型更新。这些模型更新在传送到中央服务器后会被解密。然后将更新模型的测试版本发送回选定的设备,在重复该过程数千次后,人工智能算法在不损害用户隐私的情况下得到显着改进。该技术有望在医疗保健领域掀起波澜。例如,医疗保健初创公司Owkin目前正在探索联合学习。为了利用来自多个医疗机构的患者数据,Owkin使用联合学习来利用来自不同医院的数据来构建AI算法。这可能具有深远的影响,特别是因为医院能够在保持患者数据完整性和遵守HIPAA法规的同时相互共享疾病进展数据的能力非常宝贵。医疗行业绝不是唯一采用这项技术的行业。自动驾驶汽车公司、智慧城市、无人机和金融科技组织将越来越多地使用联邦学习。其他一些联邦学习初创公司也在上市,包括Snips、S20.ai和Xnor.ai,后者最近被苹果收购。潜在问题中间人攻击这些模型预计将成为黑客的目标,因为这些AI算法值得大量投资。那些邪恶的人会尝试进行中间人攻击。但是,如前所述,通过添加噪声并聚合来自各种设备的数据,然后加密聚合的数据,企业安全措施可能会使黑客难以为继。使模型中毒或许更令人担忧的是使模型本身中毒的攻击。可以想象,黑客可以通过他们自己的设备或接管网络上其他用户的设备来破坏该模型。具有讽刺意味的是,由于联邦学习聚合了来自不同设备的数据并将加密的摘要发送回中央服务器,后门黑客在某种程度上被掩盖了。因此,即使不是不可能,也很难确定异常的位置。带宽和处理限制虽然设备上的机器学习可以在不暴露原始用户数据的情况下有效地训练算法,但它确实需要大量的本地能力和内存。企业试图通过仅在设备空闲、充电或连接到Wi-Fi时在边缘训练他们的AI算法来规避这个问题;然而,这是一个持续的挑战。5G的影响随着5G在全球范围内扩展,边缘设备将不再受带宽和处理速度限制。根据诺基亚最近的一份报告,一个4G基站每平方公里可支持10万台设备。即将到来的5G站点将在同一区域支持多达100万台设备。通过增强的移动宽带和低延迟,5G将提供能源效率,同时促进设备到设备通信(D2D)。事实上,据预测,5G将带来10-100倍的带宽提升和5-10倍的延迟降低。随着5G的普及,我们将体验到更快的网络、更多的端点和更大的攻击面,这可能会吸引大量DDoS攻击。此外,5G具有切片功能,可以根据用户需求轻松创建、修改和删除切片(虚拟网络)。根据一份关于5G破坏力的研究手稿,这种网络切片组件是否会减轻安全问题或引入许多新问题还有待观察。总而言之,从隐私和安全的角度来看,都存在新的担忧;然而,事实仍然是:5G最终将成为联邦学习的福音。