当前位置: 首页 > 科技观察

5G的到来将如何影响AI联邦学习?

时间:2023-03-14 08:25:29 科技观察

随着开发团队争先恐后地创建人工智能工具,在边缘设备上训练算法变得越来越普遍。联邦学习是分布式机器学习的一个子集,是一种相对较新的方法,允许公司在不明确访问原始用户数据的情况下改进他们的人工智能工具。联邦学习由谷歌于2017年构想,是一种去中心化学习模型,通过该模型在边缘设备上训练算法。关于谷歌的“设备上机器学习”方法,这家搜索巨头将其预测文本算法推送到Android设备,聚合数据,并将新知识的摘要发送回中央服务器。为了保护用户数据的完整性,该数据通过同态加密或差分隐私传递,这是一种向数据添加噪声以掩盖结果的做法。一般来说,通过联合学习,可以在不识别任何个人用户特定数据的情况下训练人工智能算法。事实上,原始数据永远不会离开设备本身,只会发送回聚合的模型更新。这些模型更新在传送到中央服务器后会被解密。然后,将更新模型的测试版本发送回所选设备。在重复这个过程数千次之后,人工智能算法得到了显着改进,而从未损害用户隐私。这项技术有望在医疗领域掀起波澜。例如,医疗创业公司Owkin目前正在探索联邦学习。为了利用来自多个医疗机构的患者数据,Owkin使用联合学习来使用来自不同医院的数据构建c算法。这可能具有深远的影响,特别是因为医院能够在保持患者数据完整性和遵守HIPAA法规的同时相互共享疾病进展数据的能力非常宝贵。医疗保健绝不是唯一采用这项技术的部门;自动驾驶汽车公司、智慧城市、无人机和金融科技组织将越来越多地使用联合学习。其他几家联合学习初创公司也即将出现,包括Snips、S20.ai和Xnor.ai,后者最近被Apple收购。潜在问题中间人攻击鉴于这些AI算法值得大量投资,预计这些模型将成为黑客有利可图的目标。邪恶的黑客可能会尝试进行中间人攻击。但是,如前所述,通过添加噪音并聚合来自各种设备的数据,然后加密这些聚合数据,公司可以让黑客很难这样做。模型中毒或许更令人担忧的是使模型本身中毒的攻击。可以想象,黑客可以通过他们自己的设备或接管网络上其他用户的设备来破坏该模型。具有讽刺意味的是,由于联邦学习聚合了来自不同设备的数据并将加密的摘要发送回中央服务器,后门黑客在某种程度上被掩盖了。因此,即使不是不可能,也很难确定异常的位置。带宽和处理限制虽然设备上的机器学习可以在不暴露原始用户数据的情况下有效地训练算法,但它确实需要大量的本地能力和内存。公司试图通过仅在设备空闲、充电或连接到Wi-Fi时在边缘训练他们的AI算法来规避这个问题;然而,这是一个持续的挑战。5G的影响随着5G在全球范围内扩展,边缘设备将不再受带宽和处理速度限制。根据诺基亚最近的一份报告,4G基站每平方公里可支持10万台设备。而即将推出的5G基站将在同一区域支持多达100万台设备。通过增强的移动宽带和低延迟,5G将提供能源效率,同时促进设备到设备通信(D2D)。事实上,据预测,5G将带来10-100倍的带宽提升和5-10倍的延迟降低。当5G变得更加流行时,我们将体验到更快的网络、更多的端点和更大的攻击面,这可能会吸引DDoS攻击的涌入。5G还有切片功能,可以根据用户需求方便地创建、修改、删除切片(虚拟网络)。根据一项关于5G破坏力的研究,这种网络切片组件是否会减轻安全问题或产生一系列新问题还有待观察。总而言之,从隐私和安全的角度出现了新的担忧;然而,事实仍然是:5G最终将成为联邦学习的福音。