当前位置: 首页 > 科技观察

阿里发布新一代安全架构核心技术“AI安全诊断大师”

时间:2023-03-19 14:33:43 科技观察

就像有些人天生免疫缺陷一样,AI也是天生免疫缺陷。例如,车辆的辅助驾驶和自动驾驶系统会因为算法技术缺陷而失去识别交通标志的能力,成为一辆“没有视觉系统”的汽车,从而在遇到较大障碍物时给出错误的决策,“看不见”停车标志,继续前进。AI模型对微小的干扰非常敏感,一些细微的、看不见的变化就会导致算法出现巨大的错误,往往会带来可怕的安全威胁。基于从源头构建安全免疫力的新一代安全架构理念,近日,阿里安全发布核心技术“AI安全诊断大师”,可对AI模型进行全面体检,“见adoctorandprescrible”,这样人工智能模型就诞生了内置增强的安全威胁免疫力。《AI安全诊断大师》包含AI模型安全评估与防御工具箱。通过对多个云端算法接口进行安全测试,在实际生产中可以过滤出一组恶意攻击,一种降低安全风险的人工智能防火墙系统。据阿里安全图灵实验室高级算法专家唐华介绍,“AI安全诊断大师”提供全方位的体检和诊断处方服务。DefenseBoost提供细粒度的“健康”指导。值得注意的是,这个“安全诊断”是可见的。《AI安全诊断大师》提供可视化界面,以模型损失面分析图呈现被评估AI模型的输入扰动和响应性能。可以直观的看到AI模型的整体安全性能。表面越光滑,AI就会遇到攻击,抵抗攻击的能力更强。“AI安全诊断大师”的可视化诊断结果界面不仅提供了整体安全性能评估的“体检报告”,“AI安全诊断大师”还可以通过指定评估数据集,并提供不同攻击算法下更详细的安全指标。它可以提供即插即用的安全功能。对于那些不方便“面诊”的“患者”,比如只能提供API接口的AI服务,“AI安诊大师”提供“云体检”服务,只需调用接口即可评估人工智能的安全。《AI安全诊断大师》针对遭遇攻击的多个算法API发布体检报告。“以多种攻击检测和对抗防御方式作为附加模块,为AI模型部署前置服务,在不修改原有模型的情况下,提升模型对样本攻击的防御性能,降低用户成本和风险。”经过对色情、暴恐、敏感图像识别等多种内容安全服务的测试,‘AI安全诊断大师’整体提升模型对外部攻击的有效防御能力达40%以上。”华棠说道。不久前,阿里安全发布了一款高效构建AI深度模型的“AI训练助手”,让AI训练模型在面对新场景时无需从头学习,直接从已有模型迁移,快速获取他人模型知识,能力成为全新的AI模型,将模型构建周期从一个月缩短到一天。在阿里新一代安全架构的引领下,阿里安全图灵实验室不断致力于打磨提升AI效率和保障AI安全的技术和产品,推动AI安全相关技术在实际场景中更好的应用。中国科学院计算技术研究所副研究员王树辉评论道:“阿里巴巴安全从整体层面考虑了人工智能安全的结构性漏洞,提出了‘安全基础设施’的概念和技术体系。在关键技术层面,融合最新的AI攻防技术,技术充分考虑人工智能安全攻防的应用需求,分析结果可解释性强,通俗易懂,指导实践。一套实用、即插即用的解决方案,定制化防御升级方案,帮助AI技术从业者有效提升算法系统的免疫力和安全等级,此外,阿里安全新一代安全架构的应用成果有:也有望推动AI技术的发展与进步,公关为新一代人工智能提供理论和方法研究的支撑。”目前,阿里安全正在联合相关部门、企业、高校参与人工智能安全标准的制定。《人工智能安全标准化白皮书(2019版)》由技术委员会创建。