今年是新修订实施的元年《医疗器械监督管理条例》,企业主体责任更加突出,产品验证确认活动趋向多元化,行业对标准规范的需求更加强烈。在国家政策和监管科研的支持下,国内医疗器械产品获批数量持续增加,影响力不断增强,临床转化推广步伐加快。同时,国外医疗器械法规、监管政策和标准化研究正处于新的活跃期,将对我国开展相关工作带来有益启示。人工智能医疗器械的国际监管日趋严格。目前,人工智能技术作为热门的创新技术,广泛应用于包括医疗器械在内的各个行业。各国对人工智能的监管意识和法律建设都在不断升级。今年4月,欧盟公布了规范人工智能使用的立法框架,并提出了人工智能风险分级管理的概念。其中,人工智能医疗应用被列为高风险级别,这预示着欧盟对人工智能医疗器械的监管将更加严格。这一立法框架符合欧盟于2019年提出的“可信赖的人工智能”伦理理念,从人类与人工智能的关系出发,旨在强调和保障人类的安全、权利和公平。今年1月,美国食品药品监督管理局(FDA)发布了《基于人工智能/机器学习的医疗器械软件行动计划》(以下简称《计划》)。《基于人工智能/机器学习的医疗器械软件变更监管框架》回应了2019年FDA发布《基于人工智能/机器学习的医疗器械软件变更监管框架》后收到的社会反馈。在质量管理方面,《计划》继续在持续软件学习的背景下制定预定义变更控制指南草案,开发良好的机器学习实践以评估和改进机器学习算法。在监管要求方面,该计划提倡以患者为中心的方法,包括设备对用户的透明度,这与欧盟的立法框架有相似之处。在质量评估方面,该计划高度重视算法偏差和鲁棒性的评估,推进真实世界性能监测试点。今年,国际医疗器械监管机构论坛(IMDRF)的人工智能医疗器械工作组组织了多场虚拟会议。各国和地区监管机构代表就基于人工智能/机器学习的医疗器械术语文稿编写进行了详细讨论。其中,欧美国家和地区关注“持续学习”、“算法变革”等关键词,重视良好的机器学习实践在质量管理中的作用,值得关注。从国外发展趋势看,人工智能伦理、全生命周期质量管理理念、产品快速更新要求等因素对人工智能医疗器械标准化影响较大,产品检测思路也在发生转变.诊断软件产品日趋差异化。我国人工智能医疗器械标准化进程正在加速推进。2020年我国首批人工智能医疗器械行业标准《人工智能医疗器械 质量要求与评价 第1部分:术语》和《人工智能医疗器械 质量要求与评价 第2部分:数据集通用要求》已进入报批阶段。《人工智能医疗器械 质量要求与评价 第1部分:术语》旨在为人工智能医疗器械质量评价提供基础通用术语,为后续标准起草提供词典。该标准从基础共性技术、数据集、质量评价指标、质量评价方法、应用场景等方面列出了100多个条目和定义,并以附录的形式给出了部分公式。《人工智能医疗器械 质量要求和评价 第2部分:数据集通用要求》旨在将数据集纳入人工智能医疗器械质量评价体系,明确数据集的评价对象和技术路径。本标准借鉴了医疗器械、信息技术、临床试验等领域的数据质量管理思路,结合人工智能可解释性和可追溯性等需求,提出了描述文件、质量特征和风险数据集的分析文档。等方面的要求,并给出评价方法。同时,中国食品药品检定所(以下简称国检所)联合中华医学会放射学分会、能力建设与继续教育中心联合发布《胸部CT肺结节数据集构建及质量控制专家共识》国家卫生健康委员会为标准的实施提供参考。根据国家食品药品监督管理总局公布的标准制修订计划,2021年,中央检验所作为牵头单位,将重点研究《人工智能医疗器械质量要求与评价第3部分:数据标注通用要求》和《人工智能医疗器械肺部图像辅助分析》《软件算法性能测试方法》两个主题开展了标准项目起草工作。数据标注是影响人工智能医疗器械质量的重要技术服务,直接关系到算法开发和测试所依据的参考标准的准确性和可靠性。目前,行业内数据标注流程差异较大,标注的实施主体、工作流程、质量控制和验收参差不齐,亟待形成标准。《人工智能医疗器械质量要求与评价第3部分:数据标注通用要求》拟在参照国内临床领域专家共识的基础上,明确标注任务的定义、描述、组织等相关内容。人工智能数据标注。考虑了相关的技术工具和平台。该标准草案也是对《人工智能医疗器械 质量要求和评价 第2部分:数据集通用要求》的呼应和补充,将有利于数据集的开发活动。《人工智能医疗器械肺部图像辅助分析软件算法性能测试方法》是中央检察院归口单位标准项目的第一份方法标准草案,拟对人工智能医疗器械软件进行临床等方面的测试。肺结节和肺炎。需求,描述辅助诊断、辅助检测等场景下的常用指标和测试方法。同时,标准草案拟根据近年来人工智能软件测试的发展趋势,考虑人工智能医疗器械软件的一些特殊特性,包括对抗测试和压力测试。2021年3月,中检归口单位召集临床、教育、科研、企业等领域专家,形成了上述两个标准草案的框架。在起草组的配合下,标准草案初稿已经编制完成,并在责任单位内部进行了讨论。下一步,责任单位将结合具体产品开展技术论证工作。同时,中央检察院归口单位于今年年初面向社会开展了2022年度标准项目征集活动,共收到项目建议书20余项。提案内容涉及基本通用要求、临床试验特殊要求、软件开发管理、算法性能等。测试、dataset-specificrequirements等主题。提案部分内容参考了2020年国外发布的技术文献,与国际前沿的接轨程度有所提高,体现了对标准的极高热情来自中国各行各业的研究。为确保提案遴选科学高效,中检院根据医疗器械标准制修订工作规范,于6月底召开线上线下标准研讨会,组织专家组集中单位进行专项研究和表决。标准制定程序处理后续事宜。开展合作促进标准研究在推进国内标准研究的同时,各责任单位也在积极拓展国际合作。2021年3月,国家食品药品监督管理总局、国家标准委批准中检院专家加入国际电工委员会ⅠEC/TC62医用电工技术委员会软件网络和人工智能顾问组,参与IEC创新在医疗器械国际标准研究领域。在顾问组的第一份正式研究报告中,CIQ承担了部分章节的撰写和校对,并对外公布了我国在人工智能医疗器械监管和标准化方面的研究成果,得到了顾问组的认可。中检院主导的IEEE人工智能医疗器械标准也取得重大进展。在近期的工作组会议上,来自中国、美国、德国、荷兰等国家的10余家成员单位对IEEEP2802人工智能医疗器械质量评价术语标准的技术内容进行了审议并达成共识,并将很快将手稿提交给IEEE格式审查,启动外部投票和评论过程。该标准在起草阶段就引起了国际同行的关注,先后被美国国家标准技术研究院(NIST)人工智能标准体系规划、美国FDA机器学习/人工智能行动计划、ANSICTA2089-1标准等文件参考。标准初稿是在巩固我国国内行业共识的基础上形成的,并在国际交流的背景下进行了修订和完善。它的起草和发布有助于加强国内外标准的协调与合作。今年,IEEEP2801数据集质量管理标准草案也有了新版本,起草组即将进行组内技术审查。搭建平台推动标准落地为推动标准应用,提升产品检测服务能力,中检院依托科技部重点攻关项目,正在建设医疗人工智能产品检测平台。发展计划项目,面向科研院所、企业、临床机构、检测机构等开展应用示范。平台采用云集中部署的模式,利用私有数据与公共数据相结合的通道,打通数据集开发与质量控制、数据标注、测试方案定制、算法指标评估、对抗测试等关键环节,形成可定制、标准化的产品检测服务模式,满足上市前检测、临床质量控制、真实世界性能监测、算法更新和再评价等评估需求,支持人工智能全生命周期质量控制产品。在开发阶段,项目组融合了智能检索、智能标注、抗攻击等先进技术,拓展了产品稳健性和临床性能动态评价的评价能力。在项目参与单位的共同努力下,数据存储、人员管理、测试业务应用、测试算法部署、数据中台、测试报告编辑等主要模块基本达到中期设计指标,平台正在联调测试中。内部测试阶段。目前已有来自企业、检测机构、临床机构的10余家用户参与了平台的调试。待测产品涉及肺部影像、眼底彩照、电子病历等数据模态。同时,项目组完成了4个单模态典型模型数据集和2个多模态典型模型数据集,为数据集的社会共资共建模型提供了参考。该平台预计于今年10月正式上线,面向社会征集应用示范单位,提供公益性技术服务,支持标准应用实施和宣传培训。我国人工智能医疗器械标准化工作在理论和实践两方面推进。随着人工智能医疗器械产业的发展和监管科学研究的推进,我国人工智能医疗器械标准化工作将逐步走向自主创新之路,为行业发展和监管提供技术支撑。文|中国食品药品检定所王浩《李嘉格》李景丽来源|中国医药报
