近年来,医疗行业正在经历数字化转型。
这种基于大数据和AI技术的变革几乎改变了整个行业的方方面面,充分体现了“信息就是力量”的座右铭。
人们对人工智能寄予厚望,希望它能够真正深入到临床一线,为医者为患者。
理想是丰满的,现实却是骨感的。
在这场巨变之下,数据作为医疗AI成长不可或缺的“粮食”,却成为医疗AI落地的“绊脚石”——我国医疗健康数据领域长期存在的问题。
“信息孤岛”的问题在于不同地区甚至不同医院的医疗数据不互联,没有统一标准。
与此同时,数据安全问题也带来巨大挑战。
数据问题让医疗AI变成了“空中楼阁”。
面对这一问题,腾讯天衍实验室与微众银行联合开发了医疗联邦学习框架,在保护不同医院数据隐私的同时成功实现了疾病预测模型,破解了医疗行业的数据安全和隐私保护问题。
这是联邦学习在医疗健康大数据领域应用的第一个成功案例,为分诊诊疗、慢病防控、疾病早期筛查等医疗健康各种潜在应用探索新的可能性、实施医疗保险费用控制。
方向。
首创医学联邦学习——打破数据壁垒,保护数据隐私。
在重大疾病的早期筛查和预测领域,如果想要成功建立大数据疾病预测模型,需要整合居民在不同医院的医疗信息和健康档案。
造型。
但由于信息系统不一致、医院管理机构对数据隐私泄露的担忧以及相关数据保护法规的限制,相关机构之间形成了数据壁垒。
很少有医院愿意共享数据,这使得AI很难在疾病预测领域“亮出拳头”。
在此问题下,联邦学习成为一剂“良药”。
联邦学习是一种新兴的人工智能机器学习框架。
其设计目标是保证大数据交换过程中的信息安全,保护终端数据和个人数据的隐私,保证多个参与者或多计算节点之间的合规性。
在点之间进行高效的机器学习。
联邦学习作为一种分布式机器学习范式,可以有效解决数据孤岛问题,让参与者在不共享数据的情况下共同建模,可以从技术上打破数据孤岛,实现AI协作。
该技术最早由Google于2015年提出,随后微众银行在首席人工智能官杨强教授的带领下,首次提出“联邦迁移学习”,并开发了自主研发的联邦学习框架Federated AI Technology Enabler (简称FATE)。
推动联邦学习技术在行业的落地。
此前,联邦学习在金融、互联网、智能零智能等领域已有很多成功的应用案例。
然而在医学领域,由于医学知识的专业性,电子病历的复杂性给联邦学习的建设带来了各种困难。
腾讯天衍实验室结合自身在医疗机器学习和自然语言处理方面的先天优势,联合微众银行将联邦学习与医疗深度融合,将医疗模型与机器学习有机融合,打造基于联邦学习的大数据集中式一体化数据中心学习技术。
开发医疗联邦学习技术的挖掘平台。
天衍-伟中向人工智能顶级会议IJCAI提交了论文。
这项创新技术可以“治愈”医疗行业的数据问题。
联邦学习可以绕过医疗机构之间的信息壁垒,不考虑合并各自的数据。
,但是加密信息是通过协议传输的。
加密过程具有一定的隐私保护机制,保证加密后的信息不会造成数据泄露。
各个医疗机构利用这些加密信息来更新模型参数,从而实现了使用所有患者数据的训练过程,而不暴露原始数据。
例如,假设A医院和B医院想要联合训练一个脑卒中预测模型。
两家医院各有科研案例数据。
另外,B医院还有模型需要预测的标签数据,比如中风发病率标签。
出于数据隐私保护和安全考虑,A医院和B医院不能直接交换数据。
联邦学习系统可以利用基于加密的患者样本对齐技术,在不泄露各自数据的情况下确认A、B两家医院共同的患者,并且不暴露非重叠的患者,从而结合这些用户的特征进行建模。
,在识别出常见的用户群体后,这些数据可以用来训练疾病预测模型。
天衍-伟中向人工智能顶级会议IJCAI提交了论文。
这样,联邦学习技术成功解决了医疗行业的信息孤岛和隐私保护问题,在保护不同医院数据隐私的同时实现了疾病预测模型。
这项技术在疾病预测领域也得到了落地,双方成功构建了“中风风险预测模型”。
成功应用于疾病预测领域,脑卒中预测准确率达到80%。
在建立疾病预测模型的过程中,不同医院的数据缺乏标准化是一个关键问题。
双方首先搭建大数据集中和挖掘平台,构建医疗健康领域的机器学习、深度学习、自然语言理解、文本特征提取、各种关系网络等多种大数据模型,并不断收集区域居民电子病历等数据。
执行多重关联和信息提取。
构建带有时间戳的主要慢性疾病标签(中风、冠心病、肿瘤、慢性阻塞性肺病等)和主要健康医学特征(疾病、药物、检查、症状、手术、费用、家庭关系、行为、生活、环境),为不同医院建立统一的数据标准,形成疾病标签集和特征集。
通过技术力量对疾病预测模型所需的特征进行标准化和归一化后,将标准化的模型部署到不同的医院,以便每个医院都可以根据标准分析自己的疾病、药物、检查、症状、手术等。
。
对数据进行清洗,形成各自标准化的疾病标签集和医学特征集,然后建立巢式病例对照研究队列。
基于联邦学习算法协议,有效训练机器学习模型。
利用就诊记录数最多的TOP5医院的真实就诊数据验证了基于横断面联邦学习的脑卒中预测模型的有效性。
结果表明,基于横向联邦学习的卒中预测模型具有良好的有效性。
联邦学习模型和集中训练模型的性能几乎相同。
卒中预测模型的准确率达到80%,仅比集中训练模型的准确率低1%。
同时,联邦学习技术显着提高了不同医院独立模型的效果。
特别是对于两家脑卒中确诊病例数量较少的医院,联邦学习的准确率分别提高了10%和20%以上。
因此,基于联邦学习的联合模型效果优于任何一家医院的独立建模结果,并且与集中数据训练的模型效果相差不大,为不同医院的联合建模探索了新的方向。
医院。
双方的这一成功合作案例只是医疗联邦学习落地的开始。
除了疾病预测模型之外,双方后续还将就联邦学习在医疗大数据领域的应用进行更多维度的合作,包括医保费用控制、合理诊断、精准医疗等领域。
医疗联邦学习作为基础技术框架,可以挖掘和利用医疗健康数据构建不同的医疗场景应用,比如利用联邦学习帮助电子健康卡实现用户隐私保护建模等,助力医疗健康发展。
健康产业,改善医疗服务。
的质量。