▲人工智能可以从数以百万计的基因变异中快速搜索并确定罕见病的病因,也可以快速阅读和查阅现有的医学文献据统计,全世界有4亿人患有罕见病。这个数字比美国的总人口还要多。此外,根据全球基因组组织的相关数据,80%的罕见病是由基因缺陷引起的,而基因缺陷的准确诊断平均需要4.8年。这是30%患有罕见疾病的儿童活不过五岁的重要原因之一。此外,95%的罕见病都没有FDA批准的治疗方法。这也是一件很无奈的事情。好消息是,近年来兴起的人工智能和机器学习已成为抗击罕见病的重要工具。如今,业内许多公司开发了各种平台,利用人工智能识别罕见病基因变异的根源,提供给医学研究人员和行业专业人士使用。其中一家公司是总部位于以色列的Emdgene。Emdgene搭建了一个平台,不仅可以扫描罕见病患者的DNA数据,还可以使用自然语言处理(NLP)阅读最新的医学文献。这使得该平台能够找到患者基因变异与患者当前状态之间相关性的书面记录,从而加快诊断速度。Emdgene联合创始人兼首席执行官EinatMetzer解释说,如果没有平台,这样做将是一个艰苦且耗时的过程。“每个人的DNA都包含数百万种无害的遗传变异,实验室的遗传学家必须从这么多变异中找出导致疾病的变异,”他说。在大多数情况下,他们通常会手动过滤这数百种遗传变异。此外,他们还必须搜索现有文献,以确保不会遗漏任何新发现的信息或其他证据。”Metzer还表示,Emedgene机器学习算法可以完成上述所有步骤,并自动识别文献和数据库中的致病变异基因和支持证据。遗传学家无需从头开始进行整体分析,只需查看结果即可。另外,Emedgene上个月推出了一种名为Pathorolo的新算法。该算法可以计算解决特定遗传病例的可能性,也可用于重新评估过去未解决的病例——此类病例占所有罕见遗传病例的60%。“实验室通常会定期重新分析过去未解决的案例,希望新发布的信息或新的生物信息学工具可以帮助解决一些案例,”Metzer说。这种方法通常会将解决案例的百分比提高10%。但这个过程由于过去未解决案例的积累和增长而变得复杂,如果没有机器学习的帮助,它是不可持续的。借助Pathorolo算法,我们可以识别出那些过去未解决但今天可能会解决的案例,然后让实验室将时间和精力集中在那些有望解决并可以定期重新分析的案例上。“当然,除了Emdgene,还有很多公司都在用AI来诊断罕见的遗传疾病。比如德国初创公司NostosGenomics。和Emedgene一样,NostosGenomics也在用机器学习来处理患者的基因.可能原因的变异和确定另一个有趣的例子是总部位于美国波士顿的FDNA:今年1月,FDNA在《自然医学》(NatureMedicine)杂志上发表了一篇论文(https://www.nature.com/articles/d41586-019-00027-x),其中详细介绍了一款名为Face2Gene的FDNA构建的智能手机应用程序,该应用程序经过大量图像训练,可以识别患有罕见遗传疾病的人。还有一些更复杂的案例,例如FabricGenomics。FabricGenomics总部位于美国旧金山,专注于利用AI进行各种基因分析,据了解,FabricGenomics拥有部分算法授权给1000多家临床实验室和学术机构使用。其中,部分算法可用于筛查可能由基因变异引起的罕见病,诊断成功率可达50%左右,而业内平均成功率仅为25%至30%。Rady儿童基因组医学研究所的研究人员采用机器学习过程和临床自然语言处理(CNLP),该研究所甚至创造了罕见遗传病诊断的及时记录。具体来说,研究所利用整套系统辅助诊断重症监护病房的婴儿,在20小时内提供了基因组测序,共涉及95名儿童,97种遗传病,准确率达99%。Rady儿童基因组医学研究所总裁兼首席执行官StephenKingsmore博士说:“有些人称之为人工智能,我们称之为增强智能。病人护理自始至终都是医生的事。我们利用技术的力量快速准确地识别遗传病的根本原因,然后将这一关键信息快速传递给ICU医生,以便他们可以专注于为挣扎求生的婴儿提供个性化护理。“这些成功的案例表明,人工智能是治愈罕见病诊断的良方,尤其是对4亿患有罕见病的人来说。目前这些罕见病往往被医院忽视,医院没有足够的资源来应对这些疾病。因此,在该领域引入人工智能和机器学习将使所有人受益。
