当前位置: 首页 > 科技观察

AlphaFold2立功!清华团队用深度学习增强新冠抗体,创造AI里程碑

时间:2023-03-14 11:56:56 科技观察

2020年底,DeepMind研发的第二代深度学习神经网络AlphaFold2问世,震惊结构生物学界。AlphaFold解决了困扰科学家数十年的蛋白质折叠问题。最近的研究表明,AlphaFold开创的方法正在传播到更广泛的生物界。发表在上的论文,DeeplearningguidedoptimizationofhumanantibodyagainstSARS-CoV-2variantswithbroadneutralization。在论文中,科学家们描述了修改已知COVID-19抗体以提高其针对多种疾病变体的功效的方法。地址:https://www.pnas.org/doi/10.1073/pnas.2122954119科学家写道,“我们可以将sars-cov-2变体(包括Delta)的抗体广度和效力提高10到600倍”。他们甚至发现该方法有望对抗Omicron变体的迹象。深度学习增强新冠抗体这项研究由清华大学、伊利诺伊大学香槟分校和麻省理工学院的研究人员共同完成。他们使用深度学习有两个重要原因。一个是扩大所谓的搜索空间,即修改抗体的潜在解决方案集。现有的方法,例如随机突变,虽然很有价值,但既费时又费力。使用深度学习是一种自动化的方式,从而加快您的工作。其次,像随机突变这样的方法可以在带来好处的同时带走抗体好的部分,结果可能不是最理想的。通过使用深度学习方法,作者希望在保留已经取得的成果的同时扩大效力。GraphEmbeddingAttentionProgramforfindingresiduesImportantforpredictingbindingAffinities对于他们的方法,他们采用了AlphaFold2的基本技术:图形网络和称为注意机制的变量处理方法。图网络是指一些可以根据关系进行评价的事物的集合,比如社交网络中的人。AlphaFold2使用来自蛋白质的信息来构建不同氨基酸之间距离的图表。然后通过注意力机制操纵这些图,计算每个氨基酸与另一个氨基酸的关系。Shan和他的同事采用了相同的方法,将其应用于病毒、抗原和抗体的氨基酸。他们比较了所谓的野生型和两者的突变形式,以确定抗体与抗原的结合如何随着氨基酸对在野生型和突变体之间的变化而变化。为了训练深度神经网络来做到这一点,他们设定了一个目标。在机器学习领域,它被称为目标函数,而这个函数正是神经网络试图复制的东西。在这个例子中,目标函数是自由能的变化,即蛋白质从野生型到突变体的能量变化,用希腊字母delta-delta、G和ΔΔG表示。给定目标自由能,神经网络可以可靠地预测哪组氨基酸配对变化最符合目标自由能变化。为了评估突变对蛋白质复合物的影响,我们首先通过重新包装突变周围的侧链来预测蛋白质复合物的结构,解码野生型和突变复合物,并使用网络获得野生型的嵌入。类型和突变复合体。之后,使用额外的神经网络层和两部分嵌入的比较来预测突变的影响(以ΔΔG测量)。虽然Shan和他的团队提到了AlphaFold2,他们也使用了AlphaFold2使用的方法,但是他们没有使用DeepMind的代码。麻省理工学院的BonnieBerger是该研究的合著者。他说,“对ΔΔG预测因子的研究完全是从零开始的。”因为ΔΔG预测器和AlphaFold2是开源的,大家可以自己去体验一下,看看两者的对比。ΔΔG预测器的代码在GitHub上,AlphaFold2的代码在其自己的网站上。在训练神经网络预测重要的抗体和抗原后,作者发现了抗体在新型冠状病毒的α、β和γ版本中取得成功的证据,并以此为基础开始逆向研究。他们使用这些数据来预测哪些突变抗体会延长疗效。这组作者说,我们的方法生成了一个抗体CDR的计算机突变库,通过训练一个几何中性网络进行分类。这不仅提高了抗体与DeltaRBD的结合,而且还保持了抗体与其他感兴趣变体的RBD的结合。CDR,全称complementaritydeterminingregion,是与抗原或抗体结合的部分。RBD,全称受体结合区,是病毒的重要靶点。研究人员获得了双重、三重甚至四重突变抗体。他们在实验室中针对合成病毒测试了这些抗体。他们发现随着突变的合成,降低抗原浓度的作用越来越强。他们得出结论,有一种物质可以更好地将突变抗体与病毒结合。“具有三个或四个突变的抗体HX001-020、HX001-033和HX001-034也比具有两个突变的HX001-034更强,”他们写道。当涉及到SARS或新冠的野生或变异病毒时,它会增加。”一个发人深省的发现是,变异的抗体可以避免病毒的变异,目的是提高效率。在结构分析中,他们发现原始抗体的一部分和抗原的特定部分相互摩擦,相互排斥。这是因为抗体的R103粒子和抗原的R436粒子都有很长的侧链,并且都带有正电子,这两个粒子之间的亲和力产生了很强的推力,削弱了抗体与抗原的结合度。科学家更换普通抗体颗粒后,无法观察到R346和DeltaRBD的直接作用。这个因素可以解释对Delta变体的中和效果大大提高的原因。作者使用的抗体恰好是Shan和他的同事在去年推出的。这一事实使整个研究更加有趣。这种名为P36-5D2的抗体是从一名感染新冠病毒的康复患者的血清中提取的。Shan和他的团队通过动物模型研究发现,这种抗体是一种适用范围广、有效且具有保护作用的抗体。因此,这项新研究标志着人工智能领域的一个里程碑。即在计算机的帮助下,对传统的生物制品进行改进,从而扩展生物安全实验室治疗传染病的传统方法。AlphaFold足以改变人类?2021年底,蛋白质结构预测人工智能AlphaFold被《科学》评为2021年十大科学突破。人工智能正在催生新的科学研究范式,AIforScience已成为众多科学家的共识。长期以来,蛋白质一直是生命科学工作者研究的重点。因为蛋白质是生命活动的主要载体,可以毫不夸张地说,没有蛋白质就没有生命。其中,蛋白质的结构是很多生命科学工作者研究的热点,毕竟它的主要功能是由它的结构决定的。2020年,AlphaFold2的推出成为生物界的海啸级地震。紧接着,DeepMind开源了AlphaFold2,并且能够预测98.5%的蛋白质结构,让学术界再次沸腾。不仅如此,研究人员还将其做成了一个数据集,并且免费开放。对蛋白质进行系统深入的研究,可以使人类在更深层次上解读生物体的组成和运行,进而全面揭示生命运行和发育的机制,促进生物科学、药物研发、和合成生物学。另一方面,将人工智能方法应用于蛋白质预测,可以让研究人员从中学到很多东西,站在神经网络和深度学习技术巨人的肩膀上,推动生物界的发展和研究。可以说,清华大学打造的“AI+生物学”是当前新冠中和抗体研发的最佳团队。充分利用清华大学科研资源优势,与清华大学医学院、清华大学智能产业研究院(AIR)开展强强联合,聚焦“AI+生物”。清华大学医学院张林奇教授是该研究的领军人物之一。此前,张林奇教授一直致力于挖掘新冠的免疫保护机制,开拓药物和疫苗的研发。据清华大学医学院官网显示,张林奇教授获得博士学位。院长聘请教授,北京协和医学院兼职教授,博士生导师,清华大学艾滋病综合研究中心主任。ProfessorZhangLinqiisthefirstChinesememberoftheAfricanAcademyofSciencesandwaselectedin2016.In2014,alarge-scaleEbolavirusbrokeoutinAfrica.作为国内外传染病研究专家,张林奇教授怀着研究者的初心和使命投身于病毒研究。然而,新冠病毒的肆虐远比我们想象的要猖獗!面对这样的困境,研究人员没有退缩,大胆尝试将计算机科学的前沿成果和研究方法应用到传统的生物学研究中。清华大学智能产业研究院高级客座教授彭健也是该研究的领军人物之一。彭健博士主要研究领域为信息学。他发现了生物化学领域的交叉学科点,在生物信息学、化学信息学和机器学习方面,包括蛋白质结构预测技术(CASP)的关键测试,以及转化医学和药物基因组学的DREAM挑战等,都取得了高调成就。清华AIR引领人工智能赋能生命科学,这是吸引彭健博士加入清华大学智能产业研究院的重要原因。此前,彭健获得了博士学位。人工智能实验室博士后研究,后任伊利诺伊大学香槟分校计算机科学系副教授。彭健说:“复合型人才的培养尤为重要”!这不,加盟不到一年,就已经开花结果。