当前位置: 首页 > 科技观察

AI预测蛋白质结构作为ScienceandNature年度技术突破,潜力无限

时间:2023-03-13 08:17:10 科技观察

如果要给2021年AI领域最具突破奖,你会选谁?《science》和《nature》给出的答案都是“蛋白质结构预测”。今年7月,两大AI蛋白质结构预测算法相继开源,一是DeepMind的AphaFold2,二是华盛顿大学等机构开发的RoseTTAFold。这两个算法现在被《science》命名为2021Breakthrough。众所周知,蛋白质中的长链氨基酸会扭曲、折叠并交织成复杂的三维结构,即使不是不可能,也很难破译。几十年来,科学家们一直希望仅仅根据基因序列预测蛋白质的结构形状,就能开辟一个洞察生命运作方式的新世界,但进展一直很缓慢。直到DeepMind宣布,首次发现了一种通过计算预测蛋白质结构的方法。人工智能可以在原子水平上准确预测蛋白质的结构,即使不知道相似的结构。DeepMind表示,AlphaFold可以周期性地以原子精度预测蛋白质结构,技术上使用多序列比对和深度学习算法设计,结合蛋白质结构的物理和生物学知识来提高预测结果。AlphaFold的突破性研究将帮助研究人员探索导致某些疾病的机制,并为药物设计、农作物增产以及开发降解塑料的“超级酶”铺平道路。AlphaFold的论文于7月发表于《nature》杂志,论文地址:https://www.nature.com/articles/s41586-021-03819-2Alphafold的创始人之一JohnJumper也被命名为《nature》2021年十大科学人物。JohnJumper于2018年在国际蛋白质结构预测大赛(CASP)中首发AlphaFold,2021年AlphaFold2正式开源。JohnJumper带领DeepMind研究团队克服重重困难,使AlphaFold2获得2/3的蛋白质结构预测优秀成绩.同样是蛋白质结构预测研究者的RoseTTAFold,也被《science》选为2021年的突破。RoseTTAFold是华盛顿大学医学院蛋白质设计研究所联合哈佛大学、德克萨斯大学西南医学中心、剑桥大学和劳伦斯伯克利国家实验室开发的基于深度学习的蛋白质预测。工具。RoseTTAFold实现了与AlphaFold2相媲美的超高精度,但速度更快,对计算机处理能力的要求也更低。RoseTTAFold发表于《science》杂志,论文地址:https://www.science.org/doi/abs/10.1126/science.abj8754从结构上看,RoseTTAFold是三轨(three-track)神经网络,这意味着它可以考虑蛋白质序列的模式、氨基酸如何相互作用以及蛋白质可能的三维结构。在这个结构中,一维、二维、三维信息来回流动,让神经网络集中推理蛋白质的化学部分及其折叠结构。令人惊叹的是,十多年前,一些科学家认为蛋白质结构预测的问题永远无法解决,但今天它已成为现实。人工智能带来的最大突破就是把“不可能”变成“可能”。从更广泛的角度来看,不仅仅是蛋白质结构预测的变革,AI在整个科研领域还有很大的潜力可以挖掘,这也是今年AIforScience这个话题备受关注的原因,比如如AI+数学、AI+化学、AI+医学。或许,未来两年AI+科研会有更多的突破,大家可以关注一下。