当前位置: 首页 > 科技观察

人工智能算法解决结构生物学问题

时间:2023-03-12 14:06:19 科技观察

一种新的人工智能算法可以从错误的RNA分子中挑选出正确的三维结构。RNA折叠结构的计算机预测通常很重要也很困难——因为我们知道的结构太少了。确定生物分子的三维结构是现代生物学和医学发现中最具挑战性的问题之一。公司和研究机构经常花费数百万美元来确定一个分子的结构,即使如此巨大的努力也常常面临失败。在计算机科学副教授RonDror的指导下,斯坦福大学博士生StephanEismann和RaphaelTownshend运用巧妙的新型机器学习技术,开发了一种方法来应对这一挑战,即使用计算机预测精确结构。特别是,尽管只学习了少数已知结构,但他们的方法还是成功的,这使其适用于结构难以通过实验确定的分子。他们的研究成果发表于2021年8月27日的《科学》(Science)和2020年12月的《蛋白质》(Proteins)。论文详细介绍了RNA分子和多蛋白复合物。该论文发表在《科学》(Science),是与斯坦福大学生物化学副教授RhijuDas的合作。“结构生物学是对分子形状的研究,它有一个原则:结构决定功能,”Townshend说。研究人员设计了一种可以预测精确分子结构的算法,科学家可以用它来解释不同分子的工作原理。这种方法的应用范围从基础生物学研究到药物设计实践。蛋白质结构水平。由于卷曲的褶皱,蛋白质的结构在空间上非常复杂。“蛋白质是执行多种功能的分子机器。为了执行这些功能,蛋白质倾向于结合在一起,”艾斯曼说。“如果你知道一对与疾病相关的蛋白质,并且你知道它们如何在三个维度上结合,那么你可以尝试影响它们与非常有针对性的药物的相互作用。”Eismann与Townshend和Das实验室的斯坦福博士后学者AndrewWatkins合着了一篇发表在《科学》(Science)的论文,以及与前斯坦福博士生NathanielThomas合着了一篇发表在《蛋白质》(Proteins)的论文。设计算法研究人员没有具体说明使结构预测更准确的因素,而是让算法自行发现这些分子特征。他们这样做是因为他们发现提供这种知识的传统技术会使算法偏向某些特征,从而阻止它发现其他信息特征。“在算法中手动选择特征的问题是算法变得有偏见——偏向于筛选者认为重要的东西。您可能会丢失使研究更全面所需的信息,”Eismann说。.“在没有明确指示的情况下,网络学会了寻找对分子结构形成至关重要的基本概念,”Townshend说,并发现了一些我们以前从未听说过的属性。”在蛋白质研究取得成功后,研究人员接下来将该算法应用于另一类重要的生物分子——RNA。他们在一系列“RNA谜题”上测试了他们的算法,这些谜题来自他们所在领域的长期竞争。在每种情况下,该工具的表现都优于所有其他拼图参与者,而且算法本身并不是专门为RNA结构设计的。更广泛的应用到目前为止,这项研究在蛋白质复合物和RNA分子中取得了成功,研究人员很高兴看到它可以用于其他地方。“机器学习最近的大部分突破都需要大量的数据来训练。我们的方法只用少量的训练数据就成功了——这告诉我们,相关方法可以帮助我们解决数据缺乏领域的未解决问题。”“《蛋白质》(蛋白质)论文的资深作者、《科学》(科学)论文的共同资深作者Dror说。利用人工智能开发的新分子可以应用于药物研发。特别是在结构生物学方面,研究团队表示他们只触及了科学进步的表面。“一旦你掌握了这项基本技巧,你就可以将你的理解提升到另一个层次,然后你就可以开始提出一系列后续问题,”Townshend说。“比如,有了这种信息,你就可以开始设计新的分子和药物,这是每个人都期待的领域。”