当前位置: 首页 > 科技观察

如何使用人工智能创建蛋白质形状语言

时间:2023-03-15 20:39:18 科技观察

马里兰大学的研究人员使用人工智能系统创建了一种基于生物分子(溶菌酶分子)不断运动的抽象语言。这种语言描述了蛋白质分子的多种形状,以及它们如何以及何时从一种形状变为另一种形状,这是了解疾病和开发治疗方法的关键信息。蛋白质分子的功能通常取决于它们的形状和结构,因此了解控制形状和结构的科学可以打开大门,了解从蛋白质如何工作到疾病原因以及设计靶向药物疗法的最佳方法等一切事物。这是机器学习算法首次以这种方式应用于生物分子动力学,该方法的成功提供了有助于推进人工智能(AI)的见解。2020年10月9日,关于这项工作的研究论文发表在期刊《自然通讯》上。“在这里,我们展示了在撰写电子邮件时用于完成句子的AI架构可用于揭示生命,”马里兰大学化学与生物化学系副教授、该论文的资深作者PratyushTiwary说。我们证明了这些分子的运动可以映射到抽象语言中,并且可以使用人工智能技术从生成的抽象词中生成生物学上真实的故事。”生物分子不断运动,在周围环境中发生变化。它们的形状取决于关于它们是如何折叠和扭曲的。它们可能会保持给定的形状几秒钟或几天,然后突然打开并重新折叠成其他形状或结构。从一种形状到另一种形状的过渡非常类似于逐渐展开的缠结物的拉伸线圈。当线圈的不同部分被释放和展开时,分子呈现出不同的中间构象。但是从一种形式到另一种形式的转变发生在皮秒(万亿分之一秒)或更短的时间内,这使得诸如高-倍率显微镜和光谱学准确捕捉展开过程,哪些参数影响展开,哪些影响展开不同的形状是可能的。这些问题的答案构成了Tiwary的新方法可以揭示的生物学故事。Tiwary和他的团队使用牛顿运动定律预测分子内原子的运动,并使用强大的超级计算机(包括马里兰大学的Deepthought2)开发统计物理模型来模拟单个分子的形状、运动和轨迹。然后,他们将这些模型输入机器学习算法,就像Gmail在您键入时自动完成句子一样。该算法将模拟视为一种语言,其中每个分子运动形成一个字母,该字母可以与其他运动串在一起形成单词和句子。通过学习语法和语法规则来确定哪些形状和运动相互遵循,哪些不遵循,该算法可以预测蛋白质在改变形状时如何纠缠以及它们沿途采用的多种形式。为了证明他们的方法有效,该团队将其应用于一种叫做核糖开关的小生物分子,之前已经使用光谱学对其进行了分析。结果揭示了核糖开关在拉伸过程中可能采取的各种形式,与光谱学研究的结果相符。“我希望,这种药物最重要的用途之一是开发高度靶向药物,”Tiwary说。“希望有很强的药物结合力,但仅限于它想要结合的东西。如果我们能够理解给定的目标生物分子可以采用不同的形式,那么我们就可以实现这一目标,因为我们可以制造出只结合这些特定形式之一的药物在正确的时间,只要我们愿意就可以。”重要的部分是关于Tiwary和他的团队使用的语言处理系统的知识,通常称为递归神经网络,在这种特殊情况下是长短期记忆网络。研究人员在网络学习分子运动语言时分析了网络的基础数学。他们发现该网络使用的逻辑类似于统计物理学中称为路径熵的重要概念。理解这一点为将来改进递归神经网络提供了机会。Tiwary说:“很自然地会问是否存在使AI工具成功的主要物理原理。”“事实上,我们发现这是因为人工智能是学习路径熵。它提供了更多的功能,我们可以调整它以更好地实现生物人工智能,甚至可以改进人工智能本身。只要了解一个复杂的系统,比如人工智能不再是一个黑匣子,而是提供了更有效、更可靠地使用它的新方法。工具。”