当前位置: 首页 > 科技观察

阿斯利康利用基于PyTorch的算法发现新药物_0

时间:2023-03-22 15:50:16 科技观察

AstraZeneca使用基于PyTorch的算法来发现新药来推动机器人农业项目,并且这个例子还在继续。现在,制药公司阿斯利康(AstraZeneca)透露了其内部工程师团队如何利用PyTorch,同样重要的是,它可以简化和加速药物发现。阿斯利康的技术将PyTorch与MicrosoftAzure机器学习相结合,梳理大量数据,以获得对药物、疾病、基因、蛋白质或分子之间复杂关系的新见解。这种理解可用于提供算法,这些算法可以反过来推荐一些疾病的药物靶点,供科学家在实验室进行测试。这种方法促进了药物发现等领域的巨大进步,迄今为止,药物发现一直基于昂贵且耗时的试错法。为了开发针对某种疾病的新药,科学家通常会在实验室中测试不同的蛋白质设计和组合,直到找到可行的解决方案,这就是为什么从药物设计到上市可能需要10到15年的时间。另一方面,AstraZeneca的算法可以更快地确定科学家应该寻找疾病的前10个药物靶点。将自动化应用于药物发现特别有用,因为科学家可以访问的数据量每年都在急剧增加。每天分析越来越大的数据库以了解它们如何为药物发现提供信息实际上已成为一项超人的任务。阿斯利康(AstraZeneca)的机器学习工程师GavinEdwards告诉ZDNet:“每年,可供研究人员使用的科学信息和数据的绝对数量都在增长。通过利用PyTorch和Azure等人工智能和机器学习工具,我们能够提取、整合并解释来自多个来源的信息,目的是比我们手动分析这些数据更快地得出更准确的科学结论。”许多可用数据都是非结构化文本,这就是PyTorch发挥作用的地方。Facebook开发的软件包基于Python编程语言,是一个开源机器学习库,对于处理密集型数据科学任务的开发人员特别有用计算机视觉和自然语言处理(NLP)等领域。阿斯利康(AstraZeneca)的NLP团队使用PyTorch来定义和训练生物医学文本挖掘算法,这些算法遍历数据、寻找模式和趋势,并最终确定可用信息的结构。然后输入数据到知识图谱中,智能地连接信息的点点滴滴,以便可以在上下文中研究每个数据点。图的使用就像信息网络一样,不仅反映了每条数据(基因、蛋白质、疾病和化合物)的属性,还反映了不同类别之间的关系。换句话说,知识图谱综合组织了所有可用的科学数据。然后,阿斯利康工程师利用MicrosoftAzure机器学习的计算能力,使用知识图来训练向科学家推荐新药物靶点的算法。“我们将公共领域研究和内部研究结合到一个可以轻松编码复杂信息的图表中,”爱德华兹说。“通过在此基础上使用机器学习,我们可以训练机器学习模型,这些模型可以推荐新的药物靶点并帮助做出管道决策。”对于在实验室中孜孜不倦地试验新药设计的科学家来说,用于药物发现的推荐算法听起来确实可以节省大量时间。但爱德华兹和他的团队也希望他们正在创建的知识图谱能够帮助研究人员找到新的联系,探索新的路径,并在不浪费太多时间的情况下测试未经证实的理论。可以缩小知识图以提供问题某个方面的详细视图,或扩展以提供跨不同研究分支的更广阔视图。因此,研究人员已经轻松访问可以为他们的项目增加更多价值的未开发信息。爱德华兹说:“我们的知识图允许研究人员提出有关基因、疾病、药物和安全信息的关键问题,帮助确定药物靶标并确定其优先级。”而且,作为我们的数据和知识增长,我们的图表将变得庞大,这意味着每个新试验都将从之前学到的知识中受益。”对于Edwards来说,这项技术可以有广泛的应用。随着全球疫情的持续,这无疑是个好消息。原标题:AstraZenecaisusingPyTorch-poweredalgorithmstodiscovernewdrugs,作者:DaphneLeprince-Ringuet