当前位置: 首页 > 科技观察

AlphaFold:首个有望获得诺贝尔奖的人工智能成果

时间:2023-03-14 09:11:42 科技观察

AlphaFold:第一个有望获得诺贝尔奖的人工智能成果,阿德莱德大学计算机科学教授沉春华告诉DeepTech。他表示,AlphaFold之所以受到如此关注,是因为很少有结合机器学习和生物学的成果,能够真正解决重要的实际问题。从DeepMind发表在Nature上的第一版论文来看,使用的机器学习算法都是现有技术,主要涉及卷积神经网络。商汤研究院研究执行主任、致远青年科学家戴纪峰告诉DeepTech,从深度学习的角度来看,AlphaFold2并不是理论上的原创性突破。知识结合起来,然后产生更大的应用突破。其应用前景主要在结构生物学方面,为检测蛋白质三维结构提供了一种新方法。过去主要使用冷冻电子显微镜和X射线衍射,需要大量的人工实验。现在的AlphaFold2可能不会比前两种方法更准确,但会节省大量的金钱和人力。图|AlphaFold预测的新冠病毒ORF8蛋白结构已被实验证实(来源:CASP14)。目前,AlphaFold2的能力得到了李飞飞等权威人士的称赞。在今年的国际蛋白质结构预测竞赛(CASP14)中,AlphaFold2在CASP的一系列测试中获得92.4分,在最具挑战性的自由形式蛋白质测试中获得87分。图|AlphaFold在最具挑战性的免费建模蛋白质测试中获得87分。“计算能力的提升让AlphaFold可以在短时间内测试大量不同的算法。”谈到AlphaFold表现出色的原因之一,加州理工学院博士后研究员陈子博告诉DeepTech。结果确实很厉害,但DeepMind在博客中坦言,AlphaFold预测的结果并不完美。对此,陈子博表示:“我认为还有很多未解决的问题,比如如何从第一性原理预测蛋白质的结构,如何从蛋白质的结构预测其功能,如何设计一个蛋白质的构象变化甚至变构。》图|蓝色是计算预测,绿色是实验结果(来源:deepmind.com)预测蛋白质结构到底有多难?AlphaFold之所以受到追捧,是因为预测蛋白质结构是一个超级科学的问题。前北京协和博士目前从事肿瘤药物研发的医学院教授王晨光告诉DeepTech,30多年前他上大学的时候,老师就提到蛋白质的不可预测性,从确定的一级结构和二级结构到三级结构。半个多世纪以来,学术界一直在探索如何解决这个问题。在20世纪90年代,人们意识到,如果有足够的数据和足够强大的计算能力,这将成为现实用机器来预测蛋白质结构计算机和人类以国际象棋为例随着计算能力的提高,即使是国际象棋冠军也不能打不过电脑。后来,人们认为在围棋中,机器应该无法超越人类,因为围棋有219×19的变化。但没想到仅仅十几年的时间,谷歌的AlphaGo就战胜了围棋世界冠军李世石。AlphaFold也代表了人类在这个方向上的追求,包括如何训练算法来破译蛋白质结构和验证晶体结构。机器掌握了规则之后,才有可能孜孜不倦地工作,这也是取得今天比赛成绩的原因。王晨光表示,之所以引起轰动,是因为生物医药领域这一长期无法攻克的难题终于实现了数量级的突破。该团队只有30到40点的准确度,而这次AlphaFold甚至比人工晶体结构的准确度还要高。对于预测蛋白质结构的难点,陈子博也表示:“主要难点在于这是一个非常复杂的系统,它如何折叠还与它所处的环境有关(例如膜蛋白vs胞内蛋白)。”在AlphaFold出现之前,科学家们只能通过核磁共振、X射线和冷冻电子显微镜来确定蛋白质结构,而且往往需要数年的反复试验才能得出结果。10,000美元的实验设备。正是因为困难,才凸显了预测蛋白质结构的价值,而这项技术看似先进,却离不开医疗。老百姓买药能便宜点吗?谈到AlphaFold对普通大众的意义,陈子博表示,现在很多药物都是针对人体细胞中的某些特定蛋白质。如果将AlphaFold与药物结合,在预测蛋白质与小分子相互作用方面取得突破,将大大加速新药的研发。在研发过程中,同时降低了药品成本。王晨光还表示,此次在生物制药领域取得突破的意义是显而易见的。传统的靶向药物,大部分靶点是蛋白质。以肺癌药物为例,以EGFR蛋白为靶点的药物是近20年来的研发热点。有了AlphaFold,对制药领域肯定有帮助。由于许多药物以蛋白质为靶点,因此有必要在蛋白质结构中找到可以被药物攻击的位置。因此,如果不知道蛋白质结构,药物往往是“蒙在鼓里”。只有知道它的结构,才能根据它的结合面有目的地设计一些化合物。仍以肺癌靶向药物的EGFR为例。在药物的选择压力下,肿瘤往往在一段时间后对一种药物没有反应,后来才发现基因发生了突变。基因突变的后果是表达产物蛋白的氨基酸序列发生了变化。因此,开发另一种靶向突变蛋白的药物成为临床需要。AlphaFold应该能够很容易地预测突变蛋白的结构,这对下一代新药的研发会有很大的帮助。此外,王晨光也非常期待AlphaFold的应用。他说,从事药物研发的人,即使不具备晶体结构等专业知识,也可以使用AlphaFold输入蛋白质名称,然后就可以直观地观察蛋白质结构,减少在药物研发上花费的时间。制药过程。药物发现过程。当药企能够有针对性地设计药物时,药物研发周期就可以相应缩短。这意味着药物可以在药物成分和药效不变的情况下更快地生产出来,普通老百姓能买到的药物可能会更便宜。有望提高研究人员的工作效率。有人说,AlphaFold解放了师生。从此,他们不再受制于结构分析方法,可以快速得到结构,探索结构生物学的核心问题。对于这个说法,陈子博表示,要看具体要解决的问题。结构生物学研究所需的结构一般要求精度高,需要精确到每个残基的精确位置,这是目前AlphaFold所不具备的。.图|残基连接方式预测(来源:DeepMind)王晨光表示,在一定程度上,有了AlphaFold,未来破译静态蛋白质结构会比以前更容易,但并不意味着学生不再需要努力工作。因为,毕竟AlphaFold还不是100%准确的。想了解一个蛋白质结构的同学,在使用AlphaFold预测后,还需要通过其他方式验证。但不管怎样,AlphaFold预测的参数可以对人类破译蛋白质晶体结构有很大帮助。图|AlphaFold对两种蛋白质的结构预测和实验测定的比较不过,王晨光认为,大多数蛋白质的三维结构并不是静止的,而是处于不断的动态变化中。蛋白质作为体内的一种功能分子,受到体内外各种因素的影响,其结构也在发生着变化。而这种变化带来的复杂性对蛋白质解构来说仍然是一个挑战,无论是传统方法还是AlphaFold。尽管AlphaFold目前的应用还存在局限性,但这一技术突破表明这只是时间问题。从计算机算法的角度来看,AlphaFold发布的第一个版本并没有使用太多的新技术,所以即使技术不开源,也肯定需要一两个月才能找到一个博士生来实现算法。不过,AlphaFold的第一版深度学习模型非常重要,因为它决定了相关结构能否还原。事实上,第一版AlphaFold的性能比较一般。虽然获得了CASP13比赛的第一名,但并没有引起轰动。第二个版本改进了很多,其准确性几乎与实验室所做的三维结构的预测结果相同。像谷歌这样的科技公司取得如此强大的生物学成就并不奇怪。AlphaFold背后的公司DeepMind被谷歌收购,至今仍在独立运营。自成立以来,DeepMind在深度学习,尤其是强化学习上投入了大量精力,以解决一些实际问题。再者,谷歌不仅仅是做互联网,它也在做健康和药物创新,因为它要不断寻找下一个增长点,而AlphaFold团队本身就是AlphaGo团队,谷歌也舍得烧钱,所以它可以做到。这种成果越来越难在高校诞生,因为普通高校很难有这么大的计算能力、大数据和大团队。陈子博还表示,与大众的普遍认知相反,大公司往往拥有比科研院所更好的资源,因为大公司可以集中所有力量。学术界很难有一个实验室能像DeepMind这样吸引这么多行业大牛。