当前位置: 首页 > 科技赋能

BioMap与赛诺菲达成战略合作,共同开发人工智能模型,辅助生物治疗药物研发

时间:2024-05-19 16:41:04 科技赋能

美国加利福尼亚州门洛帕克2020年10月10日,BioMap宣布与赛诺菲赛诺菲达成突破性战略合作。

双方将共同开发基于生命科学人工智能基础模型的领先生物治疗药物发现模型。

“此次合作是基于基础模型的生命科学领域最大规模的合作。

我们很高兴与赛诺菲合作,利用百图生物先进的人工智能引擎来解决与新型蛋白质疗法相关的问题,从而推动药物开发。

”宋乐博士表示。

,百图生物科技首席技术官。

“我们利用公共和私人来源的数据集来构建基本的蛋白质生物图谱来指导我们的计算模型。

同时,通过自动化和集成的工作流程,我们能够实现高质量数据的可持续收集,以推进新药开发“在人工智能领域,传统方法需要大量的标记数据才能做出准确的预测。

然而,生命科学行业的标记数据往往供不应求。

百图生物的研发团队正致力于通过训练大参数模型来彻底改变生物领域的人工智能,该模型使用普遍存在的未标记数据来通知多个下游任务模型。

这种方法可以根据免疫学、神经学、肿瘤学和罕见疾病等领域的有限数据进行更精确的预测。

借助百图生物定制的基础模型和全球领先的人工智能专业知识,以及赛诺菲的专有数据、蛋白质工程创新和深厚的生物药开发经验,双方旨在打造领先的蛋白质大语言模型和人工智能任务模型,使能生物药设计和多参数优化。

“我们可以通过将赛诺菲的专有数据集、数字基础设施、人工智能和数据科学技术以及药物发现专业知识与百图生物的蛋白质大语言模型、高性能计算和对人工智能的理解相结合来做到这一点。

深入理解并优化突破性生物治疗药物的开发流程。

”赛诺菲全球研究平台负责人Matt Truppo表示,“此次合作进一步彰显了赛诺菲成为首家大型人工智能制药公司的初衷和愿景。

”根据协议,百图生物将获得赛诺菲1万美元的预付款现金以及多项近期模型开发付款、研发里程碑付款、销售里程碑付款等回报,交易总金额超过10亿美元。

借助百图生物的生命科学大规模模型的力量,研究人员可以在药物发现和开发过程的各个阶段进行创新,包括靶点发现、分子设计和优化(图片来源:美国商业资讯)菲方合作: 1、问:人工智能将如何加快药物研发进程?答:药物研发是一个漫长、曲折且昂贵的过程。

即使研究人员确定了有前景的研发方向,但在进行临床前或人体试验时,失败率仍然很高。

在生物制药研发中,“逆摩尔定律”意味着需要10亿美元和10年时间才能成功研发出一种新药。

这些成本令人望而生畏,但并非不可避免。

得益于生命科学人工智能基础模型,包括人工智能任务模型或大型语言模型,研究人员可以在药物开发过程的各个阶段进行创新,包括靶点发现、分子设计和优化。

随着底层模型的成熟,它逐渐获得零样本能力,无需专门训练即可准确执行蛋白质预测任务。

我们的模型还可以实现新功能分子的新设计,带来新的可能性和潜力。

从百图生物的角度来看,底层模型的价值在于它们能够从生物数据中理解深层的互连和相关性。

通过利用大量未标记的数据,这些模型可以提取分子之间的内在联系,并从一个分子的属性学习到多个分子的属性,从而提供端到端的设计来覆盖更多新颖的功能并满足更紧迫的治疗需求。

基于此,我们开发了强大、成熟、独特的基础平台,为新的治疗项目和其他临床场景提供了可能。

该平台配备了高水平的计算能力,可应用于复杂的蛋白质相关药物开发问题,显着优于传统的分析技术。

2. 问:这种创新合作如何改变患者的生活?答:我们正在融合和协调我们的共同愿景,利用人工智能为患者提供变革性的、未被发现的治疗方法,以满足医疗需求。

我们将把赛诺菲的专有数据集和药物开发专业知识与百图生物的大型语言模型、高性能计算能力和深度蛋白质数据库相结合,以优化突破性疗法的发现和开发过程。

传统的人工智能方法需要大量的标记数据才能做出准确的预测。

然而,在生命科学领域,此类标记数据往往供不应求。

百图生物目前正在依靠预训练的基础模型来彻底改变生物学和生物制剂研发领域的人工智能,通过训练海量未标记数据为下游任务模型提供信息。

这不仅提供了对蛋白质结构的独特理解,还帮助我们生成这些蛋白质结构的测试序列,在不同的情况下做出相应的反应。

这种方法可以根据免疫学、肿瘤学、炎症和罕见疾病等一系列治疗领域的有限数据进行极其准确的预测,并显着降低成本和上市时间。

此次合作的重点是开发用于生物制剂设计和优化的任务特定模型,加速基于人工智能的药物开发和优化,并结合其特点和优势来解决当前未满足的临床需求并减少患者等待时间。

3. 问:是什么促使了这次合作?答:作为一家创新型全球医疗保健公司,赛诺菲在研究上投入巨资,在多个疾病领域和疗法上积累了丰富的经验和高质量的数据。

这些专属数据集对于人工智能模型的训练和优化极具价值,可以极大弥补当前公开数据的不足,提供大量适合模型应用的训练场景和验证数据。

赛诺菲的专家将与百图生物的人工智能科学家合作,全程指导模型对数据的运用,并融入更多专业知识。

双方共同认识到,凭借人工智能的优越特性,我们可以挖掘利用这些数据的潜在价值,并将其转化为可以直接推动新药研发的工具。

自2017年成立以来,百图生物科技一直致力于构建生命科学领域的xTrimo人工智能模型。

目前,该模型拥有超过1亿个参数,在抗体结构、抗体亲和力、酶功能、免疫细胞功能等20多个下游预测任务中实现了SOTA性能。

赛诺菲选择与我们合作,是因为看中了百图生物在高质量数据挖掘与利用、跨模型数据整合与分析、任务模型开发以及产业效率提升等方面的优势和潜力。

此次合作将赛诺菲的专有数据集、数字基础设施、人工智能和数据科学能力以及药物开发专业知识与百图生物的大语言模型、高性能计算和对人工智能的深刻理解相结合,开发了一系列量身定制的领先人工智能模型共同推动其在药物研发中的应用,加速实现突破性疗法。

4.问:具体合作条款是什么?答:根据协议条款,百图生物将从赛诺菲获得1万美元的预付款现金以及多项近期模型开发付款。

百图生物将获得超过10亿美元的总交易价值,基于包括达到临床前开发、临床开发、监管和商业里程碑的付款。

除了赛诺菲的专有数据、蛋白质工程创新、丰富的生物制剂研发经验以及本次协议的财务方面外,双方还旨在建立先进的人工智能和大语言模型,以提高蛋白质设计能力,进一步突破百图生物平台卓越的学习迭代能力。

5、问:当前中美局势对这一国际合作有何影响?答:对于跨国公司来说,紧密的全球合作伙伴关系对于科学进步极其重要。

通过与赛诺菲的合作,我们能够履行为世界各地的患者提供创新治疗的承诺和使命。

我们相信,双方共同努力,一定能够更好应对全球性挑战,取得突破性进展。

6. 问:您认为人工智能代表生命科学的未来吗?答:人工智能已经对人类健康产生了重大而积极的影响。

在患者护理方面,它通过人工智能驱动的病理学、医学成像和诊??断支持帮助临床医生更快地诊断病情,以协助临床医生进行治疗。

在药物研发方面,利用人工智能解决复杂问题并预测治疗效果,可以显着提高研发工作的价值,节省时间和成本,满足罕见病和个性化医疗的独特需求。

除此之外,人工智能在生物制造中也占有一席之地,在微调高度工程化的化合物和不太稳定的分子方面显示出巨大的潜力。

从这个意义上说,人工智能确实具有端到端的潜力。

但最终,如果没有人类专家,就不可能建立像百图生物这样的生物科学人工智能平台。

为了创建、验证和维护我们的平台系统,我们组建了一支由100多名人工智能和生物科学领域专家组成的团队。

他们都是在各自领域拥有多年甚至数十年经验的专业人士。

他们不仅拥有专业知识,而且对宏观层面的患者健康有创造性的理解,这永远是医学的重要组成部分。

人工智能的目标不是取代研究人员,而是战略性地支持他们减少生命科学和健康领域的投资时间,同时优化突破性疗法的开发流程。

百图生物通过跨模态设计构建了一套基础模型,整合蛋白质单体、复合物和系统的多维生物数据,使分析生命语言成为可能。

我们希望借助基础模型的力量,与更多的行业伙伴一起探索与蛋白质设计相关的复杂生命科学问题,包括大分子药物设计和靶点发现等研究方向。

7. 问:这并不是赛诺菲第一次与人工智能公司建立合作伙伴关系。

您认为百图生物有何不同?此次合作将如何支持赛诺菲的战略?答:赛诺菲一直是人工智能药物发现技术最先行者和最活跃的用户之一,并建立了众多由人工智能驱动的研究合作。

此次合作的独特之处在于百图生物独特的前沿平台,创造性地开发了生命科学领域第一个也是最大的基础蛋白质语言模型。

使用来自数十亿蛋白质序列的数十亿数据点进行训练,为突破性进展和创造性应用的可能性打开了大门。

目前该领域的人工智能提供商已将以任务为中心的模型推向市场。

这些模型为赛诺菲和其他大型制药公司的产品组合提供了巨大的价值。

作为生命科学领域的基础AI模型,百图生物的xTrimo模型是同类中第一个也是最大的模型,使科学家能够从有限的数据中进行深入理解和超级预测,推动蛋白质设计领域的新应用。

该技术与赛诺菲的抗体和纳米抗体研究完美契合,是在许多治疗领域解锁新疗法的关键,包括免疫学、肿瘤学、纤维化以及细胞和基因疗法。

我们很高兴与赛诺菲合作。

作为一家创新型全球医疗保健公司,赛诺菲致力于为全球数十亿人提供尖端药物,解决包括医疗保健在内的一系列重大健康问题。

8. 问:贵公司的技术是如何实施和运营的?答:百图生物的AI药物开发平台将基础大语言模型、超大规模计算与前沿生物技术相结合,通过对蛋白质的深入理解来发现新靶点、设计生物制剂。

公司的核心技术始于我们的AI基础模型,尖端机器学习通过蛋白质序列和单细胞RNA测序数据等“未标记数据”进行训练,以理解和执行分析细胞属性等任务,从而实现“生成人工智能” “允许研究人员生成新的蛋白质序列。

基础模型在生命科学中具有不可估量的潜力和能力,因为它们是构建其他下游“任务”模型的基础,使我们能够更好地利用这些稀有而珍贵的标记数据。

我们使用超过 60 亿个蛋白质序列、10 亿个抗体以及来自超过 1 亿个细胞的单细胞数据来训练我们的模型。

迄今为止,我们已经训练了 20 多个覆盖各个应用领域的 SOTA 任务模型。

从应用角度来看,百图生物可以利用我们的平台实现基于特定条件的蛋白质生产。

在每个设计中,我们使用生成模型生成数百万甚至数千万个候选序列,然后进入我们的多参数优化管道,该管道集成了多个专有的 SOTA 模型以进行多参数预测。

以及目标蛋白筛选,然后通过计算机筛选获得符合设计阈值的候选序列。

然后,这些序列将在我们的高通量湿实验室中进行表达和表征。

由此产生的有价值的实验数据将通过主动学习重新融入到AI模型中,指导进一步的模型优化。

借助我们的技术平台,研究人员可以绕过抗体生产的传统免疫过程,并妥善处理不可成药的靶标及其带来的风险和挑战。

关于 BioMap BioMap 是一家生命科学领域颠覆性的大型人工智能模型公司。

由李彦宏、刘伟于2001年创立,公司致力于将前沿人工智能与生物技术相结合,打造以蛋白质语言为核心的千亿参数基础大规模生命科学模型“xTrimo”平台,它模拟生物进化,解码生命规律,并为生命科学行业的前沿发现问题带来生成能力。

在创新药物设计、靶点发现、酶从头研究、设计等领域取得了一系列突破性成果,从而为人类健康和社会可持续发展做出了贡献。