当前位置: 首页 > 科技观察

基于量子化学计算和机器学习,从头创造肉眼可检测的荧光分子

时间:2023-03-14 19:53:49 科技观察

设计荧光分子需要考虑多个相互关联的分子特性,而不是与分子结构直接相关的特性,例如分子的光吸收。在这项研究中,RIKEN高级智能项目研究中心和东京大学等机构的研究人员合作使用从头分子发生器(DNMG)结合量子化学计算(QC)来开发已知的荧光分子各种学科。引起了广泛关注。使用大规模并行计算(1024个核心,5天),DNMG生成了3643个候选分子。研究人员选择了一个未报告的分子和七个已报告的分子并合成了它们。光致发光光谱测量表明,DNMG能够以75%的准确率(n=6/8)成功设计出荧光分子,并产生了一种未被报道的分子,该分子会发出肉眼可检测到的荧光。该研究题为“Denovocreationofanakedeye–detectablefluorescentmoleculebasedonquantumchemicalcomputationandmachinelearning”,该研究于2022年3月9日发表在《Science Advances》。跨越多个学科,包括有机发光二极管、传感器和生物成像。尽管已经为这些和其他应用开发了许多荧光分子,但仍然需要新分子来解决当前材料在功能、可持续性和低成本方面的缺点。即使是化学结构的微小变化也能带来重大改进。荧光是一种受量子力学支配的光化学性质。然而,尽管荧光研究历史悠久,但没有像制造吸光分子那样制造荧光分子的明确指导方针。分子荧光发射的简化物理化学机制如下图所示。最初,研究人员认为该分子处于单线态(S0);在S0最小值时,它吸收光并跃迁到单线态第一激发态(S1)。S1激发的分子在S1状态下弛豫到最小值并返回到S0状态,将S1和S0状态之间的能量差作为光(荧光)发射。激发分子应在S1状态下移动到最小值,以便在不失活的情况下发光。几个因素,包括与氧分子的反应、分子碰撞、分子内/分子间电子转移和聚集,可以使分子在激发态下运动时失活;这使得很难将荧光与分子结构相关联。因此,自动荧光分子设计会有所帮助。插图:荧光分子单线态基态(S0)和单线态第一激发(S1)态的PES图。(来源:论文)最近,开发了一种基于机器学习(ML)的从头分子生成器(DNMG),用于设计具有简单且可预测值的分子,例如分配系数(logP)的对数,可获得从组件估计。将DNMG与经典模拟相结合,成功地生成了具有更高通用性和实用性的分子。例如,DNMG与对接模拟相结合,可用于设计生物活性分子;这是通过有机合成研究的。结合分子动力学或预测模型,DNMG还可以指导功能聚合物的合成。在之前的一项研究中,研究人员将量子化学计算(QC)与DNMG(称为ChemTS)相结合,这可以(原则上)设计以量子力学(QM)特性为特征的从头功能分子。因此,将ChemTS与QC结合应用于设计可以吸收所需波长光的分子。在86个设计和生成的分子中,选择了6个未包含在训练数据集中的已知分子用于紫外-可见(UV-vis)吸收测量。结果与发生器的目标波长一致。此外,DNMG增加了发现新分子的可能性,因为与传统的高通量QM和使用ML模型的筛选相比,DNMG的搜索区域不受数据集的限制。研究人员还使用QC对ChemTS生成的分子进行了官能团富集分析,以最大化电子增益能量,并发现了驻极体文献中未涵盖的重要官能团。示意图:为B3LYP/3-21G*水平的分子的S1态吸收和荧光生成的OS分布曲线。(来源:论文)虽然相对简单的属性,如光吸收和电子增益能量,可以直接与分子结构相关,但复杂的现象,如仅由特定分子表现出的荧光,则要困难得多。在荧光的情况下,有必要考虑错综复杂地交织在一起的多种特性。这使得很难为分子结构的设计建立直观的指导方针。为了设计实用的化合物,控制目标分子特性的复杂机制必须适当地数字化,以便在DNMG中使用。此外,必须考虑到计算成本随着探索化学空间的机制的复杂性而增加。示意图:使用ChemTS设计的未报告的荧光分子。(来源:论文)在这项研究中,该团队使用大规模并行版本的ChemTS设计了荧光分子。该软件包将使用QC的荧光机制的最低要求数字化。有几个用户友好的软件包可用于基于电子结构理论的分子和材料的质量控制。为了平衡可靠性与计算成本,研究人员使用密度泛函理论(DFT)(29)来评估势能面(PES)。为了解决广泛探索化学空间的计算成本,ChemTS与基于虚拟损失的概念进行了大规模并行化;使用1024个核心,生成了3643个分子。为了验证,他们合成了一种未报道的化合物和几种报道的化合物。六种化合物,包括一种未报告的化合物,如预期的那样发出荧光。一种未报道的分子可以通过偶联具有意想不到特性的市售试剂合成,尽管它由常见的片段[香豆素、吡啶和吡唑并嘧啶]组成。这表明大规模并行DNMG有可能引发分子设计的范式转变。示意图:PC的光诱导过程。(来源:论文)几十年来,QC在化学和材料科学领域发挥着重要作用。在此期间,计算机辅助分子设计已被用于药物发现。然而,QC只侧重于对实验结果的分析和推测;很少考虑创造性工作,例如预测各种现象和设计材料。ML算法最近在化学和材料科学中的应用代表了计算机辅助化学和材料科学的积极转折点。将QC与DNMG相结合对于有机电子分子的自动化设计至关重要,因为在此类应用中不能忽视量子力学。然而,基于QC的DNMG的价值必须先得到证明,然后才能在实践中采用。在这项研究中,研究人员使用DNMG创建了具有目前无法轻易预测的特性的分子:荧光。他们使用DFT(一种固有的量子力学方法)设计了荧光化合物。尽管众所周知分子受量子力学规则支配,但仅使用QC很难从头开始创建新分子。尽管PES简单,但荧光分子很难根据第一性原理进行设计,因为它们的多样性使得很难将荧光与分子结构相关联。插图:PC的光化学特性。(来源:论文)然而,生成器处理了这种多样性并成功地从头开始设计荧光分子。基于QC的海量从头计算需要海量并行计算(1024核,5天);尽管如此,生成器还是成功生成了3643个候选分子。发生器产生吸收长波长光的分子,以类似于专业人士的方式控制分子的共轭长度;然而,它无法找到分子的荧光波长/强度与共轭长度/芳环数量之间的明确相关性。这证明了从头设计荧光分子的难度。根据可合成和可见荧光标准,研究人员选择了七种已知化合物进行验证,并选择了一种候选化合物进行进一步研究。实验验证表明,DNMG成功设计了75%(八分之六)的荧光化合物。PC的荧光(肉眼可见)展示了DNMG的创新潜力。设计PC时,发生器在香豆素中引入了一个不熟悉的基团吡唑并嘧啶;这种联系导致高空间排斥,但仍导致OS增加。普通化学家很难想出办法通过增加碎片之间的空间排斥力来增强荧光及其强度。这表明生成器是一种可以超越专业知识或直觉的工具。DNMG有可能引发分子设计的范式转变。虽然这项工作中合成的分子的荧光被设计成可以被肉眼检测到,但通过消除对原子类型的限制并延长设计时间,将会产生更多有趣的分子。此外,通过包括分子的光诱导动力学可以实现更好的分子设计。通过进一步发展QC,可以设计出更复杂的功能分子。因此,具有大规模并行计算的生成器将能够创建具有多样化和有趣功能的复杂分子,可能导致非常复杂的合成路线,这将增加最近开发的基于ML的规划逆合成路线的要求。开源地址:https://github.com/tsudalab/GaussianRunPackhttps://github.com/tsudalab/FL_ChemTS