当前位置: 首页 > 科技观察

您的生物技术研究有影响力吗?麻省理工学院的机器学习框架可以预测,

时间:2023-03-18 00:00:44 科技观察

比论文被“接受”更让研究人员感到高兴。您的论文发表后的影响力有多大?你的研究领域的未来潜力是什么?……现在,机器学习“突破”了传统的评价标准,将以全新的方式进行解读。目前,有很多基于论文引用的指标,如被引用次数、h-index、期刊影响因子等。这些指标不仅是论文质量的次优指标,而且还会影响后续学术招聘、晋升、资助的次优决策等。这些指标仅提供了不完善、不一致且易于操纵的研究质量衡量标准。随着机器学习的兴起,可以从更多角度判断他们发表的研究的潜在影响基于此,麻省理工学院(MIT)的研究人员建立了一个名为DELPHI(DynamicEarly-warningbyLearningtoPredictHighImpact)的工具,adynamicearlywarningbylearningtopredicthighimpact)人工智能框架可以通过从以前的科学出版物中学习模式,为未来的高影响力技术提供“预警”信号。并解锁大量??现有但未开发的资源。以更有效和公平的方式分配有限的资源,从而增加共同部署到科学的资源和技术的回报。该研究以“Learningonknowledgegraphdynamicsprovidesanearlywarningofimpactiveresearch”为题于5月17日发表在《自然•生物技术》(NatureBiotechnology)。科学事业的有效发展取决于在一群有前途的研究人员和项目之间识别和优化资源分配的集体能力。反过来,这个过程在很大程度上取决于直接采用的分配方法,这些分配方法是通过雇用、晋升和编辑出版物间接发生的。数字科学语料库规模的爆炸式增长促进了新的数据驱动方法的发展。方法的应用,从人工智能到现代科学企业产生的大量数据,可以提供更早或更有意义的新科学影响和创新信号。数据驱动的算法将消化现有的海量高维数字科学信息,产生有意义的低维信号,然后与人类的专业知识和直觉相结合。此外,此类方法可以包含多个目标函数,扩展到一系列期望的结果。先前的研究已经证明了从知识图谱中提取信号的价值。然而,目前还没有将这些方法与人工智能方法相结合的框架,使我们能够从过去中学习,以提高我们识别未来最具影响力的科学技术的能力。本研究提出了一个机器学习框架DELPHI,通过分析科学文献中计算的一系列特征之间的高维关系来预测可能产生高影响的工作。研究人员使用的数据集包含1980-2019年间发表的1,687,850篇研究论文(42种生物技术相关期刊),从中获取每篇论文、作者、期刊和网络相关的数据是在论文发表后1-5年。的29个特征。然后利用每篇论文的特点,训练出一个机器学习模型,让这个模型给出影响力的“预警”信号。从动态知识图收集、构建、计算和学习科学影响预警信号。(来源:论文)研究人员使用DELPHI预测了到2023年将产生巨大影响的50篇最新科学论文。论文涵盖的主题包括:用于癌症治疗的DNA纳米机器人、高能量密度锂氧电池和利用深神经网络。“从本质上讲,我们的算法通过从科学史上学习模式,然后将它们与新出版物进行模式匹配,来发现具有高影响力的早期信号,”Weis说。“通过跟踪思想的早期传播,我们可以预测它们以有意义的方式传播到更广泛的学术界的可能性有多大。”预测潜在影响Weis和Jacobson开发的机器学习算法借鉴了可追溯到80年代的科学知识。出版物大量数字信息呈指数级增长。但是,DELPHI不是使用引用次数等一维指标来判断出版物的影响,而是在期刊文章元数据的完整时间序列网络上进行训练,以揭示其在科学生态系统中的高维分布。.结果是一个知识图谱,其中包含代表论文、作者、机构和其他类型数据的节点之间的连接。这些节点之间复杂连接的强度和类型决定了它们在框架中使用的属性。“这些节点和边缘定义了一个基于时间的图表,DELPHI用来学习预测未来的高影响模式,”Weis解释道。发表5年后处于时间尺度节点中心位置的前5%的论文被认为是DELPHI旨在识别的“高影响力”目标集。前5%的论文占图表总影响的35%。可视化低影响和高影响出版物的共同作者和引用网络结构的比较演变。(来源:论文)DELPHI识别出的高影响力论文数量是引用次数的两倍多,其中包括60%的“隐藏宝石”或未达到引用阈值的论文。研究人员惊讶地发现,在某些情况下,使用DELPHI能够如此早地显示高影响力论文的“警告标志”。“在推出后的一年内,我们已经确定了将在以后产生重大影响的‘隐藏的宝石’,”Weis说。他警告说,“但DELPHI无法完全预测未来。我们正在使用机器学习来提取和量化隐藏在现有数据的维度和动态中的信号。”公平高效过去,论文影响力的衡量标准(如引用次数和期刊影响因子)可以被操纵,研究人员表示,“希望DELPHI能够提供一种更少偏见的方法来评估论文的影响力。”用户应该警惕偏见。我们需要时刻注意数据和模型中的潜在偏差。我们希望DELPHI能够以较少偏见的方式帮助找到最好的研究——因此我们需要注意,我们的模型不能仅基于次优指标(例如h-Index、作者引用计数或机构隶属关系)来预测未来影响”Weis在为生物技术初创公司设立风险投资基金和实验室孵化设施后思考了很多。“我越来越意识到投资者,包括我自己在内,一直在同一个地方,以同样的心态寻找新公司,”他说。被忽视了。我认为必须有一种方法可以在这个领域工作——机器学习可以帮助我们更有效地发现和实现所有这些未开发的潜力。”参考:https://news.mit.edu/2021/using-machine-learning-predict-high-impact-research-0517论文链接:https://www.nature.com/articles/s41587-021-00907-6