当前位置: 首页 > 科技观察

双疫将至,机器学习算法如何助力新冠肺炎病毒快速检测

时间:2023-03-18 15:23:54 科技观察

【.com原稿】秋冬将至,流感和新冠肺炎高发季又来了.世界再次面临“双疫”的严峻考验。迄今为止,检测新冠肺炎病毒最好的标准仍然是病原学检测或免疫学检测,也就是我们常说的核酸检测。但由于核酸检测的复杂性,正常的检测过程最快需要24小时才能出结果,准确率只能保证在50%-70%,不是很理想。那么有没有其他的技术或方法可以帮助我们更快速、更准确地检测和区分新冠肺炎病毒呢?事实上,早在2020年,国内相关科研团队就已经在这方面进行了深入研究,并取得了一定的理论成果。研究过程中,科研团队通过更常见、快速的血常规检测、PCT(降钙素原)、CRP(C反应蛋白)等检测获取数据指标,并创新性地尝试利用机器学习算法检测系统病毒分类训练。在实验前期的数据预处理层面,研究人员利用患者的可识别数据建立原始特征库,进行初步筛选。根据具体情况,对初筛后的数据进行异常值和噪声处理,采用独立样本t检验的方法,成功确认了多项新冠肺炎病毒异常指标。然后,在病毒检测算法的评估过程中,研究人员利用数据特征直方图和密集分布图对数据进行分析,并根据结果对数据进行归一化处理,通过Box-Cox变换提高模型的准确率。成功获得准确模型后,针对逻辑回归算法(LR)、线性判别分析(LDA)、分类回归算法(CART)、支持向量机(SVM)、贝叶斯分类器(NB)、K近邻算法(KNN))六种线性和非线性算法,随机森林(RF)、极限随机树算法(ET)、AdaBoost(AB)和随机梯度上升(GBM)四种集成算法,均采用10折交叉验证进行数据分离。当采用不同的算法对数据进行判别分类训练时,根据反馈调整惩罚系数C、径向基函数核和估计量的参数。使用精度比较算法对结果进行比较,以找到可以最佳检测COVID-19的算法。最后,研究人员通过对比评估十种算法的训练精度,发现当惩罚系数C=2.0,径向基函数核为rbf时,支持向量机算法对归一化数据的检测和分类效果最好。准确率为95%。这意味着当满足上述条件时,使用该算法训练检测系统可以使系统对新冠肺炎病毒的检测准确率达到95%。这一结果已经远远超过了传统会计检测50%-70%的准确率。在检测效率上,基于机器学习的快速鉴定方法也完全超越了传统的核酸检测。通过更简单、更快速的血液检测流程,只需几分钟即可通过系统获得准确的检测结果。研究团队表示,该系统的检测应用得到了临床医生的普遍肯定。在受疫情影响的特殊时期,要继续加大研发力度,推动技术不断成熟和完善。虽然在疾病推理覆盖率、用户体验、静态知识库等方面还需要进一步优化和完善,但该系统尚未正式实现广泛普及。但相信在不久的将来,这项基于机器学习算法的创新技术,将成为我们彻底战胜疫情的有力武器。今天,我们正式进入了“算法”时代。各种算法应用于各个领域。如今,在工业信息化、数字化乃至更普及的智能化进程中,算法能发挥多大的作用?有哪些算法应用的成功案例?算法在工业互联网和消费互联网的应用有什么区别?敬请关注2022年WOT全球科技创新大会“算法与AI应用”专题。☆WOT全球科技创新大会2022☆2022/4/9-4/10WOT全球科技创新大会2021是中国科技社区为科技从业者精心打造的WOT2.0升级版。大会议题涉及人工智能、数据安全、音视频、大数据、架构、开源、云原生、前端、研发管理、算法、金融科技、微服务等多个方向。本届WOT大会预计参会人数1500人,合作企业100余家,专家分享60人。大会不仅邀请了腾讯、阿里、百度、58、大搜车等一线互联网公司的技术专家,为大家分享独家技术干货。还特邀多位国内顶尖技术科学家,对国内重点科技创新战略及相关政策进行了详细解读。【原创稿件,合作网站转载请注明原作者和出处为.com】