可以解决范围广泛的复杂问题,ImageNet等大型数据集的激增,引发了对许多不同深度学习方法的深入探索。这篇综述论文重点关注机器学习和实验设计的融合,以及它如何通过加速数据处理、实时决策来解决关键科学问题。在过去的几年中,机器学习的许多进步都源于异构计算硬件的使用,尤其是图形处理单元(GPU)使大规模机器学习算法得以快速发展。用大数据集训练的人工智能模型已经能够执行复杂的任务。与此同时,减少计算量以实现快速高效训练的新型深度学习算法也开始越来越多地出现。强大的机器学习技术与实验设计的结合可以缩短科学发现的时间。从嵌入实时特征到跨分布式网络,计算数据中心的大规模机器学习在许多不同的科学应用实验中取得了巨大的飞跃。然而,高效的解决方案仍然需要领域专家、机器学习研究人员和计算机架构师之间的协作。随着机器学习工具变得越来越复杂,如何构建大型模型来解决复杂问题成为新的焦点,例如语言翻译和语音识别,它们的出现使得科学应用广泛受益于快速发展。这些应用现在已经多样化,因为人们必须意识到如何调整他们的科学方法以更好地利用人工智能的优势,包括人工智能实时对事件进行分类的能力,例如识别粒子碰撞或引力波合并;包括系统控制,例如来自等离子体和粒子加速器的反馈机制的响应控制。在所有这些情况下,机器学习都是由设计目标驱动的。考虑到文章的篇幅,我们将从三个部分呈现整个评论报告,第一,机器学习如何探索广泛的科学问题;其次,机器学习作为一种颠覆性技术,如何快速改变我们处理数据的方法、一般数据表示和实验程序的方式。第三,机器学习从算法设计到系统架构硬件的整体设计。1.机器学习应用:从基础物理学、医学工程到边缘计算随着科学生态系统的快速增长,数据处理和新范式需要融入系统设计层面来完成。通过对复杂数据处理过程的研究,作者发现实现机器学习在不同领域和架构之间可能有很大差异,但仍然具有相似的底层数据表示和集成机器学习需求。报告引用了大量科学领域的应用案例,涵盖现有技术和未来需求。接下来,我们将重点介绍机器学习在物理学、生物医学工程以及无线网络和边缘计算方面的应用现状和挑战。基础物理引力波,正如爱因斯坦在1916年所预测的那样,在广义相对论中表现为时空尺度的变化,并以光速在时空结构中传播。例如,美国的激光干涉引力波天文台(LIGO)、欧洲的“处女座”(Virgo)引力波探测器、日本的神冈引力波探测器(KAGRA)都使用公里级网络用于探测引力波的激光干涉仪。引力波为基础物理研究提供了独特的方法,包括在强场中检验广义相对论、引力波的传播速度和极化、核密度下的物质状态、黑洞的形成、量子引力效应等,它它以一种与电磁和中微子天文学相辅相成的方式,打开了一扇观察宇宙的新窗口。在未来的观测中,LIGO、Virgo和KAGRA将检测到越来越多的备份引力波,但这对当前的检测框架提出了计算挑战,该检测框架依赖匹配滤波技术,需要参数化波形(模板)与引力波匹配波时间序列数据。随着仪器低频灵敏度的提高,引力波搜索参数空间向自旋效应和低质量致密天体扩展,匹配滤波器尺度会变差。到目前为止,为了估计引力波的物理特性,已经使用了随机贝叶斯后验采样器(例如马尔可夫链蒙特卡罗和嵌套采样)。这些分析方法可能需要数小时到数天才能完成,在搜索和参数估计方面不可避免地会出现延迟,这可能会阻碍对双星、超新星和其他未知系统等时间敏感源的电磁跟踪。此外,引力波的瞬态观测也容易受到环境和仪器噪声的影响。瞬态噪声伪影可能被误认为潜在来源,尤其是当引力波瞬态具有未知形态时(例如超新星、中子星故障)。仪器噪声谱中的线噪声会影响对连续引力波(例如旋转的中子星)和随机引力波(例如来自致密双星系统的引力波的未解决的天体物理背景)的搜索。这些噪声源很难建模,目前的降噪技术不足以去除更复杂的噪声源,例如线路噪声和非平稳噪声源。近年来,机器学习算法已经在引力波物理的不同领域进行了探索。卷积神经网络已被应用于检测和分类来自二元结的引力波、来自超新星核心坍缩的爆发引力波和连续引力波;来自递归神经网络(RNN)的自动编码器使用无监督策略检测引力波;FPGA递归神经网络具有低延迟引力波检测的潜力。此外,用于引力波参数估计后验采样的概率生成机器学习模型在模拟数据上实现了与贝叶斯采样器相当的性能,大大缩短了完成时间。机器学习算法也被用于提高引力波数据的质量并减少噪音。可以通过时频和恒定Q变换或检查LIGO的辅助通道来识别和分类瞬态噪声伪影。尽管机器学习算法在引力波数据分析中显示出巨大潜力,但其中许多仍处于概念验证阶段,尚未成功应用于实时分析。目前需要努力为低延迟分析创建计算基础设施,提高训练数据的质量(例如,扩展参数空间,使用更逼真的噪声模型),并更好地量化这些算法在更长数据范围内的性能。表现。生物医学工程由于高分辨率和高通量生物医学设备的进步,我们看到了生物医学数据的爆炸式增长,例如生物医学图像、基因组序列和蛋白质结构。各种机器学习算法已广泛应用于医疗场景。例如,人工智能增强现实显微镜可以自动分析细胞图像并实时表征细胞。用于预测荧光标记、无标记稀有细胞分类、形态学表征和RNA测序的计算机机器学习。对于原位细胞分选、实时治疗反应预测和增强现实显微镜辅助诊断,深度学习模型的数据结构也可以大大提高速度和效率。现阶段,机器学习临床应用面临的主要挑战是缺乏训练和测试数据。对于需要专家知识的非常大的图像和视频数据集,医学数据注释过程既耗时又昂贵。训练模型推理的延迟也给实时诊断和外科手术带来了计算困难,而时间紧迫的医疗保健需要低于300毫秒的服务质量,实时视频通信也是如此。要以每秒60帧(FPS)的速度制作高质量的医疗视频,深度学习模型的效率和性能变得至关重要。推理精度和速度是机器学习算法需要改进的主要领域。一些高级机器学习模型可以实现非常高的推理速度。例如医学影像中常用的物体检测模型YOLOv3-tiny,可以在标准数据集上以超过200FPS的速度处理图像;基于GPU和FPGA的分布式无线传感器网络和基于5G高速Wi-Fi的机器学习模型均在医疗AI应用中得到部署。用于快速诊断中风、血栓形成、结肠息肉、癌症和癫痫的机器学习模型显着缩短了病变检测和临床决策的时间。实时人工智能辅助手术可以改善围手术期工作流程,实现视频分割、手术器械检测和组织变形可视化。高速机器学习在远程诊断、手术和监护等数字健康领域发挥着至关重要的作用。无线网络和边缘计算无线设备和服务已成为许多科学研究中收集和传输大数据的关键工具。此外,事实证明,移动信息有助于了解人类活动及其对环境和公共卫生的影响。数据流量的指数级增长给无线基础设施带来了巨大压力。特别地,小区间干扰极大地影响可靠性和等待时间。为了满足用户对数据通信和增值AI/机器学习服务的需求,无线提供商必须:1)开发更智能的无线电资源管理学习算法以适应复杂多变的流量和干扰条件;网络上实现了大量的机器学习/AI计算和功能,以实现更低的延迟和更高的通信效率。机器学习模型的传统实现,尤其是深度学习算法,远远落后于实用程序的数据包级动态。为了提高效率,现有的机器学习/人工智能服务通常在云端执行,但代价是高通信开销和高延迟。无线网络和边缘计算的主要挑战是如何构建能够在小型蜂窝接入点内以低于10毫秒的低延迟执行复杂任务的计算平台。研究人员提出了多种学习算法,希望通过神经网络完成特定的无线电资源管理任务。监督学习最初用于训练神经网络来控制功率传输。最近,有人提出深度强化学习可以更好地改善通路和网络的不确定性问题,而且只需要少量的先验训练数据。后来很多作品开始关注边缘计算和深度学习的融合。一些研究人员使用联邦学习来训练AI模型,而不是将所有数据发送到中央控制器进行训练。由于缺乏既快速又高效的实用ML/AI解决方案,上述工作基本停留在仿真阶段。更具体地说,开发一个能够以低于10毫秒的速度执行复杂ML模型并且可以部署在小型蜂窝接入点的计算平台是该阶段的主要目标。2.数据处理的三种主要形式实时、加速的人工智能推理有望提高当前和未来科学仪器的检测能力。为了设计高性能的人工智能系统,我们需要关注机器学习算法在目标领域的性能系数,这可能会受到推理延迟、计算成本、可靠性、安全性以及在极端环境中运行的能力的影响。例如,机器学习触发大型强子对撞机的罕见事件采集系统,需要100ns的延迟。此外,先进科学仪器的实时分析必须不间断地分配计算资源,无线医疗设备必须对敏感的患者信息保密。上述特性和特征为人们区分领域和应用程序之间的差异和共性提供了可量化的指导方针。这些指南可以解决不同科学领域的不同需求。适当的数据表示是设计过程中重要的第一步,因为它决定了模型的应用场景。数据表示数据在特定域中的表示方式对计算系统和数据存储都有影响。国际上,跨域数据表达可分为原始数据和重构数据。数据表示通常在数据处理管道中的重建阶段和上游步骤之间变化。当数据为图像性质时,包括全连接CNN模型在内的现有应用通常将经过预处理的熟练特征变量作为输入值或CNN模型。现有的CNN算法开发成果得益于变量的准确性和效率。为了充分发挥CNN模型的强大功能并最大限度地减少其信息损失,需要采用适当的原始数据表示,例如点云,可以从不同实验和测量系统的原始数据中清晰地获得:空间数据:用于描述几何空间中的物理对象。有两种主要类型:矢量数据和栅格数据。矢量数据可以由点、线或多边形组成;栅格数据是指由像素组成的网格,这些网格以图像或强度、电荷、场强等其他值表示。点云:一种空间数据。这种数据表示是通过整理一组空间数据(即三维空间中的点)创建的,这些数据通常一起形成空间中的对象。时间序列数据:用于表示系统/实验在特定时间的状态。随时间收集的数据按特定顺序排序。时间序列数据是上述表示的子集,其中数据是定期采样的。时空数据:可以在空间和时间两个维度上测量和观察系统。在这种情况下,数据可以被认为是时空的。多光谱数据:用于表示多个传感器的输出值,这些传感器能够捕获来自电磁频谱多个频段的测量值。多光谱表示通常用于成像,并且与可以识别不同波长的光的传感器相关联。通常涉及几个到几十个光谱。高光谱数据:用于表示从大量光谱(例如,100s)中获得的测量值。这些从各种窄带光谱中获取的图像被合并成一个具有三个主要维度的高光谱立方体,前两个维度指的是二维空间位置(例如,地球表面),第三个维度表示每个空间的完整光谱内容“像素”位置被捕获。点云点云数据表示是高能粒子领域的一个通用概念。在高能粒子领域,大量探测器收集的测量结果被组合成一个数据集。在众多高能粒子应用中,点云通常用于表示数据大小超过1Pb/s的粒子射流。非正式地,点云可用于捕获任何3D空间事件和空间中移动部件的交互。质子之间碰撞的残余物在定制和优化的探测器中产生信号,这些信号表示为空间中的点。扫描后的各种图像数据可以以点云的形式呈现。生物医学工程和虚拟现实中的CT和PET扫描也使用点云进行成像,以及用于产品设计、实体对象建模、建筑和设施设计的基础3D扫描仪。上述大多数成像任务都会生成相应大小的点云,从GB到TB。域共享点云表示(例如高能粒子和生物医学成像)也涉及空间属性。图例:在Kaggle数据集中,Track机器学习可视化三维空间中的粒子跟踪命中多/高光谱数据多光谱数据在无线医疗监控和无线通信系统之间无处不在。一组通常代表不同模式的生理传感器被合并到一个多光谱数据集中,用于医疗监测和干预系统。对于无线通信,信号干扰和网络流量状况是通过多光谱数据捕获的,这两个域都捕获跨时间的数据,因此表现出时间特性。与其他域相比,这两个域中生成的数据大小可以认为相对较小(从100sMb/s到10sGb/s)。高光谱数据用于许多天文应用、医学成像和电子显微镜,用于更多的材料科学设计和发现应用。如图7所示,高光谱数据显示在电子显微镜中。电子探针在所研究的样品上形成网格,并在像素检测器上捕获衍射图案。当电子探针扫描样品时,像素检测器会捕捉图像。新兴的多信使天文学应用进一步增强了高光谱数据表示的效用,这些表示结合了来自大量探测器和望远镜的观测结果。图7.二硫化物二维材料的4D-STEM实验测量3.实现低延迟、高效的ML算法作者重点简要概述了如何构建高效机器学习算法的技术和技巧。考虑到硬件,构建算法以实现协同设计需要一个高效的硬件编程平台。为实现这一点,将分三部分进行介绍:重点介绍神经网络的设计和训练,以实现硬件的有效应用;将机器学习硬件计算平台分为“传统CMOS硬件”和“新兴超CMOS硬件”部分进行介绍。前者将解决近期的硬件解决方案,而后者则侧重于推测性的一端。同时,由于新硬件编程领域的快速发展,作者以一个具体的例子:现场可编程门阵列(FPGA)阐明了器件系列面临的选择和挑战。希望读者能从FPGA的细节中了解软件设计的基本方法。帮助。本文将以高效部署机器学习模型为例,简要介绍一种系统化的方法。科学中的许多机器学习问题需要低延迟和有限的资源。然而,大多数现有的最先进的CNN模型具有非常高的延迟并且内存密集且昂贵。由于上述原因,从业者被迫使用精度不理想的次优模型(例如浅层CNN)来避免这种延迟问题。大量文献致力于通过解决上述延迟问题来提高CNN模型的有效性,大致可以归纳为:设计一种新的高效NN架构;共同设计神经网络架构和硬件;量化(低精度推理);修剪和稀疏推理;知识蒸馏。在论文中,作者阐述了机器学习算法在高吞吐量和低延迟环境下的需求,包括系统设计和训练,以及机器学习模型的高效部署和应用。在硬件应用方面,主要讨论两类内容:现有的传统CMOS技术和超级CMOS技术。在传统的CMOS案例中,基于摩尔定律,人们专注于为机器学习设计的高级硬件架构。对于多种硬件,机器学习算法的协同设计是满足特定科学领域对硬件(包括其架构和可编程性)要求的关键。高度相关且极其重要的硬件平台的一个例子是FPGA。根据作者的说法,这些技术提供了令人兴奋和超高效的技术,尽管它们可能是推测性的,但与传统技术相比,它们已经大大提高了现有技术水平。4.总结与展望本综述报告主要阐述高效机器学习算法的应用如何使跨领域的科学发现成为现实。在此过程中,科学探索往往会产生令人振奋的新研究和新发现。然而,这是一个相对较新的领域,具有丰富的潜力和跨领域的开放挑战。除了报告中陈述的内容外,我们希望通过本文呈现的科学用例及其重叠可以为读者在其他研究中的应用提供灵感。训练和部署机器学习的方法以及计算机体系结构是一个发展非常迅速的领域,新任务层出不穷。随着机器学习和科学领域不断引入新方法,了解新算法在不同硬件上的协同设计以及部署这些算法的工具流程的易用性非常重要。强大的新机器学习硬件的快速广泛采用将推动这里的创新。在BeyondCMOS技术的情况下,这些应用设计很重要,要考虑到技术的成熟度、与计算架构的集成以及如何对此类设备进行编程。我们期待在不久的将来重新审视这些主题,看看应用程序、机器学习技术和硬件平台的发展速度有多快——最重要的是,融合、颠覆科学突破。注:本综述报告是对第二届年度快速机器学习会议的概述,汇集了从粒子物理学家和材料科学家到健康监测研究人员的科学专家,以及机器学习学者和计算机系统架构师。内容,希望通过专家的视角和概念找到领域特定应用、机器学习、实验和计算机系统架构之间的交汇点,以加速科学发现。以下是整篇报告的具体章节:
