识别国家电网中的故障就像大海捞针。遍布美国各地的数十万个互连传感器实时捕获电流、电压和其他关键信息的数据,通常每秒记录多次。麻省理工学院IBM沃森人工智能实验室的研究人员设计了一种计算效率高的方法,可以实时自动识别这些数据流中的异常情况。他们展示了他们的AI方法,该方法学会了对电网的互连性进行建模,在检测这些故障方面比其他一些流行技术要好得多。由于他们开发的机器学习模型不需要有关电网异常的注释数据进行训练,因此它将更容易应用于通常无法获得高质量标记数据集的现实世界。该模型也很灵活,可以应用于其他由大量互连传感器收集和报告数据的情况,例如交通监控系统。例如,它可以识别交通瓶颈或揭示交通拥堵是如何级联的。研究人员首先将异常定义为低概率事件,例如电压突然上升。他们将网格数据视为概率分布,因此如果他们可以估计概率密度,他们就可以识别数据集中的低密度值。那些最不可能出现的数据点对应于异常值。估计这些概率并非易事,尤其是因为每个样本捕获多个时间序列,并且每个时间序列都是随时间记录的多维数据点集。此外,捕获所有这些数据的传感器是有条件的,这意味着它们以一个传感器有时会影响其他传感器的配置连接。为了从数据中学习复杂的条件概率分布,研究人员使用了一种特殊类型的深度学习模型,称为归一化流,它在估计样本的概率密度方面特别有效。他们用一种称为贝叶斯网络的图形来增强这种标准化的流动模型,这种图形可以学习不同传感器之间的复杂因果结构。这种图形结构使研究人员能够看到数据中的模式并更准确地估计异常。
