MIT-IBM沃森人工智能实验室(WatsonAILab)的研究人员正在使用人工智能解决电网故障。他们开发了一种机器学习模型,可以分析从美国电网上数十万个传感器收集的数据。这些传感器是所谓的同步相量技术的一部分,可以聚合大量与电流和电压相关的实时数据,以监控电网的健康状况并定位可能导致停电的异常情况。由于传感器生成的数据流的大小和实时性,同步相量分析需要密集的计算资源。正如研究人员在论文中所定义的那样,快速摄取用于异常检测的数据,或“识别与大多数数据实例有显着差异的异常样本的任务”,可能会带来困难。由于传感器收集的数据大多是非结构化的,因此可以在没有标记数据的情况下训练ML模型。“在电网的例子中,人们试图使用统计来捕获数据,然后用领域知识定义检测规则。例如,如果电压激增一定百分比,则应向电网运营商发出警报。这种基于规则的系统,即使有统计数据分析的赋能,也需要大量的劳动和专业知识。现在已经表明,这个过程可以自动化,或者可以使用先进的机器学习技术从数据中学习模式。”为了开发这个ML模型,研究人员首先将异常定义为低概率事件,通过将电网数据集定义为概率分布来估计概率密度。这允许检测与异常相关的低密度值或低概率事件。对于如此复杂的数据,概率分布很棘手,研究人员使用了一种称为归一化流的深度学习模型来评估概率密度。标准化流量模型使用贝叶斯网络进行缩放,贝叶斯网络是一种学习传感器如何工作以及它们如何相互作用的图表。图形结构允许在数据中进行模式识别,从而更准确地检测异常。根据《麻省理工新闻》,“贝叶斯网络将多个时间序列数据的联合概率分解为更简单的条件概率,更易于参数化、学习和评估。”结果表明,由于图的概率简化,ML模型能够独立学习图。研究人员感兴趣的是,在实施异常检测以外的方法时,如何扩展这些模型以用于越来越大的图形。由于其适应性强的方法,该技术可以应用于具有复杂数据收集和分析的其他领域,包括与交通模式和监控相关的领域。“一旦模型上线,它就会继续从稳定的传感器数据流中学习,适应可能的数据分布漂移,并随着时间的推移保持准确性。”在《麻省理工学院新闻》文章中描述。
