如果您正在进行大数据项目,需要牢记四个因素。1、数据不能脱离实际环境首先需要说明的是,脱离实际环境的数据效果会大打折扣。在制造领域,所谓的真实环境可以由工作任务或执行步骤来提供。每条数据都必须与正在执行的任务或正在生产的产品本身相关联,并与任务的特征相关联。该环境可用于任务间比较以检测显着差异。使用制造大数据的第一步是收集环境或事件信息,然后将这些信息与工厂的历史数据相关联。幸运的是,PlantHistorians的主要供应商提供了事件和上下文插件,可以将MES流程或执行系统作业步骤与历史数据相关联。2.分析与优化第二个要考虑的因素是,在线历史数据对于保存数据来说是一个很好的工具,但是对于分析数据就有点无能为力了。一个好的方法是使用离线备份或数据库进行分析。大多数工厂历史学家都针对访问数据进行了优化,当需要从正在运行的在线系统中提取大量数据进行大数据分析时,通常会花费大量时间。更好的策略是定期将历史数据备份到离线系统,或者将数据固化到数据库中,以便对大数据进行优化分析。3.考虑样本大小第三个要记住的因素是你必须选择正确的数据样本。为了具有说服力,请确保样本量足够大,以便能够检测到内在关系和因果关系。较小的样本量有可能获得不正确的内在关系,使您走向相反的方向。还有一点很重要,不要把内在关系和因果关系混为一谈,因为有内在关系的东西不一定有因果关系。数据分析可以发现内部关系,但要想弄清楚事物之间是否存在因果关系,还需要做大量的工作。大数据分析项目必须引入工程师或科学家,以确保通过工程分析方法能够得到真实的因果关系,从而使数据发挥最大价值。4.鼓励人类参与最后一个要记住的因素是,在某些情况下,依靠人类来发现模式比依靠自动系统更可靠。您可以指派人员查询数据库并查找特定模式。经验丰富的操作人员通常对生产系统及其相互关系有着深刻的理解,能够发现一些隐藏的或不明显的内在关系。为存储的数据添加上下文信息,使用经过分析优化的数据、客观的陈述和足够的样本量,对相互关系和因果关系进行合理的总结,以及利用人进行数据挖掘,都是制造业大数据项目的关键组成部分。在大数据分析真正应用到您的生产车间之前,请确保您的项目考虑了这些方面。
