人们的工作和生活周围有数十亿的智能产品和传感器。这些物联网(IoT)产品与人、家庭、工厂、工作场所、城市、农场和车辆进行交互。Gartner预测,到2021年,物联网技术将用于95%的所有电子产品的新产品设计中,从可穿戴设备到医疗设备等等。物联网提供了有价值的信息,可以更快地发现健康问题、监测健康状况、更好、更安全地跟踪商品,并更高效地生产食品。然而,智能产品会产生大量无用信息,这些信息通过光纤高速传输。管理所有这些IoT数据意味着开发和执行架构、策略、实践和程序以正确处理整个数据生命周期,这带来了独特的挑战。传统的大数据方法和基础设施需要重新思考和扩展。物联网数据管理中的常见问题使用物联网数据需要比从人类收集的数据更快地完成。例如,来自人们的评论和行为的调查数据通常在几分钟、几小时或几天内到达,而不是几秒钟。鉴于此,管理人员在决定选择哪些数据时可能会更灵活一些,而无关数据的无关性会降低。相比之下,物联网正在创建自己的生态系统,加剧了三个典型的数据管理问题:(1)可扩展性和敏捷性:物联网数据流量的即时性使这个数据管理问题变得尤为紧迫。鉴于物联网设备的数量会随着时间的推移而增加,比如从40台设备增加到400台设备,那么物联网架构如何适应这种情况?物联网是如何连接起来的,允许人和物进行实时处理和分析,因为物联网数据的保质期短吗?一旦物联网数据到达某个地方,它是如何存储的,以确保有足够的空间容纳新信息?输入和输出如何在不堵塞的情况下流过传感器?物联网数据是否需要访问非传感器数据(例如,关于用户和密码的元数据),这些数据如何捕获和理解这些信息?(2)安全性:Gartner研究表明,安全性是组织规划和实施物联网解决方案的重大挑战。预计到2022年,所有物联网安全预算的一半将用于故障修复。防止未经授权的访问已成为重中之重。《新闻周刊》报道称,使用物联网的美国公司中有将近一半受到安全漏洞的打击,损失可能惊人——大公司超过2000万美元。但这是问题的一部分。组织需要遵守有关数据保护的国家规章制度。一项主要法规,即通用数据保护条例(GDPR),自2018年5月起实施,对违规者处以巨额罚款。要理解其复杂性,请考虑冰箱通知其主人鸡蛋和牛奶已过期的示例。未经所有者同意在互联网上发布此信息,即使只是为了存档目的,也会违反GDPR等法规。但冰箱所有者可能希望他们的杂货店确保鸡蛋和牛奶有库存。功能传感器需要访问适当的信息。为了改善能源消耗,FluidInformationWorkbench将传感器连接到Statoil提供的能源,Statoil是一家分析物联网传感器数据的德国能源管理系统供应商。设置安全屏障以防止这些实体之间的基本信息流动会适得其反。(3)有用的:当数据具有最大价值时,随着数据的存储,数据量逐渐减少。IoT依赖于快速数据,立即获取见解。自适应维护、安全监控、预测性维修和流程优化等功能都依赖于实时数据。(4)安全:考虑优步在亚利桑那州的自动驾驶汽车造成的死亡。因为是晚上,汽车的传感器可能无法在黑暗中识别行人并使用该信息来减速。如果SUV的传感器确实识别了行人,那么它仍然没有有效地使用该信息。(5)过滤:传感器数据应该如何过滤和验证?哪些类型的数据过滤器适用于哪些类型的传感器?传感器记录的虚假信息(例如,将行人记录为另一辆车)怎么办?如何丢弃这些虚假数据?如何检查物联网数据质量?鉴于物联网问题的复杂性和紧迫性,全球物联网数据管理市场规模预计将从2017年的275.4亿美元增长到2022年的664.4亿美元。物联网数据管理:策略和解决方案幸运的是,物联网数据管理策略存在于技术和过去的方法。Gartner认为,许多应用于更传统用例的数据管理基础设施工具和技术可以在某些方面用于支持物联网。例如,考虑:(1)边缘计算:在边缘计算中,在数据源附近或网络边缘,数据处理发生在典型云环境中的集中数据存储位置。通过在本地处理和使用一些数据,物联网可以节省数据存储空间,更快地处理信息,并应对安全挑战。如果冰箱需要根据用户的要求降低温度,这可以在家庭网络上完成,甚至可以仅由设备本身完成。有关恒温器故障或所需修复的信息可以存储在本地并推送到制造商或供应商的云环境以供进一步分析。当开发人员解决了这个问题后,它可以打包并通过云发送,并通过设备在本地打开,这将处理大部分代码更新和密集处理,可能通过微服务。同时,由于只有所需数量的数据会从家庭以外的地方传输给供应商或制造商,因此未经授权共享个人信息的可能性很小。(2)数据治理:数据治理通过定义对信息的访问来降低安全风险。数据治理描述管理数据资产的权力和控制。以前,数据治理描述了以IT为中心的服务。在物联网世界中,数据治理对每个用户来说变得更加重要。典型的房屋管理部门没有IT部门,因此数据治理成为典型消费者的责任。关于如何有效管理个人数据的消费者教育将变得至关重要。需要就设置或使用设备做出决定的任何人都需要他们可以获得的高质量信息。这种额外的数据治理势在必行,就是数据治理2.0。对于物联网,数据治理需要成为家喻户晓的术语。(3)元数据管理:要使物联网数据有用,元数据起着至关重要的作用。元数据描述“上下文中的数据”。好的元数据会告诉设备何时使用哪些信息以及如何使用它。元数据还为自动化系统提供了深度学习的核心。在自动驾驶汽车中,元数据提供了旅行的背景信息,使驾驶更加安全,从而有助于挽救行人的生命。提取有意义的见解和提高运营效率将需要灵活的集成工具,使用户能够快速获取、准备、分析和管理数据。元数据管理在这里至关重要。Gartnet预测,随着企业继续管理由传感器类型、功能、位置、制造商和序列号生成的数据,元数据管理解决方案将会增长。物联网数据管理的未来虽然边缘计算、数据治理和元数据管理将帮助公司处理可扩展性和敏捷性、安全性和可用性,但这仅仅是个开始。由于缺乏物联网就绪的数据管理和分析能力,三分之一的物联网解决方案将在部署前被放弃。他指出,除了制定新的数据治理政策外,组织还需要在几个关键领域实现现代化,包括采用新的数据管理技术和平台。为了让物联网蓬勃发展,数据管理必须包括更多的现代基础设施和支持它们的技术。
