当前位置: 首页 > 科技观察

AI驱动的机器视觉的兴起对企业数据管理具有影响

时间:2023-03-12 03:23:44 科技观察

AI驱动的机器视觉每天都变得更加强大和广泛。机器视觉和人工智能的新应用正在快速发展,特别是在医疗保健、自动驾驶汽车、制造、农业和安全等领域。在医疗保健领域,机器视觉用于快速分析数以千计的X射线、CAT扫描和其他医学图像。它通过优先安排医院急诊室的患者治疗来挽救生命。在交通运输行业,人工智能驱动的机器视觉系统使自动驾驶汽车能够发现障碍物并安全地在道路上行驶。机器视觉还通过自动缺陷检测在制造中发挥关键作用,而迅速扩展的数字农业领域部署计算机视觉系统来限制甚至消除农药的使用,同时继续提高产量。与机器视觉系统一样有用的是,它们是大量非结构化数据的来源。根据国际数据中心(IDC)的研究,它们的日益普及是推动全球数据收集激增的一个重要因素,预计到2025年全球数据收集量将继续上升至163泽字节。由于人工智能驱动的机器视觉和所有这些数据的所有这些用途,它对企业产生了许多数据管理影响。如今,大多数组织都面临着相互冲突的数据管理需求。大多数数据起源于边缘,但计算和存储基础设施通常集中在几个大型数据中心或公共云中。将数据移动到集中位置会导致与传输和存储数据相关的显着延迟和成本。对速度的需求根据Gartner的数据,到2025年,大约75%的企业生成数据将在传统数据中心或云之外创建和处理。目前,大多数在边缘捕获的数据都被移动到一个集中位置进行处理和AI模型开发。在实施机器视觉技术时必须考虑到这一点。对于任何捕获和集中PB级非结构化数据(无论是视频、图像还是传感器数据)的企业而言,这些负载都会显着减慢机器学习算法的训练过程。这种集中的数据处理方法延迟了AI开发管道和生产模型的调整。在工业环境中,这可能会导致遗漏产品缺陷,从而给企业造成巨大损失,甚至危及生命。为了解决这个问题,越来越多的企业开始转向分布式和去中心化架构。这意味着大多数数据都在边缘保存和处理,以解决延迟和延迟问题,并解决与数据处理速度相关的问题。边缘分析和联合机器学习技术的部署带来了显着的好处,同时解决了集中式系统固有的安全和隐私缺陷。例如,一个大型监控网络不断捕捉视频片段,编译大量原始数据以供日后分析。为了从视频中有效地训练ML模型,必须检查它们以区分视频中的特定对象。只需要检测新事物的镜头,而不是可能捕捉空荡荡的建筑物或街道的冗长不变的视频。通过在边缘预分析数据并仅将必要的镜头移动到集中点,企业可以节省时间、带宽和成本。虽然分布式架构有很多优点,但它们也带来了额外的复杂性。在边缘选择和部署适当的存储和计算基础设施并进行集中管理至关重要,并且会显着影响整体系统效率和拥有成本。分层存储许多收集的图像和视频主要用于人工智能模型训练,应根据不同目的永久存储。例如,在高级驾驶辅助系统和自动驾驶汽车中,人工智能根据实时收集的数据做出决策。但是,如果出现问题(可能是数月或数年后),企业需要能够回过头来分析发生了什么。虽然这种类型的存储对安全性至关重要,但它的成本很高——根据Gartner的数据,平均每年每TB的成本为3,351美元。当您考虑到自动驾驶测试车辆平均每小时捕获2TB的数据时,很容易看出成本是如何增加的。许多存储大量非结构化数据的企业通常依赖于网络附加存储设备或公共云存储。但是,采用分层数据存储架构可以显着节省成本。在分层系统中,在处理和分析数据的过程中,内容被放置在快速存储中,而备份副本被存储和归档在成本较低的存储中,例如磁带或对象存储。低成本存储可以低至每TB50美元。在包括自动驾驶汽车在内的许多领域,大多数收集到的数据需要无限期保存,但很少使用,并且可以以最低成本存储。非结构化数据存储解决方案和边缘分析的新发展继续冲击市场。为了利用这些优势,组织应该从头开始实施模块化数据管理,以便在发布时可以将元素换成更先进的技术。寻找机器视觉的新机遇即使拥有最好的技术和服务,成功传输、处理和存储为机器视觉用例捕获的大量数据仍将继续挑战各种垂直领域的企业。然而,存储的数据也提供了一个新的机会。例如,可以重复使用图像和视频来开发新的用例。因此,存储的数据将成为企业新的收入来源,而不是成本。同样,当更先进的分析技术可用时,许多企业可以重复使用现有的存档数据来开发自己的新产品。一些公司,尤其是汽车制造商,已经开始意识到这种潜力。这些潜在的新收入流和数据使用是现在开始优先考虑智能高效数据处理和存储的极好理由。