近年来,数字化转型已成为企业业务升级必不可少的手段。事实上,“数字化转型”的概念、智能化、物联网等核心技术已经遍及各行各业。边缘计算、机器学习、数字孪生等新技术层出不穷,重塑商业模式,颠覆生活体验,加速万物智能化。追本溯源,一切变化都源于数据,都由数据驱动。日前,IDC的一份报告显示,2021年全球大数据市场IT总投资规模为2176.1亿美元。到2026年,这个数字将增加到4491.1亿美元。复合增长率约为15.6%。大数据市场的高速增长,客观上反映了企业用户对数据关注度的进步:他们正在从以往的数据采集、存储和管理,转向对数据的分析和价值发现,从而实现数据的真正价值。.用虚拟数字优化真实现实的目的,最终完成其“数字化”应用的完整过程。万物智能时代新趋势数字化转型进入2.0时代,企业投入不断加大。期望将单点技术聚合成系统,发挥综合效应,进一步增加利润,激发创新,提高员工生产力,提高运营效率,改善客户体验。虽然AI一直在推动存储的发展,但要进一步激活存储潜力,仍然需要解决存储在AI场景下容易面临的挑战:大量的小文件,因为需要的文件数量对于训练任务是数亿到亿级的,所以存储需要能够承载数十亿甚至上百亿的文件。同时,由于很多训练模型依赖图片、音频、视频文件,这些文件基本在几KB到几MB之间。多读少写。大多数场景下,训练任务只读取文件,很少产生中间数据。即使产生少量中间数据,也会选择本地写入,很少选择回写到存储集群。目录热点,由于训练时业务部门的数据组织不可控,用户极有可能将大量文件存放在同一个目录下,容易造成多个计算节点同时读取这批数据训练过程中的时间。该目录所在的元数据节点将成为热点。“工欲善其事,必先利其器”。为了释放人工智能技术的最大力量,解决存储挑战已成为构建强大IT基础设施的重要组成部分。如果没有高性能的存储,就会导致整个系统性能的延迟。因此,“AI”对存储性能有着非常严格的要求。企业希望存储系统能够满足高吞吐量和低延迟的需求,让更多的数据能够更及时地传输和执行。这个愿望应该如何实现呢?AI驱动存储发展众所周知,大数据、AI、ML等概念并不是最近才出现的,但在当时的数字时代,计算能力的限制不仅限制了数据的产生,也限制了数据的产生。AI和ML的真正价值。直到云计算让计算能力不再有上限,用户开始获取更广泛的数据,AI和ML才真正成为最有效的数据分析工具。企业在为AI平台选择存储设备之前,首先要考虑以下几点:1.成本AI数据存储设备的价格是企业的一个关键因素。显然,高管和参与采购决策的人员希望存储尽可能具有成本效益,并且在许多情况下,这将影响组织的产品选择和策略。2.可扩展性如上所述,在创建机器学习或人工智能模型的过程中,收集、存储和处理大量数据是非常必要的。机器学习算法需要源数据呈指数增长,以实现准确性的线性提高。创建可靠且准确的机器学习模型可能需要数百TB甚至PB的数据,而且这只会随着时间的推移而增加。存储成本的变化引入了分层存储的概念,即使用多种类型的存储来存储数据。例如,对象存储是存储大量非活动AI数据的良好目标。当数据需要处理时,可以将其移动到高性能的文件存储集群或对象存储中的节点,处理完成后再移回。3.性能人工智能数据的存储性能主要体现在三个方面。首先,可能也是最重要的是延迟,或者说软件处理每个I/O请求的速度。低延迟很重要,因为改善延迟会直接影响创建机器学习或AI模型所需的时间。复杂的模型开发可能需要数周或数月的时间。通过缩短这个开发周期,组织可以更快地创建和完善模型。在检查延迟功能时,由于对象访问的流媒体特性,对象将参考时间存储为第一个字节,而不是单个I/O请求的延迟。机器学习数据可以由大量小文件组成。在这方面,文件服务器可以提供比对象存储更好的性能。这里要问AI存储解决方案提供商的一个关键问题是,他们的产品的性能特征对于大文件类型和小文件类型有何变化。4.可用性和持久性机器学习和人工智能模型可以长时间连续运行。通过训练开发算法可能需要几天或几周的时间。在此期间,存储系统必须保持通电并持续可用。这意味着任何升级、技术更换或系统扩展都需要在不停机的情况下进行。在大型系统中,组件故障很常见。这意味着任何用于AI工作的平台都应该能够从设备(如硬盘或SSD)和节点或服务器故障中恢复。对象存储使用纠删码在多个节点上广泛分布数据,并最大限度地减少组件故障的影响。纠删码技术可用于扩展文件系统以提供相同级别的弹性。纠删码方案的效率非常重要,因为它直接关系到读写I/O性能,尤其是对于小文件。由于大多数大型对象存储都太大而无法定期备份,因此可靠的纠删码成为AI存储平台的基本特征。5.在公有云上开发机器学习和人工智能算法,需要高性能存储和高性能计算。许多AI系统都是基于GPU的,例如NvidiaDGX,它可用于开发精确算法所涉及的许多复杂数学计算。公共云服务提供商已开始提供可用于机器学习的GPU加速虚拟实例。在公共云中运行机器学习工具可降低构建机器学习开发基础设施的资本成本,同时提供扩展开发机器学习模型所需的基础设施的能力。6.集成在本文中,我们将机器学习和人工智能的数据存储和计算分开。构建AI数据存储可能很困难,因为必须考虑存储网络和调整存储以及??其他因素以与机器学习应用程序一起使用。产品的预包装使供应商能够在将产品交付给客户之前对其进行测试和优化。如今,存储产品结合了流行的AI软件、计算(例如通用CPU和GPU)、网络和存储以提供AI就绪平台,并且在部署这些系统之前进行了大量详细的调整。虽然成本可能是一个问题,但对于许多客户而言,预打包系统可以降低采用AI存储的障碍。写在最后目前,人工智能的发展正在加速技术设施的进步,数据类型和数据存储需求也在发生变化。也许很难预测未来的存储技术会是什么样子,但我们可以肯定的是,未来的人工智能将继续推动存储发展。随着科技进步,人工智能作为新一轮产业变革的核心驱动力,将催生新技术、新产品、新产业、新业态、新模式,实现社会全面提升。生产率。
