当前位置: 首页 > 科技观察

人工智能也会遇到瓶颈分析人工智能技术对存储性能的需求

时间:2023-03-13 08:41:22 科技观察

2020年对于很多人来说是值得永远铭记的一年。突如其来的新冠疫情,几乎改变了每个人的生活。造成了极大的损失,也给人类健康带来了巨大的威胁。面对这场难缠的病毒,我们不仅看到了无数勇士逆行的惨烈,也看到了科技在整个抗疫斗争中的关键作用,尤其是AI人工智能技术——通过AI技术我们可以加速疫苗的研发;通过人工智能技术,我们可以从众多医疗终端设备和大量患者临床数据中提取最佳诊断方案,加快诊断效率,提高诊断效果。可以说,人工智能技术在这场关键战役中发挥了重大作用。人工智能已经渗透到医疗、教育、工业、能源、金融等各个领域。因此,在2020年第三届软件定义存储峰会上,英特尔提出“突破内存和存储瓶颈,释放人工智能无限潜能”的主题也就不足为奇了。毕竟在这场抗击疫情中,英特尔不仅投入巨资资助合作伙伴研究利用AI技术进行诊断和疫苗研发,还推动AI技术在医学检验、医用物资生产、疫情推演和疫苗研发等方面的加速落地。其他领域。Intel我们深知AI人工智能对人类的重要性。除了对抗新型病毒,AI人工智能技术其实已经渗透到人类生活的方方面面。英特尔中国区非易失性存储解决方案事业部战略业务发展总监倪金峰先生在峰会上表示:“从医疗、教育、工业到能源、金融等,每个行业都在寻求。我们可以预见,在不久的将来,全社会对数字服务的需求将持续激增。”AI人工智能技术会给存储产品带来重大挑战,人工智能技术的数据流水线主要分为采集、准备、训练和推理四个部分,每个部分需要读写不同类型的数据,工作量是“工欲善其事,必先利其器。”为了发挥AI人工智能技术的最大威力,企业需要建设强大的IT基础设施。处理器、FPGA、GPU,还要高性能的存储设备,否则就和普通电脑一样,因为机械硬盘传输速度最慢,查找数据的时间最长,这往往成为整个系统的问题系统性能的瓶颈,即使是SATA/PCIeNANDSSD,也常常跟不上AI数据处理的需求。倪金峰先生介绍,无论应用于哪个行业,人工智能的工作其实主要由获取、准备、训练和推理四个部分组成。每个部分需要读写不同类型的数据,工作量也不同,这会给存储设备带来更大的挑战。简单地说,在人工智能执行的整个过程中,IO需求是不可预测的、复杂的、多变的。它读写的数据有三个重要的特点:第一是它的数据集大小,差别很大。初始采集阶段是PB级别,训练阶段是GB级别,当功能训练执行时,相关模型可能是KB级别;其次,它的工作量也是复杂多变的,从最初的准备阶段100%写50%读50%写混合负载,到后面的一些训练和推理阶段可能会出现100%读,包括很多随机读操作;三是存储方式也会有很大变化,从一开始是顺序数据流写入,到后来完全随机读写,帮助建立精准模型。因此,人工智能技术对存储性能有着非常严格的要求。用户总是希望设备能够满足高吞吐量和低延迟的要求,总是希望更多的数据能够更靠近处理器以获得及时传输,但是用户希望AI基础设施的投资成本能够得到控制。可以说,这是一个矛盾的要求。那么用户如何才能实现这个愿望呢?为了优化成本和提高性能,英特尔存储产品构建分层存储的第一步是对用户使用的数据类型进行研究。倪金峰先生为我们展示了英特尔经典的存储金字塔图。在应用中,并不是所有的数据都会被频繁使用,所以数据可以分为三个不同的层次:热数据、温数据和冷数据。热数据是指需要立即处理的数据,比如银行收到的转账请求、实时地理位置等。暖数据是非即时状态和行为数据,比如用户最近感兴趣的话题,或者用户最近去过的地方等,而冷数据是不经常访问的数据。研究数据类型、数据使用产生的工作负载、对数据进行分层以及使用最合适的设备来存储数据可以提高存储系统性能并降低成本。如果全部使用DRAM内存来存储这些数据,性能可能会很出色,但也意味着用户需要花费非常高的成本。因此,根据数据的类型和负载为它们合理使用存储设备更为合理。例如,DRAM内存和IntelOptane持久内存可用于存储热点数据,因为它们具有高性能和超低延迟,并且最接近CPU和GPU,能够及时洞察。英特尔傲腾固态硬盘搭配以英特尔为代表的TLC、QLCNAND固态硬盘,容量大、性能高,适用于热、温、温存储。这种分层设计的巧妙之处在于,金字塔中每一层的数据和使用的产品在容量和延迟特性上都有一个数量级的差异,可以让用户根据数据的类型进行冷热分布和工作量。分层,同时参考自己的预算、性能需求、功耗预期,不断优化您的存储方案。Optane采用不同于传统NAND闪存的革命性材料,具有三个新特性:就地写入、支持位寻址和低延迟。那么英特尔的内存技术能否担此重任呢?从倪金峰先生的介绍中我们可以看出,由于采用了与传统NAND闪存不同的傲腾介质,傲腾持久内存和傲腾SSD具有很多新的特点。首先是它支持就地写入,写入前不需要擦除数据。不同于普通的NAND闪存,有一个读-修改-写的过程,因此具有更好的性能。同时,长时间写入后,不会有脏数据块,不需要垃圾回收。因此傲腾产品可以很好的保持性能一致性,不会出现NANDSSD使用时间越长性能越差的现象。问题。与使用传统NAND闪存的DCP4600SSD相比,OptaneSSDDCP4800X具有更低的延迟、更好的一致性、更长的寿命和更高的效率。其次,傲腾技术支持位寻址,可以提供超低延迟,带来更快的传输速度。毕竟,AI人工智能技术的应用对存储设备的容量和性能有着很高的要求。与传统NAND闪存相比,Optane产品在性能上有了质的提升。一个形象的比喻就是将数据载体从汽车升级为飞机。在延迟方面,最好能做到微秒级别。虽然与不到0.1微秒的DRAM相比还有一定的差距,但远好于NAND闪存的近100微秒。Intel数据显示,OptaneDCSSD的访问延迟不仅明显低于传统HDD和SATASSD,即使与同样采用NVMe接口的NANDSSD相比,其优势也非常大——与3D的IntelDCP4600相比NAND颗粒与SSD相比,OptaneSSDDCP4800X在不同写入压力和不同队列深度下的读取延迟降低了8到63倍。此外,新媒体大大提高了傲腾产品的使用寿命。IntelOptaneSSD最多可以支持60个DWPD(每天全盘写入),而熟悉的IntelP4600和P4610这类高性能、高寿命的NAND固态硬盘只能支持3个DWPD左右,而IntelOptane的进步固态硬盘非常令人印象深刻。人工智能技术的数据管道可以使用英特尔傲腾持久内存、傲腾固态硬盘、QLC3DNAND固态硬盘进行合理组合,提高任务执行效率,降低成本和功耗。同时,从AI数据通道中的采集、组织、训练、推理四个阶段我们可以看出,每个阶段对存储的要求都非常高,需要持续一致的吞吐量,以及一致的,连续和超低吞吐量。延迟,这些需求正是Optane产品所擅长的,再加上IntelQLC3DNANDSSD的大容量(32TB/盘)和高性能,通过这样的完美结合,可以帮助提升客户性能。数据的整合提高了软件定义存储解决方案的性能,帮助用户为即将到来的人工智能时代的数据爆炸做好准备。显着提升效率,英特尔存储解决方案体现实际价值采用傲腾SSD后,VMWarevSAN、hadoop、CEPH等各种存储系统的性能都得到了大幅提升。据倪金峰先生介绍,在实际使用中,很多平台在改用英特尔傲腾产品后都取得了不错的效果。例如,百度在2018年发布了基于IntelOptaneSSD和IntelQLC3DNANDSSD的存储解决方案,该方案大大提升了AI人工智能、大数据、云计算的存储性能。在AI训练场景下,该方案相比原有HDD机械硬盘方案可实现21倍的性能提升和96%的时延降低,同时TCO降低高达60%。在VMWarevSAN分布式存储系统中,将高性能缓存从NANDPCIe固态硬盘更换为Intel的Optane固态硬盘后,虚拟机密度提升60%,系统集成度提升30%。在该架构中,当用户使用IntelOptaneSSD作为Hadoop的临时数据缓存时,其吞吐量或性能可提升约40%。在CEPH分布式存储系统中,当用户使用IntelOptaneSSD替代传统NANDSSD作为元数据缓存和日志盘时,延迟可降低约50%,IOPS性能也得到提升。大约40%的改善。在微软的AzureStackHCI云平台上,当用户使用IntelOptaneSSD作为缓存盘时,每个系统和每个节点所能支持的虚拟机数量可以增加约60%。分数也可以提高80分左右。此外,国内很多企业都在使用英特尔傲腾技术创新存储解决方案,包括浪潮、VMWare、XSKY、青云等众多合作伙伴。让存储更贴近计算资源,让存储兼具高性能和稳定性该方案之所以能够取得如此出色的性能,主要取决于性能接近内存的傲腾存储产品。在前不久召开的2020英特尔中国年度战略“分享会”上,英特尔也提出了近内存计算的概念,那么这是否代表了未来的存储趋势呢?幸运的是,笔者在此次大会上也有机会采访到英特尔非易失性存储解决方案事业部中国区战略业务发展总监倪金峰先生。倪金峰先生认为,在这个数据爆炸的时代,尤其是5G技术成熟后,产生的大量数据无法通过网络收集到数据中心,所以部分数据必须在边缘进行计算,这就需要边缘存储和计算。边缘端是一体的,只有高效的存储性能才能帮助边缘端快速完成计算。在数据中心,有很多压缩、解压等规律性、重复性、依赖内存的计算需求。如果采用传统的执行方式,会消耗大量的CPU计算资源和DRAM内存资源。英特尔的中长期目标是整合计算和存储,让存储和计算更加紧密。比如英特尔中国研究院院长宋继强提到的解决方案就是将FPGA和存储架构整合在一起。存储系统可以满足压缩、解压、AI训练等实时计算需求。同时,存储系统的参与也可以有效降低用户对CPU和内存资源的需求,从而降低成本。性能接近内存的傲腾介质确实更适合这项任务。显然,傲腾出色的性能是实现近内存计算的关键,那么企业在长期使用傲腾时,是否需要进行额外的维护保养呢?倪金峰先生表示,对于传统的NAND闪存固态硬盘,可能需要做这样的工作。毕竟传统SSD的read-modify-write机制会导致垃圾数据堆积,造成性能下降,而垃圾回收又会带来额外的生命损失。传统SSD未来之所以会出问题,一是垃圾堆积得不到有效处理,二是NAND闪存使用时间越长,坏块越多。因此,有必要对坏块做大量的管理工作。冗余空间越多、越少,性能就会越差。不过傲腾产品不存在写放大的问题。同时,可重写能力非常高,寿命有一个数量级的差异。因此,在其整个生命周期内不存在性能下降的问题。同时,Optane产品经过了严格的性能和可靠性验证,包括模拟在严苛负载条件下工作5年的测试,即加速老化测试。英特尔有大量数据证明傲腾产品的性能在整个生命周期内始终如一、稳定。Optane将成为加速AI人工智能技术的“催化剂”。在写这篇文章的时候,新冠疫情还没有结束,人类还在与它抗争。但我们坚信,没有过不去的冬天,没有过不去的春天。人工智能新兴技术必将助力人类更快战胜疫情,加速数字化、智能化社会发展。为加速人工智能技术的发展,像傲腾这样让数据更接近CPU、性能更接近内存的新技术必不可少。凭借更大的存储容量和出色的性价比,IntelQLC3DNAND也将成为替代HDD机械硬盘阵列的新选择。毫无疑问,傲腾技术与QLC3DNAND技术的结合将成为AI人工智能技术的“催化剂”。我们也期待这瓶“催化剂”能够让AI人工智能技术更快的发展,创造更多的成果造福于人类。