自从AlphaGO打败了人类围棋选手后,AI就成为了整个商业界最热门的名词。AI的背后是对传统商业模式的巨大颠覆和对社会生产力的终极解放。虽然未来人工智能很可能会淘汰一些重复性高的工作岗位,但释放出来的劳动力将推动未来人类的创造力达到一个新的高峰。但除了人工智能的美好前景已成为陈词滥调之外,在实际应用中,人工智能技术还处于起步阶段。现阶段,人工智能——ArtificialIntelligence还处于初级阶段,只能在基于海量数据构建的模型的应用中完成推理和判断。与以扩展模型、做判断为主的强人工智能还有很大差距。但是,自从确定了人工智能开发应用的主要模式后,相应的研究方法也逐渐清晰起来。在目前的技术方向下,企业需要利用神经网络技术,利用机器学习和深度学习算法建立模型,然后基于模型开发相应的软硬件解决方案。无论是训练AI模型,还是利用AI模型进行推理判断,强大的计算能力都是必不可少的。AI两端的不同场景在模型训练方面,由于输入数据类型和使用的DL/ML框架不同,硬件不仅需要具备强大的并行计算和浮点运算能力,还需要具备很强的灵活性。但是,这两个需求在传统的x86服务器上都不擅长,因此需要与x86异构的协处理器来完成相应的模型训练任务。在这个领域,最大的赢家无疑是NVIDIA。面对这个市场巨大的需求和巨大的利润,英伟达不仅针对不同的性能和应用环境推出了多款GPU产品,还推出了相应的一体机,甚至是为大规模应用提供更高带宽的NVLink总线。GPU互连。此外,针对云数据中心虚拟化环境的开发以及相关的训练计划,NVIDIA还拥有专门的GRID虚拟化技术和CUDA语言来提高并行计算的效率。英伟达在产品研发上的巨大投入,几乎占据了AI领域的模型训练市场。但在使用成品模型对实际问题进行推理判断领域,英伟达还没有取得相应的优势。利用AI模型(程序)对实际问题进行推理和判断,仍然需要相应的硬件系统具备强大的计算能力。但与模型训练的复杂场景不同,由于需要运行的程序和处理的数据类型相对固定,硬件系统的灵活性要求不高。相反,在实际的AI应用场景中,用户往往对硬件采购成本、能效、部署效率等方面有更高的要求。于是,越来越多的对应特定算法的AI芯片被制造出来。近期受到资本圈和市场广泛关注的华为海思、寒武纪、地平线、比特大陆等公司都是该领域的新贵。在产品形态上,大多采用ASIC将AI应用固化在芯片中,从而获得更低的成本和更高的性能和能效。当然,传统科技公司在这个领域也没有缺席,包括谷歌的TPU、英特尔的Arria10系列(FPGA芯片)和Xilinx的Versal芯片(FPGA)等也纷纷进入AI推理判断领域。与在AI模型训练领域独树一帜的NVIDIA不同,推理判断领域呈现出百家争鸣、争雄的景象。云数据中心人工智能隐忧随着云概念和云优势被越来越多的企业所认可,云计算市场也在经历一轮又一轮的高速增长。以云计算的形式向企业和用户交付人工智能能力,也成为人工智能技术快速发展和广泛应用的先决条件。因此,对于云数据中心而言,各类计算卡和AI芯片成为扩容建设的重中之重。但随着云计算市场和应用集中度趋于越来越明显,大规模的云数据中心很快会发现越来越多的GPU、ASIC、FPGA开始填充数据中心,它们运行的??方式各不相同程式,扮演着不同的角色,有着不同的管理方式。而这对数据中心来说是一个巨大的挑战。二十年前,当时的CPU性能远没有现在强大。面对庞大的数据存储和管理压力,大多数企业开始研发运行效率更高的ASIC芯片,并将其作为存储系统的核心功能。单元。期初,这个想法取得了不错的效果,满足了用户的需求。但随着时间的推移,不同品牌、不同管理架构、不同功能的ASIC越来越多,也导致存储网络的管理和运营成本飙升;最终受害的还是企业。直到现在,软件定义存储技术才慢慢开始扭转这种局面,慢慢将企业拉出存储体系结构的深渊。现在,虽然数据中心已经实现了大面积运算,但CPU+GPU+FPGA+ASIC的复杂计算架构依然有可能将企业拖入AI基础设施的深渊,让数据中心面临挑战20年前。困境。显然,这一切还没有引起足够的重视。诚然,人工智能的兴起可以让企业在数字时代的竞争中获得巨大优势,有望彻底改变人们生活和企业运营的效率和模式,但这种粗放的发展思路仍然值得数据中心经理。注意。指望在复杂多变的人工智能市场建立统一的管理运营框架是不现实的;指望初出茅庐的AI芯片独角兽从未来整个数据中心的管理和运营角度来设计产品也是不现实的。不太可能。但从市场规律来看,在新的颠覆性技术出现之前,谁能解决这个问题,谁就能成为未来AI硬件市场真正的赢家。基于此,最有希望的赢家仍然是像英特尔和谷歌这样的大公司。他们不仅具备设计数据中心架构的能力和经验,更具备引领行业发展的资本和实力。属于华为的海思,也有可能凭借华为丰富的设备制造和系统建设底蕴,分一杯羹未来的市场。但对于近几年才兴起的地平线、比特大陆、寒武纪等新公司来说,数据中心仍然是一个庞大且不可控的存在,其未来最好的归宿或许还是收购。当然,FPGA和GPU解决方案由于灵活性相对较高,依然可以轻松兼容各种数据中心管理架构,这对于近期股价持续下跌的NVIDIA来说或许是个好消息。
