当前位置: 首页 > 科技迭代

DPU 蓬勃发展,关于“未来计算”的争论再次兴起

时间:2024-02-25 12:56:56 科技迭代

图片来源:图虫创意 曾几何时,作为计算机的大脑,计算机需要 CPU。

计算机、外围设备和其他部件中存储的数据要么向CPU输入数据,要么接受CPU的指令。

后来为了减轻CPU的压力,GPU应运而生。

虽然GPU的出现是为了减轻CPU在图像处理方面的压力,但由于其出色的并行处理能力,GPU现在不仅仅局限于图像渲染,还应用于人工智能、深度学习、大数据分析等领域。

现在,随着核心网和汇聚网向100G和200G发展,接入网也达到了50G和100G,CPU无法提供足够的计算能力来处理数据包。

因此,就出现了“性能带宽增长比例不平衡”的问题。

AWS形象地称之为“数据中心税”——在运行业务程序之前,访问网络数据会占用大量的计算资源。

例如,在云计算场景中,虚拟机之间的数据转发通常需要20个VM来消耗计算能力。

如果使用Xeon多核CPU来处理,则需要大约5核的计算能力。

这是一笔巨大的开支。

阿里云弹性计算产品线负责人张贤涛曾测算,阿里云营收已达数百亿元。

如果存储和网络占用CPU资源10%左右,则意味着每年损失超过10亿元。

因此,为了继续减轻CPU的负担,DPU登场了。

对于CPU处理效率低、GPU无法处理的负载,可以卸载到专用的DPU处理。

DPU的概念是由NVIDIA推广的。

2020年上半年,英伟达以69亿美元收购以色列网络芯片公司Mellanox Technologies,并于同年推出BlueField-2 DPU,拉开了DPU的发展序幕。

NVIDIA CEO黄仁勋表示:“DPU将是未来计算的三大支柱之一。

CPU用于通用计算,GPU用于加速计算,DPU在数据中心移动数据进行数据处理。

” DPU竞争开始 DPU最早实现的领域是云计算。

许多云服务提供商很早就意识到了这个问题。

AWS从2015年开始就一直在探索DPU的发展,收购了芯片制造商Annapurna Labs,并推出了Nitro芯片。

尽管当时还不存在“DPU”这个名称,但 Nitro 被认为是 DPU 的早期形式。

随后,AWS于2017年正式推出Nitro,将网络、存储和安全任务卸载到基于Arm架构的专用设备上。

同样是在2017年,为了解决云计算业务规模扩大带来的资源竞争和算力流失的问题,阿里云推出了神龙,利用虚拟化来转移CPU存储、网络等基础。

功能性目的。

很快,阿里云以天猫双十一为试验场,并成功运营。

随后,上汽成为神龙架构的第一个测试客户。

回顾过去,2017年可以说是DPU元年。

三年后,Nvidia 将其命名为 DPU 后,它就有了统一的名称。

目前全球真正实现大规模商用DPU架构的公司只有两家:亚马逊的AWS和阿里云。

云服务商中,不仅亚马逊和阿里云在部署DPU,同样对云服务感兴趣的腾讯云也加入了DPU的研发。

为了统一算力基础,降低综合成本,腾讯自主研发了水杉和银杉两代DPU。

目前,腾讯自研DPU已支持外部公有云客户,以及微信、QQ、腾讯会议等自研业务上云。

去年加入云计算的新成员字节跳动也宣布将开发自己的DPU,并计划通过火山引擎云产品对外提供服务。

在云厂商的猛攻下,芯片厂商也并非无动于衷。

全球DPU市场竞争格局,来源:赛迪顾问,最初在DPU领域领跑的Nvidia,自然对DPU也有一些规划。

NVIDIA计划在2022年推出性能更强的BlueField3;到2022年,NVIDIA计划推出第三代DPU; 2024年,NVIDIA计划推出集成其GPU模块的BlueField4。

Marvell 最新的 OCTEON 10 系列 DPU 采用 Armv9 架构 Neoverse N2 CPU 内核和台积电 5nm 工艺技术,支持最新的 PCIe 5.0 I/O 和 DDR5 内存。

作为 DPU 的重要补充,Marvell 还为 OCTEON 10 引入了内部机器学习 (ML) 引擎。

这样,Marvell 实质上成为 Nvidia 的直接竞争对手。

英特尔也参与其中,将于2021年6月发布首款IPU产品,将其视为云战略的重要支柱之一,帮助数据中心网络加速向可编程分布式架构迈进。

2022年4月,英特尔宣布协议收购云解决方案公司Granulate,以提升其在云计算系统方面的综合协同能力; 2022年5月,英特尔发布了第二代IPU,并宣布将于2023年至2024年期间上线第三代IPU的消息。

基于端到端的可编程能力,英特尔不断在“云”中实现高效计算,释放数据中心基础设施的新潜力。

国内DPU初创公司DPU也逐渐出现在中国企业的赛道上,并随着DPU的普及而成功融资。

目前国内较受关注的DPU初创企业有:云宝智能、中科御数、芯启源、云麦芯联、星云智联、大羽智芯等。

今年6月,大鱼智信宣布完成A轮融资。

融资金额尚未公布。

本轮融资由前海方舟智能互联网产业基金、中原前海基金、齐鲁前海基金共同投资。

融资资金将用于产品研发和推广。

云豹智能也于6月完成B轮融资。

据悉,云豹本轮投后估值约为90亿元。

本轮投资方包括腾讯、淡马锡、深创投、华西村投资平台一村资本,以及民生银行上市金融控股平台民银资本和耀图资本,是腾讯对这家成立不到2年的DPU公司的第三笔投资。

9月,中科御树宣布完成数亿元B轮融资,金额超过前几轮融资。

由金融街资本领投,建行旗下建信股权跟投,老股东灵君投资、光环资本、全纵资本连续三轮跟投。

继去年11月完成数亿元Pre-A4轮融资后,新启源今年3月宣布再次获得过亿元战略投资。

本轮融资由国家集成电路产业基金子基金上海超越摩尔领投。

股东云泰资本继续坚定跟投。

可以看到,在DPU的热潮下,不少初创公司获得了巨额融资。

然而,DPU作为数据处理的主要参与者,需要与CPU和GPU同等水平的投资,但市场规模却远小于CPU和GPU。

据统计,2021年全球DPU市场规模将达到50.7亿美元,CPU市场规模将达到532亿美元,差距达10倍。

有业内人士做出了估算。

终端场景下,大芯片销量至少需要达到千万级,才能有效摊薄一次性研发成本;在数据中心场景,需要销量达到50万甚至100万才有效。

稀释研发成本。

根据Fungible、Pensando等海外DPU初创公司所需的高级开发人员规模、研发时间、需要购买的IP和测试工具以及这些公司筹集的资金,可能需要大约比美国更多的成本3亿美元实现客户量产。

这就决定了DPU不可能是一个简单的创业“游戏”。

DeepTech曾总结,打造一家成功的DPU芯片公司至少需要六大条件:一是高端芯片开发经验;第二,大量的商业实施经验;第三,有成功创业经验的团队;第四、非常熟悉云计算客户业务;第五,与主要云计算客户合作密切,具有丰富的场景实践经验;第六,需要大量的融资。

从创始人的经历来看,很多初创公司可能缺乏高端芯片开发经验,或者缺乏与领先云服务商合作的经验。

他们能否走到最后,还是一个问号。

肖启阳,云豹智能创始人,博士毕业。

美国斯坦福大学博士,随后在硅谷创立RMI;中科御数创始人严桂海,中科院出身;新启源,创始人路胜有销售USB和TCAM芯片的背景;智信创始人大宇李爽曾任美团公有云负责人,对云业务有一定了解。

这四家公司的创始人都有相关背景。

公开资料显示,云麦芯联、星云智联等公司创始人均没有研发高端芯片或创业的经验。

云麦信联创始人刘永峰拥有技术出身,曾就职于阿里巴巴、华为。

公开信息未显示其创始人有高端芯片研发及创业经验;星云智能网络,两位创始人是夏路生和于勇。

夏路生曾任安信证券研究中心通信行业首席分析师。

没有任何公开信息可以查到于勇在芯片行业的背景。

即便是强大如Nvidia,其DPU也发布了两年左右,使用的人数仍然不是很多,更不用说在芯片方面发展相对较少的中国芯片初创企业了。

目前能取得成果的只有中科御数和云宝智能两家公司。

成立仅一年,中科御数首款芯片就已顺利完成流片,并实现了业界首个集成数据库和时序数据处理加速芯片的突破。

中科御数第三代DPU芯片的研发迭代也已接近尾声。

中科御数第二代DPU芯片K2已于今年年初投产,预计10月份发布。

云豹首款DPU SoC(片上系统)正处于开发阶段,计划明年量产。

去年年底,云宝发布了基于FPGA的DPU云霄版本。

与CPU、GPU等一样,DPU结构复杂、开发周期长、投资高。

2020年、2021年起步的中国DPU初创企业,算上早期团队组建时间,发展周期只有一年左右。

市场期待量产产品何时出现。

总结:其实,梳理中国DPU行业的商业模式后,可以分为两种类型。

一是以新启元为代表,采用自主研发的中高级软件、外购处理器和网络芯片。

该方法门槛适中。

DPU生产线的核心研发团队至少需要10人,预计需要5至5。

8年才能收回前期成本。

另一种方式,以中科御数、云豹为代表,自研处理器微架构和中高层软件以及外包网络芯片。

这种方法门槛较高。

DPU生产线的核心研发团队必须至少有40人。

人们。

DPU没有统一标准,需要与云计算基础设施紧密结合,存在产品通用性问题,没有明确的大客户。

这些都是DPU创业会遇到的问题。

目前解决DPU的标准化应用还存在一定的挑战。

由于数据中心本身的复杂性,各大厂商一方面采用商用现成组件(即COTS)来构建系统以追求低成本,另一方面尝试对服务进行分层,打造标准化产品针对不同类型的客户。

但除此之外几乎所有其他技术实现都是“八仙过海,各显神通”。

中科御数创始人颜桂海也表示:“有的厂商加强IO能力,有的专注于路由转发,有的专注于存储分流,有的专注于安全加密等等。

”不同的上层负载必然对底层架构有不同的要求,这可能是目前DPU标准化面临的最大挑战。