图片来源:图虫创意 曾几何时,作为计算机的大脑,计算机需要 CPU。
计算机、外围设备和其他部件中存储的数据要么向CPU输入数据,要么接受CPU的指令。
后来为了减轻CPU的压力,GPU应运而生。
虽然GPU的出现是为了减轻CPU在图像处理方面的压力,但由于其出色的并行处理能力,GPU现在不仅仅局限于图像渲染,还应用于人工智能、深度学习、大数据分析等领域。
现在,随着核心网和汇聚网向100G和200G发展,接入网也达到了50G和100G,CPU无法提供足够的计算能力来处理数据包。
因此,就出现了“性能带宽增长比例不平衡”的问题。
AWS形象地称之为“数据中心税”——在运行业务程序之前,访问网络数据会占用大量的计算资源。
例如,在云计算场景中,虚拟机之间的数据转发通常需要20个VM来消耗计算能力。
如果使用Xeon多核CPU来处理,则需要大约5核的计算能力。
这是一笔巨大的开支。
阿里云弹性计算产品线负责人张贤涛曾测算,阿里云营收已达数百亿元。
如果存储和网络占用CPU资源10%左右,则意味着每年损失超过10亿元。
因此,为了继续减轻CPU的负担,DPU登场了。
对于CPU处理效率低、GPU无法处理的负载,可以卸载到专用的DPU处理。
DPU的概念是由NVIDIA推广的。
2020年上半年,英伟达以69亿美元收购以色列网络芯片公司Mellanox Technologies,并于同年推出BlueField-2 DPU,拉开了DPU的发展序幕。
NVIDIA CEO黄仁勋表示:“DPU将是未来计算的三大支柱之一。
CPU用于通用计算,GPU用于加速计算,DPU在数据中心移动数据进行数据处理。
” DPU竞争开始 DPU最早实现的领域是云计算。
许多云服务提供商很早就意识到了这个问题。
AWS从2015年开始就一直在探索DPU的发展,收购了芯片制造商Annapurna Labs,并推出了Nitro芯片。
尽管当时还不存在“DPU”这个名称,但 Nitro 被认为是 DPU 的早期形式。
随后,AWS于2017年正式推出Nitro,将网络、存储和安全任务卸载到基于Arm架构的专用设备上。
同样是在2017年,为了解决云计算业务规模扩大带来的资源竞争和算力流失的问题,阿里云推出了神龙,利用虚拟化来转移CPU存储、网络等基础。
功能性目的。
很快,阿里云以天猫双十一为试验场,并成功运营。
随后,上汽成为神龙架构的第一个测试客户。
回顾过去,2017年可以说是DPU元年。
三年后,Nvidia 将其命名为 DPU 后,它就有了统一的名称。
目前全球真正实现大规模商用DPU架构的公司只有两家:亚马逊的AWS和阿里云。
云服务商中,不仅亚马逊和阿里云在部署DPU,同样对云服务感兴趣的腾讯云也加入了DPU的研发。
为了统一算力基础,降低综合成本,腾讯自主研发了水杉和银杉两代DPU。
目前,腾讯自研DPU已支持外部公有云客户,以及微信、QQ、腾讯会议等自研业务上云。
去年加入云计算的新成员字节跳动也宣布将开发自己的DPU,并计划通过火山引擎云产品对外提供服务。
在云厂商的猛攻下,芯片厂商也并非无动于衷。
全球DPU市场竞争格局,来源:赛迪顾问,最初在DPU领域领跑的Nvidia,自然对DPU也有一些规划。
NVIDIA计划在2022年推出性能更强的BlueField3;到2022年,NVIDIA计划推出第三代DPU; 2024年,NVIDIA计划推出集成其GPU模块的BlueField4。
Marvell 最新的 OCTEON 10 系列 DPU 采用 Armv9 架构 Neoverse N2 CPU 内核和台积电 5nm 工艺技术,支持最新的 PCIe 5.0 I/O 和 DDR5 内存。
作为 DPU 的重要补充,Marvell 还为 OCTEON 10 引入了内部机器学习 (ML) 引擎。
这样,Marvell 实质上成为 Nvidia 的直接竞争对手。
英特尔也参与其中,将于2021年6月发布首款IPU产品,将其视为云战略的重要支柱之一,帮助数据中心网络加速向可编程分布式架构迈进。
2022年4月,英特尔宣布协议收购云解决方案公司Granulate,以提升其在云计算系统方面的综合协同能力; 2022年5月,英特尔发布了第二代IPU,并宣布将于2023年至2024年期间上线第三代IPU的消息。
基于端到端的可编程能力,英特尔不断在“云”中实现高效计算,释放数据中心基础设施的新潜力。
国内DPU初创公司DPU也逐渐出现在中国企业的赛道上,并随着DPU的普及而成功融资。
目前国内较受关注的DPU初创企业有:云宝智能、中科御数、芯启源、云麦芯联、星云智联、大羽智芯等。
今年6月,大鱼智信宣布完成A轮融资。
融资金额尚未公布。
本轮融资由前海方舟智能互联网产业基金、中原前海基金、齐鲁前海基金共同投资。
融资资金将用于产品研发和推广。
云豹智能也于6月完成B轮融资。
据悉,云豹本轮投后估值约为90亿元。
本轮投资方包括腾讯、淡马锡、深创投、华西村投资平台一村资本,以及民生银行上市金融控股平台民银资本和耀图资本,是腾讯对这家成立不到2年的DPU公司的第三笔投资。
9月,中科御树宣布完成数亿元B轮融资,金额超过前几轮融资。
由金融街资本领投,建行旗下建信股权跟投,老股东灵君投资、光环资本、全纵资本连续三轮跟投。
继去年11月完成数亿元Pre-A4轮融资后,新启源今年3月宣布再次获得过亿元战略投资。
本轮融资由国家集成电路产业基金子基金上海超越摩尔领投。
股东云泰资本继续坚定跟投。
可以看到,在DPU的热潮下,不少初创公司获得了巨额融资。
然而,DPU作为数据处理的主要参与者,需要与CPU和GPU同等水平的投资,但市场规模却远小于CPU和GPU。
据统计,2021年全球DPU市场规模将达到50.7亿美元,CPU市场规模将达到532亿美元,差距达10倍。
有业内人士做出了估算。
终端场景下,大芯片销量至少需要达到千万级,才能有效摊薄一次性研发成本;在数据中心场景,需要销量达到50万甚至100万才有效。
稀释研发成本。
根据Fungible、Pensando等海外DPU初创公司所需的高级开发人员规模、研发时间、需要购买的IP和测试工具以及这些公司筹集的资金,可能需要大约比美国更多的成本3亿美元实现客户量产。
这就决定了DPU不可能是一个简单的创业“游戏”。
DeepTech曾总结,打造一家成功的DPU芯片公司至少需要六大条件:一是高端芯片开发经验;第二,大量的商业实施经验;第三,有成功创业经验的团队;第四、非常熟悉云计算客户业务;第五,与主要云计算客户合作密切,具有丰富的场景实践经验;第六,需要大量的融资。
从创始人的经历来看,很多初创公司可能缺乏高端芯片开发经验,或者缺乏与领先云服务商合作的经验。
他们能否走到最后,还是一个问号。
肖启阳,云豹智能创始人,博士毕业。
美国斯坦福大学博士,随后在硅谷创立RMI;中科御数创始人严桂海,中科院出身;新启源,创始人路胜有销售USB和TCAM芯片的背景;智信创始人大宇李爽曾任美团公有云负责人,对云业务有一定了解。
这四家公司的创始人都有相关背景。
公开资料显示,云麦芯联、星云智联等公司创始人均没有研发高端芯片或创业的经验。
云麦信联创始人刘永峰拥有技术出身,曾就职于阿里巴巴、华为。
公开信息未显示其创始人有高端芯片研发及创业经验;星云智能网络,两位创始人是夏路生和于勇。
夏路生曾任安信证券研究中心通信行业首席分析师。
没有任何公开信息可以查到于勇在芯片行业的背景。
即便是强大如Nvidia,其DPU也发布了两年左右,使用的人数仍然不是很多,更不用说在芯片方面发展相对较少的中国芯片初创企业了。
目前能取得成果的只有中科御数和云宝智能两家公司。
成立仅一年,中科御数首款芯片就已顺利完成流片,并实现了业界首个集成数据库和时序数据处理加速芯片的突破。
中科御数第三代DPU芯片的研发迭代也已接近尾声。
中科御数第二代DPU芯片K2已于今年年初投产,预计10月份发布。
云豹首款DPU SoC(片上系统)正处于开发阶段,计划明年量产。
去年年底,云宝发布了基于FPGA的DPU云霄版本。
与CPU、GPU等一样,DPU结构复杂、开发周期长、投资高。
2020年、2021年起步的中国DPU初创企业,算上早期团队组建时间,发展周期只有一年左右。
市场期待量产产品何时出现。
总结:其实,梳理中国DPU行业的商业模式后,可以分为两种类型。
一是以新启元为代表,采用自主研发的中高级软件、外购处理器和网络芯片。
该方法门槛适中。
DPU生产线的核心研发团队至少需要10人,预计需要5至5。
8年才能收回前期成本。
另一种方式,以中科御数、云豹为代表,自研处理器微架构和中高层软件以及外包网络芯片。
这种方法门槛较高。
DPU生产线的核心研发团队必须至少有40人。
人们。
DPU没有统一标准,需要与云计算基础设施紧密结合,存在产品通用性问题,没有明确的大客户。
这些都是DPU创业会遇到的问题。
目前解决DPU的标准化应用还存在一定的挑战。
由于数据中心本身的复杂性,各大厂商一方面采用商用现成组件(即COTS)来构建系统以追求低成本,另一方面尝试对服务进行分层,打造标准化产品针对不同类型的客户。
但除此之外几乎所有其他技术实现都是“八仙过海,各显神通”。
中科御数创始人颜桂海也表示:“有的厂商加强IO能力,有的专注于路由转发,有的专注于存储分流,有的专注于安全加密等等。
”不同的上层负载必然对底层架构有不同的要求,这可能是目前DPU标准化面临的最大挑战。