每一次华为的新动作,都是褒贬不一。9月18日全联接大会上刚刚发布的“全球最快AI产品”就是如此。但从现场和华为内部来看,这只是“华为计算”努力的成果。Strategy”,正是这场筹码与算力博弈的关键棋子。△华为云&AI产品与服务总裁侯金龙与Atlas(古希腊神话中的“大力士”)相比,华为在不到三年的时间里发布了10款商用芯片:鲲鹏916、920;麒麟970、980、810、990、9905G;升腾310、910;鸿鹄818。根据泄露的计划,未来两年至少有6款芯片发布落地。无论是计算领域,还是半导体行业,在这样的大战中,势头都异常的激烈。那么背后的原因是什么?华为究竟想做什么?计算战略发布后,就该来完整的看一看这场大局,揭开华为在计算背后的种种计划和布局。经过15年的努力,目前有20,000名工程师投入到计算这一从十多年前开始的产业投资中。最具标志性的事件之一是2004年4月,其芯片公司海思半导体成立。??华为云&AI产品与服务总裁侯金龙透露这背后的投资:从2004年开始投入第一颗嵌入式处理芯片的研发,目前投入了2万多名工程师,形成了“鲲鹏+升腾”核心核心基础芯片系列。基本芯片家族带来的意义是非常直接的。华为成为业界唯一拥有“CPU、NPU、存储控制、网络互联、智能管理”五大计算架构关键芯片的厂商。但一切都结束了。从产品发布的节奏来看,华为在芯片方面的投入还在快速增加,迭代也越来越快。此前华为投资芯片的战略也曾曝光过。可以用三个关键词来概括:量产一代、研发一代、策划一代。以鲲鹏系列处理器为例,从2007年到现在已经12年了,现在已经是第三代芯片了。现在华为释放的最新信号是:鲲鹏+升腾将长期进化,按照每年推出一代的节奏提升竞争力。这也是华为在不到3年的时间内推出10款芯片的直接推动力之一。当然,上述努力和产品只是结果,细看“因”才是华为对行业变化趋势的核心判断。华为芯片的机遇:风云变幻下的2万亿市场在华为看来,当前计算产业正在发生深刻变革,尤其是整个社会都在迈向智能时代,这带来了变化和挑战,也带来了机遇。在全连接大会上,胡厚昆引用了Gartner的数据——全球计算产业的总空间是2万亿美元。在他看来,这是一片大蓝海,华为将坚定不移地投入计算领域,并推动其落地。侯金龙进一步阐述了四大趋势,也可以说是华为投资芯片进入这片蓝海的主要切入点:一是数据中心不够用。对于数据中心来说,过去它承担的功能更多的是存储,但未来更重要的是,数据中心正在逐渐向计算中心演进。最直接的表现就是大型数据中心的服务器越来越多。以华为云的数据中心为例,其中60%是用于计算的服务器。可以说,计算正在成为数据中心的主体。这是华为推广鲲鹏系列芯片的重要原因之一,也是鲲鹏芯片的使用场景。与此同时,整个行业对AI算力的需求也在不断增加,而且更加汹涌。从2012年到2018年,AI算力消耗增长了近30万倍。现在年增长率超过10倍,到2025年,AI算力将占到数据中心算力的80%以上。正是在这样的算力需求下,华为推出了升腾910、Altas900等AI计算产品。其次,端侧芯片与中心芯片之间还有很大差距。在华为看来,Arm的生态优势会逐渐延伸到数据中心。对于华为来说,这既是挑战也是机遇。现场,侯金龙还分享了一组数据:2018年Arm处理器出货量为230亿颗,主要用于终端和边缘,而数据中心端只有3000万颗,差距很大数百次。每年有超过十亿部手机基于Arm架构。2019年,华为智能手机的总算力将是今年全球数据中心新增算力的2倍,数百万手机应用基于Arm生态。之前基于Arm的技术之所以不能用在数据中心,核心的限制就是性能。但以解决问题为导向,华为现在已经找到了对策。今年发布的鲲鹏920兼容Arm,多核,高并发。将四核合二为一,性能超过业界通用CPU性能的20%。而且,在现在的计算中,简单的计算可??以在终端进行,复杂的计算可以在云端进行。如果继续使用X86架构在云端计算终端任务,效率会降低40%,而如果使用Arm架构,效率会提升40%。第三,这种绿色高性能计算虽然计算效率更高,但背后也有大量的碳排放。马萨诸塞大学阿姆赫斯特分校曾做过研究,训练单个AI模型会产生180吨碳排放。这相当于一辆普通汽车在整个使用寿命期间的排放量的三倍,以及地球上一个普通人30年日常生活的碳排放量。在算力和效率的背后,还需要对能源和环境更加友好。从芯片层面来说,需要以更低的功耗实现更高的性能。对此,华为很有信心。侯金龙表示,华为Atlas900AI训练集群只需要16个机柜就可以实现256PFLOPS的算力。要达到这样的算力,CPU需要6195个机柜,GPU需要208个机柜,升腾等NPU需要128个机柜。这背后,主要得益于升腾架构对深度学习业务的优化。此外,经过华为的板级液冷、机柜级气密绝缘等系统级优化,整个集群的功耗从4万千瓦降到了736千瓦,降幅超过50倍。终于,摩尔定律减速成为事实经过几十年的快速迭代发展,高速的摩尔定律已经变得难以实现。近五年来,通用CPU的发展遇到了很多技术瓶颈。平均单核性能每年增长不足10%,摩尔定律减速成为现实。要想进一步提升技术能力,在晶体管上想出点子太难了,需要另辟蹊径。这就是为什么华为将基础研究视为其整体计算战略的关键组成部分。最具代表性的成果就是华为自研的达芬奇架构。未来,华为的目标是通过一系列技术创新,打破能效墙、散热墙、优化墙、内存墙、高速IO墙,进一步释放计算潜力。总之,在华为看来,计算产业已经进入架构创新的黄金时代,丰富、高性能、多样化、绿色、可及的算力将成为智能社会发展的驱动力。这需要更高性能的芯片来支持,但仅仅依靠芯片是不够的。在整个华为计算战略中,芯片只是其中的一部分。华为计算战略解读:硬件开放、软件开源总体而言,华为的计算格局可以归纳为“一朵云、两翼、两台引擎+开放生态”。其中一个云是华为云。这是华为计算的核心输出渠道——芯片不直接对外销售,而是以云服务和组件的形式面向客户,优先支持合作伙伴开发整机。双引擎指的是“鲲鹏”和“升腾”。基于此,构建芯片集群、构建异构计算是华为计算战略的基础和主要动力源泉。两个翼是智能计算业务、智能数据和存储业务,是计算业务模型和直接的应用场景。开放的生态是华为计算战略的“点睛之笔”,也是今年华为全联接大会的亮点。在这方面主要分为硬件开源和软件开源两部分。目标是让大量合作伙伴形成一个开放的产业生态。硬件开放如何落地?具体到商业模式,提供基于芯片的主板/SSD/网卡/RAID卡/Atlas模块和板卡,优先支持合作伙伴开发服务器、PC等计算产品,以及自有品牌。华为在AllConnect大会上也表示,其TaiShan服务器和华为终端PC将专注于高端和内部支持。条件成熟时,将停止销售泰山服务器。在Connect大会上,除了Altas之外,华为还发布了以下硬件新品:鲲鹏主板,用于服务器和桌面产品的快速开发。采用xPU高速互联、一体机SoC、100GE高速I/O等关键技术,不仅搭载鲲鹏处理器,还内置BMC芯片和BIOS软件。同时,华为还将开放主板接口规范和设备管理规范。TaiShan系列通用服务器被誉为“最强”的通用服务器。它具有至少64个核心、8个内存通道、PCIe4.0、一体机SoC、xPU高速互联、100GE高速I/O等六大特点。此外,华为还提供多种存储密集型、计算密集型、边缘计算服务器产品,满足数据中心和边缘计算分布式演进的需求。Atlas全系列产品覆盖云、边、端场景,为训练和推理提供强大的计算能力。主要基于升腾910和310AI处理器,华为推出了Atlas900、AI训练服务器Atlas800、AI训练卡Atlas300。其中,Atlas800在4U空间内集成了8颗升腾910AI处理器,可提供2PFLOPS的超强算力,算力密度是业界同类产品的2.5倍。解码16384张1080P图片,可与训练并行处理。△8个Atlas800组成的机柜,内置64颗升腾910芯片,一个Atlas900训练集群至少由16个机柜组成。Atlas300可以提供256TFLOPS的计算能力,是目前业界主流训练卡的2倍,每秒训练图片数从965张增加到1802张。可以实现梯度参数和数据集的并行传输,梯度同步延迟最多可减少70%。此外,华为还发布了112款基于鲲鹏和升腾的云服务,其中基于鲲鹏的69款云服务和基于升腾的43款云服务,让客户和合作伙伴更容易获得鲲鹏和升腾的算力。据华为称,基于升腾的图片搜索服务和内容审核服务,价格将降低70%。软件开源软件开源伴随着硬件的开放,是硬件开放能力的放大器。继8月23日华为宣布开源AI计算框架MindSpore,8月31日发布方舟编译器框架代码后,华为在Connect大会上发布了多项软件开源计划:2019年12月31日开源服务器操作系统,20202018年6月,可覆盖70%以上企业数据库业务场景的GaussDBOLTP单机数据库开源。之后,华为将支持基于openEuler的合作伙伴发布商用操作系统,支持各行业主流应用和软件开发商将软件和应用迁移至基于openEuler的操作系统。此外,华为还将与深知度、WinbikKirin、天津麒麟、中国移动速研、普华等合作伙伴共同推出openEuler开源社区(http://openEuler.org)。您如何理解华为做什么和不做什么?随着华为计算战略的披露,“华为做什么不做什么”被反复摆上台面。您如何理解华为做什么和不做什么?侯金龙还进一步解释说,华为的重点是投资计算架构创新、处理器研发和华为云。另外,华为不做应用,但是免费支持主流应用和软件的迁移。更能体现这种态度的是华为对开发者的支持。侯金龙表示,开发商是行业的灵魂。未来五年将培养500万开发者,投入15亿美元用于产业生态的发展。那么,华为到底想做什么?胡厚昆在采访中也给出了答案:在智能时代,华为要做的是成为数字世界的“基地”。您如何看待这样的愿景?
