当前位置: 首页 > 科技观察

2022ODCC峰会上,华为为数据中心持续进化提供了哪些解题思路

时间:2023-03-12 05:47:36 科技观察

2022年9月5日,一年一度的开放数据中心(ODCC)峰会在北京召开。本届峰会以“畅享精彩算力,共赴低碳未来”为主题,邀请了众多业内知名专家和企业,共同探讨数据中心可持续发展所面临的挑战。双碳减排及多种可行方案。对策。作为ODCC生态的重要参与者,华为不仅参加了本次峰会的多个环节,还以主题分享和准确的展台内容,对这一复杂的问题进行了全面的解答。华为中国政企媒体系统部总经理李腾获得“ODCC优秀合作伙伴”称号。在华为看来,要实现低碳算力发展,简单来说就是一个PUE问题,但真正标本兼治的答案是各种算力的融合发展。数据中心通过将多种算力合二为一,综合利用,能够实现不同类型业务负载与专用算力硬件之间的精准匹配,让不同类型的基础设施尽可能各取所需。擅长的任务总是工作在高效率区间;从而实现数据中心业务产出和能耗的增减,同时实现低碳和算力的两大目标。对此,华为计算产品线品牌与行业营销总监白晨表示,实现低碳发展,推动多元算力融合,绝不是传统算力与AI算力的简单积累,但需要计算能力、通信、操作系统和应用使能等多重因素的综合考虑;实用的方法是“硬件集成和软件集成”。实现这一目标并不容易,但幸运的是,华为找到了一条可行的实践路径。华为计算产品线品牌与行业营销总监白晨发表主题演讲《以算力筑基,以绿色DC开创数字智能未来》DC作为计算机,让下一代数据中心高度协同像电脑这样的中央机架规模已经达到520万台,过去5年的复合增长率超过30%。此外,对非结构化数据处理和人工智能计算的需求仍在快速增长;到2030年,对人工智能算力的需求将达到现在的500倍。”这是白晨在ODCC主论坛分享环节给出的一组数字,既说明了数据中心的重要性,也展示了多元化算力发展的巨大前景。但数据中心在扩充算力的同时,也要提前规划,为异构算力的高效应用做好铺垫。在这个领域,华为的解决思路是“硬件一体化,软件一体化”。1.硬件集成针对众多数据中心面临的能效、部署周期、管理、空间等挑战,华为携手合作伙伴推出液冷机柜新品。通过计算平台、服务器节点、电源、网络、布线、散热一体化设计,新型集群机柜在性能上不仅可以做到“一机柜顶四机柜”,节省70%的机房空间空间,还通过冷板液冷技术、集中供电、全背板总线设计,实现能效、部署、运维性能的全方位升级。以机柜为单位进行预制、交付和部署,数据中心用户的产品交付周期也可以从过去的3-4个月缩短到1周,并且在安装过程中实现0水管接、0电线路连接,和0信号线连接的简化部署。2、软件集成与硬件系统的整体考虑相同。华为在系统和软件层面也不遗余力;其重点是欧拉生态与北冥多元计算融合架构与鸿蒙、openGauss等一系列基础软件的相互融合。祝福。近两年,华为完成了Euler操作系统的开源,并将Euler捐赠给了OpenAtom开源基金会。由此,Euler也从一个由创始公司主导的开源项目,演变为行业共建、社区自治,以更加开放的模式整合全球开发者贡献,openEuler生态保持快速发展。得益于众多生态合作伙伴的贡献,openEuler实现了ARM、x86、RISC-V+GPU、NPU、DPU等主流处理器指令集计算架构100%覆盖。整机100台,板卡300多块。可以说,openEuler已经成为支持多样化算力的最佳数字基础设施开源操作系统。在高速发展的AI计算领域,华为通过北冥多元计算融合架构的持续更新,进一步拓展升腾AI的能力、效率和适用场景。北冥多元计算融合架构,可支持基础设施层面的算力统一调度,形成基础使能层;此外,它还提供了统一的开发工具链和管理软件,让开发者、算力用户和数据中心都可以在一套框架内高效协作,达到“书同文、车同”的效果追踪”。从传统计算平台到应用于各种场景的多种加速卡,从服务器和存储产品生态到兼顾算力、密度和能效的液冷集群机柜,从服务器使用的操作系统到辅助多样化计算华为正在与生态系统合作,为整个数据中心行业的上下游提供相互兼容、高效、快速迭代的产品和解决方案体系,让复杂、庞大、多样的数据中心也能像单台电脑一样有机运行并且高效。这是从更高维度解决应用需求、算力发展、绿色节能等一系列复杂问题的可靠解题思路。多方发力,为算力的高效和安全打下坚实的基础在给出算力问题的答案之后,我们还必须关注数据中心在网络通信、安全和可靠性方面面临的诸多现实挑战。在系统网络结构方面,数据中心每个节点有1-4个处理器和0-N个GPU、NPU或DPU;而数据中心中这样的节点有几万个,甚至十几万个。并且随着分布式软件架构的快速普及,数据中心要面对的业务往往不再是节点内或单节点到单节点的资源协同,而是多对多的大规模跨节点合作。要解决如此规模和复杂的问题,我们当然需要更先进的数据中心通信技术。在本次峰会的新技术与测试元器件论坛上,华为DCN标准代表卢云萍女士分享了解决这一问题的最新方法——NDMA(NetworkDMA)技术。卢云萍女士表示:NDMA技术以减少多对多集体通信任务的完成时间为优化目标;通过端网协同构建统一的传输框架,将多对多的通信逻辑下沉到网络/传输层。与RDMA、NDMA等点对点传输相比,减少额外的系统开销,优化多对多通信吞吐量和时延性能,打破分布式系统性能扩展的天花板,提供大规模数据中心为多算力协同和分布式业务系统的不断演进提供了更有力的支持。华为DCN标准代表卢云平发表主题演讲《NDMA,分布式系统高效传输新探索》在安全方面,华为安全解决方案首席架构师王宇辰在本次峰会的安全分论坛上分享了全新的“弹性”安全理念。王雨辰表示:目前,因为安全只是为了防御威胁,所以系统被攻破是必然的结果。华为的“弹性”安全架构并非旨在竭尽全力对抗威胁,而是致力于通过“三维”技术体系构建可信、弹性的网络安全环境,确保系统行为始终可预见、可预见。已验证的安全状态。确保关键信息系统在“漏洞开放、威胁威胁、防御失效”的极端情况下,确保业务安全的底线。华为安全产品线首席架构师王宇辰发表主题演讲《建立韧性安全,确保安全底线》同时,在本次峰会上,华为参与制定的《分布式存储多协议融合互通技术规范》正式发布。该规范的诞生打破了当前多个分布式存储系统在综合部署时经常面临的数据格式壁垒,可以帮助用户实现0副本的数据格式转换,极大地提高多样化数据的分析效率。该规范项目经理、华为高级标准工程师赵丽丽荣获“2022ODCCMangerAward”展位并在华为展区展示,展示了围绕数据中心计算、数据中心网络的最新技术成果和生态进步和数字基础设施操作系统。展示了“多元化算力,扎根DC”的理念。华为以“多元算力,打造数据中心”为主题,展示了硬件集成、软件集成、多点发力;为数据中心的持续快速发展铺平道路。从整体市场趋势来看,2030年之前,处于起步阶段的AI市场仍处于起步阶段。将迎来算力500倍的扩容,而本已体量巨大的通用算力市场仍将实现10倍的算力增长。诚然,在如此快速的增长下,数据中心行业仍然面临着很多挑战,解决了很多具体问题;我们希望通过硬件融合、软件融合,多方努力,助力ICT产业快速演进,构建安全稳定的互联网基础设施,使数字经济在持续发展的基础上获得快速转型的能力。技术和计算能力的进步。