当前位置: 首页 > 科技观察

数据中心再讨论:成本、技术、简单、可重构性

时间:2023-03-17 21:19:50 科技观察

100G数据中心正在走向成熟,无论从哪个角度来看,其中的技术都在趋于先进。100G的数据中心已经可以承载我们想要的大部分东西,但最多装载的是人类生活的记忆和精神食粮。我们确实看到了一些计算的存在,但是这样的计算和以前时代的超级计算不一样。两种不同。如果不了解数据中心应用的目标,就无法设计出技术与应用相匹配的数据中心。光互连技术正在从100G向200G、400G迈进。或许我们可以说,100G光互连要到2018年才会有稳定的表现。所以我们基本上可以断言,之前建设的100G数据中心都是危楼或沙建房,必须要意识到其中存在的风险。现在的大数据中心基本上沿用了上个时代的100GCWDM4架构,伴随的还有AOC和DAC。今天我们有必要重提一个话题:建议将数据中心分为传输结构和互连结构两部分,传输层采用波分复用有源架构,传输层坚定采用并行PSM结构。互连层(包括平行光和平行电)。我们确实看到类FB的架构很简单,但是成本很高。因此,我们也有必要论证成本经济与建筑经济的关系。我们要做的,一定是找到一个有原则的排序关系,引导我们在艰难的取舍中做出最好的选择。100GCWDM4成为爆款产品,付出了高昂的代价。主要原因是前一个时代光芯片的稳定性和一致性不好。在上一个时代,数据中心的光互连没有标准。(幸运的是,至少我认为一飞扬在2018年8月对这款产品的设计标准是符合预期和应用的。)现在业界明白可靠性、产品寿命和维护成本是相互关联的。目前的结论基本支持CWDM4在技术实现上符合100G数据中心的主流特点,节省光纤,从维护多款不同风格的产品到维护一个等等。但是,从不同的角度来看,这个类似简单架构的结论也存在问题:1.成本昂贵:在计算互连架构时,我们往往不计算光纤的成本,因为计算这个成本是把车放在前面马,带领我们的思想走向失败。方向。就像我们盖房子一样,不考虑用多少油漆。光纤为系统服务,就像油漆为建筑物服务,或食物为人类膳食服务一样。将波分复用技术引入所有互联架构,至少需要付出2-3倍的模块成本。2、总成本不经济:我们之所以在互连机架采购中不倾向于采用更多的波分复用技术,是因为密集网络的信号分层是绝对清晰和可调度的。波分复用模块主要通过AWG或自由空间光技术将光纤成本降低3/4,但带来了高生产投入和产业良率问题。生产成本的投入和良好的产品筛选率牺牲了行业的利润空间。事实上,我们知道大部分互连距离仍然在500米以内,因此在光纤成本上的节省是有限的。3、维修费用是否经济:争议在于维修的经济性。维护的经济性在于产品的稳定性和网络的可重构性。从产品稳定性来看,目前的CWDM4产品日趋成熟可靠,但与PSM模块相比仍存在一个数量级的差距。当然,这个数量级的数据中心可以忽略不计。然后是网络的可重构性。所谓重构,就是在原来的地方推倒重来,有没有剩下的。从人类绿色经济的角度来看,如果我们要在原来的地方升级现有的网络,那么我们需要论证未来的网络架构应该是什么样的?然后我们回来检验这里的结论。两年前,我写了《数据中心:平行还是波分复用》,引起了一些批评。在实践中,数据中心也在朝着CWDM4覆盖PSM4的结构发展。就像人类走过的路一样,正确的视野被错误的路线所取代是很常见的。一个出身贫寒的孩子,在世界观和金钱观上肯定与出身富贵的孩子截然不同。2018年OFC的人确实炒作了400G,但确实不成熟。按照2018年初对400G的了解,基本上是跳过PAM4技术,直接采用100G单波DSP技术植入400G模块。那就是跳过200G,达到难以想象的400G。这一跳不是一代,而是两代。现在我们知道,这个愿望显然过于乐观了。是从NRZ到PAM4再到DSP的渐进式飞跃,还是一步到位的飞跃?我们还是要回到传输或互连本身来讨论。我觉得前两个是互联架构,DSP基本就是传输的事情。DSP与PAM4调制有着根本不同的工作。DSP能否在客户端模块中取得成功还不得而知。我基本上很难理解如何在不对链路的光层进行任何处理的情况下使用DSP来处理接收信号的失真。当然,正如我的很多观点已经随着时代的进步而逐渐被修正一样,试图争论、探索和试错也是人类科技和市场进步必经的境界。抛开技术实现的不可预测性,我们有4种分析架构涵盖200G和400G网络:其中分析的是200GNRZ架构,这是一种使用8个并行信号的架构。优点是成本很低,密度高。缺点是:光纤数量多带来物理布线的复杂性,一次性成本投入高。第二个分析是200GPAM4架构,它是FR4架构,在电域创新了调制技术。优点是成本适中,密度高,与NRZ架构相比去除了大量光纤。缺点:与100GCWDM4相同,如果有的话。第三个分析是200G/400G混合架构,会采用PAM4技术+8通道复用FR8技术。优点是成本均衡,密度极高,光纤极少。缺点:光学结构和模块性能的稳定性还有待观察。第四种分析是:400GSIIICON架构,借助SILICON技术平台可以实现理想的100G单波传输,不需要使用DSP。这种架构的优点很明显就是性价比高、密度适中、高速、网络简单。缺点是SILICON光模块属于替代技术,构思还需要时间。由此我们有一个总结:1)纯100GCWDM4架构演进为200GFR4,不能再往下演进,需要重新布线或增加光纤资源。2)100GPSM4网络架构演进为200GDR4或200GSILICONDR4,也可以继续演进到400GDR4。3)200GNRZ8通道网络提供充足的光纤资源。未来演进不成问题,一半的光纤资源很可能会被浪费掉。我们没有关注过流行的400G网络结构:400GDR4+400GFR4,基本上我们认为这种架构极难实现。这种架构是人们超越技术难点的美好幻觉,从实用的角度看不一定经济。我们理解人们(包括我们自己)总是在寻找一个紧凑、可重构且具有成本效益的数据中心,但人们的命令通常是:简单===可重构===成本===技术上可实现。这违反了事物的规律。实施违反事物规律的结果是额外的费用。人类确实没有什么做不到的,而且很多时候都是不惜一切代价任性的。从专业的角度来说,我们最好的是:成本===技术===简单===可重构。成本:数据中心必须以成本为导向。人类只有最合理、最符合整体利益的成本经济。因为经济的出发点是成本与收益的关系。无成本的产业结构扭曲了技术、简单性和世界秩序。技术:技术的实现有一个时间过程,不同时期技术的使用和成本之间存在对应关系。成本决定技术规模。而不是强迫一项技术去刻意降低成本。例如,我们为太阳能和电动汽车强制技术规模化,从而降低成本,而人类为此付出了极高的代价。简单:简单不是泛泛而谈,也不是从表面上看不出那种孩子气的简单。简单是流程设计的结果,不可能是初衷。当我们说设计必须简洁时,我们的意思是:所有的能力和技术都包含之后,找到一个简洁的表达。简单是抽象复杂的艺术。表面的简单可以理解为涂鸦或知识的一知半解。可重构:可重构非常困难。人类走过的技术路线表明,技术和网络是不可重构的,这确实造成了很多浪费。可重构任务要求人类必须按照计划进行生产和投资。以无节制浪费为基础的市场经济的本质是无法重构的。目前人类还无法实现技术的可重构性,与其好好规划,不如想想怎么重构!