当前位置: 首页 > 科技观察

数据中心网络拥塞简介

时间:2023-03-19 21:31:41 科技观察

为了给用户提供优质的云服务,微软、谷歌、亚马逊、阿里巴巴等众多大型互联网公司在全球建设了众多的数据中心。在数据中心内部,数以万计的服务器通过高带宽(10-100Gbps)、低延迟(0-100us)的数据中心网络(DataCenterNetwork,DCN)相连。许多对延迟敏感的实时应用程序在数据中心运行,例如电子商务零售、搜索和社交网络。这些实时应用的用户请求需要尽快得到响应,高响应延迟会严重影响用户体验,降低公司的营业收入。数据中心网络流量以其突发性着称。当流量瞬间爆发时,很容易在流量接收端产生拥塞(endpointcongestion)。路由选择不当还会导致网络内部流量不平衡,造成内部拥塞(链路拥塞)。网络拥塞一般可以通过负载均衡机制来解决。一旦发生拥塞,网络时延和流量吞吐量都会受到影响,导致应用响应延迟变长,用户体验变差。传统数据中心的内部网络是有损网络,网络严重拥塞时交换机可以直接丢弃数据包。由于数据中心交换机的小缓冲区和数据中心流量的突发性,拥塞导致的数据包丢失在数据中心非常普遍。丢包的后果会造成高重传延迟,从而影响实时应用的性能。学术界和工业界都非常关注传统有损数据中心网络的拥塞问题,并采取了一系列拥塞控制机制来减少网络中的排队和拥塞丢包问题。即便如此,这些机制也很难完全避免拥塞造成的丢包。众所周知的DCTCP协议在网络拥塞不严重时可以有效控制交换机队列长度,但当并发连接数较多时,DCTCP仍然难以避免交换机缓冲区溢出。为了彻底解决拥塞丢包问题,很多公司都尝试在数据中心部署无损网络。