网络世界以思维方式的广泛转变而闻名,并且经常推动网络行业的炒作周期。范式转换有很多,比如集中控制平台,分散控制平台,各种路由协议和范式。目前正在进行的一个重大变革是支持公有云或私有云的叶脊数据中心架构,可以认为是将网络、计算和存储资源作为计算能力的单位进行出售。数据中心结构通常基于最初为电话网络设计的CLOS结构,其中准入控制是服务质量的主要手段。在电路交换领域,网络性能指标本质上是分配固定数量的带宽,如果没有可用带宽则拒绝连接。这些原始的LOS网络已经通过折叠(或双向传递流量)和构建不同的变体(例如Benes和Butter)来适应计算机网络。这些更通用的叶脊网络对导纳控制之外的网络性能指标提出了挑战。以下是网络面临的一些挑战。例如,在一个网络中,主机1和主机2之间有256条路径。那么可以收集什么样的网络性能指标来了解网络的运行情况呢?收集每个接口的队列深度、丢弃数和TCP重新传输将提供网络性能的可靠一般视图。但是除了这个抽象视图之外,很难看出如何收集信息来帮助任何一个应用程序更有效地运行。下面是一个更具体的示例:如果应用程序性能不佳,并且您怀疑问题出在网络中,您会从哪里开始进行故障排除?很难追踪任何数据包或数据包通过这些类型的广泛等价多路径网络流的路径来识别可能存在问题的地方。一种可能的答案是向网络添加更多状态,尤其是在网络性能指标方面。例如,如果您使用IPv6版本的SegmentRouting(SRv6),则可以为网络接受的每个数据包添加一个标头,并在数据包标头上添加路径列表。由于SRv6在交换期间不会删除或修改此标头,因此在路径中的任何点检查数据包标头都将揭示数据包通过网络所采用的路径。有许多不同的方法可以添加跟踪网络中单个流量所需的信息类型,但每种方法都需要权衡取舍。添加这些网络性能指标可以生成大量新信息,网络管理系统必须使用、管理、分类和考虑这些信息。人们还必须在解决问题、容量规划和总体了解网络健康状况的过程中使用这些信息洪流。这些问题尚未完全解决,但它们可能是研究、机器学习和网络管理系统设计和部署中更强大的架构方法的新方向。
