当前位置: 首页 > 科技观察

由于BGP配置错误,美国网络瘫痪:全球网络流量下降3.5%

时间:2023-03-18 01:11:32 科技观察

CenturyLink的一次BGP路由错误引发了整个互联网的连锁反应,导致无数联网服务瘫痪,例如Cloudflare、AWS、Garmin、Steam、Discord和Blizzard以及许多其他服务。中断始于美国东部标准时间早上6点左右,当时客户开始报告影响美国CenturyLink服务的大规模中断。在Twitter上搜索一下,就会发现突然涌入大量用户抱怨性能不佳或无数连接服务完全中断,例如Blizzard、Steam、Discord、Roblox、Cloudflare、Hulu、Slink、Reddit和AmazonAWS等。CenturyLink声称其Level3CA3数据中心导致了中断并正在调查该问题。CenturyLink的状态页面上写着:“我们的技术团队正在调查一个影响我们CA3数据中心部分服务的问题。确保我们服务的可靠性是我们的首要任务。随着事件的发展,我们将继续提供状态更新。如果您需要进一步的支持,您可以通过help@ctl.io联系我们。”故障已经解决,服务正在慢慢恢复,一些地区比其他地区需要更长的时间。AWS恢复消息BGP路由问题导致中断根据受影响客户的大量报告,今天的问题是由于CenturyLink的BGP路由问题导致的,该问题未能正确传输互联网的某些部分。为了使Internet正常运行,Internet服务提供商(ISP)、数据中心和网络提供商通告他们通过BGP路由协议路由和管理的IP地址。由于这主要是一个基于信任的系统,因此当大型ISP开始为他们不管理的IP地址范围发布路由时,可能会导致全球中断和性能问题。CenturyLink似乎在BGP路由方面犯了一个错误,这导致了今天的大范围中断。大约10分钟前,Centurylink似乎撤回了无效的BGP路由并修复了其网络问题。作为预防措施,我们暂时关闭了AS3356会话,以防Centurylink出现其他问题。我们将继续全天密切关注局势。格林威治标准时间2020年8月30日10:04,CenturyLink发现了一个影响多个市场用户的问题。IP网络运营中心(NOC)参与其中,初步研究发现有问题的flowspec广告阻止了跨CenturyLink网络的多个网络元素建立边界网关协议(BGP)。IPNOC部署了一个全局配置更改来阻止有问题的flowspec广告,从而允许BGP开始正确建立。在全网实施变更后,IPNOC观察到所有引发告警的相关服务都已清除,服务恢复到稳定状态。CenturyLink中断导致全球网络流量下降3.5%。