今年6月,全球知名网站发生大规模宕机。国内网友的感受可能没那么强烈,但国外很多知名网站都受到了影响。图片来自Pexels。大规模停电持续了一个小时。受影响网站包括Google、Twitter、Amazon、eBay、Target、Reddit、PayPal、Square、Spotify、Twitch,以及《卫报》、《金融时报》、《独立报》、《纽约时报》、CNN、BBC、TechRadar等各大媒体网站。01日晚,网友访问这些网站时,网站无法正常显示,并提示“错误503服务不可用”。连英国政府网站gov.uk也中招了!就在网友猜测是什么原因导致多家大型网站集体宕机时,一家“不知名”的公司宣称此次大规模宕机可能与他们有关:“目前我们的内容分发网络服务(ContentDeliveryNetwork)的潜在影响是正在调查中。”公司是一家叫Fastly的公司,他们的主营业务是提供互联网内容分发服务,他们的主要产品是边缘计算平台,实际上提供内容分发网络(CDN)、网络安全服务、负载均衡、以及videostreaming,因为很多公司要服务全球用户,全球用户要访问他们的网站,所以需要通过网络从他们的服务器加载资源,这就是Fastly做的,也就是提供可以传递服务器资源的服务离终端用户更近更快,相当于把服务器上的资源预加载到自己的CDN节点中,用户访问网站时,只需要从他们那里获取服务器资源,不需要直接和远程服务器交互,大大缩短了时间02美国太平洋时间8日凌晨2点58分,在Fastly表示全球大量网站与Inter断开连接后net和它们相关,人们开始指定失败的原因。许多人的第一个想法是它可能已被黑客入侵。甚至很多想象力丰富的朋友,脑海中都上演了一场黑客攻防大戏。大约一个小时后,太平洋时间8日凌晨4点10分,Fastly表示他们已经找到并解决了问题。“我们发现一个服务配置变更导致了全球服务的短暂中断,这个配置已经关闭,我们的全球服务网络已经恢复正常。"serverconfigurationchange???这怎么看都是低级错误,这个解释显然让很多程序员接受不了,这么重要的系统,配置推送不就灰度了吗?后来,就是说这个配置错误最初是在5月份的一个release中引入的,直到6月份才触发这个bug。看了相关报道,我在想肯定又要怪程序员了。这么大的影响肯定是个P0-levelfault嗯,这样的失败,起码得开除一个副总裁级别的人吧?不过,事后的发展出乎我的意料。03本以为这件事会被Fastly的道歉弥补,高管引咎辞职,程序员被解雇。然而,一个有趣的现象发生了,当人们知道重大失败的主要责任是Fastly时,公司股价上涨了10%以上在盘中。因为,很多人都知道,这家自己从来没有听说过的公司,竟然和那么多大公司有合作关系,能够有这么大的影响力。而且,更让大家确信这家公司有未来的是,当天的失败,全球最大的云服务商亚马逊也倒下了。所以……这件事一出,大家瞬间就知道了一家叫Fastly的公司。在这次事件中,有几点需要大家注意:边缘计算云服务现在的应用非常广泛。一旦云服务商出了问题,那肯定是个大问题。如何保证云服务的稳定性是一个长期的话题。这么大的故障,1小时左右就能发现、定位并解决,这家公司的效率已经很高了。网上换车需谨慎!!!哪怕是一行配置!最后,本文内容不构成任何投资建议!!!来源:转载自公众号codeoutofthefuture
