当前位置: 首页 > 科技观察

2021年的八场IT灾难

时间:2023-03-18 17:30:19 科技观察

从安全漏洞到软件工程故障,这些备受瞩目的IT灾难今年对现实世界造成了严重破坏。让它们作为警示故事。对于几乎任何规模的公司而言,IT都是业务运营的代名词。因此,当技术失败时,公司可以关门大吉。IT故障,无论是复杂的系统还是项目,都越来越多地出现在商业新闻页面上,它们的影响可能变得更具破坏性——而且令人尴尬。我们汇总了2021年最大的八个技术危机,以突出各种近乎灾难性的IT问题,这些问题不仅会突然出现,而且会对您的业务产生巨大影响。除了幸灾乐祸之外,我们希望这些IT灾难故事能给您带来启发,即使您的组织远不及这些故事中的一些主角那么大或面临风险。1.为什么应该设计更好的用户界面许多公司倾向于对他们的IT工具采取“如果它没有坏,就不要修复它”的态度,如果你曾经参与过拙劣的升级或部署,你会知道为什么。但这可能会导致一些真正过时的系统在生产使用中使用可追溯到软件行业早期的用户界面——这反过来又可能意味着可用性问题和现实世界的后果。花旗银行的后端系统就是这种趋势的一个很好的例子,也是造成5亿美元业务失败的主要原因之一。故事是这样的:花旗银行试图代表其客户之一露华浓向露华浓的几位债权人支付780万美元的利息。在Flexcube中执行此操作是一个特别繁琐的过程,将大部分付款发送到花旗银行内部账户,而只有利息部分发送给债权人。尽管三个不同的人签署了露华浓的交易,但它没有勾选所有适当的框就这样做了,并发出了9亿美元,其中大部分直到2023年才归还债权人。你可能会发现这种错误并非闻所未闻--你会惊讶地发现,受益人经常将错误发送的钱退回给出错的公司。但这一次情况有所不同:超过一半的资金流向了各种对冲基金,贷款条款之前重新谈判后对露华浓有利。他们说,他们认为这笔钱是他们欠债的提前偿还,今年法官裁定他们不必归还这笔钱。这里的重要教训是至少要使您的UI现代化,以确保员工能够以精简、连贯的方式履行职责——如果人们对您的愤怒程度不足以利用它,那么犯错的痛苦就会减少。2.法国银行客户看到彼此的账户法国银行LCL的客户于2月23日登录他们的银行应用程序,却发现他们正在查看别人的信息。消息迅速在推特上传播开来,许多人猜测这可能是网络攻击的结果。但根据银行自己的说法,这实际上是一天之内纠正的软件错误的结果。当然,此类开发失误是公司内部失败的征兆,尤其是在银行业。后果说明了此类错误的典型之处,公司有责任将事情控制在最低限度:LCL表示没有泄露个人信息,客户只能看到其他客户的账户而不能转账,而且可能只有数百个中的一个的客户受到影响。其他人指出,交易信息可用于推测客户身份,并且在实时代码上运行漏洞利用程序时,可能有数万名用户正在登录。最终,LCL不得不争先恐后地避免遭到欧洲隐私监管机构的巨额罚款。3.当软件锁住牢门时2019年,亚利桑那州立法机构通过了一项法律,允许某些被判犯有非暴力罪行的囚犯在州立监狱完成一项计划,以加快释放速度。但这位举报人在2月份透露,一年多过去了,追踪囚犯获释资格的软件仍未更新以适应新法律。虽然国家坚持符合条件的囚犯可以而且确实可以人工重新计算他??们的刑期,但事实是,许多人可能不知道他们有资格获得释放,或者没有外部倡导者来推动他们的案件,所以他们在监狱里萎靡不振。当法律规定他们有权获得自由时挣扎。这里有几门IT课程。一是在任何系统中构建灵活性和可扩展性的重要性。另一个原因是软件不仅仅是软件:它对人类生活有着真实而深远的影响。最后,还有如何在代码中执行法律的问题——以及执行算法是否应该在立法过程中开发,而不是在法律已经制定之后。4.缅因州陈旧的人力资源系统正如《波特兰新闻先驱报》所描述的,缅因州的人力资源和工资单由“一个有40年历史的系统运行,该系统使用过时的语言编程,只有一名州雇员知道如何使用它。”该系统已经超过了2016年更换它的尝试失败了。另一项本应在2020年结束的尝试在去年3月连续爆发,当时该公司聘请为缅因州推出新的基于云的系统的Workday退出了该项目。众所周知,ERP系统和类似平台的推出容易发生灾难,缅因州的工资需求也很复杂(例如,如果州警携带武器、使用K9工作或佩戴潜水装备,他们的时薪就会不同)。争议的核心是一个任何参与过如此大型项目的人都应该熟悉的故事:缅因州说系统上线时有50%的错误率,Workday说缅因州带入系统的数据已经无可救药地满了错误的。更根本的是,缅因州似乎正在雇用不具备该项目工作所需技能的工人,而且该州不愿支付足够的费用来寻找能够满足要求的工人。再加上一些关于裙带关系和性骚扰的指控,你就会遇到真正的IT管理混乱。缅因州仍在使用其已有40年历史的人力资源系统。5.亚马逊的休假问题如果您从前两个项目中得出政府无力进行项目管理的结论,那么我们很遗憾地通知您,今年私营企业也爆发了类似的危机——不仅是私营企业,亚马逊也是如此。,IT和网络使新的高效经济成为可能的原型。《纽约时报》的一项调查显示,亚马逊为员工提供各种休假的内部流程极其混乱。这导致了一系列影响白领和蓝领工人的恐怖故事,例如员工因在批准的休假期间不来上班而被解雇,休产假的新妈妈被神秘地削减工资,以及一名受伤的残疾工人被被迫卖掉他的结婚戒指换取现金,因为他的支票不再兑现。事实证明,亚马逊使用来自不同供应商的各种软件产品来管理其休假系统,这是其最初快速增长的遗留问题,所以这里的教训可能是,您在公司历史早期??做出的选择可能需要数年或数年之后。几十年后的影响。与亚利桑那州的监狱系统一样,亚马逊试图通过体力劳动来弥补IT功能障碍:67名全职员工致力于输入员工休假数据,这项工作压力如此之大,以至于许多人最终需要自己请假。6.吃自己的狗粮10月4日,世界各地的人们无法访问Facebook、Instagram或WhatsApp,因为该公司现在在Meta上运行的所有服务都与互联网断开连接。我们不会深入探讨危机的真正原因,它涉及边界网关协议中的一个错误,该错误从根本上切断了Facebook的服务与互联网DNS系统其余部分的联系。相反,我们希望专注于可能与任何IT商店相关的一个细节,即使是那些不属于世界上最大的科技公司之一的商店。停电初期,《纽约时报》科技记者SheeraFrenkel报道称,Facebook员工无法进入公司总部,因为他们的身份证无法再开门。这反过来又阻碍了技术人员对解决整个问题所需的服务器进行物理访问。令人难以置信的是,Facebook的电子门锁由……Facebook提供支持。Facebook似乎非常痴迷于在Facebook自己的基础设施上运行其所有内部系统,这意味着其内部通信系统也出现故障,无法应对危机。公司这样做的行业术语是“吃自己的狗粮”,这通常被视为对自己产品的信任投票,但Facebook的灾难表明你需要方便的备用食品供应。7.快速消除潜伏的错误6月8日,数百万互联网用户试图访问从Reddit到英国重要政府部门的网站时,发现自己遇到了503错误代码,这表明托管该网站的服务器无法处理请求.(推特还在,可惜不能再显示emoji了。)这么多不同的网站怎么同时下线了?事实证明,答案与内容交付网络的兴起有关,互联网上的战略存在点为其客户部署代理服务器以确保超快的加载时间。现在几乎每个大型内容站点都使用CDN,而且这个领域的参与者不多,所以当一个站点出现故障时,可能会引起大量互联网关注。在这种情况下,单点故障是Fastly,这是一家边缘计算提供商,拥有蓬勃发展的CDN业务。软件更新于5月12日迅速推出,其中包含一个错误,在适当的条件下,特定的客户配置可能会触发该错误。6月8日,一位客户在不知不觉中更新了配置,在软件开发和行业整合的交叉点引发了一场危机。8.数据泄露10月,圣路易斯邮报记者与安全专家ShahJihan合作,发现一个允许公众搜索教师证书和证书的网站也无意中泄露了这些教师的社会安全号码。虽然这些数字实际上并未显示在搜索结果页面本身上,但它们在页面的HTML中以明文形式显示,因此很容易找到。Post-Dispatch将这个漏洞通知了州教育部门,给他们时间来纠正它,如果事情是这样,我们现在可能不会谈论这个故事。但是,在教育部发言人开始起草(从未发送过)一份声明感谢媒体提请他们注意此事两天后,州长公开指责该报雇用“黑客”让他和国家难堪,并承诺发起犯罪活动调查。在加倍努力后,他面临强烈反对和嘲笑,包括来自他自己政党成员的强烈反对,现在肯定在谈论这个故事。因此,也许这里的教训是,您如何处理IT灾难的后果几乎与灾难本身一样重要。