当前位置: 首页 > 科技观察

云风险、云中断和云安全:人为错误是罪魁祸首

时间:2023-03-13 13:35:00 科技观察

有人认为云计算其实并没有那么可靠,那么企业如何提高云计算安全性,消除单一供应商锁定的云计算风险,并降低云计算风险?破坏的可能性?就在几年前,云采用的两个最大障碍是云安全性和可靠性。随着时间的推移,人们了解到云计算与本地计算一样安全(甚至更安全)。虽然建立良好的记录需要数年时间,但现在众所周知,云平台通常更可靠。但这并不是说采用云计算是万无一失的。仍然有很多重大停电。2019年的趋势很有趣:中断事件凸显了依赖单一云平台的企业面临的风险。云风险和寡头垄断市场云计算市场仍由少数行业巨头主导。AWS在市场发展方面处于领先地位,2018年第四季度占据32.3%的市场份额,其中微软Azure占据第二位,占比16.5%,谷歌云占据第三位,占比9.5%。其他市场的组合构成了其他市场,其中包括阿里巴巴和IBM等几家大公司。市场的形态造成了风险分散和风险集中之间的冲突。企业分散了业务风险,因为它们不依赖办公室中的单个服务器机房或数据中心。公司IT团队可以位于其他地方,从而降低与该位置相关的风险。其次,大多数企业使用不止一种云计算服务。即使是声称将业务迁移到单一云平台以获得单一平台和批量折扣的企业,也可能会使用其他SaaS服务,例如客户关系管理(CRM)和工资单(Payroll)。这应该意味着企业的风险进一步降低,因为所有系统都不太可能同时失败。但情况并非总是如此。一些主要云计算供应商的问题在于许多基于SaaS的云计算服务可能托管在同一个平台上。表面上看,企业是在分散风险,其实也可能是把鸡蛋放在一个篮子里。2017年2月AWS的云中断影响了Spotify、Dropbox和Trello等服务。2018年的AWS云中断影响了Atlassian、Twilio和Slack的运营。因此,云计算安全并不像人们想象的那么安全。超大规模云计算提供商已经构建了他们的基础设施,以便客户可以让他们的系统和应用程序在AWS、Azure和谷歌云公共云服务提供的隔离可用性区域中运行。如果企业在至少两个地区建设基础设施,就可以减少或消除单点硬件故障。这种隔离应该防止重大问题影响多个区域,因为事件并不总是发生。独立的数据中心可以防范停电或极端天气等风险,但不能防范平台范围的问题。云计算只是用别人的电脑,谷歌在美国的服务于6月2日中断,其对单个地区少量服务器的配置变更影响了相邻多个地区的大量服务器。该地区一半以上的可用网络容量未被使用。这不仅会影响公司自身的搜索服务,还会影响Gmail和YouTube等服务,以及使用GoogleCloud的客户。今年早些时候,谷歌云平台再次出现此类问题。代码更改导致GoogleCloudConsole和CloudDataflow出现问题,进而导致GoogleCloudStorage在全球范围内出现错误。今年,MicrosoftAzure由于DNS迁移错误而遭遇全球中断。这个小问题扩展到计算、存储、广告身份服务和SQL数据库。2019年,云计算服务提供商并没有遇到太多数据中心问题,但人们看到了一些平台范围的问题,通常是人为错误造成的。有人说云计算的应用就是用别人的电脑,但是“别人”也容易出错。Databarracks进行了10多年的年度IT调查,发现数据丢失的主要原因始终是硬件故障和人为错误。云计算让公司可以构建自己的系统来处理硬件故障,但不可能消除人为错误。云安全:管理供应商风险以限制云风险的建议首先,了解托管云计算服务的位置。知道某些服务托管在同一平台上并不一定意味着它们需要更换,它可能只是存在一定的风险。至少通过调查,企业知道对涉及云计算提供商的事件有何期待。对于其他领域,这意味着做出改变。紧急或批量通知工具不能使用与生产系统相同的云,因为它是业务在中断期间进行通信所依赖的平台。在这里,企业需要深入了解第二和第三云提供商,以了解使用了哪些云服务。紧急通知工具可以托管在云平台上,也可以使用Twilio等第三方消息工具提供服务。使用多个云计算提供商的服务这里一个很好的建议是企业使用多个云计算提供商的云服务。即使您在一个云上的系统中内置了弹性,使用多个可用性区域甚至区域意味着您始终至少拥有该云之外的数据备份副本。或者,企业可能希望跨多个云提供商建立弹性。您需要确保不依赖特定于平台的专有工具,并始终构建可移植的应用程序。容器和基础架构即代码方法意味着组织可以快速且可重复地构建和拆除环境。这种方法会更有效,但它提供的好处不仅仅是弹性。企业还可以更自由地在云服务之间切换,利用云提供商之间的定价或性能差异。