译者|业务规模或更低的云成本。降低云成本已连续五年被列为企业业务运营的重中之重。研究机构发布的2021年云现状调查报告显示,超过60%的企业计划优化云成本。那么出了什么问题,为什么这么多工程团队都在为云成本优化而苦苦挣扎?以下是导致云计算资源、时间和金钱浪费的一些最常见问题,并找到有效的解决方案。为什么云成本优化如此具有挑战性?公有云是按使用付费的模式,给工程团队带来了更多的自由,但这种自由是有代价的。它可能与Pinterest等公司的云计算账单一样惊人。研究表明,大多数企业都在努力应对不断上涨的云成本。平均而言,公共云支出超出预算24%。云支出超出预算的原因有很多。这些问题通常归结为低成本可见性、复杂的云定价以及估计未来需求的问题。所有这些问题都会“影响”企业的预算和支出。采用云计算服务并不能完全帮助企业降低成本,高昂的云成本账单可能令人望而生畏。2022年企业需要解决的6个云成本优化问题1.仍受保留和节省计划的诱惑在考虑云计算服务的成本节省时,企业首先想到的是为他们使用的云计算服务支付更少的费用。企业选择保留或省钱计划是因为与按需定价模式相比,他们能够获得大幅折扣。预留看似可预测的云支出听起来很合理。但仔细观察就会发现,这家公司并没有解决问题,只是在成本上得到了一些优惠。(1)那么问题是什么?如果人们还记得,Pinterest预先向亚马逊AWS云计算服务投资了1.7亿美元,但随后不得不再花费2000万美元购买额外的资源。该公司的故事有助于说明这样一个事实,即很难知道一到三年后需要多少产能。长期选择单一供应商的企业也可能失去业务灵活性,不得不为不断变化的需求付出高昂的代价。(2)省钱方案呢?最好的解决办法是根本不使用这种方法。与其提前购买资源,不如考虑如何解决云计算的支出问题,例如:调整规模、自动伸缩、打包、资源调度2.陷入过度配置的陷阱当企业团队选择的资源多于实际资源时实际上需要运行工作负载,它会发生过度配置。这背后通常有一种未雨绸缪的心态,因为没有人希望应用程序被打断。在某些业务环境中,企业团队通常会获取比工作负载所需更多的资源,以“以防万一”。虽然这种方法在提高性能方面对工程师有意义,但它会造成云计算浪费和更高的成本。(1)过度供应有什么问题?简而言之,它会导致云计算浪费以及不必要且可能失控的支出。从长远来看,团队养成过度供应的习惯是不利的。出于安全原因养成选择大于工作负载的实例的习惯会随着业务和应用程序的扩展而变得疲惫不堪,并且您将面临昂贵的账单。把钱花在更重要的事情上不是更好吗?例如,投资于应对因过度分配而加剧的气候危机。(2)如何处理超额配置?一种常见的方法是投资定制监控和成本管理解决方案。他们对调整配置的建议可以帮助企业减少对过度配置资源的依赖,但仍然需要手动执行。另一种解决方案是采用自动化解决方案。自动调整大小会选择最合适的实例类型和大小,从而在满足应用程序要求的同时降低成本。每当集群需要额外的节点时,人工智能驱动的实例选择算法就会选择能够实现最高性能的资源。更好的是,团队不必自己做,因为这一切都是自动发生的。由于过度配置在许多企业的文化中根深蒂固,因此必须建立成本优化程序以平衡性能、可靠性和成本。自动化可以成为更广泛的企业变革道路上向前迈出的重要一步。3.陷入孤立的云计算资源很容易为一个项目启动一个实例,然后忘记关闭它。因此,许多团队都在与没有所有权但继续产生成本的孤立实例作斗争。还记得Adob??e每天为其Azure云平台收取80,000美元计划外费用的错误吗?这是企业绝对想避免的问题。这个问题在大型企业中尤为严重,在这些企业中有许多计划同时运行而没有集中的资源可见性。在IT之外和IT不知情的情况下管理的计划(影子IT)可能占所有企业IT支出的40%。此外,研究表明影子云的使用量可能是已知云服务使用量的10倍。(1)孤立的云计算资源有什么问题?孤立的云计算资源意味着资金流失,具有复杂的可持续性影响。简而言之,数据中心使用大量硬件并消耗大量电力,大大增加了整个ICT行业的碳足迹。他们所需的能源每四年翻一番,而AWS或Azure等云提供商开辟的每个新区域都会加剧这个问题。这就是为什么减少云计算浪费是减少不必要支出和相关碳足迹的关键所在。(2)您如何应对这一挑战?确保只有真正需要的资源在运行可能极具挑战性,尤其是在大型企业中。但是企业如何识别和淘汰未使用的实例?这是自动化再次发挥作用的地方。自动化的云优化解决方案可以不断扫描其使用情况,发现效率低下的地方,并尽可能少地使用资源。这些解决方案还可以关闭未使用的实例和进程,以降低企业的云成本。4.管理需求下降和激增的效率低下构建电子商务基础设施的工程师非常了解变化的速度。例如,一个影响者可以在一夜之间带来数百万的销售额,一个网站可以因流量激增而瘫痪。大多数其他应用程序的使用随着时间的推移而变化,但平衡成本和性能仍然是一个持续的挑战。(1)这有什么问题?如果企业保持打开状态,流量峰值可能会产生大量且不可预测的云账单,或者如果对其资源施加严格限制,则应用程序会崩溃。当需求低迷时,企业就有支付过高成本的风险。当需求很高时,企业可能会为客户提供糟糕的服务。企业可以使用云成本管理解决方案来监控他们的使用情况,如果超过设定水平或有任何异常情况会实时提醒。这些工具可以为企业提供有用的建议,帮助他们使云资源与当前需求保持一致。然而,手动扩展云容量既困难又耗时。除了跟踪系统中发生的所有事情之外,企业通常还需要注意:平稳处理流量高峰和低谷——并在他们使用的所有服务中为每个虚拟机上下扩展资源;更改不会对其他工作负载造成任何问题;自己配置和管理资源组,以确保它们包含适合其工作负载的正确资源。(2)如何解决这个问题?这是云计算自动化可以发挥作用的另一个领域,帮助企业节省大量时间和金钱。自动缩放可以自动执行上面列出的所有任务,并控制云成本。使用容器编排器Kubernetes的企业可以受益于三种内置机制。Horizo??ntalPodAuto-Scaler(HPA)添加或删除Pod副本以匹配应用程序不断变化的使用情况。它监视企业的应用程序以查看其副本数是否应该更改,并计算删除或添加它们是否会使当前值更接近目标。VerticalPodAuto-Scaler(VPA)增加和减少CPU和内存资源请求,以更好地使企业分配的集群资源与实际使用情况保持一致。ClusterAuto-Scaler更改受支持平台上集群中的节点数。如果它识别出具有可以重新安排到集群中其他节点的pod的节点,它会驱逐这些pod并删除备用节点。在许多解决方案中,组织只需要定义水平自动缩放和垂直自动缩放策略,自优化工具会为它处理剩下的事情。5.没有机会利用Spot实例CSP以较低的价格出售其未使用的容量,尤其是在将成本与其常规按需报价进行比较时。在AWS云平台,抢占式实例最高可享受90%的优惠。(1)抢占式实例有什么难的?由于企业竞标备用计算资源,因此永远不知道这些容量将保持多长时间。一些可抢占的实例有一个预设的持续时间;例如,AWS提供了一种类型,可以为企业提供长达6小时的不间断时间保证。但除此之外,提供商可以回收企业正在使用的抢占式实例,并在30秒到2分钟内通知您。但是人类不可能在这么短的时间内做出反应。创建新的虚拟机也需要比这更长的时间,因此存在停机的潜在风险。这就是为什么如果您决定使用抢占式实例,您必须接受中断将会发生。对于关键或不能容忍的工作负载,它们显然不是正确的选择。(2)您如何应对这一挑战?尽管存在风险,但抢占式实例非常适合无状态且可横向扩展(即具有多个副本)的服务。幸运的是,现代架构中的大多数服务都是无状态的,因为Kubernetes是为这种类型的设置而设计的。使用抢占式实例的过程如下:①需要确定工作负载及其处理中断的能力。②查看供应商提供的实例,选择最适合您需求的实例。一个经验法则是选择不太受欢迎的实例并检查它们的中断频率。③此时有策略地设置最高出价,以避免价格上涨时可能出现的中断。④企业也可以考虑将可抢占实例分组管理,请求多个类型,增加抢占的几率。组织可以手动执行这些步骤,但要使其发挥作用,他们需要为大量配置、设置和维护任务做好准备。自动化在这个时候又派上用场了,除了上述流程,当企业需要的抢占式实例暂时不可用时,自动化解决方案可以提供即时的帮助。6.延迟采用自动化云优化本文提到自动化云优化是有原因的。如果你已经是云原生的,正在运行Kubernetes,甚至可能使用现代DevOps方法——自动化你基础设施的这一部分绝对是个好主意。德勤已将云计算自动化确定为2021年及以后的主要趋势之一,尤其是在大型企业环境中,它为IT团队带来了切实的成果。首先,它减少了企业配置虚拟机、创建集群、选择正确资源等所需的手动工作。这一变化节省了时间,使公司的工程师能够专注于更重要的任务、创新并充分利用其云计算基础设施。此外,自动化工具允许更频繁的更新,这是持续部署理念的关键。它还减少了人为错误的可能性,降低了基础架构的运营成本,提高了系统的安全性和弹性,并增强了备份过程。最后,自动化使企业能够了解他们正在使用的资源,否则这些资源将难以控制。简而言之,云计算自动化已成为科技行业的新常态。(1)延迟云计算自动化有什么问题?既然云计算自动化有这么多毋庸置疑的好处,而且势不可挡,企业为什么不去做呢?自动化会带来许多挑战,例如对新解决方案的抵制、对实施成本过高的担忧,以及需要更新现有流程的问题。与大多数数字化转型项目一样,成功的关键是人,组织需要鼓励人员层面的变革。在工作方面,麦肯锡公司的研究证明,员工普遍害怕被技术取代。然而,自动化的好处远远大于风险。例如,在2021年DevOps状态调查报告中,这一点很明显,其中97%的受访企业认为自动化提高了他们的工作质量。在2022年延迟云计算自动化无异于错失以下好处:为您的应用程序选择最高效的实例类型和大小;自动扩展云资源以处理需求高峰和低谷;消除未使用的资源以降低成本;优化可抢占实例;减少存储、备份、安全、配置更改等其他领域的不必要开支-所有这些都是实时的,而且成本仅为企业手动实施的一小部分。(2)如何解决这个挑战?克服人类对变革和新解决方案的抵制的问题由来已久。自动化云优化可以将团队从重复性任务的负担中解放出来,但仅仅告知他们这一点可能还不够。因此,我也希望更多的企业能够在2022年采用自动化云优化,并享受到它带来的好处。原标题:2022年要避免的6大云成本优化问题以及如何处理这些问题,作者:LaurentGil
