CloudOps:用于优化云操作的新兴框架|翻译|李睿评论|SunShujuan希望升级其云计算战略的企业正在转向CloudOps,这是一种用于优化性能和管理在云中开展业务的成本的新兴框架。任何参与创建软件产品的人都应该非常熟悉DevOps,这是一组将软件开发和IT运营相结合以缩短开发生命周期并提供持续交付和高质量产品的实践。随着企业越来越多地将应用程序开发和工作负载转移到云中,并且这些云支出变得更加复杂,出现了一个相关的概念,称为“云操作”(CloudOps)。本文探讨了什么是CloudOps、它如何使企业受益,以及在企业中实施CloudOps时要牢记的关键问题。1.什么是云运维?CloudOps是一种操作实践,用于管理在云计算操作环境中运行的IT服务和工作负载的交付、优化和性能。无论企业采用多云、混合云还是私有云战略,CloudOps的目标都是为基于云的流程建立程序和最佳实践,这与DevOps对应用程序开发和交付的作用大致相同。2、CloudOps云运维的多层次框架凯捷美洲副总裁兼云卓越中心负责人JasonHatch表示:“整体的云运维是一个多层次的框架,可以帮助企业管理他们的云生态系统。方面。”其中之一是治理层,其中包括财务运营(也称为FinOps)等活动,以控制成本和管理云预算。“治理层还应包含有关在云中部署的方式和内容的架构标准,并具有一种以编程方式执行这些标准的方法,”Hatch说。其他框架层包括:云应用层,涵盖企业如何部署和管理/监控应用程序和特定于应用程序的服务;云操作层,主要用于部署、管理、监控和运营云计算服务;云基础设施层,包括身份、网络管理、日志记录、中央备份管理、基础设施即代码和中央监控能力等核心服务。“跨越所有这些层的是‘安全层’,其中包括漏洞和威胁管理、工作负载保护以及与企业更大的网络安全人员的集成代理功能,”哈奇说。应用程序交付尤为重要,许多企业都专注于旨在增加销售额和增强客户体验的数字计划。云计算服务提供商Replicon的工程和运营执行副总裁SureshKuppahally表示:“CloudOps汇集了在云中构建、部署、运营、监控和管理(Web)应用程序交付功能的五项主要职责。Kuppahally指出网络、计算、安全和存储是在初始构建和设计阶段必须牢记的四个关键组件。“从那里,企业要么自动部署他们的应用程序,要么通过持续集成和持续交付来部署他们的应用程序,”他说。Kuppahally表示,企业的CloudOps团队还应该与工程或产品团队明确职责分离和独立,这样做可以使CloudOps为企业带来透明度和服务质量[QoS]问责制。4.CloudOps的好处CapgeminiAmericas的Hatch认为,CloudOps的商业利益是可观的,首先是企业对云服务的整体部署。他说,“CloudOps可以帮助推动企业内部进一步采用和使用云计算服务。如果企业能够有效地部署、管理和保护他们的云环境,就应该增加他们对云计算的使用,并提供对新服务和技术的访问能力实验和创新,这反过来又可以使他们更加敏捷,提供更快的上市时间,并帮助推动创新。”Hatch补充说,利用CloudOps的企业也可以从越来越多的云计算服务中受益,以更好地管理和财务控制。“实施控制来管理它。有效的CloudOps有助于缓解这种情况。在治理层面,我们可以实施更好的预算和财务跟踪和优化。这在运营层也得到了促进,部署和管理的自动化程度更高。”咨询公司Protiviti的客户提到的另一个主要好处是能够自动化释放许可资源,该公司总经理WillThomas说,这有助于客户管理日益复杂的云计算。增强的安全性是CloudOps的另一个关键好处,Thomas说,因为该模型确保与安全控制、标准或框架保持一致,并建立可以在报告云中的健康和活动时限制不合规的策略。Thomas还认为,实施CloudOps的企业将能够更好地优化其云环境,因为CloudOps工程师们将专注于使用最新最好的服务对应用程序进行现代化改造,充分利用云中的授权资源。此外,部署CloudOps的企业可以根据性能和成本考虑制定合适的资源分配计划;持续报告和审查有关云健康的指标;并在云中保持合规性的同时实现资源的主动配置。Replicon的Kuppahally指出,CloudOps可以在不影响QoS的情况下经济高效地扩展云服务。他说:“使QoS目标与CloudOps投资保持一致非常具有战略意义,因为可以激励专门的CloudOps团队来管理运营成本,从而在降低运营成本方面获得既得利益。”5.CloudOps实践Stretto公司是一家受益于采用CloudOps的公司。该公司的首席技术官GeorgeTsounis表示,这家为企业和消费者破产部门提供服务的破产服务和技术公司很早就确定了对CloudOps实践的需求,并将关键原则纳入其应用程序和在云中运行的应用程序。系统。Tsounis说,“例如,我们有严格、快速的规则,我们只会将基础设施作为代码[IaC]实践用于任何部署。我们通过决定所有应用程序/系统将始终跨两个可用性区域运行来实现这一点。”为了实现冗余,我们利用云提供商的内置高可用性功能。”Tsounis表示,Stretto战略的一个关键部分是利用CloudOps实践来确保对其技术运营采取更主动的方法。他说,“我们更愿意授权我们的架构师和工程师为我们的内部和外部客户创建高性能、自我修复和弹性的云原生解决方案,而不是继续以被动的方式运营。”Tsounis表示,云服务的引入,甚至向无服务器功能的过渡,都带来了独特的挑战。“CloudOps是帮助我们应对这些挑战的战略,”他说。最终,CloudOps为Stretto带来的好处包括降低成本、可扩展性、自动化、简化灾难恢复以及将基础设施用作应用程序一部分的能力。接缝整合。“我们的团队受益于采用这些CloudOps概念的应用程序的整体改进。CloudOps实践也提高了质量。这可以通过利用基础设施即代码方法使云计算基础设施的部署和配置可重复来实现,”Tsounis说。实现了。随着我们跨环境推出应用程序,配置错误减少了,我们现在使用基础架构即代码拥有一致的基础架构配置。”通过消除对其云计算基础设施的手动配置,Stretto质量问题减少了大约20%。他说,“利用CloupOps实践让工程师有信心了解应用程序/系统的行为,以便在预生产环境中发布到生产环境时取得成功。此外,帮助台和内部工单减少了,因为我们的应用程序质量改进,我们看到了整体IT运营的改进。”6.跟上不断发展的方法在云服务及其使用方式方面没有什么是一成不变的,因此采用CloudOps的企业需要定期调整他们的方法以跟上。对于许多企业来说,这仍然是一个新领域CapgeminiAmericas的Hatch说:“随着越来越多的企业采用真正的多云部署,他们的CloudOps实施也需要成熟和扩展。许多客户在孤岛中管理他们的云环境,使用不同的工具和流程来管理每个云计算环境,同时将整个云环境视为一个整体。为了提高效率和效果,企业需要开发自己的CloudOps框架,以便能够轻松插入新的云提供商和服务,同时仍提供适当级别的管理、监控和运营严谨性。”Kuppahally说企业处理事件管理的方式在云中也可以改进。他说,“这是大多数CloudOps团队都在努力的领域,他们充斥着内部和外部事件,无法有效地管理它们。有一个专门的项目管理流程来简化事件管理分类和优先化是降低风险的一种方式。与此同时,企业需要降低事件误报率。当CloudOps团队跟不上高误报率时,他们会不知所措。拥有有效的策略和计划来减少或消除误报是非常关键的成功因素。”CloudOps可以受益于人工智能(AI)和机器学习等技术,研究和教育服务提供商Wiley的执行副总裁兼首席技术官ArefMatin说。Matin说,“通过机器学习,CloudOps工具可以帮助定义企业-广泛的政策,检测和报告异常,并以自动化方式采取纠正措施以维护云计算最佳实践政策。”7.CloudOps文化与DevOps相同但是,CloudOps的成功在很大程度上取决于培养旨在充分利用云计算优势的文化框架和工具。随着越来越多的企业将更多的工作和流程转移到云端,他们需要专注于构建CloudOps专业知识。Protiviti的Thomas表示,“大多数客户在与云计算服务打交道时处于被动状态,无法响应事件、变更或新服务请求。CloudOps通过支持自动化的部署建立结构,允许监控、审查和优化现有资源,并审查公司政策以与云计算保持一致。Stretto的Tsounis对此表示赞同。他指出,企业需要更广泛地了解组织结构、专业知识和协作的正确结合,CloudOps才能真正发挥作用。“CloudOps不是一个单独的团队或部门,”Tsounis说。.IT、安全、架构和应用程序团队需要就常见的CloudOps实践进行协作和调整。如果这些团队在孤岛中工作,CloudOps就无法正常工作。基于将CloudOps付诸实践的经验,Tsounis认为企业还需要更好地定义CloudOps成功所需的基本技能,而不是重新发明轮子。他说,“技术团队需要了解基于云的架构、网络、安全和自动化。如果没有基础技能,团队可能会冒险在已经存在云服务的地方实施解决方案。”原文链接:https://www.cio.com/article/100000992/cloudops-a-framework-for-optimizing-your-cloud-operations.html
