在本文中学习混沌工程的基础知识。混沌工程由科学、规划和实验组成。这是在系统上进行实验以建立对其承受生产中混乱条件的能力的信心的学科。首先,我将在文章的介绍部分解释混沌系统的工作原理。如何开始学习混沌系统?根据我的经验,开始学习混沌系统的最佳方法是通过触发早些时候在生产中发生的事故来进行实验。使用过去的数据,制定计划以相同的方式破坏您的系统,然后制定补救策略并确认结果符合您的预期。如果计划失败,您将有一种新方法来试验并转向一种快速处理问题的新方法。最重要的是,您可以随时记录所有内容,这意味着随着时间的推移,整个系统将被完全记录下来,任何人都可以随叫随到而无需太多开销,每个人都可以度过一个愉快的周末。你打算在混沌工程中做什么?运行混沌系统实验背后有一些科学依据。我记录了其中的一些步骤:定义稳定状态:使用监控工具收集有关系统在没有问题或事件的情况下似乎正常运行的时间的数据。做出假设或使用以前的事故:既然您已经定义了稳定状态,请提出关于在事故或停电期间会发生(或发生)什么的假设。使用这个假设推导出将要发生的一系列事故的理论,以及如何解决这些事故。然后你可以制定一个计划来故意造成这个问题。提出问题:使用计划破解系统,开始在真实环境中测试。收集中断时的指标状态,安排修复,并跟踪提出解决方案所需的时间。确保记录所有内容,以防将来出现问题。试图推翻你的假设:实验最好的部分是试图推翻你的想法或计划。您创建一个不同的状态,看看您可以走多远并在系统中生成一个不同的稳定状态。在另一个系统中创建破坏性因素之前,请确保建立一个处于稳定状态的控制系统。这将使您更容易发现实验之前、期间和之后各种稳定状态的差异。混沌工程意味着什么?这里有一些适合初学者混沌工程的好工具:良好的文档方法一个监控系统来捕获你的系统是否处于稳定状态现在你已经掌握了基础知识,是时候安全地销毁你的系统了。我计划一年制造四次混乱,然后努力每月破坏一次。混沌工程是一种很好的实践,也是将内部文档更新到最新的好方法。此外,随着时间的推移,新的升级或应用程序部署会变得更加顺畅,使用Kubernetes后您的日常管理也会更加轻松。
