随着自动化扩展到涵盖IT的更多方面,越来越多的管理员正在学习自动化技能并应用它们来减轻他们的工作量。自动化可以卸载重复性任务并为基础架构增加一定程度的一致性。但是,当IT人员部署自动化时,会出现常见的错误,这些错误可能会对大大小小的基础设施造成严重破坏。自动化部署中经常出现五个常见错误。缺乏测试初学者常犯的一个错误是没有彻底测试他们的自动化脚本。由于拼写错误或逻辑错误,简单的shell脚本可能会对服务器产生不利影响。将该错误乘以基础架构中的服务器数量,您可能会遇到一大堆问题需要清理。在大规模部署之前始终测试您的自动化脚本。意外负载第二个经常发生的错误是没有预料到脚本可能对其他资源造成的系统负载。当目标是十几台服务器时,运行一个从存储库下载文件或安装包的脚本可能没问题。脚本通常在数百或数千台服务器上运行。此负载会使支持服务停止或完全崩溃。不要忘记考虑端点影响或设置合理的并发率。离开脚本自动化工具的一种用途是确保符合标准设置。自动化可以轻松确保组中的每个服务器都具有完全相同的设置。如果该组中的服务器需要根据该基线进行更改,而管理员不了解合规性标准,那么就会出现问题。安装并启用不需要的和不需要的服务,从而导致可能的安全问题。缺乏文档管理员的常规职责之一应该是记录他们的工作。由于合同到期、晋升或定期员工流动,公司可能会经常在IT部门雇用新员工。公司内的工作组彼此隔离也很常见。由于这些原因,重要的是要记录什么自动化到位。与运行脚本的用户不同,自动化可能会在创建它的人离开组后继续很长时间。管理员可能会发现自己面临着来自其基础架构中未经检查的自动化的奇怪行为。缺乏经验列表中的最后一个错误是管理员对他们正在自动化的系统了解不够。管理人员经常受雇担任他们未受过充分培训且无人求助的职位。自COVID以来,这一点尤为重要,因为公司正在努力填补职位空缺。然后,管理员被迫处理他们尚未设置且可能不完全理解的基础架构。这可能导致非常低效的脚本浪费资源或配置错误的服务器。结论越来越多的管理员正在学习自动化以帮助他们完成日常任务。因此,自动化正在被应用到更多的技术领域。希望这个列表将有助于防止新用户犯这些错误,并敦促有经验的管理员重新评估他们的IT策略。自动化旨在卸载重复性任务,而不是为最终用户创造更多工作。
