【独家专访】随着各业务对IT的依赖度越来越高,IT基础设施的快速发展和云计算技术的普及,平均企业IT基础架构的规模正在扩大,尤其是在Web2.0企业中。这些企业有时可能需要在两周内添加数千台服务器。因此,对于运维来说,人工一一搭建的方式,不仅繁琐、低效,而且非常不利于维护和扩展。这是绝对不可能的。服用方式。即使在传统企业中,人工备份、服务器状态监控和日志记录的效率也很低,非常浪费人力。因此,对于运维来说,自动化不再是一个高端技能,而是每个运维都必须掌握的看家本领。上面我们也提到了,在不同的企业,自动化的规模、要求、实现方式都是不同的。因此,在技术细节层面,运维很难套用其他企业的方法。然而,在很多情况下,自动化的想法有一些共同点。因此,系统频道近期请来了中国移动通信研究院项目经理李阳先生,谈谈他对运维自动化实现,尤其是基于开源工具的运维自动化的经验和看法。嘉宾介绍:李洋,博士,毕业于中国科学院计算技术研究所。从事计算机网络信息安全研究与开发工作10余年,主持和参与多项国家重点项目和信息安全系统、企业信息安全系统的研发工作。有Linux系统应用、管理、安全和内核研发经验,擅长网络安全技术、协议分析、Linux系统安全技术、Linux系统和网络管理、Linux内核开发等:能否简单谈谈你的运维经验?李洋:我的运维经历分为三个阶段:(1)依赖人工、重复的软件部署和运维;(2)通过编写脚本,方便的进行软件部署和运维;(3)借助第三方工具,实现高效便捷的软件部署和运维。这些阶段随着我的知识、经验和教训的不断积累而不断演进。而且,第二阶段和第三阶段也可以说是齐头并进。虽然Linux下已经有很多第三方工具,但是Linux下的脚本对运维工作的推动也是不容忽视的。所以我一直在实践中使用这两种方法。:Linux下有哪些运维工具让你觉得特别好用,让你眼前一亮?李洋:其实Linux下的运维工具并没有太多。我觉得RedHat提供的KickstartInstallations自动安装方案比较好用,但是这个方案比较繁琐;目前有一些工程师认为Cobbler是一个很吸引眼球的好工具,个人感觉也很好。另外,其实在Linux下,写shell脚本,使用CronTab等方式运维也很方便。我个人认为这也是一个非常不错的选择。:有人理解自动化是运维为了减少重复枯燥的工作而建立的一种流程方式。此外,自动化还可以带来减少人为错误、及时报警和故障恢复、提高业务可用性等好处。如何理解运维工作的自动化?您认为自动化技能/意识对运营有多重要?李洋:运维工作的自动化确实包括以上两个方面。总结起来,其实就是:把零碎的工作集中起来,把复杂的工作简单化、有序化,把流程标准化,最大限度地解放生产力,也就是解放运维人员。自动化技能/意识对运营工作至关重要。运维工作不是简单的使用工具,里面有很多技巧和意识。具体的技能/意识包括:如何驾驭这些眼花缭乱的工具为自己所用,如何根据不同的应用环境选择不同的工具,如何根据应用组合工具等等。我们必须记住一件事:工具是帮助人运维的,过程中需要人的干预和决策。工具无法替代完整的运维工作。:自动化的范围大致可以分为安装自动化、部署自动化、监控自动化。除此之外,还有哪些方面是你比较关心的?(如软件发布、更新、备份等)对于这些方面的技术实现,您一般使用什么工具?与其他类似工具相比,这些工具有哪些优势?李洋:自动化其实包括软件发布自动化、升级自动化、安全控制自动化、优化自动化等等。我个人比较注重管理和安全的技术实现。比如我现在使用的是HP和IBM出品的一些ITIL和ITSM产品,比如HPOpenview、IBMTivoli等。这些工具都有Linux版本。与其他同类工具相比,它们的优势应该在于商业应用的成熟度,而且都是老品牌。:对于小型网站,到百万级或千万级的网站,您如何看待工具选择上的差异?李洋:在选型上,我会特别考虑选择成熟的工具、高性能的工具,以及百万、千万规模的网站大家熟悉的工具。对于小型网站,会考虑一些开源和免费的工具。这个原则是面向应用的。数百万、数千万的网站,涉及面广,要求高。通常很难说服我使用不成熟的工具,所以主要是在成熟度方面。:很明显,自动化的实现不是简单的学习几个工具就能搞定的。即使在规划不佳的情况下,自动化不仅没有节省人力,反而带来更多问题。您建议运维人员在考虑自动化流程时应遵循哪些原则或思路?李阳:其实这个问题早前或多或少已经讨论过了。归纳起来,它包括以下原则:(1)根据应用选择工具;(2)针对关键应用,选择成熟度高的工具;(3)不要过度依赖一种工具,需要对比分析;(4)熟练掌握工具的特点;(5)人控制工具,人应该监督工具,而不是工具控制人;(6)不要忘记剧本。:您推荐运维人员可以通过哪些资源和渠道学习自动化方面的经验和知识?根据我个人的经验,很多专业的网站,比如.com、网管天下等都是很好的媒体。看到这方面的文章很多,运维人员可以多看看学习;登录该工具的网站进行学习。一般这类网站都会有一些运维的基础知识,帮助运维人员更快的熟悉工具的使用。:感谢李洋接受我们的采访并分享他的经验。回头见!【小编推荐】浅谈门户网站运维经验SA、不朽与机器人:运维工作是怎样的?RHEL5无人值守安装图文指导
