当前位置: 首页 > 科技观察

给1到10年运维人的修仙指南

时间:2023-03-19 12:01:18 科技观察

1-10年运维人员培养指南。今天和大家分享一下运维人员的职业发展以及相应的软硬技能的提升。该主题分为两个部分。首先是运维工程师的成长烦恼,二是如何走自己的运维之路。一、运维工程师的成长烦恼第一部分,根据自己长期的工作经验,我把运维工程师按照工龄长短分为一些年,比如三年,五年,八年……在不同的阶段,运维人员也呈现出截然不同的状态。1-3岁:干练风趣(1)休闲工程师上班时间,一般都是比较休闲的工程师。出家一日,打钟一天。我亲身经历过这个阶段。这个时候没有责任感,也不会有太多的想法。我只负责执行,没有想太多。对应上班时间的“被动思维”,下班后有更丰富的夜生活,比如撩妹、抖音、打游戏等。(2)什么是“管见豹”的概念”因为做技术容易?一到三年的运维人员,大部分都靠度娘。不知道也不关心。至于各种文章中的图片,我就不深入研究了。(3)积极的工作态度,充满干劲。我曾经接过一个实习运维工程师:3月入职,9月离职。新人很散漫,只满足我们的基本期望。得到一些思想上的引导后,年轻人工作起来突然变得干劲十足;他的所作所为,包括撰写日报和周报,表现得就像两个不同的人。2015年4月的22个工作日里,他加班22天,每天加班到凌晨两三点。期间技能也有了很大的提升:比如让他测试一下集群的性能。除了积极去做,他还会认真思考自己为什么要做这件事;对新技术进行研究,思考如何快速掌握。(4)交易型人才最后,我把各个行业的孩子都称为交易型人才。顾名思义,他们只需要把事情做好,实现公司的经营目标。“顾头不顾尾”也是一种常态。我曾经指导过一个90后的运维工程师。他把代码放出来就贴出来,忽略后面的事情,比如发布是否成功,业务是否通畅。3-5年专业老手(1)技术提升技术确实有了一定的提升,这是生存法则。当你第一次进入公司时,你有一张白纸。为了掌握和了解公司的业务,你会学习,否则你只会被淘汰。(2)“跳槽”惯性技术提高后,会陷入“跳槽”惯性。上述2015年3月来到我这边的运维工程师,刚入职时就变成了普通5K。9月离职去大麦网后,工资降到13K。但是很容易混淆。如果你频繁换工作,发现好像跳到这家公司、那家公司都差不多,就不清楚怎么办了。这个时候我们运维的技术方向就变了。基础设施运维和面向开发的运维开始分化。其中,DevOps会比较多,一些运维工程师会很迷茫,不知道该做什么。我认识的一些人做了大概五年的DevOps,基础设施运维还没有很深入。他们发现原来的开源组件并不能很好地使用。带来一定的风险。(3)技术能力与高薪期望的“错位”技术能力提升的放缓与高薪期望的“错位”,使得现阶段的中高级运维很容易狂妄自大。我面试的运维人员跟我年龄相仿,有的比我还大。他们中的一些人在五年前还有技术知识,但因为他们已经在这个领域从事了一段时间,所以他们对薪水的期望很高。这造成了错位,即高薪期望与实际能力之间的不匹配。(4)交易型和思维型人才3-5年运维人员是交易型和思维型人才。作为中级以上的运维工程师,大部分还处于被领导的状态。在经验和学习能力的加持下,他们会思考应该掌握什么,但思考的强度往往不够。(5)缺乏总结和回顾最后,缺乏总结和回顾。相信运维人员在面对新技术或者做一些测试的时候都会做笔记。那为什么还缺少总结呢?很多时候笔记只是一个笔记,没有对笔记进行复习,笔记的内容和分类也不会及时更新。5-8年:运维经理,至少是运维主管。5-8年的运维人员基本都是运维经理,至少是运维主管。但是很多运维工程师是根据自己的技术能力和工作年限成为运维经理的。在这个过程中,他们要面临从技术到管理的跨越,所以有很多问题等待着适应和解决。(1)找不到自己的定位。升为运维经理后,很多事情还是自己一个人承担。结果,团队里的其他兄弟分担的任务很少,进度也很慢。长此以往,不利于整个团队的发展。(2)团队意识淡薄,不会带领团队,不懂得利用团队的力量来满足公司的业务需求,仍应发挥原有的作用。(3)对管理角色的认知存在偏差。身份转变来得突然,不适应新角色,开始摆架子、狂妄自大、指使别人做这做那等。另外,我不习惯处理管理事务。比如某哥们,业务在某公司机房,先是运维工程师,后来被提到是IT主管。他会觉得每天做报告太烦人了,宁愿不做,也想回去继续做运维工程师。(4)思维和业务的比例会相对更加均衡。当你成为运维经理之后,你往往要思考如何让自己的运维更加高效,如何让公司形成这样一个规范化、常态化的体系。运维体系和运维技术体系。那么这个时候,作为leader,你可能不仅要处理团队中棘手的技术问题,还要规范运维体系。(5)运维技术容易达到瓶颈期。当公司处理大量线上事务时,对于运维经理来说,时间和精力都用来弥补管理,很少更新技术知识,所以技术知识往往会停留在那个阶段。但是在技术圈有一个特别有趣的现象。普通员工要说服你,就看你的技术能力够不够强。如果你的技术能力不强,即使你的管理能力再强,下面的兄弟也不会认可你。我遇到过很多这样的情况。一个做运维工程师的朋友觉得他的manager技术能力不强,就瞎指挥。但即使管理者不如其他人熟练,他也可以安排一些任务及时完成,并保证一定的质量。这就是懂得管理。而我认识的这位朋友,虽然做了八九年,但还是普通的基层技术人员,做不了管理岗。8-10年:运维总监/运维架构师8-10年的运维人员,已经达到运维总监/运维架构师的水平。这时候技术经验和管理经验已经很丰富了,做过运维总监或者运维架构师,都有比较好的职业习惯。(1)知识陈旧,不再做一线运维。问题交给组员,他们只会给出一个idea。举个例子:不管你是DBA还是运维人员,他们听过的名词都非常熟悉,但是就是做不了毫秒级的failover。很快有人来找我,问我,你怎么能做到毫秒级的failover?我回答说我们一直在更新技术领域,Keepalived是用的最多的failover,Keepalived官方已经给出了答案。另外,技术是我的兴趣,管理是我的工作。(2)如果学习能力下降,能成为运维总监或者运维架构师的肯定不会特别年轻,一般在33-35岁之间。这个时候,家庭、团队、公司中有很多事情会让你分心,你的学习能力会比较下降。在我有孩子之前,我可以每周至少三个晚上学习三个小时。现在,我经常被两个孩子缠着玩,等他们睡着了,我发现剩下的一个小时或半小时根本不够玩。再加上早起,精神上会很累。(3)接受新交易的能力在下降。例如,数据仓库和区块链是比较流行的技术。一群三十多岁的人搞技术研究是不可能的。(4)不懂的东西会越来越多。现在有很多新技术。如果不不断更新自己的知识体系,就会发现自己跟不上行业的发展步伐。(5)做事的目的和目标不明确。很多人只是做运维,却不关心为什么要做,应该是什么样子。比如在做failover的时候,我们要求必须在十毫秒内发现问题,两毫秒内failover。但是很多公司没有这个要求,只要有故障就可以切换过来。至于你的生意会中断多久,你可能想都不敢想。以上是我根据自己的实际工作经验总结出的运维工程师在不同阶段的特点。还是希望更多的运维工程师能够有一个好的职业,所以在下面提出一些建议。2、如何走自己的运维之路。分享一下我最近面试新人的一些心得吧。面试的时候不会问太多问题,只问应聘者:你会不会安装操作系统?这个问题看似简单,但要回答起来却不是那么容易。应聘者都说不清为什么我的操作系统安装在服务器上,服务器运行正常,也没人说得清。我又问了,你能在任何一台服务器上安装操作系统吗?他们说是的。这个不好挖深,比较肤浅。再比如,很多人在做配置的时候,都会选择在网上输入信息。我们操作系统在配置/etc/security/limits.conf的时候,有些人会把nofile配置成65535,我问他们,你为什么不配一个65536呢?他说不。我就笑了,也就是说很多人不会去仔细研究这个65535能不能配,能不能比这个大,大多少倍,这些都没人去想。所以,面试完之后,我会告诉他们,只有你能深入,你才有价值。对于刚进入职场的人来说,五年内的发展靠的是硬实力;五年后,运维软实力决定了他能走多远。一、磨硬实力(一)官方文件红帽在招聘面试的时候会问一个问题。当运维环境出现故障时,首先去哪里找资料解决问题?如果你回答,我就从RedHat的官方文档说起。找到,再去处理idea,你已经一只脚踏进了RedHat;如果你说先谷歌搜索,你可以继续聊一会,但如果你说先百度搜索,就没有必要进行下面的操作了。这些是RedHat的相关负责人告诉我的。(2)及时跟上流行技术。现在很多人学习运维,只停留在技术落后的架构上,然后根据百度查到的资料去使用,没有办法深入使用。对于优化,也只是停留在微调的层面,不会做进一步的研究。(3)多关注技术公众号我关注了20多个技术相关的公众号,不为别的,就是为了及时了解新技术,提高自己的知识。(4)为自己投资技术书籍我有一个观点。给家人买东西,要舍得花钱;时间也是。读书是一项对自己有益的投资。以下是我看完后觉得不错的书,推荐给大家:技术对我来说是一种爱好。虽然我分不出来那么多精力,但是每当有什么新软件或者新版本出来的时候,我都会去摸摸,看看我以前的技术知识能不能用。在探索新的更好的使用方法的同时让它发挥作用。2.提升软实力。我现在对提升部门所有运维工程师的软实力要求非常高,比硬实力高很多。(1)沟通技巧面试沟通:我在面试的时候,发现有些人的沟通技巧很差。虽然我已经尽量让他在轻松的环境下面试,从最轻松的话题开始,然后逐渐进入正题,但他还是紧张,不知所措。但是,沟通能力不等于口才。它应该有一些关键要素。沟通的时候,把你做了什么,为什么做,有多少种方法来解释清楚。这就是沟通能力。上下级沟通:做管理的时候,你会发现领导最想听到下属的反馈。我向下布置任务的时候,希望过段时间他们会来找我,了解这样做的目的,如何规避风险,有没有其他的应急预案等等。如果没有沟通,上下级很容易出现这样的问题:比如我安排的配置要求很高,但是他们不知道我要达到什么水平,还认为配置很好。才发现效果还不够好。如此反复,领导只能时不时关注下属的任务进度。我们在建立呼叫中心的时候,招聘了一个人力资源负责人。他第一周下午下班后给我和公司所有高层发一份周报,汇报项目的完成进度,完成结果,谁负责,为什么延期等,很详细.那个时候大家的反应就是这个人一定要好好的留着。所以,通过写周报,就体现了他的价值。我推荐阅读这本书《不懂汇报工作,还敢拼职场》。(2)时间管理能力(碎片化时间)当你不加班的时候,下班后你通常用手机做什么?我的习惯是,如果坐地铁,我会利用这段时间看文档、PDF等。非常值得一提的是,去年给我们公司培训过的一位讲师,碎片化时间管理非常出色。例如,在我们现在的峰会上,会有10分钟的休息时间。这10分钟,他可以写个PPT准备明天的演讲,但大部分人做完今天的分享,就会去那里。做下一个PPT。因此,懂得如何利用碎片化时间是非常重要的。(3)方法论技术人员常用的方法论是什么?SWOT6W2HPDCA鱼骨图:Man,Machine,Method,Material,RingTaskDecompositionMethodSMARTPrinciple:Specific,Measurable,Achievable,Timely,Relevant性思维导图SWOT原则可以用来分析自己的优势和劣势。当你去新公司工作时,挑战和机遇是什么?所以面试的时候经常问两个问题,你了解自己吗?有的人想过,有的人没有想过,我来提炼一下,你自己的长处是什么?你的弱点是什么?PDCA的原理其实就是帮助我们做事情之前做好计划,做完之后再检查。原理比较好。很多时候,要想做好,就必须要有PDCA原则。我推荐阅读这本书《管理管到位就这几招》。鱼骨图、任务分解法、思维导图,这三个我什么都用。如果鱼骨图不成功,反过来定位失败的原因,制定计划,然后按照思维导图做这个任务;你的执行计划是什么,制定执行计划,然后把任务分解:什么时候,做什么,需要什么配合。(4)工具下面是技术人员经常使用的工具:Xmind:用于思维导图;JIRA:通过JIRA管理项目,根据项目的进度,评估每个团队成员每周的工作是否饱和。如果这周谁有空,我就让他做学习、改进或优化;Confluence:在本系统中做文档管理。(5)项目管理能力、事件回顾、评审能力最后,项目管理能力、事件回顾、评审能力也是需要提高的软技能。我推荐读一本书《复盘:对过去的事情做思维演练》。Q&AQ1:我是做系统安全运维的。我所知道的安全事件一般都是由用户泄露引起的。想问一下,对于现阶段运维安全结合的方向,大家有什么指导意见吗?A1:说说我的感受:如果运维是面向安全的,我不知道该如何去面对。为什么?因为运维在做一些开源组件配置的时候,很多时候是可以避免安全问题的。像之前在网上看到的NTP、DNS的域名反射攻击,还有数据泄露,这些在我看来其实都不是应该发生的问题。因为作为运维,他的职责首先是稳定,其次是安全。我们讨论的安全问题80%都是运维引起的。为什么?因为我们不考虑配置,所有的配置都是默认建立的。对于公共IP,您的数据直接公开。在我看来,如果在安全方面好好利用这些开源组件,那就更直接了。如果这个开源组件中有一个参数是指定的IP,你只需要将这个IP指向内网IP,然后让端口指向内网即可。您的安全80%的运维工作已经完成。Q2:我是运维开发人员,想问一下,您怎么看待运维和运维开发的关系?A2:只有深入了解自己业务的基本组件,并能用好它们,才可以在自己的运维和开发中得心应手。比如我们公司,从运维开始就没有做过运维开发,但是在运维的过程中,我们会做简单的运维开发,做一个平台,实现很多功能。为什么不招运维开发?因为当时还没有完善的运维体系。只有建立规范化、规范化的运维规则、制度、流程,我才会用运维来发展。比如现在我有了标准化标准化的东西,我需要招运维开发人员帮我实现相应的平台,更高效的实现运维的目标。所以,对于运维开发,个人建议要么做监控,要么想负责所有开源组件更好的运维,先夯实运维基础,再做运维架构。讲师介绍了拥有10多年运维管理经验的李强。曾在AdMaster、饿了么担任运维经理。现任天天拍车运维总监。建设和培育。擅长互联网运维体系、运维技术体系的搭建,高并发互联网基础设施的设计与优化。同时,作为思科网络模拟器在中国最早的推广者之一,虚拟化先锋论坛的创始人,一直致力于网络模拟器的推广使用,为中国网络工程师的培训贡献力量。