当前位置: 首页 > 科技观察

一位运维小哥的运维法则十大总结收录

时间:2023-03-14 11:15:41 科技观察

作为一名IT小哥,在看技术书籍的时候,看到作者的运维法则总结,内容简明扼要,浅显真实。有些认知是我自己的理解,但我无法用语言来概括;有些事情让我从无知走向认知;有些东西想做却做为运维小弟做不到~总之,看完如获至宝。当然,作为运维小弟,下面的内容和规则(一般涉及系统)能自己控制的很少,但丝毫不影响我的学习欲望!那是我工作的方向,那是我狂妄之心的追求,那是我在提升能力的同时注重的自我升华。以下是我根据书上的内容和一点点自我认同摘取的一些精华(至少我是这么认为的,^_^)。个人觉得有的适合运维人员,有的适合技术管理人员。相信有很多和我一样的IT兄弟姐妹,所以希望分享出来,希望能让有需要的人看完后有所感触!为什么一定要总结这两类人的改编内容呢?呃,毕竟不想当将军??的军人不是好军人~对于运维来说,平台、工具、知识、经验、意识等等都很重要,它们都决定了运维的好坏操作和维护在一定程度上。至于运维规则,更是不容小觑。调整之后,可能会有四两千斤的效果!以下内容是我对技术书籍的节选,加了一些个人感悟和个人的话,不喜勿喷!1、不要重复劳动不要重复劳动,不要什么都从外面拿,比如工具、代码、框架等,需要考虑的是在合适的时间以合适的成本切入,并且还需要考虑投资回报。一般来说,每个公司都有重新发明轮子的现象,很多人都热衷于此。他们可能需要用这样的项目来证明自己,却忽略了投入产出比这个重要指标。如果能充分利用社区的成果,利用公司现有的成熟框架,可以大大加快你的项目进度,何必自己做一个呢?可能有些人会想着重新发明轮子,真的可以锻炼团队。毕竟一个项目从零开始,往往比普通项目积累的经验要多得多,对个人成长和公司后续项目都有帮助。2、允许错误的人不是圣人,没有错,运维也一样!错误并不可怕。关键是要建立一种机制,让错误尽快改正,限制错误的范围,同时总结,让个人从错误中成长,让组织成长。当然,允许错误并不意味着在每一个细节上都可以犯错误。允许错误是基于整体系统在总体层面上已经尽可能完善,运维流程已经标准化。发生不可预知的错误!只要有硬件载体,就必然伴随着各种故障。有时为了追求高可用性,设计复杂的架构或者准备过多的冗余设施往往会导致方案成本的急剧增加,而方案的复杂性也会增加后期改造和维护的难度。国内很多公司号称可用性高达99.99%,为了精度高,甚至在小数点后加了几个9。但是大公司的云产品造成小公司的数据丢失,大公司的页面异常响应活动日等等,让我们唏嘘不已~~3.设置备份角色可能只有运维工作中的人才能看到日常运维的价值,而当主角色因为某种原因离职、加班、辞职时,备份角色的价值就是突出显示。他可以让正在进行的项目不被打断,让正在进行的工作不至于被动。备用角色的高效培养需要文档、流程、规范的支持,所以运维规范也是重中之重!4、无监控,无运维定位瓶颈。这句话说明了监控的重要性。一些资源的争夺可以通过监控系统直观的反映出来。对于一些隐藏深层次的资源瓶颈和系统瓶颈,往往需要借助工具,依靠经验来分析判断。作为运维人员,要有意识地尽可能通过监控系统发现问题,让监控系统越来越智能,越来越少依赖人的经验。高级工程师和初级工程师之间有很大的区别。高级工程师知道如何定位瓶颈。他们不仅知道如何使用工具,还知道何时、何地以及为何使用它。这样就可以在问题爆发之前定位到瓶颈。当然,单一的运维知识可能无法满足定位瓶颈的需求,因为数据可能要经过很多环节,比如本地电脑、浏览器、DNS服务、负载均衡设备、应用服务器等等.因此,你应该尽可能多地涉猎不同领域的不同知识。5、关注工具/平台很多互联网公司都有基础平台技术部门,负责开发基础平台、工具和服务,提供给各个应用研发团队。但这往往是一件短期内难以看到效益的事情。对于业务规模小的公司,更多的时候是在做技术储备。基础平台部门往往随着公司的快速发展而壮大。开发出来的产品不使用,自然不会改进,也就没有人会用了。如此恶性循环。形势往往考验着高层的决心。考虑是否有必要继续保持适当比例的底层平台开发人员?毕竟,应用软件的研发不同于平台工具的研发。如果基础不扎实,可能会造成更大的经营风险。所以从长远来看,用一些人力(高素质的工程师)来做平台和工具其实是节省成本的!硅谷有些公司让优秀的人做平台和工具,给予最好的待遇和足够的尊重,他们的衡量标准应该不一样!6、分工明确一个大型系统架构系统的维护,离不开训练有素的工程师。他们需要大量的知识、经验和技能,而且必须有明确的分工,比如开发和维护平台,专门的数据操作,以及性能调优、源代码优化等。一个优秀的团队可能还包括项目经理、质量控制、文档编辑、成本分析、培训和教育等专业领域。不同岗位的人员发挥各自专业领域的优势,各司其职,让整个项目大放异彩。7、善于分享,多参与行业技术交流。对于一些问题,一些公司可能有更好的解决方案。如果你分享你的经验,你的同龄人也会分享他们的经验。从某种角度来看,两者是竞争对手,但如果要发展,就必须看行业内的竞争对手在做什么,必须跳出公司架构,看技术和管理问题。同时,参加行业技术论坛不仅是关注行业技术动态的一种手段,也是一种招聘方式。通过认识更多的人,扩大影响力,吸引更多的人加入你的公司。在拓展个人人脉的同时,也丰富了公司的发展。为什么不这样做呢?8、重视例会许多管理者忽视了周会和例会的重要性。如果长期不注意,整个团队可能会变得松散,没有凝聚力。周会的一个重要功能就是讨论分工。随着机器规模的扩大和人员的增加,团队管理者需要分工明确,责任到人,尽可能地激励员工尽职尽责。周会还可以互相讨论工作进度,交流未完成工作的对策,了解团队成员的工作状态,传达上级领导的指示,交流技术分享等等~~~总之大家的工作饱和度和个性如果没有有效的沟通,这段关系可能就像一颗水果,从核慢慢烂到表皮,互相埋怨。因此,固定时间的正式沟通并成为一种习惯是推荐的沟通方式。同时也可以使同事之间的关系融洽,人事氛围得到改善~9.性能限制。关键目标或关键成功因素。在达到一定规模后,许多企业将KPI考核作为主要的管理工具。但事实是,业绩是工具,但人是复杂的,管人更复杂。如果我们要面面俱到,很难用性能这个工具把所有的问题都简化。当然,很多东西量化之后,就变得更容易管理了。对于产品经理、运营人员、销售人员等,量化指标往往是看得见的数字。对于运维和一些岗位,可能很难有一个量化的指标!绩效的设计应该是帮助个人发展,帮助员工赢得尊重,而不是束缚个人。当个人价值观与企业价值观发生轻微冲突时,好的公司往往是包容的;而当矛盾严重,个人无法妥协时,可以考虑换个环境,避免继续在一起的双方都受到损失。在《赢》一书中,管理大师杰克·韦尔奇用绩效创造了伟大的文化,其中不可忽视的背景是他用多年时间打造了坦诚沟通的企业文化。没有坦率和沟通,绩效可能成为文化杀手。在推动工作进步的时候,不考虑是否真的对公司有帮助,而主要考虑自己的业绩,是一种很不好的倾向。我现有的工作成果和工作产出决定了我后续的工作方向~~~10、优化设计要有意识地优化流程设计,提高工作效率和服务质量。随着公司业务的发展,运维部门也将相应扩大。如果缺少合理的流程或高层次的人才,那么往往会出现一个问题:人数增加了,效率却下降了!因为随着公司规模的扩大,所管理和维护的资源会迅速扩大。出于安全等原因,设计了各种流程以获得正确的执行结果,但有时这些流程可能会导致效率下降,部门内部的沟通成本越来越高,这就需要运维人员建立流程本身的反馈和优化机制,有意识地持续优化流程!最近良旭经常在视频号上分享程序员直播相关的干货,反响不错。欢迎大家关注一波良旭的视频号,以免错过最新分享!

猜你喜欢