当前位置: 首页 > 科技观察

DBA在线运维须知

时间:2023-03-12 07:02:04 科技观察

根据墨菲定律1:“凡是能出错的都会出错,只要任何事件的概率大于零,就不能确定它不会发生。”这句话如果说是一句谚语的话,想必每个运维从业者都有很深的感触。本文从DBA线上操作的角度谈谈自己的看法。在工作日,DBA会处理大量的工单;在非工作日,DBA随时准备应对紧急情况。也就是说,DBA需要一直在线操作。那么问题来了,个体的状态是不确定的,包括精神状态和身体状态。时刻保证不乱,是DBA的重要素质之一。线上故障分秒必争,处理不及时、操作不当很可能给企业带来不同程度的损失。线上运营需要稳定,本文给出笔者的思考。?PierrePuvisdeChavannes/ThePoorFisherman,1881/Wikipedia2首先,在处理工单、凌晨维护和处理紧急故障之前,先梳理流程并准备必要的材料。优秀的DBA追求的不是速度,不是效率,而是稳定。犯错的概率低,别人也会觉得你更可靠。对于有经验的DBA来说,线上操作就是复制粘贴,宁愿相信0和1也不愿相信自己和别人。每次清晨处理工单或维护,我都会养成一个习惯,梳理流程,准备上线服务器IP列表,需要的脚本,可能的命令,相关文档等。这样做的好处是你心里有计划,不要惊慌。即使遇到紧急情况,也会相对平静。当然,你没有那么多时间来准备紧急故障,但至少你应该准备常用的命令。这里有个小建议,常用的命令用印象笔记保存,当然涉及公司敏感信息的不能保存。就地玩,尽量避免手工输入,因为在高度紧张的状态下,输入错误的概率比日常生活中要高。对于DBA来说,打字错误造成的灾难将是毁灭性的。类似的案例已经有很多了,这里就不展开了。其次,在处理故障之前分析是最重要的。通常断层不是一个单点,而是一个面,或者一条链。在线故障直接影响到用户。原因是用户层、接入层、逻辑层、数据层每一层都可能出现问题。在处理故障之前,不要进行不必要的反复试验。如果一次失败了,下次还是一样的概率就相当高了,然后时间就在不知不觉中浪费了。这个时候就应该冷静下来,思想不能只关注数据层。考虑到整个技术链,这样获取的信息是最全面的。那么问题来了。在互联网行业的细分工作中,DBA很可能没有超越数据层操作的权限。如何做到信息相对完整是下一个话题。第三,学会沟通,尽可能做到信息对称。第二点提到DBA更关注数据层,实现整个技术链的信息流通非常重要。这其实不是技术问题,而是一个人的软实力。关于提问的智慧3,可以参考笔者之前的文章。我们都知道提出好的问题比答案本身更重要。DBA在处理故障时可能会涉及监控、研发、测试、产品、运维等。监听会反馈受影响的范围、延迟等,属于用户层;研发、测试、产品会反馈业务故障、程序日志等,属于用户层和逻辑层;运维会反馈网络情况和流量情况,web服务器异常等等,这个属于接入层。最后,DBA会关注数据层,包括持久层和缓存层,然后结合不同链的信息,进行综合分析,然后进行相应的操作。在线上运营中,我们不能容忍低效甚至无效的沟通。第四,三思而后行。DBA们要牢记“备份比什么都重要4”,修改任何配置文件前先备份,慎用甚至不用rm。对于有DROP和TRUNCATE的工单,要反复审核确认,避免无效操作。如果有这样的需求,首先要确认是否有备份,备份是否可用。DBA应该清楚地了解高风险操作。此外,所有的恢复操作也需要牢记在心,防患于未然。第五,事后回顾、反思、总结,形成知识库。故障是不可控的,可能是人为的,可能是程序的bug,也可能是网络故障,总之,故障的原因是多种多样的。但是我们可以控制失败后的回顾、反思和总结。针对具体的故障,反思处理流程是否有优化,反思基础设施是否还存在不完善,反思团队存在的问题,反思与其他部门的配合是否存在问题等,然后形成会议记录、故障报告、故障总结,形成知识库,定期复习一遍,避免下次出现类似问题。另外,也可以作为新入职人员的参考,从真实案例中学习,进步会更快。要成为一名优秀的DBA,技术是一方面,更重要的是个人素质。比如要有良好的习惯,要有过硬的心理素质,要有责任感和道德感,要有良好的沟通能力……这些软实力才是基石。在此基础上,拓展技术的广度和深度,这样才会有更好的发展。借这篇文章聊聊你最近的想法。笔者经常反思自己为什么坚持这样更新博客,最近有了一个比较理想的答案。一是督促自己思考,二是为他人提供价值。先说第一点,坚持更新博客是为了提醒自己不断思考,这样才能获得比别人更多的超越技术的能力。但是,这些能力是在枯燥的工作中学不到的。世界上的道理很简单,每个人都明白,但真正付诸行动并坚持下去的人却少之又少。你读了一千篇文章,读了一百本书,但如果你不行动,那也是白费力气。然后说第二点,博客很重要的一点就是为读者提供价值。读者觉得你的文章能启发他,是正向输出;读者评论你的文章,通过邮件与你交流,加微信与你聊天,这就是正反馈。你为读者提供了价值,说不定有一天读者会给你带来意想不到的惊喜。一个长期保持高质量更新的博客,对自己和他来说都是一笔财富。即使它现在没有实现,将来某个时候它也会实现。回到这篇文章本身,作者一直强调软实力。软实力靠的是长期积累,需要不断提升自控能力。归根结底,任何管理本质上都是对自我的管理。