当前位置: 首页 > 科技观察

揭秘BAT运维的奥秘,大型互联网公司如何做好运维管理?

时间:2023-03-16 23:47:55 科技观察

相信做运维的童鞋都会有这样的经历,“参加7*24小时值班,抗着机器,敲代码,偶尔把数据玩两遍”。在一些小公司,运维童鞋不能说是多面手,但至少有空子的地方能补上。但是大公司对运维工作的分类比较细,比如以高重复工作为主的运维、以基础运维工作为主的业务运维、以运营为主的项目管理和需求规划设计等运维工作规划运维、开发运维重点开发运维工具等。大公司的运维工作不仅面临分工复杂,还要承受高峰期的冲击交通。那么,大公司的运维工作是如何管理的呢?本文将以BAT为例,揭开大型互联网公司运维思维的冰山一角。腾讯:服务化、标准化、自动化、产品化当运维团队只有几个人的时候,大家的工作状态可能是“个人自扫”,哪里需要救火就支持哪里。但是,当团队人数增加到几百人、几千人的时候,如果工作状态还是这样的话,可能就出大问题了。因此,腾讯运维服务实现了“四个现代化”,即服务化、标准化、自动化和产品化。如何理解“四个现代化”?服务化是指为业务服务,倾向于解决产品的痛点;标准化是自动化的基础,因为业务架构的差异是不同的,所以标准化的粒度和维度也需要调整;自动化,必须打通企业中的各个信息孤岛,只有全流程自动化,才能真正实现自动化;产品化,运维平台也要注重用户交互,要以产品的概念来建设。百度:书同文、车同轨、行同魂从网上公布的信息来看,百度运维经历了四个阶段,即脚本工具、基础运维平台、开放运维平台和智能运维平台。运维的核心目标也从之前的提升效果转变为如何解放运维本身的效率。在SACC2017大会上,一位百度讲师曾透露,“百度指导运维的三大思路,书上同文、车上同轨、线上同道”。怎么理解呢?”,比如运维应用、服务、机房、集群的定义;车辆同轨指的是一致运维的“方法”,比如执行扩缩容,执行流量切换;行通轮是指一致运维的模式,比如故障诊断策略、弹性伸缩策略、流量调度策略。百度AIOps技术栈阿里:通用的“大中小前台”,似乎很像每个公司运维的“杀怪升级”路线。阿里也经历过脚本、工具、DevOps、自动化,然后是智能。过程。在DTCC2018大会上,阿里技术专家徐晓飞曾将AIOps无人运维与无人驾驶进行类比。两者都可以分为六个阶段,每个阶段都有相似之处。其中,AIOps无人运维的六个阶段分别是人肉运维、脚本/工具化运维、平台化运维DevOps、数据化运维DataOps、高度智能化运维AIOps,以及全智能运维AIOps。从无人值守AIOps无人运维的角度,了解阿里的人应该听说过“大中小前台”这个词。这是阿里所有技术部门奉行的技术战略。没有例外。阿里大数据运维阿里有一个大数据运维解决方案叫Tesla,贯穿阿里整个大数据体系,负责从基础设施到基础平台再到存储、计算的所有产品的运维支持平台。运维垂直体系也是SPI的层级结构。运维IaaS层,负责为运维管理提供基础运营能力;运维PaaS层为各运维领域提供功能服务,以及运维数据源和管控服务;运维SaaS层提供面向场景的自动化智能运维应用。