当前位置: 首页 > 科技观察

14年蜕变:从菜鸟到卡厂运维总架构师_0

时间:2023-03-13 21:00:14 科技观察

嘉宾介绍了中国卡厂技术委员会专家、信息中心架构室负责人任铭。高可用性、问题、容量性能管理器。运维架构师、布道者、企业讲师。荣获中国人民银行科学技术发展奖一等奖。负责卡厂云平台和运维平台建设。热爱纯技术,曾从事网络协议开发、省行数据集中建设、卡厂二代系统建设、卡厂云计算系统建设,对运维技术和管理有较深理解和掌握超过十年。专注于数据中心架构、运维架构、云计算、自主开源、DEVOPS在传统企业的思考与实践。前言大家好,我是任铭。很高兴在线与您分享和交流。今天要讲的话题包括以下四个部分:运维流程运维系统运维思考从运维到放弃,希望能给运维的小伙伴一些启发和收获和维护。首先放一张图来说明几个数字:交易量1亿/天核心系统10年无故障核心系统59异地切换100秒10000个节点管理3000笔交易TPS运维流程Stage1:菜鸟呱呱叫(2006年以前)阶段特点:学什么要求:协议分析图形展示网络学习:使用fluke协议分析tcp经典三卷Javaccnp要求:数据移植学习:sqldb2jdbcinfomixds8000sharkb16要求:系统部署系统在线学习:aixsusehacmppower/lparshellds8000sharkcatalyst要求:大小额,信用系统,卡前,checkimage学习:sybase,MQ,cicstsm为了实现一些明确的需求,有针对性的自学基础学习.基本的监控、巡检、备份、日常操作等都是用shell+java编写的。由于单兵作战的人不多,而且都是新手,所以基本都是靠自己的测试和实验。而且当时运维学习资源和交流方式都比较匮乏。加班是常态,熬夜是常态。马大牛黄埔军校,曾经是金融界最早的两天校之一,现在是银行,很多集成商的专家和领导都出自那里。在管理员的时代,似乎没有运维、系统管理员、网络管理员这些东西。也尝试考了很多证书,比如DB2AIXcate、CCNP、OCP、systemanalyst、RHCE等等。第二阶段:运维在路上(2007-2011)阶段特点:1、专业分工成熟、管理分工细化后,将更加注重部分系统运维和部分应用运维和维护。虽然可以更细化、系统化地了解系统化的知识,但也会造成全面性的欠缺。2、ITIL在接触ITIL之前,一直觉得是个高大上的东西,自己也深入研究了一下,通过了master认证。鬼子总结的方法确实很详细。但是很多传统企业落地的时候,确实已经成为了人员的过程控制/记录工具,和技术本身关系不大。举个例子:CMDB跟银行、保险、证券、航空、制造、物流、电力、烟草等很多公司交流过,从来不认为CMDB是成功的,可见一斑。问题是大家在做的时候还是为了ITIL和ITIL,并没有从实际需求出发,考虑自动化和便捷性,没有从运维消费场景出发。我开始负责公司的问题管理流程(包括生产问题的技术质量控制)、高可用性流程(演练、故障模拟、测试方法、应急响应)、容量性能管理(容量模型、容量活动)、容灾technologyprogrametc.3.Traininglecturer一次偶然的机会,替朋友做了一个企业培训(AIX),然后慢慢开始兼职做IT专业讲师,做一些烟草,电力,银行等方面的培训.,主要针对poweraixdb2cicshacmp等。占用了机会的所有空余时间,但还是有收获的:准备课件技巧(PPT、组织逻辑)讲课技巧(反应、语言、表达)备课可以让自己的学习更加巩固金钱学习操作和多企业维修技术与操作维修方法4、产品为王。传统企业的运维大多依赖产品的购买,无论是备份(tsm/nbu)、监控(tivoli/patrol)、测试(loadrunner、qtp)、os、db、中间件等。购买商业产品,除了一些简单的日常运维shell。第三阶段:雨将至,天上乌云密布(2011年以后)当我在感叹传统IT运维已经陷入平台期的时候,变化就这么巧合的发生了。以上是我2012年写的云计算内部技术宣传资料。阶段特点:1、开源独立公司开启了开源自主技术路线。对于一个大公司来说,有一个明确的技术战略是非常有用的,这样就不会出现自下而上使用开源产品而引起的质疑和反对。可推进大胆选择、大胆试验、先行先试。Bind、haproxy、mysql、jboss、redis、memcached、zabbix、openstack逐渐取代原有产品为王。这是我们基于当时行业热点技术的技术雷达分析。2、云计算这几年,搞IT的不说以前玩过云计算,也不好意思和同行交流。确实,因为云计算、devops、开源等等,再次为我在技术道路上指明了前进的方向。十年前交流的时候,我说我在搞AIX,觉得很高级,现在不得不说我在玩cloud/x86。回顾三年半前的这篇文章,似乎我没有猜错。3.Devops开发运维更进一步,解决原有的部门壁垒和责任问题,通过平台、机制优化、技能提升,共同承担应用、业务、市场的快速变化。基于这样的变化,我们也衍生出了“托管”和“联营”的开发运营模式。这是我们今年校招JD,已经很明显偏向devops技能了。4、传统+互联网随着互联网企业“反超”传统企业的业务,卡厂商也增加了很多面向持卡人和商户的2b2c应用。银联钱包、互联网在线、营销活动等业务直接带来更多以往经验无法解决的问题。于是,各种学习、交流、测试、解决问题又成为了工作的重心。同时,由于卡厂在传统金融行业(开源、独立)走的比较彻底,在增量应用中大量采用开源软件运维系统。扎实的学习很有用。在实际学习中,tcpip、算法、数据库原理、操作系统原理等都是只有在实际使用中才有用的东西。技术:基本操作、命令和配置。方法:将测试、监控、容量、高可用、容灾、安全、备份、自动化等细化标准化,然后平台化,提升运维水平。2.运维可用性运维可用性从高可用、安全指标、性能能力指标、监控四个技术维度,以及演练和应急响应两个管理维度来衡量。至于高可用指标,我们可以看到,通过结合环境、网络、存储、服务器、数据库、中间件、应用、安全、数据、容灾等可用性指标,我们可以解决每一个可能出现的技术单点造成风险。能力绩效指标监控安全演练通过演练的统筹规划,我们几乎每天都有多次实战演练。应急三轴确保值班人员能够清晰、快速地处理故障。三、运维平台运维理解1、要懂业务就必须懂业务,否则你连应用发布是干什么的都不知道,除了问题只会打电话。2.不断抽象,不断总结和抽象自己的工作和思维方式,“你为什么要做这个”,“你能不能做得更好”,“你还能做什么”,“你能不能做得更好?”“不能推广到其他地方”,“能不能更快更好”……3.自动化OS安装,was安装,应用安装,重构,自恢复等没有增加价值的,努力找一个方式自动化。换个维度解决问题,比僵局有效一百倍!4.听说读写没有声音戏再好,也出不来。学习技术很重要,但随着年龄、经验、圈子的变化,听、说、读、写也很重要。经常总结自己的经验,经常学习新东西,测试写出来。经常和人交流,交流大家的技术和想法。一切从“运维到放弃”也是一样,精力和时间的分配决定了前方的距离Q&AQ1:你开始用docker了吗?是我们吗ed来替换cgroup。Q2:?这张图是什么意思?A2:这是每个月的实战演练次数。Q3:您是否打算将自己的安全性集成到安全的云模型中?你怎么看待这件事?什么是架构设计?A3:安全方面还是产品化,比如ips、堡垒机、杀毒等,现在加入的是hostips,类似云盾模块,但是没有计划做安全的入口处的云团。Q4:看过很多高端架构,但不知道如何实现。什么样的方法有助于更好的实现?A4:其实这个问题还是问应用架构师比较好,不过一般的回答是:一是大系统小,层级、框架、数据同步确定,接口也可以用过的。等关键方案出来后,一步步分析拆解设计。二是根据业务特点确定技术需求,如后台、前台、2b、2c。最后,你会发现设计完成后,相同技术要求的应用系统是一致的。Q5:从事IT软件开发的人,35岁以后有没有合适的出路?做云计算项目停留在开发层面,不知道接下来的路该怎么走。A5:主要看个人发展,喜不喜欢发展。如果是的话,加强听、说、读、写和总结,经常和自己的上下级同事交流,和外部同行甚至跨行交流。如果没有,那就转向产品、业务、市场和开发,这些都是非常有效的。国内环境确实不好,尤其是互联网时代之后,前两天去武大和南大招聘的时候,男生只愿意做开发。所以,后浪太多了,前浪只好利用自己的优势和经验,慢慢给后浪布道。Q6:有没有人真正把Oracle做成云?A6:云计算的发展非常火爆。我们现在需要云计算开发和运维开发,很流行关注它。但是,oracledb2在云端做什么呢?感觉有点自相矛盾,除非体量很大,自主需求频繁。