当前位置: 首页 > 科技观察

微盟删库事件深度评测报告

时间:2023-03-15 20:00:03 科技观察

介绍有“三不朽”:立德、立功、立言。一个人无德不立,德才兼备,才配得上大任和良知。本次故障及事件简要回顾2020年2月23日18时56分,微盟研发中心运维部核心运维人员通过VPN登录服务器,恶意破坏线上生产环境;2月23日19:00,微盟内部系统监控报警,大面积服务集群无法响应。2月25日7点,生产环境和数据部分恢复。预计25日晚24:00完成生产环境修复,新用户恢复营业。老用户预计要到2月28日晚才能恢复。随后,微盟对恶意破坏生产环境的犯罪嫌疑人进行了跟踪分析,成功定位到犯罪嫌疑人的登录账号和IP地址,并于28日向保山市公安局报案。24号。目前,犯罪嫌疑人已被宝山区公安局刑事拘留,并对犯罪事实供认不讳。事件的第一个也是最直接的影响是严重的经济损失。这件事对微盟本身和整个行业都有很大的影响。据相关数据显示,截至2020年2月25日10时,微盟集团报5.620港元,下跌5.23%。2月24日至25日10:00,微盟集团市值蒸发约12.53亿港元,给微盟客户带来的损失无法估量。对于微盟老用户来说,5天以上都会面临系统故障。对于疫情期间就已经饱受关店之苦的商家来说,这是双重的致命打击。其次,在更深层次上,微盟的社会公信力受到较大影响。本次事件是一起典型的运维安全事件,给公司业务注入了危机。此次事件或将极大影响微盟的社会形象和商业生态。公众对其管理、服务和技术的质疑在所难免。此外,本次活动对于IT圈,对于运维同行,对于远程办公等,都是一次深刻的警示教育,让人深思,深表警惕。将产生深远的影响。网友称,前天晚饭时间,微盟出了大事。一个情绪波动剧烈的运维同学删库,引起轩然大波。好在在微盟和腾讯云的努力下,相关数据正在有序恢复中。回顾这两年的数据库删除事件,可以说是层出不穷,有误删的,有介质损坏的,还有人为造成的。单从这件事来看,就很严重了。肇事者被拘留,公司损失惨重。那么如何从中吸取教训,如何规避呢,下面就微盟事件网友们的一字一句、一字一句全面梳理一下。专家总是在网民中。他们懂礼仪,懂法律,懂技术,会管理。且看网友如何评论微博事件:大佬观点1:需要什么样的权限来限制运维?现在的远程办公场景下,很多人都纠结于VPN的权限问题。一个许可不是另一个。今天我们说的是危险行为限制相关的权限,不是运维岗位需要的绩效权限。事实上,人的行为比想象的更危险,尤其是关键岗位,而这种危险一般来自于不知道这种行为有多危险;他们会故意执行这种他们知道是非常危险的行为,所以权力的控制首先要做的就是限制危险的行为。一直以来,笔者一直觉得在产线环境下传单是一个很不好的习惯,除了那些在领导面前炫耀自己本事的人。在我看来,一个公司运维的技术能力,安全管控体系是否完善,都可以通过运维人员的具体操作和权限控制看出来。完全人性化指挥,体现运维能力和安全性管控系统越弱,运维能力和安全管控系统越强,运维能力输出自动化平台。rm、mv、alias等危险命令要严格控制;身份验证应尽可能详细;禁止直接使用root用户。这些耳熟能详的规则其实就是运维的门规,日常运维checklist中必不可少。但事实真的如此吗?如何通过这些有效手段限制这些危险行为?一个好的运维输出能力应该是这样的,人管代码,代码管机器,不是人管机器。你可能还记得DevOps的目的,就是在组织层面提高效率和质量。放在这里不是一个好的解决方案,危险的行为是由机器执行的。从信息审计的角度来看,现网环境的每一次变更,也是一次变更,一次环境发布,可以跟踪、追溯、记录、审计。我们回到阿西莫夫的机器人三定律,第三定律:机器人必须保护自己,除非它违反第一和第二定律。当一些危险行为发生时,系统的使用者和管理人员应该采取预防措施。除了检查表还有更好的方法吗?即分而治之,操作员发起操作请求,审核员审核操作请求,机器执行请求。过度扩大权力的控制实际上是错误的。这是一种倒车,并不是所有的动作都是危险的动作。因为故障不同于灾难,除了人为之外,有时候老天也会和你作对,介质损坏,设备故障,病毒感染会让你的权限控制无用,该发生的故障会不请自来,你的checklist,操作而维护流程和权限体系就没有用了,那么需要什么样的权限来约束运维,又不会增加太多的人力、物力和财力,不外乎三点。(1)构成极端危险行为的行为;(二)平台化、自动化运维方式;(3)在线评审流程。大咖观点二:备份怎么做?如观点一所述,当你的checklist和权限控制无法掌握时,你需要的是一种实用的备份和恢复方法。一般来说,在没有热备份的情况下进行危险操作,不亚于不系安全带开200英里的跑车。你很幸运能活着。在这次事故中,我们发现恢复时间是最亮眼的,不亚于顺丰删仓事件中的恢复时间,非常长。仔细分析,除了始作俑者同时删除了主备库外,只保留了冷备份。备份时间的问题,全量和增量时间都会影响到你的备份数据的数据失真。比如你把备份的数据恢复到现网环境,在这段时间里,你对数据有一些增删改查,那么你备份的数据就乱码了,所以你需要热备份,而你还需要备份所有DDL和DML语句的记录。恢复验证。许多公司在实施备份策略的这些年里从未进行过恢复测试。事实上,当重大故障或灾难袭来时,你会发现各种问题导致你的恢复失败,比如介质问题、数据问题、以及操作问题。工程师职业道德的反思与总结首先,奥维以这样的形象走向了社会的前台和中心,被同仁鄙视。俗话说,出来混就得还!正如业内资深专家所言:删除数据是违法行为,是对技术人员底线的践踏,理应受到严惩!在谈工程师伦理之前,先说说道德、制度、法律的关系。准确地说,是靠道德和专业约束自己,靠制度规避风险,靠法律惩戒违法行为。其实所有的风险都是完全靠技术来解决的,成本会非常高。只有通过制度、技术、企业文化、价值观才能防范和防范。对管理者来说,要让员工有所成就,就是把人看作一个有机的样本,具有特殊的生理和心理特征、能力、缺陷和不同的行为模式。把它看成一个活生生的人,而不是一个东西。作为一名工程师,需要的不仅是诚信,更需要敬畏法律,敬畏职业。人生在世,要对自己负责,对家庭负责,对社会负责。云厂商的选择云计算引爆了互联网的发展,越来越多的企业选择了上云。也可以预见,云计算的未来就像今天的电力一样,已经完全成为信息经济社会的基础资源。因此,云提供商的选择极为重要。对于微盟,事故发生后,腾讯云技术团队第一时间与微盟结盟,研究制定修复方案,协助微盟将损失降到最低。删库事件是不幸的,选择腾讯云是幸运的。不难想象,如果没有腾讯云的助力,后果可想而知。普及法律法规根据第四条:破坏计算机信息系统功能、数据或者应用程序,有下列情形之一的,视为“刑法”第286条第1款、第2款“严重后果”:(1)造成十余个计算机信息系统的主要软件或者硬件不能正常运行的;(二)删除、修改、增加二十多个计算机信息系统存储、处理、传输的数据的;(三)违法所得五千元以上或者经济损失一万元以上的;用户为提供服务所使用的计算机信息系统不能正常运行超过一小时的;(五)造成其他严重后果的。实施前款规定的行为,有下列情形之一的,视为对计算机信息系统造成“后果特别严重”的损害:(一)数量或者数额达到本款规定标准的五倍(前款第(二)项一至(三)项,致使500个以上计算机信息系统或者为5万个以上用户提供服务的计算机信息系统的域名解析、身份认证、计费等基础服务无法正常运行的;累计不能正常运行超过一小时的;(3))破坏国家机关的功能、数据或者在金融、电信、交通、教育、医疗、能源等领域提供公共服务的计算机信息系统的功能、数据或者应用程序,对生产生活造成严重影响的或造成不良社会影响;(四)造成其他特别严重后果的。根据《中华人民共和国网络安全法》第二十一条:国家实行网络安全等级保护制度。网络运营者应当按照网络安全等级保护制度的要求,履行下列安全保护义务,保护网络免受干扰、破坏和未经授权的访问,防止网络数据泄露、被窃取和篡改:(1)制定内部安全管理(二)采取技术措施,防范计算机病毒、网络攻击、网络侵入等危害网络安全的行为;(3)采取措施监测和记录网络运行状况,(4)对重要数据采取数据分类、备份和加密等措施;(五)法律、行政法规规定的其他义务。安全意识安全意识培训必不可少。安全不仅仅是安全技术的责任,更是企业每一个人的责任。根据《网络安全法》,谁经营谁负责。因此,企业法人要毫不犹豫地做安全运营第一人。的性格。安全运维是一个全员参与的三维工程。只有尽可能降低每个环节的风险,才能降低整体的风险面!单一的防御面是万无一失的,没有100%的安全,但安全意识是万无一失的核心基因。文化传承思思中华文化源远流长,讲究仁义,以德为先。以德立本,立万事。道生于本,道生于道,正如古人所说:人有“三不朽”,即德、功、言。孔子所谓的仁,其实就是佛教所说的悟道、悟道的境界。一旦开悟,就会明白世间无我无他,万物皆一。整个世界和宇宙都是我们的。自己的。王阳明曾说:“无善无恶身,有善恶。知善知恶是良心,行善去恶是审事。”核心价值观其实是一种美德,不仅是个人的美德,更是一种大德,是国家和社会的美德。国无德不能兴,人无德不能立。服人,以德为上,以才为中,以势为下。作为专业的运维同仁,有技术特点,希望大家互相鼓励。只有德才兼备,才能无愧于国家的重大责任,才能为良心服务。