最近热议的微盟系统故障事件,想必大部分人都已经关注了。截至2月26日中午,微盟官网仍有公告,表示数据仍在修复中。从2月23日晚开始,SaaS业务的生产环境和数据遭到严重破坏,至25日核心业务基本恢复,新用户使用基本不受影响。不过由于部分数据还在修复过程中,官方还是建议老用户重新注册账号使用后,后期会合并新旧账号数据,估计无法完全修复直到28日晚上。删库跑路这几年时有发生,甚至时常成为技术圈调侃的话题。作为国内最大的微信生态服务商,微盟在香港上市已近七年,员工人数超过3000人。系统故障造成的严重影响持续了36个多小时,数万商户无法开展业务,股价暴跌。很难想象,这是一家上市公司所经历的困境。如果23日19:00开始计算,要到28日官宣才能全面修复,这次故障的影响将持续数日。“删库跑路”产生如此深远的影响,实属难得。微盟官方对事件没有太多细节:嫌疑人为微盟研发中心运维部核心运维人员何先生。2月23日18时56分,他通过个人VPN登录公司。互联网跳板机因个人精神和生活原因,恶意破坏微盟线上生产环境。意识到事故后,微盟第一时间联系腾讯云制定修复方案。即便如此,也花了几天时间。在后续回应中,微盟集团表示,商户数据备份已完成,系统服务恢复后商户使用不受影响。通过各种已知信息点对此次事故进行简单回顾,斗象科技技术总监徐中豪认为,微盟内部应该构建了一定的安全能力:VPN:提供远程网络访问和基本的身份认证以及网络访问授权。跳板机:SaaS服务器只允许跳板机访问,提供基础网络和数据库网络访问控制。主数据库和备份数据库:具有故障转移和数据恢复能力期间的可用性。在生产环境中,运维权限相对宽松,研发权限普遍收紧。相信很多互联网公司都处于类似的状态。目前,在这次事故中,主数据和备份数据都应该被删除。幸运的是,执行的是“删除”操作,而不是“清除”、“覆盖”、“加密销毁密钥”等操作。这种情况下还是可以从副本或者磁盘恢复,但是恢复效率慢,耗时长,所以出现了微盟说“商家数据备份完成”的情况,但是需要很长时间才能完全恢复。建议业务风险管理措施截至目前,犯罪嫌疑人何某已被刑事拘留,微盟核心业务已恢复正常,其余部分数据已逐步恢复。“微盟事件”或许是众多中小互联网企业安全建设的缩影,也为所有企业敲响了警钟。内幕犯罪仍然是各企业安全防范的重点和难点。斗象科技技术总监徐中豪总结了此次事故暴露出的问题,并从业务风险管理的角度给出了一些有针对性的建议:1、数据库权限管理原则,分库分表,权限最小化;从与备份(1)主从:发生故障时,可以进行故障迁移,满足高可用(2)备份:实时备份:在线备份数据库,进行读写分离,用于数据恢复离线备份:日常异地离线备份,用于数据容灾3.备份数据权限控制设置备份数据的操作权限策略,限制高危敏感操作,如drop、rm等设置备份的访问控制策略数据,否则容易导致另一个数据泄露问题4.指令控制对操作系统敏感/关键指令的限制和监控进行审计,收集并远程存储和分析操作指令的历史记录,供数据库审计,设置建立数据库流量或日志审计的报警通知机制5.优化管理流程,完善在线变更流程审批、申请变更周期和操作细节,提高效率cy会更慢,但会提高安全性。系统的风险评估、风险识别和量化、风险处理、风险降低BCP(业务连续性计划)和DRP(灾难恢复计划))的制定、评估和定期演练。有一定规模的企业有必要认真考虑这两个方案。安全娱乐圈也提供了很多点子,比如删除数据库不留痕迹跑掉,也有人调侃。建议在黑市上购买一份被下架的数据,用于数据恢复等。这次疫情给企业带来了很大的挑战,需要大家齐心协力,共克时艰。此外,企业不能只专注于业务,合理的文化建设和员工关怀也是必不可少的。
