全面升级!龙力自动化运维平台SysOM2.0可支持操作系统一站式迁移|系统迁移等问题。对于迁移过程,如果由人工进行,不仅效率低下,而且存在无法规范、原地迁移等问题,会消耗大量的人力物力,显然是不现实的。如何解决依托工具实现一站式迁移评估、迁移实施、迁移后优化的问题迫在眉睫。基于此,龙蜥社区正式推出了以操作系统迁移和运维为核心的自动化运维平台SysOM2.0。本次升级从架构到核心功能进行了优化升级,包括三大核心能力:操作系统迁移、全面升级、诊断中心和整体架构升级。SysOM2.0将为用户提供完整的迁移功能,包括迁移评估、迁移工具、迁移前后对比、系统优化等,确保用户从迁移到运维的操作系统管理闭环。围绕迁移场景,SysOM2.0还在监控中心、诊断中心等模块丰富了相关功能,进一步提升了操作系统的运维体验。01操作系统迁移还在为CentOS停产而苦恼,不知道改什么,能不能改,怎么改,改后系统会不会出问题?SysOM2.0新增的“OSMigration”功能可以给你答案。SysOM2.0支持所有CentOS7和CentOS8操作系统迁移到AnolisOS7和8,为用户提供一个简单、可视化的界面来完成一站式迁移工作。SysOM2.0操作系统迁移模块的功能点包括:迁移评估和迁移实施。支持就地迁移和批量迁移,解决用户机器太大无法轮换的问题。支持迁移系统异常的诊断分析和系统调优。迁移评估:在操作系统迁移之前,通过自动化迁移评估功能,用户可以了解迁移后的AnolisOS与原系统的兼容性,包括软件兼容性和硬件兼容性,并为用户提供详细的兼容性性能报告,以备不时之需为后续迁移到AnolisOS提供足够的决策信息。迁移评估功能包括:迁移风险评估、对操作系统的全面迁移操作风险评估。系统评估,对迁移前后的系统内置环境变量、服务命令、内核系统调用等系统级配置进行评估。硬件评估,评估系统硬件信息和板卡信息。应用评估,评估系统中已安装应用的兼容性。(图片/迁移评估)(图片/迁移评估报告)迁移实施:用户完成迁移评估后,可通过迁移实施的界面操作完成系统迁移。为避免迁移过程中出现意外或迁移结果不尽如人意,用户可通过界面提前进行系统备份。迁移实现功能支持单机迁移和批量迁移,支持单步迁移和一键迁移,支持备份恢复和离线迁移等功能。迁移实现过程包括:实现配置,以及对实现配置的一些操作。系统备份,必要时备份当前系统。环境准备,迁移前的环境准备和工具部署。风险评估,迁移的实施将进行风险评估。迁移实施,当风险评估通过后,将进行系统迁移操作。重启机器。迁移完成后,需要重启机器。当机器重启成功后,系统会切换到AnolisOS,标志着系统迁移完成。如果用户对系统进行了备份,可以随时使用系统还原功能将当前系统还原到未迁移状态。(图片/批量迁移实现)(图片/迁移实现)02监控中心SysOM2.0新增迁移监控报表功能,对迁移前后的资源使用总量、基础指标变化趋势、指标波动等进行统计和可视化。该展示可以让用户更直观地体验迁移前后操作系统的变化。同时,通过在迁移前后分别运行一段时间的测试任务,可以对实际业务在两个操作系统上运行的性能有一个直观的对比效果。资源变更监控迁移监控可以直观的展示迁移前后常用资源的变化和变化趋势,可以直观的对比迁移前后系统的资源变化。(图片/迁移监控)基础指标监控和同步迁移监控会监控常用指标(CPU、内存、网络、IO、磁盘),将各指标的实时值、变化趋势、波动幅度可视化,可直观比较迁移前后各指标在时间维度上的波动情况。(图/基础监控)03诊断中心SysOM2.0提供调度、存储、网络、内存等全方位诊断,帮助操作系统用户进行全方位的故障排除和定位。新增诊断功能:调度抖动诊断、IO延时分析、IO挂起诊断、网络丢包诊断、网络抖动诊断、网络重传诊断、内存缓存分析、内存OOM诊断,支持自定义命令下发。调度诊断中心调度抖动诊断:在系统运维场景下,CPU长时间执行在sys态,导致用户态程序无法调度;系统长时间关闭中断,导致CPU无法正常接收TICK中断,造成调度抖动问题。这两种情况往往伴随着业务流程的突然调度延迟,甚至出现短时间的系统挂起。调度抖动记录了调度抖动发生的时间、发生的次数以及抖动的具体值,以帮助用户更好的定位该场景下出现的问题。存储诊断中心IO延迟分析:IO延迟高一般意味着IO性能瓶颈,如IO流量过多、积压、存储设备瓶颈或存储设备异常、OS存储栈异常等,导致IO请求处理缓慢和IO延迟高。本项监控各存储设备的历史IO延迟水位,统计每分钟访问的IO延迟异常偏离历史水位的次数。可以快速定位到IO延迟消耗最多的层级,方便定位问题。IO流量分析:系统IO流量过高,IO占满磁盘,容易造成IO资源竞争,导致有IO需求的用户进程被阻塞。这种情况一般是IO资源没有得到合理的分配,以至于某个进程占用的IO资源比预期的要多。此项在每个存储设备的进程级别监控IO资源(如iops、throughput)的占用情况,可以分析出资源占用最大的进程,方便定位问题。IO挂起诊断:IO挂起是系统的灾难。及时发现,将IO流量切换到正常的存储设备上。隔离异常存储设备非常重要。该监控项监控系统中各个存储设备的IO访问路径是否存在IO挂起问题。网络诊断中心网络丢包诊断:丢包诊断监测并记录丢包事件、丢包硬件或网卡设备、丢包点和时间、丢包原因。帮助用户诊断和定位网络丢包问题。网络抖动诊断:抖动诊断目前支持icmp包。它由两部分组成,一是ping发起方的包延迟,即包的发送路径,二是ping接收端的包延迟,即接收包的路径。网络重传诊断:重传诊断通过记录重传时间、IP和TCP套接字状态、拥塞状态,帮助用户了解网络重传情况。内存诊断中心MemoryCache分析:内存Cache分析功能用于分析系统或容器组、容器中文件缓存和共享内存对应的文件,以及文件缓存的活跃和不活跃比例。内存OOM诊断:OOM(Outofmemory)是生产环境中常见的异常。OOM发生时,伴随着大量的内核日志,而这些内核日志往往难以分析。该诊断可以帮助用户定位系统cgroup内存泄漏、cpuset、mempolicy等设置不合理导致的OOM。自定义诊断中心命令诊断:考虑到运维人员在诊断问题时会有多种场景,而这些场景可能无法被SysOM现有的一些诊断功能准确覆盖,因此新增命令诊断功能,允许用户自定义自己需要的命令,然后查看返回的结果,就像平时终端命令输入一样。04整体架构升级SysOM1.0架构设计适合单机部署全功能,一键集成主机管理、主机监控??、主机诊断、宕机分析、安全检测等强大运维功能。随着SysOM的多场景落地和开源社区的流行,新功能的加入和管理规模的增长对SysOM的架构设计提出了新的要求:支持大规模场景。支持快速功能扩展。针对以上需求,SysOM2.0对整体架构设计进行了全面升级,使整个平台能够更灵活、更快速地部署和接入新服务:SysOM微服务各个后端组件,实现部署分离。支持分布式容器化部署,可以根据每个微服务的负载水平扩展指定的微服务。SysOM引入CommonEventCenter(CEC)支持微服务间异步通信,促进微服务间解耦,保证高内聚、低耦合、单一职责、清晰关系、可插拔设计,可以兼容各类MessageQueue(MQ)技术,以及无需修改代码即可灵活切换多个MQ。SysOM提供了统一的通道能力。每个微服务都可以使用通道SDK(ChannelSDK)在节点上执行命令、文件传递和文件下载功能。其可插拔的设计可以快速支持各种类型的通道,通道微服务采用全异步编程,大大提高了并行处理能力。(图/SysOM2.0架构图)05使用实践下载rpm包wgethttps://gitee.com/anolis/sysom/releases/download/v2.0/sysom-2.0-1.an8.x86_64.rpm安装rpm包rpm-ivhsysom-2.0-1.an8.x86_64.rpm#或yuminstall-ysysom-2.0-1.an8.x86_64.rpm默认安装路径为/usr/local/sysom默认使用的nginx对外端口配置为80,可以使用exportSERVER_PORT=xxx设置默认内网IP为通过ip-4route命令找到的第一个IP,可以使用exportSERVER_LOCAL_IP=xxx.xxx.xxx.xxx设置启动#使用以下命令启动:bash-x/usr/local/sysom/init_scripts/server/init.sh当服务日志输出如下日志时,部署成功:Oct1012:58:51mfengbash[3217754]:/usr/local/sysom/init_scripts/serverOct1012:58:51mfengbash[3217754]:+fordirin`ls`Oct1012:58:51mfengbash[3217754]:+'['-dinit.sh']'Oct1012:58:51mfengbash[3217754]:+fordirin`ls`Oct1012:58:51mfengbash[3217754]:+'['-dstop.sh']'Oct1012:58:51mfengbash[3217754]:+sed-i's/^FIRST_INIT_DONE=0/FIRST_INIT_DONE=1/g'/usr/local/sysom/init_scripts/server/init.sh通过WEB前端部署成功后-端访问,可以通过公网/私网地址访问指定的SysOM前端访问,如http://172.22.3.238。默认用户名和密码:admin/123456SysOM提供了一个Demo体验网站,可以访问:http://sysom.openanolis.cn/06系列直播预览直播预览:周二(今天)16:00-17:00,DragonLizardCommunity系统运维SIGContributor阙建明受邀分享《SysOM 2.0 特性及架构介绍》,为您展示SysOM2.0的架构设计、新特性以及如何快速扩展SysOM。快来扫海报二维码进群,预定前排小板凳看直播吧!07关于SysOMSysOM是一个集监控、告警、诊断、修复、安全等功能为一体的操作系统运维平台。目前,SysOM已经开源给DragonLizard社区。详情请参考龙蜥社区系统运维SIG。欢迎大家参与讨论、使用、共建。龙里社区系统运维SIG:https://openanolis.cn/sig/sysomSysOM项目gitee:https://gitee.com/anolis/sysom案例分析:消失的记忆去哪儿了!DragonLizard正式开源SysOM:百万实战经验打造!一站式运维管理平台——完——
