当前位置: 首页 > 科技观察

高可用指标说明及容灾的几个衡量指标

时间:2023-03-22 14:50:16 科技观察

很多朋友可能只停留在高可用的一些基本概念上,没有深入的理解。比如5和9是什么意思,可能没有任何概念。今天分享一篇之前组织的医管局,带大家进门。高可用性(HighAvailability,简称HA)大多被定义为IT系统运行的综合指标。它的表现形式是大于九的百分比,代表着IT系统运行的稳定性和可靠性。越接近100%,说明系统基本稳定可靠。当然,这种稳定性和可靠性需要很多努力才能获得,比如应用程序结构设计、IT系统冗余架构、容灾机制、环境基础(水、电、气、火、房)、设备质量和精细化运营等。而维护管理几乎是必不可少的,那么HA的百分比具体指的是什么呢?最直接的解释是表示一年内允许中断服务(运营)的时间。具体算法如下:T=365*24*60*(1-HA)单位:分钟网站可用性所谓网站可用性(availability),也就是网站正常运行时间的百分比。业界使用N个9来量化可用性。%)“可用性。描述通用名称可用性级别(HA)年度停机时间基本可用性2999%87.6小时较高可用性3999.9%8.8小时具有自动故障恢复的可用性4999.99%53分钟非常高的可用性5999.999%5以分钟为单位的灾难恢复能力的关键指标RPO:(RecoveryPointObjective,恢复点目标)是指灾难过程中业务系统允许的最大数据丢失,用于衡量灾难恢复系统的数据冗余备份能力。RTO:(RecoveryTimeObjective,恢复时间目标)是指信息系统从灾难状态恢复到运行状态所需的时间,用来衡量灾难恢复系统的业务恢复能力。我国的国家标准《GB20988-2007-T 信息安全技术信息系统灾难恢复规范》根据RPO和RTO这两个指标把容灾数据中心分为了对应的六个等级,如下图:总结一下高可用比较重要的就是如何做一个高可用的方案,比如如weblogic搭建集群其实体现的是高可用,LVS+nginx也是高可用的,oracle做rac等等都体现了高可用的思想,后面可以尝试自己搭建。篇幅有限,只能写到这里啦~