可视化运维是将各种信息源产生的大量数据映射成几何图元,再绘制成图形图像,清晰直观地展示出来。可视化运维提供了高效、一致、透明、面向用户的服务。在数据中心,可视化运维并不是一个新概念。几乎在数据中心初期就出现了一些可视化运维的技术和应用。例如:将网络流量映射到监控大屏。通过监控大屏,可以看到各个网络节点的流量转发情况。一旦出现故障,就会出现报警。在监控大屏幕上呈现整个网络结构图。一旦任何网络设备失去连接,大屏幕将显示红色并出现警报。这些都在可视化运维范围内。如今,可视化运维被推到了风口浪尖,成为了一个非常热门的技术。这是因为人们希望通过可视化运维,可以做更多的事情,不再局限于上述简单的应用。在大家眼里,运维工作是一个没有输入也没有输出的工作。运维投入越大,会影响数据中心的生产利润。因此,运维部门承担了繁重的工作,却没有得到足够的重视。大多数时候,我看到架构师们在谈论和畅想数据中心的美好未来,而过多地关注这些建设者。其实在实际实施中会遇到很多实际问题,需要运维人员擦屁股。可视化运维是运维运营商的机会。可视运维不仅可以提高数据中心的生产效率,及时发现和消除隐患,降低故障概率,还可以为数据中心带来收益。可视化运维可以大大减少数据中心运维的人力和资金投入,为数据中心节省真金白银。可视化运维还可以将数据中心的运行状态和基础设施以图形化或数字化的方式呈现出来,供用户观察和选择,让数据中心在用户面前不再是一个神秘的黑盒子,给用户一个可视化的互联网的体验和影响,吸引更多用户将业务部署在数据中心。可视化运维也会对整个数据中心进行盘点,让数据中心认识到自己的属性,哪里有不足和不足,及时进行补充和改正。可视化运维更像是数据中心的一面镜子。镜子越亮,你就越能看清自己。很多时候,人就是看不清自己,所以能见度对数据中心来说非常重要。可视化运维并没有那么美好,还存在很多问题。例如:在很多情况下,当一个网络设备出现故障时,并不是所有的服务都会受到影响。它可能是端口或IP。此时网管监控的大屏幕无法显示设备故障。对于此类故障,现有的视觉方法仍然无法识别,仍然依赖流量统计或镜像来检查每个设备。这将需要很长时间才能定位问题,尤其是现在数据中心的网络规模非常大。这是不可取的。这时,数据流量就必须可视化。可以监控网络中每个流的转发状态。如果流程有问题,可以立即看到。这就是现在可视化运维应该追求的。再比如,需要对整个数据中心的网络流量进行统计,对大数据进行分析,得出一定的规律。数据中心拥有大量的数据,是研究大数据的最佳场所。通过数据分析,为数据中心带来巨大的价值和额外的收入,这就是可视化运维现在应该做的事情。除了流量的可视化,机房环境、设备运行参数、历史运行记录、功耗、温度变化等数据也需要采集可视化。总之,只要有数据,就一定要有可视化。可视化不仅要实现数据的可视化,还可以深入到设备内部巡检,将数据呈现出来。可视化运维仅仅发现问题还不够,关键是解决问题,所以可视化运维还需要引入执行动作,发现问题自动启动修复模式,让数据中心自动管理。这些都是目前可视化运维要解决的问题。传统的可视化运维视角过于狭隘,不能为数据中心带来太大的价值。更多的是给人们提供一些监控数据。很多时候,人们还是靠自己的经验来分析问题。可视化网络运维带来的数据影响是非常有限的,必须做出改变。正是因为可视化运维还不够完善,才需要发展。如今的数据中心对可视化的要求越来越高。希望数据中心的任何动作都可以图形化或数字化呈现。这为可视化运维提供了机遇,也带来了挑战。在BAT的数据中心,如果你的网络设备还不支持可视化,是不会考虑的。对可视化的支持程度直接决定了在BAT的数据中心可以占有的份额,BAT对不支持可视化的设备拥有一票否决权。不仅在BAT,很多大型数据中心也出现了新的可视化需求,传统的网管监控无法满足。这也催生了运维服务市场。制作一些数据中心可视化的专用软件,推荐给数据中心。一些大型数据中心干脆自己做软件,将可视化运维集成到自己的私有云中,在云端动态呈现整个数据中心的运行状态。这对于提高数据中心的运行效率极为有利。现在有越来越少的数据中心开始行动。复杂的运维交易没有进一步封装,对运维人员来说意味着高昂的学习成本和交易执行成本。在运维管理中,监控、流程、自动化、运维大数据都是重要的环节。可视化呈现对于降低运维成本不可或缺。可视化代表运维,可视化运维的落地程度在一定程度上反映了我们对运维工作的理解。可见度越高,运维越简单高效,间接为数据中心创造价值。今天的数据中心已经开始意识到这一点,愿意投入运维,尤其是可视化运维。与它们所能带来的收益相比,这些投资实在是微不足道。不难预见,未来可视化运维将受到更多关注。是数据中心快速发展的法宝,必须掌握。
