云智能是一家拥有“两条”主线的企业。
一明一暗。
亮线代表业务逻辑,遵循数字化企业的发展路径。
暗线代表技术传承,赋能企业IT能力升级。
在其业务逻辑上:运维不再局限于冰冷的机房,而是支撑企业数字化转型的控制中心,关系到企业各项顶层业务指标的完成情况。
当然,支撑云智能业务逻辑的还是其技术底蕴。
强大的数据分析功能可以快速定位并追踪业务运营中的任何放缓、异常或中断的根源。
商用AIOps能力还可以帮助运维人员变被动为主动,实现运维的最高理想。
。
2010年和3个阶段,简述了云智能的发展历程,从IT运维到业务运维,并在清晰的路径上持续发展。
公司成立于2009年,恰逢互联网经济兴起。
公司推出的首款网络性能监控SaaS产品“监控宝”通过解决中小型网站的可用性痛点,迅速成为现象级SaaS产品。
完全依靠口碑,3年内积累了30万企业用户,并获得数百万美元A轮融资。
云智能总裁刘洪涛表示,移动化和企业上云已成为IT发展的主旋律。
云智能进军APM(应用性能管理)领域,推出“透视宝”。
“云智是国内第一家实施端到端应用性能跟踪并实现APM数据全采集的公司,即用户的每一次点击、每一条访问路径都能被准确记录和再现。
”云智总裁刘洪涛表示,云智APM得到了市场的广泛认可,已陆续完成B轮、B+轮融资。
这一年是云智能发展的历史转折点。
从依靠工具类产品服务中小企业客户,转向通过“业务运维”为大型企业用户提供一体化运维管理解决方案。
智能业务运维平台DOCP(数字)上线。
运营中心平台),并以此为基础,将产品和服务延伸至智能运维(AIOps)领域。
一根亮线和一根暗线。
这里对云智慧的发展有一个形象的比喻:如果说传统运维工具是一把螺丝刀,那么“监控宝”就是一把电动螺丝刀,“透视宝”就是一套具有诊断能力的电动工具套装。
不过,具备智能运维能力的“DOCP平台”再次升级为综合维修中心。
“北美用户IT能力较强,更愿意购买工具类产品,而中国用户则希望通过‘平台+服务’整体解决特定业务场景下的所有问题。
”刘洪涛表示,“这就是云智能过去所用的。
八年来,我们顺应数字经济的发展趋势,不断探索、积累、逐步发展出‘云智能’的业务运维方法。
”智慧DOCP产品及解决方案矩阵。
当然,云智慧的发展还延续着一条隐线,那就是始终遵循“数据基因”为企业提供运维服务。
超海量数据采集和实时处理能力成为企业的竞争优势和差异化优势。
因为只有数据才能揭示用户行为的业务逻辑,只有基于业务数据的运维服务才能上升到业务层面,当然从业务运维进一步演化到AIOps领域。
需要完整的平台体系支撑,云智能不断将更先进的ABC(A为AI、B为大数据、C为云)基因融入到业务运维方式中,形成更有效、更高效的数字化转型技术。
符合企业的发展需求。
什么是业务运维?回顾历史只是为了梳理云智慧的业务传承和技术传承,但本文更多关注的是公司现阶段的战略重点,那就是:就是,运维和业务有什么关系?如何支撑企业数字化转型?互联网公司的IT系统就是业务系统,因此IT系统运维就是业务系统运维。
传统企业从互联网+转型以来,已经学习这种模式近十年了。
在数字时代,挑战越来越大。
为什么?首先,能力不足,思维不同。
传统企业的运维部门无法支撑互联网级的业务运维。
数字化不能局限于传统的运维机房,其考核指标不是设备故障率,而是销售收入、客户转化率、成本控制、风险管理等业务指标。
其次,传统企业还背负着过去十年甚至二十年逐步打造的信息化“包袱”。
新系统必须与旧系统连接并串联。
经过一系列的兼容之后,业务系统架构将会变得更加复杂。
运维压力自然会变重。
这不仅是传统企业数字化转型的痛点,也是云智慧业务运维的核心价值,即打破传统运维的界限,不再只是面对冰冷的IT设备,而是承担责任以获得真实的业务指标。
。
跟随藤蔓还是跟随藤蔓。
如果说传统IT运维的工作模式是循藤而行,那么云智能业务运维的逻辑就是循藤而行。
两者有什么区别?例如,一家大型餐饮连锁企业,会员在线交易额突然下降了10%,这是一个非常典型的数字化商业场景。
如果业务降到零,就是系统可用性问题,依靠现有的运维监控系统可以快速识别。
但如果仅下降10%,就很难从海量的报警信息中发现异常情况。
面对数十个应用系统和数万台关联IT设备,顺着线索一一排查底层设备至少需要一周的时间,这足以造成业务的巨大损失。
对此,刘洪涛解释了业务运维“走路”的运作逻辑,“首先根据业务指标监控可以第一时间发现异常,然后可以针对会员消费相关的几个应用系统进行管理。
”通过业务逻辑拓扑快速定位是否正常?如果正常,进一步检查相关数据库、中间件、操作系统的运行情况,如果以上两层都没有问题,则需要检查底层服务器。
”“跟踪业务到IT后,只用了一个小时就追查到了故障点。
速度变慢,导致第三方支付接口处理超时。
”刘洪涛说道。
可见业务运维的行为逻辑已经被颠覆。
传统运维思维是自下而上的方式,而业务运维思维是自上而下的方式。
在业务运维系统中,任何影响业务指标的故障都将成为最高级别的服务响应事件并立即报告和处理。
如何通过数据勾画业务逻辑来实现业务运维?简单的解释就是,它就像血液一样,时刻为人体的内脏器官提供能量。
无论IT架构多么复杂,无论业务系统多么复杂,它都是由数据组成和连接的。
于是,业务运维不再寻求各个系统的紧密耦合,而是通过数据勾勒和再现企业的业务逻辑。
云智能DOCP全面接入企业IT监控数据,以及APP和浏览器用户体验数据、业务系统指标数据。
这些数据不仅是数字化企业的核心资产,也是再现企业业务逻辑的遗传密码。
任何影响系统和业务的线索都可以通过数据分析揭示出来。
云智能可以对IT系统进行三维实时监控,并提供故障发现、智能报警等运维服务。
然后将业务指标与IT指标关联起来,根据数据流转路径勾勒出业务拓扑,并提供业务绩效分析等数据运营支撑。
从业务运维到AIOps 事实上,人工智能在运维领域具有先天优势。
许多热门AI场景的底层数据碎片化,不足以支撑上层人工智能的性能。
但在运维场景中,每一层的数据都相当完整。
“从广义上讲,自动化运维也属于AIOps的范畴。
但如果人工智能这项伟大的技术仅仅落实在自动化运维上,那就太不公平了。
人工智能在业务层面帮助客户,这才是真正价值的体现。
刘洪涛说道。
当然,正是因为云智慧始终专注于业务,利用AI技术率先应用业务运维解决方案,并在多个行业和场景中成功落地,其增长空间依然广阔。
。
刘洪涛表示:“AIOps突破了传统运维管理的权责限制。
在设备层面,AIOps可以利用大数据和机器学习来分析故障之间的关联性,在关键故障发生前实现“预警”;而在业务层面,AIOps依托业务运维平台,深入挖掘IT指标背后的数字化业务。
影响,实现IT与业务的双向驱动,以数字化KPI为导向的智能决策逐步取代令人头痛的人工决策,最终实现业务“预测”。
最后,刘洪涛表示,实现“预警”和“预测”是很多运维科技公司的理想,“而云智能已经将这一理想付诸实践,并率先达到了商业化的水平。