当前位置: 首页 > 科技观察

当AI遇上容器,WOT大师眼中的运维转型之路

时间:2023-03-16 23:29:14 科技观察

2018年5月18-19日,由万维网主办的全球软件与运维技术峰会在北京举行。来自全球企业的技术精英齐聚北京,共话软件技术前沿,共同探索运维技术新边界。本次大会,除了星光熠熠的主论坛外,12个分论坛各具特色,聚焦容器、人工智能、区块链、大数据、物联网等最受关注的技术领域。.  通过让多个操作系统共享一套彼此独立的硬件,企业开启了云时代。容器技术的出现,使得多个独立的运行时和应用组合可以共享一套操作系统资源。这样一来,企业应用的配置可以变得更加灵活,硬件资源的利用率也会变得更高。作为直接提升企业数据中心运行效率的技术,容器技术将受到追捧几乎可以肯定。  人工智能不仅赋予了机器和程序智能,更是将人从简单的重复劳动和决策中解放出来的最直接手段。随着半导体技术和软件算法的不断演进,人工智能利用机器的计算能力部分替代人脑和体力,让人们更专注于创新。毫不夸张地说,人工智能将成为人类生产力跃升的关键技术之一。  当AI技术遇上容器,运维将彻底摆脱密集型人力的积累,进入更加自动化和高效化的新时代。对于这种技术的融合与碰撞,本届WOT峰会专门举办了分论坛进行探讨。分论坛人头攒动  本次分论坛,宜信科技研发中心研发总监张震、转转公司架构与算法部负责人孙轩、新聚网络执行副总裁程永信、阿里集团监控负责人程超运维领域资深专家展示经验,从不同维度、不同类型企业的角度向与会者讲解,当AI技术遇上容器,传统运维将发生变化。  运维机器人任务决策系统的演进之路  作为本次分论坛的开场演讲,易鑫科技研发中心研发总监张振义将话题锁定在“决策系统《运维机器人的设计思路》就这个前沿话题。而这正是运维自动化方案的性能和实际效果的核心。易鑫科技研发中心研发总监张震发表演讲  张震表示:“首先,容器环境下的AI运维将主要分为三个阶段,即全维监控、全维关联和全维智能。而人工智能技术将在第二阶段和第三阶段发挥真正的威力。在运维场景中,AI机器人将主要实现理解、异常检测、问题分析和执行计划四大功能。》  首先,机器人需要有一个与人类运维工程师交互的交互系统。为了保持高效率,这个系统应该基于自然语言。通过自然语言理解和多轮对话有了人类员工,AIRobots将能够建立起一套人类意图与自身能力的映射关系,同时AI还要了解企业的??IT系统和现实世界,了解这些信息后,人类员工的真实意图,AI机器人将基于人类的  ,在后续的IT系统自动化检测中,AI机器人将能够发现系统当前存在的问题并找出背后的原因,最终实现对医学、制定和实施相关的  在这个过程中,AI机器人一般有两种设计思路可以遵循,即任务驱动和自主驱动。任务的关键-driven是AI能够体现背后决策者的意图;驱动的关键在于如何设计一个可以生成执行计划的机制。一般来说,AI是一种技术,而技术的背后是设计者的愿景和目的。  转一转AI工程架构系统如何搭建  运维一方面是解决系统运行中的各种问题,维护系统整体的可靠性和效率,但另一方面另一方面,运维是维护业务的持续运行和演进。从这个角度来看,运维不仅仅是业务,运维的进化也是业务的进化。在当前AI趋势下,如何设计一套基于人工智能算法的业务自演化架构体系,成为业务运维演进的最佳方向。转转公司  作为转转资深架构师,孙轩表示:“在电商应用中,核心算法无非就是两种,排序和召回;电商平台行业几乎所有的商家都给这两类应用的不同表现形式和组合方式。”  就架构而言,在经过基于人工权重的规则制定和逻辑回归模型之后,排序将向通用化、平台化、服务化方向演进。通过将一系列机器学习技术与实时数据分析技术相结合,转转将在未来形成一个能够持续模型集成和快速迭代复杂模型的系统架构。在这样的架构上,***生成的任何模型可以一键上线,快速迭代,这些演进归根结底都是基于算法的不断演进。搜索、排序和召回,以及人工智能和数据源的访问。转型  回到运维问题本身,无论是业务层面的运维,还是架构层面的运维,其演进的核心方向都是智能化。无论从哪个角度看,“从数据可视化到运维管理自动化,最后通过AI技术实现智能运维”都是普遍的发展规律。新火炬网络副总裁程永新Fabian  新火炬网络副总裁程永新表示:“可视化是运维一切演进的基础,因为可视化的核心是衡量和规范运营而一旦把这些数据标准化、可衡量,企业就可以进一步分析这些数据,找出解决运维问题的方法和途径,而这种从数据中寻找方法和途径的思维,就可以称之为自动化。通过平台化规范的建立,企业可以更快、更可靠地进行架构的自动化运维,之后通过不断积累架构和业务工作经验和演进思路,辅以人工智能算法进行管理,企业到底是系统架构的智能化运维  面对资源管理、应用容量、网络安全、应用体验、故障诊断、容灾备份、智能巡检、安全审计等,企业需要面对这套来自可视化的演进思路到自动化到智能化都适用。  当然,在当前人工智能仍属于“超级大国”范畴的情况下,程永新也表示:当前人工智能的技术发展水平更适合处理低频出现的复杂问题,并通过人工智能技术预测可能的原因和解决方案。面对高频率或低频率出现的各种简单问题,普通的自动化运维系统其实是最好的解决方案。  而如果复杂问题已经频繁出现,那么可能是设计或其他方面出现了重大问题整个架构,需要更复杂更彻底的方法才能达到标本兼治的效果。  超大规模秒级监控平台  作为国内独一无二的超大规模平台中国,阿里巴巴的一举一动都会引起全球IT人士的关注。广泛的业务、海量的交易和金融平台本身的所有属性,让阿里巴巴的IT系统成为当今世界最先进IT架构的代表。至于运维中不得不谈的监控部分,阿里巴巴显然也有自己的一套经验和方法论。  ,阿里巴巴集团研发效率事业部程超表示:“最初阿里采用Nagios+Cacti架构来满足全平台的监控需求,但随着业务量的增长,这种组合已经不能满足性能要求了。”监控的需求。因此,阿里开始搭建自己代号SunFire的监控平台。”  目前,阿里自研的监控系统服务于90多家租户,由11000多个应用组成。整个系统托管超过4,000台物理机和虚拟机。这样的系统每分钟可以处理2TB的日志文件。在日常运营中,监控系统可以秒级响应整个业务系统。  面向未来,阿里正在开发全方位、全环节的全新监控体系。该系统可以帮助业务和开发者独立管理所有系统、硬件和平台,让每一位阿里开发者都成为全栈人才,同时让业务和系统更好的打通。  AI、容器与运维  随着企业数字化转型如火如荼的进行,中国企业的IT系统变得更加复杂。在部分企业信息化水平还处于初级水平的同时,不少企业已经开始探索和应用人工智能、容器等前沿技术。听了各个专家对AI、容器、运维的看法,其实总结起来,运维升级演进的思路虽然大体相似,但具体的技术和实现路径是不一样的。因地制宜,向先行者寻求启示,结合自身发展现状,寻找适合自身需求的方法和路径,才是有效提升运维效率和效果的终极秘诀。  以上内容是记者根据WOT2018全球软件与运维技术峰会《容器下的AIOps》分论坛发言内容整理而成。更多WOT资讯请关注51cto.com。