当前位置: 首页 > 后端技术 > Java

如何做到“业务100%云原生,阿里中间件全面升级到公有云架构”?

时间:2023-04-01 20:02:41 Java

介绍:今年天猫双11,中间件支持交易额5403亿,全面升级为公有云架构。本次架构升级是以开源为核心,以公有云为基础,以OpenAPI进行解耦扩展。在架构上,开源、自研、商业化是统一的。通过采纳和回馈开源,推动社区建设,通过阿里巴巴丰富的业务场景,打磨技术的性能和可用性,通过云上的商业化服务更多的企业,创造更好的用户体验,全方位淬火竞争。云产品力。作者|中间件支撑组云技术团队2019年阿里核心系统100%跑在阿里云上。2021年阿里巴巴业务100%云原生。阿里巴巴成为全球第一家将所有业务都放在自己的公有云上的大型科技公司。举全集团之力,将所有业务迁移至公有云,不仅是对云的坚定信心,也证明了阿里云有能力在艰难、超复杂的环境中应对技术挑战,为客户提供有更多机会享受云端的技术红利。实实在在的保障。01架构一致性、开源、自研、商用三位一体今年天猫双11,中间件支持交易额5403亿,全面升级为公有云架构。本次架构升级是以开源为核心,以公有云为基础,以OpenAPI进行解耦扩展。在架构上,开源、自研、商业化是统一的。通过采纳和回馈开源,推动社区建设,通过阿里巴巴丰富的业务场景,打磨技术的性能和可用性,通过云上的商业化服务更多的企业,创造更好的用户体验,全方位淬火竞争。云产品力。在此过程中,阿里巴巴业务研发效率提升20%,CPU资源利用率提升30%,应用100%云原生,线上业务容器可达百万级规模,计算效率大幅提升,双十一计算成本下降了30%。接下来,我们将全面揭秘业务100%云化、后端BaaS、运行时Mesh、业务端Serverless的全过程。02中间件后端BaaS,有状态应用也可以分钟级交付。以往双11网站建设的交付是线性的。先交付IaaS资源,再交付中间件,最后交付业务。今年中间件升级到公有云架构后,IaaS资源和中间件同步交付,节省了两者串行交付的时间。中间件公有云架构的运维基础全部切割到K8s,让有状态的中间件也能做到极致的弹性,让中间件的交付效率从天级降到分钟级,大幅提升交付效率,减少资源保留时间和资源成本。后台支持系统也全面升级,如通过对接阿里云账号权限系统解决安全问题;通过与计量计费系统对接,解决IT资产数字化问题,使集团各技术团队的操作人员可以将数据以账单的形式可视化,实现成本优化。在用户界面上,IPv6也进行了升级,为阿里巴巴生产网络全面向IPv6架构演进做准备。03海外业务是Mesh,远程多活可以下沉Sidecar阿里海外有AE&Lazada等多种业务形态,远程多活系统侵入性强,技术架构不统一,影响全局高可用和研发协作效率。随着服务网格架构的演进和成熟,我们逐步规范服务路由,分层路由功能,通过插件的方式扩展业务,将远程多活系统下沉到Sidecar,解耦业务逻辑,探索远程多活。多功能、非侵入式、低成本的解决方案。今年,该系统已在海外业务中得到充分验证,为未来商业化积累了实践经验。随着Mesh服务架构的深入应用,除了将远程多活功能下沉到Sidecar之外,阿里巴巴还统一了基于Mesh架构的流量调度技术和产品架构,降低流量调度实现成本和治理,提升业务容灾能力和在线业务治理效率,实现更加灵活稳定的调度规则分发和单元间流量切换。04业务端Serverless,实现研发效率提升38%,灵活性提升200%。Serverless是阿里巴巴首选的降本增效技术方案。今年双11,Serverless不仅成功承载了三倍的峰值流量,支撑的应用场景也翻了一番,整体研发运维体系增长了38%,主要体现在以下两个关键点。1、夯实三合一技术体系,利用阿里云函数计算FC,支持全面的无服务器函数计算FC与阿里内部运维体系的推广,实现全面标准化对接,打通研判最后一公里发展。首次实现了全业务链路的“FaaS+BaaS”Serverless全流程研发体系。在FunctionComputing入组之前,云端的Serverless技术体系无法融入开发者生态。虽然功能丰富,功能强大,但不能被企业使用。即使使用了Serverless技术,研发成本反而增加了。因此,在2021年,我们推出了Serverless-Devs工具链,基于标准接口和集团内的技术社区,共同打造一个致力于Serverless的研发体系,巧妙地将云上的技术融入集团.以双十一大促场景为“磨刀石”,进一步打磨关键核心技术,再反馈到云端商业产品和工具链,夯实三合一技术体系。今年交出了一份满意的答卷。全面支持2021年天猫双11各种业务场景,覆盖淘特、淘喜、阿里妈妈、1688、高德、飞猪等多个业务场景,数量增长2倍,总峰值流量同比增长3倍,以及50wQPS的突破,整体研发效率提升了38%。2、加大对Serverless硬核技术的投入。阿里对内打磨天猫双11场景,对外通过公有云输出,服务千万级企业。在serverless场景下,冷启动的速度是客户选择的关键,也是产品的核心竞争力,今年,我们加大了硬核技术研发的投入,在“弹性策略”、“镜像分发”、“容器启动”等各个方面提升了冷启动的性能。冷启动时间进一步缩短60%,刚性交付能力提升200%。年初的时候,函数计算刚开始在集团内部应用时,运行层的冷启动时间在秒级,需要初始化中间件。整体冷启动时间大于2秒,严重限制了serverless场景的使用。因此,我们创新性的发明了ServerlessCaching来进行图片分发。根据不同存储服务的特点,构建数据驱动、智能高效的缓存体系,实现软硬件协同优化;即使在GB级镜像冷启动的场景下,函数计算也可以提升秒级的交付能力。在调度方面,相比去年增加了更多的时序/CPU等弹性策略,基于集团内资源统一调度的能力,支持天猫双11业务的10w级实例弹性。在容器层,采用自研的安全容器池化技术,将容器启动时间进一步压缩至50ms以内。这些技术已经在双11场景得到验证,也全面输出到公有云上,帮助合作伙伴轻松应对业务高峰。05从Ops到Dev,云原生技术转型进入下半场。让客户第一次使用和阿里巴巴一样的技术,是中间件开源、自研、商业化的初衷。Trinity的这些产品正在帮助云上的客户更好地提高Ops的效率。Trinity的商业输出包括:微服务引擎MSE:完整的注册&配置中心(原生支持Nacos/ZooKeeper/Eureka)、网关(原生支持Ingress/Envoy)和非侵入式开源增强服务治理(原生支持SpringCloud/多宝);消息队列MQ:原生支持ApacheRocketMQ和ApacheKafka;应用实时监控服务ARMS:原生支持Prometheus,提供基于开源的Tracing能力;应用高可用服务AHAS:原生支持Sentinel和ChaosBlade;函数计算FC:支持开发者工具开源ServerlessDevs、开源Observable工具等。云计算和云原生技术上半场为Ops解决了更多的问题,我们相信下半场更多的问题会被解决。专注于开发。围绕开发者效率的提升,中间件完成了Serverless、应用运行时、低代码、云边融合、在线IDE等重点领域的技术布局。通过服务网格和应用运行时等技术,非业务逻辑下沉,通过插件模式,形成新的研发分工,让中间件研发屏蔽底层复杂技术,让安全研发建立可信应用运行时层的安全防线,让高可用研发构建熔断器、限流、降级、异地多活动等能力,让业务更轻量化,更专注于业务本身的发展,以及更有效地建立业务竞争力。原文链接本文为阿里云原创内容,未经许可不得转载。