当前位置: 首页 > 科技赋能

TOP100全球案例峰会:作业邦打造百万级QPS归一化链路压力测试诊断平台

时间:2024-05-20 02:12:07 科技赋能

近日,TOP全球案例峰会在北京国际会议中心举行。

作业帮成功入选在线教育领域典型案例。

作业邦产研中心团队测试负责人王俊星出席会议,并在工具链建设分会向来宾演示了作业邦百万级QPS归一化链路压测诊断。

平台。

据了解,TOP全球案例研究峰会是msup主办的全球顶级技术峰会。

迄今已成功举办9届。

本届TOP全球案例峰会邀请了来自亚马逊、LinkedIn、IBM、百度、阿里巴巴、腾讯、字节跳动等顶尖技术专家和专家,18位来自垂直主题领域的行业人士专家担任联席主席并负责专题。

案例评审和评选最终产生18个案例和18个专题。

在案例选择上,TOP崇尚专业实力和案例实施,致力于为听众造福,确保发布的案例清单具有学习价值。

作业帮成功入选全球TOP案例,是权威机构对作业帮作为领先在线教育平台技术实力的认可。

王俊星表示,作业帮一直通过全链路压测模型的迭代升级赋能多元化场景,保证千万级并发直播课在线的稳定性。

未来,作业邦将继续整合各种技术和团队能力,深化压测平台架构优化等基础设施建设,确保作业邦在线服务稳定性达到99.99%,实现优质教育资源的稳定供给辐射亿万儿童的教育。

了解旅程并实现教育使命和愿景。

数千万学生的学习场景存在被解构的风险,压测是唯一出路。

今年年初,在“停课但不停学”的号召下,教育部鼓励师生“在家上学”。

随之而来的是通过互联网音视频连接知识的方式在全国迅速普及,在线教育用户数量呈指数级增长。

今年被称为“在线教育爆发年”。

作为在线教育企业独角兽之一,作业帮超级APP今年聚合效应持续增强。

易观3月数据显示,作业帮是中国唯一月活跃用户过亿的教育类APP,流量保持行业领先地位。

随着用户数量的不断增长,保证系统稳定性、有效破解数百万学生学习场景的解构风险,成为作业邦面临的首要任务。

王俊星在会上表示,教育方面容不得马虎和妥协。

为了满足所有学生和家长在线获取知识的期望,我们必须保证系统的稳定性。

因此,作业邦开始探索系统稳定性评估路径。

作业邦在研究了业界各大公司的稳定性解决方案和开源压测框架后,根据自身业务场景选择了自主研发的全链路压测模型解决方案。

据了解,模型必须与作业帮的业务场景高度契合,才能有效保证系统的正常运行。

它不仅涵盖双师角色的复用和切换以及学生交互的复杂场景,还必须考虑到服务架构和私有协议的特殊性。

范围。

然而,把握在线教育的脉搏并非一蹴而就。

虽然参与者人数众多,每次操作都经过精心设置,整个团队都把熬夜视为常态,但早期的压力测试仍然没有达到预期的效果。

“压测结果与现实差距巨大,团队的心情只能用一句歌词来形容:好痛的领悟,别再受压测的苦了。

”对于第一次尝试的失败,王俊星回忆道。

与传统线下行业可以模拟点对点的生产环境不同,互联网行业的压测很难达到服务集群的同等水平。

不切实际的数据结构和想象的场景是压力测试架构脆弱的关键。

此外,压测工具缺乏安全性、人力投入成本高等问题也亟待解决。

因此,作业邦要完美经受市场赛道的高压考验,还有很长的路要走。

安全第一,场景还原,作业邦推出自主研发压力测试平台。

对于作业邦人来说,压力测试不仅是关系到绩效和成长的技术命题,更是关系到中国跨城乡、跨地区中小学生的教育供给。

主张。

为此,作业邦解锁了自研压力测试平台的高级水平。

首先,产研团队在探索压测时达成安全第一的共识,以“服务与数据隔离”为核心思想,共建研发、测试、运维来落实方案。

具体来说,依托日志服务,对数据进行清洗、脱敏。

数据通过压测平台后,生成压测标记,并在业务网关分发到各个业务集群。

业务模块根据压测标志进行基础业务服务和数据。

的隔离。

关于场景模拟和数据构建的真实性,团队目前已经从最初的困难阶段,进入到可以轻松利用技术的阶段。

平台投入使用后,我们针对大家的衍生使用需求进行了优化和支持,比如数据预热需求、高压下的持续稳定性测试等,满足压力测试的多样化需求。

在塑造模拟场景方面,作业帮分为两大板块,产生不同的设计思路。

一方面,针对大规模销售活动,采用多场景链路压力测试和参数化,进行梯度压力,基于漏斗型用户行为模型,达到预期效果;另一方面,对复杂教学场景的支持,复杂性主要体现在技术复杂性(涉及私有技术架构、长连接和流媒体协议)、数据和交互的复杂性,这就是双师的业务形态教学(每个学生都是独立的个体,有自己的特点)。

行为顺序;讲师和导师各司其职,实时同步学生状态,让讲师及时调整教学内容,保证学生课堂收获)。

因此,作业邦自主开发了学生节点、讲师节点、导师节点模型,依靠真实日志将不同角色的行为序列化,最后注入到模型中,实现教学场景的模拟。

王俊星表示:“周业邦是做教育的,所以我们在直播课堂场景上投入了更多的精力。

我们必须严格控制视频流的同步、实时交互和到达率,以保证教学质量和学生体验。

”场景还原是充分攻防破坏演练的基础,跨过这个坎之后,作业邦还需要继续在压测技术上寻求向上的突破。

教育价值 对于在线教育技术团队来说,每一次活动或开课都是一场艰苦的战斗。

平台服务层面的“平静”一般来自于底层技术团队无数次“惊心动魄”的压力测试。

为了缓解人员运维压力,提高效率,作业帮助团队从压测平台的压测阶段入手,有效提升平台应对重大事件的能力。

王俊星表示,作业帮对压力产生端进行了结构调整和优化。

基于2PC思想和流水线处理环节,大大提高了单个节点的压力产生能力,降低了设备投资和运维成本。

压测的安全性也将进一步优化。

很快我们将接入业务支撑系统,触发阈值熔断,并与自动化平台联动,达到业务检测的目的,进一步降低压测风险。

同时,为了解决高并发数据结果的统计瓶颈,JobBang还将优化计算引擎,通过分层计算和分布式部署解决数据聚合的压力,提高集群的水平扩展能力。

除了控制源头之外,效率的提升也离不开中间层调度器的优化。

对此,作业帮丰富了节点管理,增加了节点属性,针对特殊压测场景独立申请压测节点,使得节点分配更加高效合理,避免相互影响。

目前,集安全、模拟、高效于一体的百万级QPS归一化链路压测诊断平台已初步具备抗风险能力,对百万儿童教育资源流通产生强大辐射作用。

未来,作业邦还将围绕预测系统薄弱环节,持续构建内置学习模型,全面打造自动化、行业领先的赋能平台。

谈及压测平台的研发经历,王俊星表示,“用科技完美处理瞬时流量,可能会让每一位工程师都有一种无差别的成就感,用科技落实教育理念,是作业帮手的独特标签。

” ”对于我们来说,教育是不容马虎和妥协的。

我们要保证每个学生的体验和课堂收获,让高质量的教育触手可及。

未来,我们将持续投入,优质教育资源稳定供应,规模达数百万。

孩子们的学习之旅,履行教育使命和愿景。