当前位置: 首页 > Linux

圆满结束!回顾eBPF技术发展与挑战

时间:2023-04-06 12:07:39 Linux

11月3日,2022云栖大会eBPF&LinuxStability专场在杭州云栖小镇圆满落幕。本次专题论坛为DragonLizard3workshop系列,特邀高校、手机、安全厂商师生共同探讨eBPF在安全、网络方面的最佳应用与实践,以及Linux运维经验在手机和服务器上共享。(图/特邀嘉宾合影)eBPF&LinuxStabilitySession由DragonLizard系统运维SIG和eBPF技术探索SIG联合举办。开场主持人毛文安介绍了这两个SIG的情况。跟大家分享一下这两个SIG的愿景和目标,以及SIG目前的重点项目和SIG的下一步工作。也欢迎大家到龙蜥官网的SIG群里查看详情。工欲善其事,必先利其器。系统运维SIG推出的SysAK工具集是对以往百万台服务器运维经验的总结。让我们进一步揭开这个工具的底细,看看它的应用实践是怎样的。阿里云高级技术专家、龙蜥系统运维SIG维护者张毅以《SysAK 的应用实践》为主题分享了演讲。他介绍了DragonLizard社区运维SIG出品的诊断工具集SysAK的使用场景及其核心技术架构。着重介绍了监控模式的相关组件,以及如何结合DragonLizardOS和SysAK的增强功能来监控疑难问题和系统健康状况。最后,结合当前运维趋势,介绍了SysAK未来的应用诊断和插件规划路线。eBPF给我们带来了更多的可能性。西安邮电大学教授、eBPF技术探索SIG负责人陈立军以《eBPF 技术的发展与挑战》为主题进行了分享。陈立军教授首先从传统的操作系统模型入手,阐述了近50年来操作系统模型和进程模型的现状,并解释了为什么引入eBPF打破了这一模型。本文介绍LinuxKernelTour社区为推动eBPF在中国的发展所做的工作。最后,从eBPF在内核可编程性和易用性方面的发展入手,介绍了eBPF技术面临的机遇和挑战。eBPF目前在跟踪、诊断和网络方面有很多应用。如今,越来越多的开发者也开始关注eBPF。Maintainer徐庆伟与来宾们分享了他在《eBPF 安全特性解析》上的演讲。他从eBPF的安全原理出发,从安全角度分析eBPF,针对eBPF在云原生容器场景下的使用场景,分析了后续eBPF安全技术的发展趋势。他应该深入到内核的基本机制,实现在不影响正常业务的情况下实现阻塞函数调用级别的操作,这样防御更细粒度也更合理。最后得出结论,系统安全不是一个单一的维度。需要建立从应用态到内核态的多层次防御矩阵,多角度看待和解决安全问题,才会取得更好的效果。一提到节目相机就让我们耳目一新。协云科技CTO、龙力eBPF技术探索SIGMaintainer分享了《基于 eBPF 可观测性项目 kindling 的最新进展:基于 eBPF 的程序摄像头——trace-profiling 功能》的过程。介绍了当前主流可观测性技术的局限性。Tracing、Log、Metric无法很好的融合。程序员在排查在线问题时仍然需要大量依赖经验。Kindling利用eBPF技术,从系统内核的角度,将程序代码执行过程转化为OS资源层面的消耗过程,并通过trace、metric、log整合形成一个视图。有基本计算机经验的程序员很容易理解程序每一毫秒在做什么。最后分享一下使用程序相机可以解决线上常见的奇葩场景:GC导致的线程挂起、高并发导致线程不足导致的requeststarvation、trace级别的火焰图、资源依赖导致的问题等。Coolbpf推出的eBPFTechnologyExplorationSIG是一站式的eBPF开发编译平台。大家最了解的就是Coolbpf是用来开发编译的,那么基于它的应用有哪些呢?阿里云资深技术专家、龙力系统运维SIG负责人、龙力eBPF技术探索SIGSIGMaintainer毛文安带来《Coolbpf 的应用实践》分享,与嘉宾共同探讨eBPFSIG的Coolbpf项目来自其原理和设计实现层面阐述,具体介绍了远程云编译和低版本内核运行eBPF的技术原理。最后通过一个具体的网络抖动案例,展示了Coolbpf在业务观察和抖动发现方面的具体应用和实践过程。轻量级的开发框架确实给我们带来了很多便利。随后浙江大学Linux开发者、DragonLizardeBPF技术探索SIGMaintainer郑雨生分享了《eBPF 轻量级开发框架 eunomia》的主题演讲。一开始,她介绍了eunomia-bpf项目的背景和目标,作为一个轻量级的eBPF开发框架,旨在简化eBPF程序的开发、分发和运行,然后展示了eunomia-bpf是如何从一行命令开发的在云端下载运行eBPF程序,只写内核态代码运行和导出事件,并与WebAssembly等功能结合。最后简单说明一下eunomia-bpf的原理和设计实现的思路。SysOM是系统运维SIG的重大项目,是与统信软件深度合作打造的一站式运维管理平台。同心软件高级系统研发工程师、系统运维SIG维护员魏冬分享《SysOM 在系统可靠性与安全上的实践》。从sre开始,魏东分享了自己的操作系统稳定性知识,并介绍了龙蜥社区运维SIG出品的一站式系统运维平台SysOM在系统稳定性方面的相关工作。运维和系统诊断功能。然后,介绍了操作系统安全知识和SysOMSecurityCenter的漏洞修复功能。最后指出了当前系统稳定性的痛点,并介绍了未来的展望。我们所知道的Linux稳定性是基于x86和Arm服务器的,但是手机上的系统稳定性也值得研究。魅族科技高级工程师、龙力系统运维SIG贡献者白浩文与来宾畅谈《手机内核稳定性的治理与实践》。他首先简要介绍了稳定性问题的来源和开发过程。结合实例介绍了运行时动态检测的一些方法和相关原理。在实践中,魅族手机在开发阶段引入了一些新特性来增加捕获内存异常的概率,包括从上游龙百合社区引入的改进特性。为了全方位监控和解决稳定性问题,魅族在智能分析问题和提升性能方面也做了相应的工作。最后,还给出了一个简短的总结和面临的一些挑战。本次eBPF&LinuxStabilitySpecialSession圆满结束。未来两天,龙蜥操作系统峰会暨云原生专场与大家见面。明早9:30,龙蜥操作系统峰会在D馆D3-5隆重举行,下午14:00。龙蜥峰会云原生专场将于D2-20举行,欢迎亲临现场体验,只要来到展区,即可获赠龙蜥社区限量版T恤一件,先到先得首先服务。最后附上今天的活动现场图和特别分享视频:(图/专题论坛现场)龙蜥峰会(图/活动现场)