当前位置: 首页 > 科技观察

无法在循环中声明变量,顽固的Linux之父终于决定升级C语言版本

时间:2023-03-22 00:47:57 科技观察

依然使用89版本的C语言Linux内核,现在终于要做出改变了。今天,Linux开源社区宣布,内核C语言版本未来将升级到C11,预计在5.18版本之后生效,也就是今年5月份。这个决定很突然,从发出到正式声明,不过短短一周时间,要知道要说服固执的Linux之父LinusTorvalds并不容易。事情的起因,说起来,还是有些意外的。错误问题的连锁反应起源于上周的Linux社区讨论。一位名叫JakobKoschel的博士生在研究防止与内核链表原语相关的推测执行漏洞时发现了这样一个问题。Linux内核广泛使用由structlist_head定义的双向链表:structlist_head{structlist_head*next,*prev;};此类结构通常嵌入其他结构中。这样,可以使用任何相关的结构类型来制作链表。此外,内核还提供了大量的函数和宏,可以用来遍历和操作链表。其中之一是list_for_each_entry(),这是一个伪装成控制结构的宏。问题出在这个宏上。假设内核包含以下结构:structfoo{intfooness;结构list_head列表;};列表中的元素可用于创建foo结构的双向链表。假设一个名为foo_list的结构被声明为这样一个链表的头部,可以使用以下代码遍历该链表:structfoo*iterator;list_for_each_entry(迭代器,&foo_list,列表){do_something_with(迭代器);}/*此处不应使用迭代器*/list参数告诉宏foo结构中list_head结构的名称。该循环将对迭代器指向的列表中的每个元素执行一次。这导致USB子系统中的一个错误:退出宏后可以使用传递给宏的迭代器。这是一件危险的事情,所以Koschel提交了一个修复程序,在循环后停止使用迭代器来修复这个错误。说服了Linus,但LinusTorvalds本人不太喜欢这个补丁,也没有看到它与推测执行漏洞的关系。在Koschel详细解释后,Linus承认这只是一个常见的bug。然而,事情并没有那么简单,Linus很快意识到了真正的根本原因:传递给列表遍历宏的迭代器必须在循环本身之外的范围内声明。出现这个非预测性错误的原因是C89中没有“在循环中声明变量”。像list_for_each_entry()这样的宏基本上总是将最后一个HEAD条目泄漏到循环之外,仅仅是因为我们不能在循环本身内声明迭代器变量。如果可以编写一个列表遍历宏来声明自己的迭代器,那么迭代器就不会在循环外可见,这样的问题就不会出现了。但是,由于内核坚持C89标准,因此不能在循环内声明变量。Linus决定,让我们升级吧,也许是时候转向C99标准了。虽然也有20多年的历史了,但至少比C89新,可以在循环中声明变量。既然C89这么老了,这么多年都没改过?Linus说是因为我们在一些古老的gcc编译器版本中遇到了一些奇怪的问题,不能随便升级。不过现在linux内核已经把gcc的最低要求提高到5.1版本了,以前的那些奇怪的bug应该不会出现了。另一位核心开发人员ArndBergmann认为我们可以升级到C11甚至更高。但是升级到C17或C2x会破坏对gcc-5/6/7的支持,所以升级到C11更容易。最终,Torvalds同意了这个想法:“好吧,提醒我,让我们在5.18合并窗口中尽早尝试一下。”接下来迁移到C11可能会导致一些意想不到的错误,但如果一切顺利,下一个Linus内核版本将正式迁移到C11。参考链接:[1]https://lwn.net/SubscriberLink/885941/01fdc39df2ecc25f/[2]https://news.ycombinator.com/item?id=30459634