Linux内核使用了GCC编译器,它不仅支持ANSIC,还支持GNUC。在Linux内核中,很多地方都使用了GNUC语言的扩展特性,比如typeof、__attribute__、__aligned、__builtin_等,这些都是GNUC语言的特性。下面的typeof是比较两个数的大小并返回最大值的经典宏写法:#define如果a传入i++,b传入j++,那么这个比较就会出错。例如:#defineintx=1,y=2;printf("max=%d\n",max(x++,y++));printf("x=%d,y=%d\n",x,是);输出:最大值=3,x=2,y=4。这是一个错误的结果。通常我们想要max(1,2),并返回max=2。如何修改这个宏?在GNUC语言中,如果知道a和b的类型,就可以在宏中定义一个变量,将a和b赋给变量,然后进行比较。例如:#definemax(a,b)({\int_a=(a);\int_b=(b);\_a>_b?_a:_b;})如果不知道具体的数据类型,可以使用typeof类转换宏,Linux内核中的例子:#definemax(a,b)({\typeof(a)_a=(a);\typeof(b)_b=(b);\(void)(&_a==&_b);\_a>_b?_a:_b;})typeof(a)_a=(a):定义一个类型为a的变量_a,将a赋值给_atypeof(b)_b=(b):定义a类型为b的变量_b,将b赋值给_b(void)(&_a==&_b):判断两个数的类型是否相同,如果不相同则抛出警告。因为a和b的类型不同,它们的指针类型也会不同。如果比较两种不同的指针类型,将抛出编译警告。typeof用法示例://typeof的参数可以是表达式,也可以是类型//参数是typeof(int*)a,b;//等价于:int*a,*b;//参数isanexpressionintfoo();typeof(foo())var;//声明一个int类型的v??ar变量,因为表达式foo()是int类型。由于不会执行表达式,因此不会调用foo函数。零长度数组零长度数组也称为灵活数组。而它的作用主要是满足变长结构的需要,所以有时也习惯性地称为变长数组。用法:在结构的末尾,声明一个长度为0的数组,使结构的长度可变。对于编译器来说,此时长度为0的数组是不占空间的,因为数组名本身不占空间,它只是一个偏移量,而数组名本身的符号代表一个不可修改的地址常量,定义在结构零长度数组:structpcpu_chunk{structlist_headlist;无符号长填充[];/*变长数组*/};数据结构的最后一个元素定义为零长度数组,不占用结构空间。这样我们就可以根据对象大小动态分配结构体的大小。结构线{int长度;charcontents[0];};structline*thisline=malloc(sizeof(structline)+this_length);thisline->length=this_length;如上例所示,structline数据结构定义了一个int长度的变量和一个变长数组contents[0],这个structline数据结构的大小只包括int类型的大小,不包括int类型的大小内容,即**sizeof(structline)=sizeof(int)**。在创建结构体对象时,可以根据实际需要指定变长数组的长度,并分配相应的空间。例如,上面的示例代码分配了this_length字节的内存,您可以通过contents[index]地址数据访问索引。caserangeGNUC语言支持指定一个caserange作为标签,如:caselow...high:case'A'...'Z':这里lowtohigh代表一个区间范围,也用在ASCII字符代码非常有用。下面是Linux内核中的代码示例。staticintlocal_atoi(constchar*name){intval=0;for(;;name++){switch(*name){case'0'...'9':val=10*val+(*name-'0');休息;默认值:返回值;另外,也可以用整数来表示范围,但是这里需要注意“...”两边的空格,否则会编译失败。staticintat91sam9261_udc_init(structat91_udc*udc){for(i=0;iep[i];}switch(i){case0:ep->maxpacket=8;休息;情况1...3:ep->maxpacket=64;休息;案例4...5:ep->maxpacket=256;休息;GNUC语言可以通过指定索引或结构成员名来初始化,而不必按照原来固定的顺序进行初始化。结构体成员的初始化在Linux内核中经常用到,比如在设备驱动中初始化file_operations数据结构:,.write=write_zero,.read_iter=read_iter_zero,.aio_write=aio_write_zero,.mmap=mmap_zero,};如上面代码,zero_fops的成员llseek被初始化为zero_lseek函数,read成员被初始化为new_sync_read函数,以此类推。当file_operations数据结构的定义发生变化时,这种初始化方式仍能保证已知元素的正确性,未初始化成员的值为0或NULL。可变参数宏在GNUC语言中,宏可以接受可变数量的参数,主要用于输出函数。例如:#definepr_debug(fmt,...)\dynamic_pr_debug(fmt,##__VA_ARGS__)"..."表示可变参数列表,"__VA_ARGS__"为编译器保留字段,在预处理期间将参数传递给宏。当扩展对宏的调用时,实际参数将传递给dynamic_pr_debug函数。函数属性GNUC语言允许声明函数属性(FunctionAttribute)、变量属性(VariableAttribute)和类型属性(TypeAttribute),以便编译器可以进行特定方面的优化和更仔细的代码检查。特殊属性语法格式为:__attribute__((attribute-list))attribute-list的定义有很多,比如noreturn、format和const。此外,还可以定义一些与处理器架构相关的函数属性,比如interrupt、isr等属性都可以在ARM架构中定义。下面是在Linux内核中使用格式属性的示例。intlibcfs_debug_msg(structlibcfs_debug_msg_data*msgdata,constchar*format1,...)__attribute__((format(printf,2,3)));libcfs_debug_msg()函数声明了一个格式函数属性,它告诉编译器根据printf参数列表的格式规则检查函数参数。数字2表示第二个参数是格式字符串,数字3表示参数“...”中的第一个参数在函数参数总数中的个数。noreturn属性告诉编译器函数从不返回值,这样可以消除一些不必要的警告信息。比如下面这个函数,函数是不会返回的:void__attribute__((noreturn))die(void);const属性会让编译器只调用一次函数,以后调用时只需要返回第一个结果,从而提高效率。staticinlineu32__attribute_const__read_cpuid_cachetype(void){returnread_cpuid(CTR_EL0);}Linux还有一些其他的函数属性,定义在compiler-gcc.h文件中。#define#define#define#define#define#define#define#define变量属性和类型属性变量属性可以设置变量或结构成员的属性。类型属性的常见属性是对齐、打包和部分。对齐属性指定变量或结构成员的最小对齐格式,以字节为单位。结构qib_user_info{__u32spu_userversion;__u64spu_base_info;}__aligned(8);在此示例中,编译器以8字节对齐的方式分配qib_user_info数据结构。packed属性使变量或结构成员使用最小对齐方式,即变量按字节对齐,字段按位对齐。结构测试{字符一个;intx[2]__attribute__((packed));};x成员使用了packed属性,会存放在变量a后面,所以这个结构一共占用9个字节。内置函数内置函数的函数名以“_builtin_”为前缀。下面介绍一些Linux内核中常用的内置函数。__builtin_constant_p(x):判断x是否可以在编译时确定为常量。如果x是常量,函数返回1,否则返回0。__builtin_expect(exp,c):#define__swab16(x)\(__builtin_constant_p((__u16)(x))?\___constant_swab16(x):\__fswab16(x))__builtin_expect(exp,c)__builtin_expect(exp,c):这里的意思是exp==c的概率很高,用来引导GCC编译器进行条件分支预测。开发人员知道哪个分支最有可能被执行,并告诉编译器最有可能执行的分支,这样编译器就可以优化指令序列,使指令尽可能按顺序执行,从而提高CPU预取的正确率指示。likely()和unlikely()函数在Linux内核中经常见到,本质也是__builtin_expect():#defineLIKELY(x)__builtin_expect(!!(x),1)//x很可能为真#defineUNLIKELY(x)__builtin_expect(!!(x),0)//x很可能为false__builtin_prefetch(constvoid*addr,intrw,intlocality):主动进行数据预取,并将其值加载到缓存,减少读取延迟,从而提高性能。该函数可以接受3个参数:第一个参数addr表示要预取数据的地址;第二个参数rw表示读写属性,1表示可写,0表示只读;第三个参数locality表示数据在缓存中的时间局部性,其中0表示addr读取后不需要保留在缓存中,1~3表示时间局部性逐渐增强。比如下面prefetch()和prefetchw()函数的实现。#define#define以下是使用prefetch()函数进行优化的示例。void__init__free_pages_bootmem(structpage*page,unsignedintorder){unsignedintnr_pages=1<#defineattribute((regparm(0))):告诉编译器该函数不需要通过任何寄存器传递参数,只需要通过堆。对于ARM,函数参数的传递有一套ATPCS标准,即通过寄存器传递。ARM中的R0-R4寄存器存放传入的参数。当参数超过5个时,多余的参数存入本地栈。所以ARM平台没有定义asmlinkage。#define#defineUL在Linux内核代码中,我们经常会看到一些数字的定义是用UL后缀修饰的。数值常量被隐式定义为int类型,两个int类型相加的结果可能会溢出。所以使用UL强制将int类型的数据转换为unsignedlong类型,就是为了保证运算过程不会因为int的位数不同而导致溢出。1:表示有符号整数1UL:表示无符号长整数1