1、C语言内嵌汇编的作用
(1)优化:对于特别重要代码进行优化,出于性能的考虑;
(2)C语言需要借助汇编指令来实现特殊功能。比如:C语言中访问系统寄存器就需要借助CSR指令;
2、基础内嵌汇编
2.1、基础内嵌汇编格式
asm asm-qualifiers(AssemblerInstructions)
| 关键字 | 含义 | 
|---|---|
| asm | 这是内嵌汇编的关键字,表明这是一个GNU扩展 | 
| asm-qualifiers | 修饰词,比如:volatile、inline | 
| AssemblerInstructions | 要内嵌的汇编语句,如果是多条汇编语句指令,需要使用"\n\t"来换行 | 
(1)基础内嵌汇编指令支持带参数;
(2)gcc编译器不会去解析内嵌汇编指令,当做一个字符串处理;
2.2、基础内嵌汇编举例
#同时内嵌多条汇编指令
asm( "pushl %eax\n\t""movl $0,%eax\n\t"
"popl %eax");# 也可以将多条的内嵌汇编语句拆开写,效果一样
asm("movl %eax,%ebx");
asm("xorl %ebx,%edx");
asm("movl $0,_booga);
3、扩展内嵌汇编
3.1、扩展内嵌汇编的格式
3.1.1、格式说明
asm关键字 修饰词(指令部:输出部:输入部:损坏部:GotoLables(goto修饰时才有该部))
| 关键字 | 含义 | 
|---|---|
| asm关键字 | 扩展汇编指令的关键字:__asm__ | 
| 指令部 | 要内嵌的汇编指令,可以是一条或者多条 | 
| 输出部 | 用于描述在指令部中可以被修改的C语言变量以及约束条件 | 
| 输入部 | 用于描述在指令部中只能被读取访问的C语言变量以及约束条件 | 
| 损坏部 | 告诉编译器内嵌汇编可能带来的影响 | 
3.1.2、修饰词
| 修饰词 | 含义 | 
|---|---|
| volatile | 用于关闭gcc优化,可参考博客:《C语言中volatile关键字详解以及常见的面试问题》 | 
| inline | 用于内联,gcc会把汇编代码编译成尽可能短的代码 | 
| goto | 用于在汇编代码里跳转到C语言的标签处 | 
3.1.3、内嵌汇编操作符号/修饰符
| 操作符/修饰符 | 含义 | 
|---|---|
| = | 被修饰的操作数是只写属性 | 
| + | 被修饰的操作数具有可读可写属性 | 
| & | 被修饰的操作数只能作为输出,这个操作数在输入参数的指令执行完成之后才能写入 | 
输出部通常用“=”或者“+”修饰符;输入部分则不能用“=”或者“+”约束条件,否则编译器会报错,因为输入部是用来描述只能读取的C语言变量,不能具有写属性;
3.1.4、操作数约束符
| 操作符/修饰符 | 含义 | 
|---|---|
| p | 内存地址 | 
| m | 内存变量 | 
| r | 通用寄存器 | 
| o | 内存地址,基地址寻址 | 
| i | 立即数 | 
| V | 内存变量,不允许偏移的内存操作数 | 
| n | 立即数 | 
3.1.5、损坏部介绍
| 关键字 | 含义 | 
|---|---|
| memory | 告诉编译器,内嵌汇编代码改变了内存中的值,执行完汇编代码后重新加载该值 | 
| cc | 告诉编译器,内嵌汇编代码修改了状态寄存器的相关标志位 | 
3.1.6、指令部的参数表示
3.1.6.1 、用"前缀% + 数字"表示变量
asm volatile(
"add %0, %1, %2" 
: "=r"(res)
: "r"(i), "r"(j)
);
(1)%0对于"=r"(res),%1对应"r"(i),%2对应"r"(j),内嵌汇编的功能:把i+j的结果写到res中;
(2)"r"修饰词,表示该变量需要使用一个通用寄存器;
总结:用%+数字来引用后面输入部和输出部的参数;
3.1.6.2 、用汇编符号来表示变量
asm volatile(
"add %[result], %[input_i], %[input_j]" 
: [result] "=r"(res)
: [input_i] "r"(i), [input_j] "r"(j)
);
在输出部和输入部定义变量时就绑定符号,然后在指令部就可以通过符号来引用变量,提高代码的可读性;
3.1.7、goto修饰词介绍
asm goto("addi %0, %0, -1\n""beqz %0, %1[label]\n":: "r"(a): "memory": label);return 0;label:printf("11111\n");
(1)输出部必须是空的。goto是用于跳转功能,在满足某个条件下进行跳转,没有输出数据的必要;
(2)相较于其他情况,goto修饰的情况下多了标签部,表明最后要跳转的标签处;
(3)上面内嵌汇编的功能:当变量a是1时,则跳转到标签label处;
3.2、扩展汇编实例分析
//读取csr寄存器的宏
#define read_csr(csr)						\
({								\register unsigned long __v;				\__asm__ __volatile__ ("csrr %0, " #csr			\: "=r" (__v) :			\: "memory");			\__v;							\
})unsigned long val;
val = read_csr(mstatus);//将上面的代码按宏定义展开
val = ({ register unsigned long __v; \__asm__ __volatile__ ("csrr %0, " "mstatus" : "=r" (__v) : : "memory");\__v; });
3.3、内嵌汇编和宏结合
//用ATOMIC_OP宏定义内嵌汇编的函数,摘抄自linux源码
#define ATOMIC_OP(op, asm_op, I, asm_type, c_type, prefix)		\
static __always_inline							\
void arch_atomic##prefix##_##op(c_type i, atomic##prefix##_t *v)	\
{									\__asm__ __volatile__ (						\"	amo" #asm_op "." #asm_type " zero, %1, %0"	\: "+A" (v->counter)					\: "r" (I)						\: "memory");						\
}	#define ATOMIC_OPS(op, asm_op, I)					\ATOMIC_OP (op, asm_op, I, w, int,   )				\ATOMIC_OP (op, asm_op, I, d, s64, 64)ATOMIC_OPS(add, add,  i)//将上面的宏展开
static __always_inline void arch_atomic_add(int i, atomic_t *v)
{__asm__ __volatile__ ( "amoadd.w " zero, %1, %0" : "+A" (v->counter) : "r" (i): "memory"); 
}