GCC.rar_内嵌汇编资源-CSDN文库

共1个文件

doc：1个

版权申诉

内嵌汇编

20 浏览量 2022-09-24 01:01:05 上传评论收藏 14KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

GCC.rar （1个子文件）

GCC中的内嵌汇编语言.doc 67KB

GCC 中的内嵌汇编语言

一.声明

　　虽然 Linux 的核心代码大部分是用 C 语言编写的，但是不可避免的其中还是有一部分是用汇编语言

写成的。有些汇编语言代码是直接写在汇编源程序中的，特别是 Linux 的启动代码部分；还有一些则是利

用 gcc 的内嵌汇编语言嵌在 C 语言程序中的。这篇文章简单介绍了 gcc 中的内嵌式汇编语言，主要想帮助

那些才开始阅读 Linux 核心代码的朋友们能够更快的入手。

写这篇文章的主要信息来源是 GNU 的两个 info 文件：as.info 和 gcc.info，如果你觉得这篇文章中的介

绍还不够详细的话，你可以查阅这两个文件。当然，直接查阅这两个文件可以获得更加权威的信息。如果

你不想被这两篇文档中的一大堆信息搞迷糊的话，我建议你先阅读一下这篇文章，然后在必要时再去查阅

更权威的信息。

二.简介

　　在 Linux 的核心代码中，还是存在相当一部分的汇编语言代码。如果你想顺利阅读 Linux 代码的话，

你不可能绕过这一部分代码。在 Linux 使用的汇编语言代码中，主要有两种格式：一种是直接写成汇编语

言源程序的形式，这一部分主要是一些 Linux 的启动代码；另一部分则是利用 gcc 的内嵌式汇编语言语句

asm 嵌在 Linux 的 C 语言代码中的。这篇文章主要是介绍第二种形式的汇编语言代码。

　　首先，我介绍一下 as 支持的汇编语言的语法格式。大家知道，我们现在学习的汇编语言的格式主要

是 Intel 风格的，而在 Linux 的核心代码中使用的则是 AT&T 格式的汇编语言代码，应该说大部分人对这

种格式的汇编语言还不是很了解，所以我觉得有必要介绍一下。

　　接着，我主要介绍一下 gcc 的内嵌式汇编语言的格式。gcc 的内嵌式汇编语言提供了一种在 C 语言源

程序中直接嵌入汇编指令的很好的办法，既能够直接控制所形成的指令序列，又有着与 C 语言的良好接口，

所以在 Linux 代码中很多地方都使用了这一语句。

三.gcc 的内嵌汇编语言语句 asm

　　利用 gcc 的 asm 语句，你可以在 C 语言代码中直接嵌入汇编语言指令，同时还可以使用 C 语言的表

达式指定汇编指令所用到的操作数。这一特性提供了很大的方便。

　　要使用这一特性，首先要写一个汇编指令的模板（这种模板有点类似于机器描述文件中的指令模

板），然后要为每一个操作数指定一个限定字符串。例如：

　　　　 extern __inline__ void change_bit(int nr,volatile void *addr)

　　　　 {

　　　　　　 __asm__ __volatile__( LOCK_PREFIX

　　　　　　 "btcl %1,%0"

　　　　　　 :"=m" (ADDR)

　　　　　　 :"ir" (nr));

　　　　 }

　　上面的函数中：

　　 LOCK_PREFIX：这是一个宏，如果定义了__SMP__，扩展为"lock;"，用于指定总线锁定前缀，否

则扩展为""。

　　 ADDR：这也是一个宏，定义为(*(volatile struct __dummy *) addr)

　　 "btcl %1,%0"：这就是嵌入的汇编语言指令，btcl 为指令操作码，%1,%0 是这条指令两个操作数

的占位符。后面的两个限定字符串就用于描述这两个操作数。

　　 : "=m" (ADDR)：第一个冒号后的限定字符串用于描述指令中的“输出”操作数。刮号中的 ADDR 将

操作数与 C 语言的变量联系起来。这个限定字符串表示指令中的“%0”就是 addr 指针指向的内存操作数。

这是一个“输出”类型的内存操作数。

　　 : "ir" (nr)：第二个冒号后的限定字符串用于描述指令中的“输入”操作数。这条限定字符串表示指令

中的“%1”就是变量 nr，这个的操作数可以是一个立即操作数或者是一个寄存器操作数。

　　 *注：限定字符串与操作数占位符之间的对应关系是这样的：在所有限定字符串中（包括第一个冒号

后的以及第二个冒号后的所有限定字符串），最先出现的字符串用于描述操作数“%0”，第二个出现的字符

串描述操作数“%1”，以此类推。

　　①汇编指令模板

　　 asm 语句中的汇编指令模板主要由汇编指令序列和限定字符串组成。在一个 asm 语句中可以包括多

条汇编指令。汇编指令序列中使用操作数占位符引用 C 语言中的变量。一条 asm 语句中最多可以包含十

个操作数占位符：%0，%1，...，%9。汇编指令序列后面是操作数限定字符串，对指令序列中的占位符

进行限定。限定的内容包括：该占位符与哪个 C 语言变量对应，可以是什么类型的操作数等等。限定字符

串可以分为三个部分：输出操作数限定字符串（指令序列后第一个冒号后的限定字符串），输入操作数限

定字符串（第一个冒号与第二个冒号之间），还有第三种类型的限定字符串在第二个冒号之后。同一种类

型的限定字符串之间用逗号间隔。asm 语句中出现的第一个限定字符串用于描述占位符“%0”，第二个用

于描述占位符“%1”，以此类推（不管该限定字符串的类型）。如果指令序列中没有任何输出操作数，那么

在语句中出现的第一个限定字符串（该字符串用于描述输入操作数）之前应该有两个冒号（这样，编译器

就知道指令中没有输出操作数）。

　　指令中的输出操作数对应的 C 语言变量应该具有左值类型，当然对于输出操作数没有这种左值限制。

输出操作数必须是只写的，也就是说，asm 对取出某个操作数，执行一定计算以后再将结果存回该操作数

这种类型的汇编指令的支持不是直接的，而必须通过特定的格式的说明。如果汇编指令中包含了一个输入-

输出类型的操作数，那么在模板中必须用两个占位符对该操作数的不同功能进行引用：一个负责输入，另

一个负责输出。例如：

　　　　 asm ("addl %2,%0":"=r"(foo):"0"(foo),"g"(bar));

　　在上面这条指令中，

　　 "%0”是一个输入-输出类型的操作数，

　　 "=r"(foo)用于限定其输出功能，该指令的输出结果会存放到 C 语言变量 foo 中；

　　指令中没有显式的出现“%1”操作数，但是针对它有一个限定字符串"0"(foo)，事实上指令中隐式的

“%1”操作数用于描述“%0”操作数的输入功能，它的限定字符串中的"0"限定了“%1”操作数与“%0”

　　具有相同的地址。可以这样理解上述指令中的模板：该指令将“%1”和“%2”中的值相加，计算结果存

放回“%0”中，指令中的“%1”与“%0”具有相同的地址。注意，用于描述“%1”的"0"限定字符足以保证

“%1”与“%0”具有相同的地址。

　　但是，如果用下面的指令完成,这种输入-输出操作就不会正常工作：

　　　　 asm ("addl %2,%0":"=r"(foo):"r"(foo),"g"(bar));

　　虽然该指令中“%0”和“%1”同样引用了 C 语言变量 foo，但是 gcc 并不保证在生成的汇编程序中它

们具有相同的地址。

　　还有一些汇编指令可能会改变某些寄存器的值，相应的汇编指令模板中必须将这种情况通知编译器。

所以在模板中还有第三种类型的限定字符串，它们跟在输入操作数限定字符串的后面，之间用冒号间隔。

这些字符串是某些寄存器的名称，代表该指令会改变这些寄存器中的内容。

　　在内嵌的汇编指令中可能会直接引用某些硬件寄存器，我们已经知道 AT&T 格式的汇编语言中，寄存

器名以“%”作为前缀，为了在生成的汇编程序中保留这个“%”号，在 asm 语句中对硬件寄存器的引用必须

用“%%”作为寄存器名称的前缀。如果汇编指令改变了硬件寄存器的内容，不要忘记通知编译器（在第三

种类型的限定串中添加相应的字符串）。还有一些指令可能会改变 CPU 标志寄存器 EFLAG 的内容，那么

需要在第三种类型的限定字符串中加入"cc"。

　　为了防止 gcc 在优化过程中对 asm 中的汇编指令进行改变，可以在"asm"关键字后加上"volatile"

修饰符。

　　可以在一条 asm 语句中描述多条汇编语言指令；各条汇编指令之间用“;”或者“\n”隔开。

　　 ②操作数限定字符

　　操作数限定字符串中利用规定的限定字符来描述相应的操作数，一些常用的限定字符有：（还有一些

没有涉及的限定字符，参见 gcc.info）

　　　　 1."m":操作数是内存变量。

　　　　 2."o":操作数是内存变量，但它的寻址方式必须是“偏移量”类型的，也就是基址寻址或者基址加

变址寻址。

　　　　 3."V":操作数是内存变量，其寻址方式非“偏移量”类型。

　　　　 4." ":操作数是内存变量，其地址自动增量。

　　　　 6."r":操作数是通用寄存器。

　　　　 7."i":操作数是立即操作数。（其值可在汇编时确定）

　　　　 8."n":操作数是立即操作数。有些系统不支持除字(双字节)以外的立即操作数，这些操作数要用

"n"而不是"i"来描述。

　　　　 9."g":操作数可以是立即数，内存变量或者寄存器，只要寄存器属于通用寄存器。

　　　　 10."X":操作数允许是任何类型。

　　　　 11."0","1",...,"9":操作数与某个指定的操作数匹配。也就是说，该操作数就是指定的那个操作

数。例如，如果用"0"来描述"%1"操作数，那么"%1"引用的其实就是"%0"操作数。

　　　　 12."p":操作数是一个合法的内存地址（指针）。

　　　　 13."=":操作数在指令中是只写的（输出操作数）。

　　　　 14."+":操作数在指令中是读-写类型的（输入-输出操作数）。

　　　　 22."f":浮点数寄存器。

　　　　 23."t":第一个浮点数寄存器。

　　　　 24."u":第二个浮点数寄存器。

　　　　 27."I":0-31 之间的立即数。（用于 32 位的移位指令）

　　　　 28."J":0-63 之间的立即数。（用于 64 位的移位指令）

　　　　 29."N":0-255 之间的立即数。(用于"out"指令)

　　　　 30."G":标准的 80387 浮点常数。

　　注：还有一些不常见的限定字符并没有在此说明，另外有一些限定字符，例如"%","&"等由于我缺乏

编译器方面的一些知识，所以我也不是很理解它们的含义，如果有高手愿意补充，不慎感激！不过在核心

代码中出现的限定字符差不多就是上面这些了。

对《gcc 中的内嵌汇编语言》一文的补充说明

　　初次接触到 AT&T 格式的汇编代码,看着那一堆莫名其妙的怪符号,真是有点痛不欲生的感觉,只好慢

慢地去啃 gcc 文档,在似懂非懂的状态下过了一段时间。后来又在网上找到了灵溪写的《gcc 中的内嵌汇编

语言》一文,读后自感大有裨益。几个月下来，接触的源代码多了以后,慢慢有了一些经验。为了使初次接

触 AT&T 格式的汇编代码的同志不至于遭受我这样的痛苦,就整理出该文来和大家共享.如有错误之处,欢

迎大家指正,共同提高。

　　本文主要以举例的方式对 gcc 中的内嵌汇编语言进行进一步的解释。

一、gcc 对内嵌汇编语言的处理方式

　　 gcc 在编译内嵌汇编语言时,采取的步骤如下：

　　变量输入：根据限定符的内容将输入操作数放入合适的寄存器,如果限定符指定为立即数("i")或内存

变量("m"),则该步被省略,如果限定符没有具体指定输入操作数的类型(如常用的"g"),gcc 会视需要决定

是否将该操作数输入到某个寄存器.这样每个占位符都与某个寄存器,内存变量,或立即数形成了一一对应的

关系.这就是对第二个冒号后内容的解释.如::"a"(foo),"i"(100),"m"(bar)表示%0 对应 eax 寄存器,%1

对应 100,%2 对应内存变量 bar.

　　生成代码：然后根据这种一一对应的关系(还应包括输出操作符),用这些寄存器,内存变量,或立即数来

取代汇编代码中的占位符(则有点像宏操作),注意,则一步骤并不检查由这种取代操作所生成的汇编代码是

否合法,例如,如果有这样一条指令 asm("movl %0,%1"::"m"(foo),"m"(bar));如果你用 gcc -c -S 选

项编译该源文件,那么在生成的汇编文件中,你将会看到生成了 movl foo,bar 这样一条指令,这显然是错误

的.这个错误在稍后的编译检查中会被发现.

　　变量输出：按照输出限定符的指定将寄存器的内容输出到某个内存变量中,如果输出操作数的限定符

指定为内存变量("m"),则该步骤被省略.这就是对第一个冒号后内容的解释,

如:asm("mov %0,%1":"=m"(foo),"=a"(bar):);编译后为：

　　　　 #APP

　　　　 movl foo,eax

　　　　 #NO_APP

　　　　 movl eax,bar

　　该语句虽然有点怪怪的,但它很好的体现了 gcc 的运作方式。

　　再以 arch/i386/kernel/apm.c 中的一段代码为例，我们来比较一下它们编译前后的情况：

源程序编译后的汇编代码

__asm__ (

"pushl %%edi\n\t"

"pushl %%ebp\n\t"

"lcall %%cs:\n\t"

"setc %%al\n\t"

"addl %1,%2\n\t"

"popl %%ebp\n\t"

"popl %%edi\n\t"

:"=a"(ea),"=b"(eb),

　 "=c"(ec),"=d"(ed),"=S"(es)

:"a"(eax_in),"b"(ebx_in),"c"(ecx_in)

:"memory","cc");

movl eax_in,%eax

　　 movl ebx_in,%ebx

　　 movl ecx_in,%ecx

评论收藏

内容反馈

版权申诉

JonSco

粉丝: 66
资源: 1万+

GCC.rar_内嵌汇编

GCC 内嵌汇编

GCC内嵌汇编收集

GCC的内嵌汇编语法

GCC内嵌汇编语法

GCC内嵌汇编的一些资料

gcc-4.8.5-44.el7.x86_64相关包

gcc.tar(gcc-4.8.5-39.el7.x86_64.rpm)

ASm_Gcc.rar_内嵌汇编

gcc-c++-4.4.7-16.el6.x86_64.rpm

ARM_GCC内嵌汇编

GCC-ASM.rar_asm gcc 内嵌

GCC内嵌汇编.pdf

GCC的内嵌AT&T汇编语法

AT&amp;T汇编语言与GCC内嵌汇编简介

gcc_4.1.2_x86_64

gcc-c++-4.8.5-39.el7.x86_64.rpm

gcc-8.5.0-4.el8-5.x86-64.rpm

gcc-c++-8.5.0-4.el8_5.x86_64.rpm

gcc-c++-4.8.5-36.el7.x86_64.rpm

AT&T汇编语言与GCC内嵌汇编

gcc-4.8.5-36.el7.x86_64.rpm

gcc-8.3.1安装包及其依赖包

64位centOS 6.5 安装gcc4.4.7所需的rpm包

GCC-rpm安装包.rar

gcc.rar_Verilog GCC_gcc vhdl_it

gcc-4.4.7-11.el6.x86_64.rpm

gcc-base-debuginfo-4.8.5-39.el7.x86_64.rpm

gcc-4.4.7-23.el6.x86_64.rpm

gcc-2.95.3.rar_gcc 2.95_gcc 2._gcc 2.95.3_gcc-2.95._gcc2.95 dow

最新资源

AT&T汇编语言与GCC内嵌汇编简介