GCC 内联汇编

2024年 1月 22日系统运维泡泡

LINUX下的汇编入门

AT&T风格汇编和GCC风格汇编

汇编代码的调试

前面写了三篇,是自我摸索三篇,摸着石头过河,有些或许是错误的细节,不必在意! 今天我们直接用GCC编译C语言代码,且在C语言里面内嵌AT&T风格的汇编! 前三篇大家了解即可,我们重点放在内嵌汇编里,简单快捷舒服!

GCC支持在C/C++代码中嵌入汇编代码，这些汇编代码被称作GCC Inline ASM——GCC内联汇编。

这是一个非常有用的功能，有利于我们将一些C/C++语法无法表达的指令直接潜入C/C++代码中，另外也允许我们直接写C/C++代码中使用汇编编写简洁高效的代码。其实为了装逼和护城河!

gcc 编译器支持
2 种形式的内联 asm 代码：

基本 asm 格式：不支持操作数；

扩展 asm 格式：支持操作数；

1. 语法规则

asm [volatile] ("汇编指令")

所有指令，必须用双引号包裹起来；

超过一条指令，必须用n分隔符进行分割，为了排版，一般会加上t；

多条汇编指令，可以写在一行，也可以写在多行；

关键字 asm 可以使用
asm 来替换；

volatile 是可选的，编译器有可能对汇编代码进行优化，使用 volatile 关键字之后，告诉编译器不要优化手写的内联汇编代码。

基本内联汇编的格式是

__asm__ __volatile__("Instruction List");

可选风格有比较多种,不过测试了下就下面代码的风格支持得好,

每行汇编命令要加冒号和NT 确实麻烦. 不过可以使用软件前后追加特定符号就行了.

下面是基本格式不支持操作数,它必须使用全局变量,这限制太麻烦了



#include <stdio.h>




int a = 
1;


int b = 
2;


int c;





int 
main
()

{

    

asm 
volatile 
(

        
"movl a, %eaxnt"

        
"addl b, %eaxnt"

        
"movl %eax, c"

        );

    
printf(
"c = %d n", c);

    
return 
0;

}

其实汇编

内嵌相当于调用个
C函数

而已,
不过这C函数是汇编函数而已





#
include 
<stdio.h>





int 
main
()

{

    
int data1 = 
1;

    
int data2 = 
2;

    
int data3;



    

asm 
volatile

    
(

        
"movl %%ebx, %%eaxnt"

        
"addl %%ecx, %%eax"

        : 
"=a"(data3) : 
"b"(data1),
"c"(data2)

);




/*asm [volatile] ("汇编指令nt" : "输出操作数列表" : "输入操作数列表" : "改动的寄存器")*/


    
printf(
"data3 = %d n", data3);

    
return 
0;

}

这里必须使用扩展ASM格式,才能不使用全局变量当作参数传入汇编函数里

所以汇编命令寄存器要多个%号 “movl %%ebx,%%eax” 把EBX的值覆盖进
EAX

里.

所有汇编命令结束后最后个小挂号前开始定义我们的函数参数

第一个冒开始是输出参数 :”=a”(data3)

第二个冒号开始是输入参数有多个参数用逗号分隔

第三个冒号是不要优化寄存器列表

其中

:
“=a
”
(data3
) 的 data3 是C的变量用小挂号保护起来, 前面的=A

叫做
“修饰符”

对输出寄存器或内存地址提供
额外的说明，包括下面4个修饰符：

+：被修饰的操作数可以读取，可以写入；

=：被修饰的操作数只能写入；

%：被修饰的操作数可以和下一个操作数互换；

&：在内联函数完成之前，可以删除或者重新使用被修饰的操作数；

其中A 使用寄存器的别名 “=a” 表示只能写A的寄出器(EAX)

通俗讲下面的
叫约束

a: 使用 eax/ax/al 寄存器；

b: 使用
ebx

/bx/bl 寄存器；

c: 使用 ecx/cx/cl 寄存器；

d: 使用 edx/dx/dl 寄存器；

r: 使用任何可用的通用寄存器；

m: 使用变量的内存位置；

b(data1)表示 data1变量的值复制到B寄出器里

在内联汇编代码中，没有声明“改动的寄存器”列表，也就是说可以省略掉(前面的冒号也不需要)；

使用占位符来代替寄存器名称

如果操作数有
很多，那么在内联汇编代码中去写每个寄存器的名称，就显得
很不方便。占位符有点类似于批处理脚本中，利用

2…来引用输入参数一样，内联汇编代码中的占位符，从
输出操作数列表中的寄存器开始从
0 编号，一直编号到
输入操作数列表中的所有寄存器。



#
include 
<stdio.h>



int 
main
()

{

    
int data1 = 
1;

    
int data2 = 
2;

    
int data3;



    
asm(
        
"movl %1, %%eaxnt"


        
"addl %2, %0"

        
 : 
"=r"
(data3) : 
"r"
(data1),
"r"
(data2)         );



    
printf(
"data3 = %d n", data3);

    
return 
0;

}

%0 是输入参数依次是两个输入参数 %1 %2

内联汇编的C语言正常编译就好了


[root@dsmart=>LINUX_ASM]
$gcc main_add.c -o main.add.exe

[root@dsmart=>LINUX_ASM]$./main.add.exe 

data3 = 3

我们可以查看下GCC 汇编的代码

[root@dsmart=>LINUX_ASM]$gcc -S main_add.c -o main_add.asm[root@dsmart=>LINUX_ASM]$vim main_add.asm

下面是我们GCC把MAIN_ADD.C全部翻译成了汇编代码,而我们重点的内嵌汇编用蓝色注解#APP—-#NOAPP 范围内

.file "main_add.c" .section .rodata .LC0: .string "data3 = %d n" .text .globl main . type main, @ function main: .LFB0: .cfi_startproc pushq %rbp .cfi_def_cfa_offset 16 .cfi_offset 6, -16 movq %rsp, %rbp .cfi_def_cfa_register 6 subq $16 , %rsp movl $1 , -4(%rbp) movl $2 , -8(%rbp) movl -4(%rbp), %eax movl -8(%rbp), %edx #APP # 9 "main_add.c" 1 movl %eax, %eax addl %edx, %eax # 0 "" 2 #NO_APP movl %eax, -12(%rbp) movl -12(%rbp), %eax movl %eax, %esi movl $.LC0, %edi movl $0 , %eax call printf movl $0 , %eax leave .cfi_def_cfa 7, 8 ret .cfi_endproc .LFE0: .size main, .-main .ident "GCC: (GNU) 5.5.0" .section .note.GNU-stack,"",@progbits
里面这段代码不是%1了,被具体替换成了寄出器名.

这段是C语言调用汇编函数进行参数压栈操作,分别把参数1,2压入栈底

        movl    $1, -4(%rbp)        movl    $2, -8(%rbp)        movl    -4(%rbp), %eax        movl    -8(%rbp), %edx

rsp :
栈指针

寄存器，指向栈顶

rbp : 栈基址寄存器，指向栈底

返回参数:

        movl    %eax, -12(%rbp)        movl    -12(%rbp), %eax

把结果压入栈底 -12位置,然后出栈把RBP栈的值返回给EAX

好像这有点多余

下面准备调用PRINTF函数
edi : 函数参数

rsi/esi : 函数参数

下面我们进行O3优化下看

[root@dsmart=>LINUX_ASM]$gcc main_add.c -S -O3 -o main_add.asm

代码确实少了些


        .file   
"main_add.c"

        .section        .rodata.str1.
1,
"aMS",@progbits,
1

.LC
0:

        .string 
"data3 = %d n"

        .section        .text.unlikely,
"ax",@progbits

.LCOLDB1:

        .section        .text.startup,
"ax",@progbits

.LHOTB1:

        .p2align 
4,,
15

        .globl  main

        .type   main, @function

main:

.LFB11:

        .cfi_startproc

        subq    $8, %rsp

        .cfi_def_cfa_offset 
16

        movl    $2, %esi

        movl    $1, %eax


#APP


# 9 "main_add.c" 1

        movl %eax, %eax

        addl %esi, %esi






# 0 "" 2


#NO_APP

        movl    $.LC
0, %edi

        xorl    %eax, %eax

        call    
printf

        xorl    %eax, %eax

        addq    $8, %rsp

        .cfi_def_cfa_offset 
8

        ret

        .cfi_endproc

.LFE11:

        .size   main, .-main

        .section        .text.unlikely

.LCOLDE1:

        .section        .text.startup

.LHOTE1:

        .ident  
"GCC: (GNU) 5.5.0"

        .section        .note.GNU-stack,
"",@progbits