GCC 内联汇编

2024年 1月 22日 79.3k 0

LINUX下的汇编入门

AT&T风格 汇编 和GCC风格汇编

汇编代码的调试

前面写了三篇,是自我摸索三篇,摸着石头过河,有些或许是错误的细节,不必在意!  今天我们直接用GCC编译C语言代码,且在C语言里面内嵌AT&T风格的汇编! 前三篇大家了解即可,我们重点放在内嵌汇编里,简单快捷舒服!

GCC支持在C/C++代码中嵌入汇编代码,这些汇编代码被称作GCC Inline ASM——GCC内联汇编。

这是一个非常有用的功能,有利于我们将一些C/C++语法无法表达的指令直接潜入C/C++代码中,另外也允许我们直接写C/C++代码中使用汇编编写简洁高效的代码。其实为了装逼和护城河!

gcc 编译器支持
 2 种形式的内联 asm 代码:

  1. 基本 asm 格式:不支持操作数;

  2. 扩展 asm 格式:支持操作数;

1. 语法规则

asm [volatile] ("汇编指令")

  1. 所有指令,必须用双引号包裹起来;

  2. 超过一条指令,必须用n分隔符进行分割,为了排版,一般会加上t;

  3. 多条汇编指令,可以写在一行,也可以写在多行;

  4. 关键字 asm 可以使用 
    asm 来替换;

  5. volatile 是可选的,编译器有可能对汇编代码进行优化,使用 volatile 关键字之后,告诉编译器不要优化手写的内联汇编代码。

基本内联汇编的格式是

    __asm__ __volatile__("Instruction List");

    可选风格 有比较多种,不过测试了下 就下面代码的风格支持得好,

    每行汇编命令 要加冒号和NT 确实麻烦. 不过可以使用软件前后追加特定符号就行了.

    下面是基本格式 不支持操作数,它必须使用全局变量,这限制太麻烦了

    
    
    #include <stdio.h>
    

    int a =  1;
    int b =  2;
    int c;

    int  main ()
    {
         asm  volatile  (
             "movl a, %eaxnt"
             "addl b, %eaxnt"
             "movl %eax, c"
            );
         printf( "c = %d n", c);
         return  0;
    }

    其实汇编

    内嵌 相当于调用个
    C函数

    而已,
    不过这C函数是汇编函数而已

    
    
    # include  <stdio.h>

    int  main ()
    {
         int data1 =  1;
         int data2 =  2;
         int data3;

         asm  volatile
         (
             "movl %%ebx, %%eaxnt"
             "addl %%ecx, %%eax"
            :  "=a"(data3) :  "b"(data1), "c"(data2)
    );

    /*asm [volatile] ("汇编指令nt" : "输出操作数列表" : "输入操作数列表" : "改动的寄存器")*/
         printf( "data3 = %d n", data3);
         return  0;
    }

    这里必须使用扩展ASM格式,才能不使用全局变量当作参数传入汇编函数里

    所以汇编命令 寄存器要多个%号 "movl %%ebx,%%eax" 把EBX的值覆盖进
    EAX

    里.

    所有汇编命令结束后 最后个小挂号前 开始定义我们的函数参数

    第一个冒开始是 输出参数   :"=a"(data3)

    第二个冒号开始是 输入参数 有多个参数用逗号分隔

    第三个冒号是不要优化寄存器列表

    其中 
     
    :
    "=a
    "
    (data3
    ) 的 data3 是C的变量 用小挂号保护起来, 前面的=A

    叫做
    "修饰符" 

    对输出寄存器或内存地址提供
    额外的说明,包括下面4个修饰符:

    1. +:被修饰的操作数可以读取,可以写入;

    2. =:被修饰的操作数只能写入;

    3. %:被修饰的操作数可以和下一个操作数互换;

    4. &:在内联函数完成之前,可以删除或者重新使用被修饰的操作数;

    其中A 使用寄存器的别名 "=a" 表示只能写A的寄出器(EAX)

     通俗讲下面的
    叫约束

    a: 使用 eax/ax/al 寄存器;

    b: 使用 
    ebx

    /bx/bl 寄存器;

    c: 使用 ecx/cx/cl 寄存器;

    d: 使用 edx/dx/dl 寄存器;

    r: 使用任何可用的通用寄存器;

    m: 使用变量的内存位置;

    b(data1)表示 data1变量的值复制到B寄出器里

    在内联汇编代码中,没有声明“改动的寄存器”列表,也就是说可以省略掉(前面的冒号也不需要);

    使用占位符来代替寄存器名称

    如果操作数有
    很多,那么在内联汇编代码中去写每个寄存器的名称,就显得
    很不方便。占位符有点类似于批处理脚本中,利用
     

    2...来引用输入参数一样,内联汇编代码中的占位符,从
    输出操作数列表中的寄存器开始从
     0 编号,一直编号到
    输入操作数列表中的所有寄存器。

    
    
    #
    include 
    <stdio.h>
    
    int  main ()
    {
         int data1 =  1;
         int data2 =  2;
         int data3;

         asm(          "movl %1, %%eaxnt"
             "addl %2, %0"
              :  "=r" (data3) :  "r" (data1), "r" (data2)         );

         printf( "data3 = %d n", data3);
         return  0;
    }

    %0 是输入参数  依次是 两个输入参数 %1 %2

    内联汇编的C语言 正常编译就好了

    
    [root@dsmart=>LINUX_ASM]
    $gcc main_add.c -o main.add.exe
    
    [root@dsmart=>LINUX_ASM]$./main.add.exe 
    data3 = 3 

    我们可以查看下GCC 汇编的代码

      [root@dsmart=>LINUX_ASM]$gcc -S main_add.c -o main_add.asm[root@dsmart=>LINUX_ASM]$vim main_add.asm

      下面是我们GCC把MAIN_ADD.C全部翻译成了汇编代码,而我们重点的内嵌汇编用蓝色注解#APP----#NOAPP 范围内

      
      
              .file   
      "main_add.c"
      
              .section        .rodata
      .LC0:
              .string  "data3 = %d n"
              .text
              .globl  main
              . type    main, @ function
      main:
      .LFB0:
              .cfi_startproc
              pushq   %rbp
              .cfi_def_cfa_offset 16
              .cfi_offset 6, -16
              movq    %rsp, %rbp
              .cfi_def_cfa_register 6
              subq     $16 , %rsp
              movl     $1 , -4(%rbp)
              movl     $2 , -8(%rbp)
              movl    -4(%rbp), %eax
              movl    -8(%rbp), %edx
      #APP
      # 9 "main_add.c" 1
              movl %eax, %eax
              addl %edx, %eax

      # 0 "" 2
      #NO_APP
              movl    %eax, -12(%rbp)
              movl    -12(%rbp), %eax
              movl    %eax, %esi
              movl    $.LC0, %edi
              movl     $0 , %eax
              call     printf
              movl     $0 , %eax
              leave
              .cfi_def_cfa 7, 8
              ret
              .cfi_endproc
      .LFE0:
              .size   main, .-main
              .ident   "GCC: (GNU) 5.5.0"                       .section        .note.GNU-stack,"",@progbits

      里面这段代码不是%1了,被具体替换成了寄出器名.

      这段是C语言调用汇编函数进行参数压栈操作,分别把参数1,2压入栈底
                movl    $1, -4(%rbp)        movl    $2, -8(%rbp)        movl    -4(%rbp), %eax        movl    -8(%rbp), %edx

        rsp :
        栈指针

        寄存器,指向栈顶

        rbp : 栈基址寄存器,指向栈底

        返回参数:

                  movl    %eax, -12(%rbp)        movl    -12(%rbp), %eax

          把结果 压入栈底 -12位置,然后出栈 把RBP栈的值 返回给EAX

          好像这有点多余

          下面准备调用PRINTF函数
          edi : 函数参数

          rsi/esi : 函数参数

          下面我们进行O3优化下看

            [root@dsmart=>LINUX_ASM]$gcc main_add.c -S -O3 -o main_add.asm

            代码确实少了些

              
                      .file   
              "main_add.c"
              
                      .section        .rodata.str1.
              1,
              "aMS",@progbits,
              1
              
              .LC
              0:
              
                      .string 
              "data3 = %d n"
              
                      .section        .text.unlikely,
              "ax",@progbits
              
              .LCOLDB1:
              
                      .section        .text.startup,
              "ax",@progbits
              
              .LHOTB1:
              
                      .p2align 
              4,,
              15
              
                      .globl  main
              
                      .type   main, @function
              
              main:
              
              .LFB11:
              
                      .cfi_startproc
              
                      subq    $8, %rsp
              
                      .cfi_def_cfa_offset 
              16
              
                      movl    $2, %esi
              
                      movl    $1, %eax
              
              
              #APP
              
              
              # 9 "main_add.c" 1
              
                      movl %eax, %eax
              
                      addl %esi, %esi
              
              
              
              # 0 "" 2 #NO_APP        movl    $.LC 0, %edi        xorl    %eax, %eax        call     printf        xorl    %eax, %eax        addq    $8, %rsp        .cfi_def_cfa_offset 8        ret        .cfi_endproc .LFE11:        .size   main, .-main        .section        .text.unlikely .LCOLDE1:        .section        .text.startup .LHOTE1:        .ident   "GCC: (GNU) 5.5.0"         .section        .note.GNU-stack, "",@progbits

                      
              结果优化的不像人样了,
              volatile 也无法禁止优化内嵌汇编!

              相关文章

              服务器端口转发,带你了解服务器端口转发
              服务器开放端口,服务器开放端口的步骤
              产品推荐:7月受欢迎AI容器镜像来了,有Qwen系列大模型镜像
              如何使用 WinGet 下载 Microsoft Store 应用
              百度搜索:蓝易云 – 熟悉ubuntu apt-get命令详解
              百度搜索:蓝易云 – 域名解析成功但ping不通解决方案

              发布评论