1. 程式人生 > >從暫存器看I386和x64位中函式呼叫中引數傳遞

從暫存器看I386和x64位中函式呼叫中引數傳遞

x86_64基本使用暫存器儲存函式引數,暫存器不夠才入棧;

而i386將所有引數儲存在棧上,通過gcc的擴充套件功能__attribute__((regparm()))即可實現部分引數的暫存器傳遞。

除錯語法:

--《深入理解計算機系統(原書第2版)》

程式碼

#include <stdio.h>
#include <stdlib.h>

int v1 = 1;
float v2 = 0.01;

#ifdef FAST
__attribute__((regparm(3)))
#endif
void func(int a, long b, short c, char d, long long e,
          float f, double g, int *h, float *i, char*j)
{
    printf("a: %d, b: %ld, c: %d, d: %c, e: %lld\n"
           "f: %.3e, g: %.3e\nh: %p, i: %p, j: %p\n",
           a, b, c, d, e, f, g, h, i, j);
}

int main(void)
{
   func(100, 35000L, 5, 'A', 123456789LL, 3.14, 2.99792458e8,
        &v1, &v2, "string");

   return EXIT_SUCCESS;
}

編譯

gcc -g -Wall -o test test.c

啟動gdb

(gdb) b * func

說明:break中不加* 使用函式名就無法用於引數確認

不加*,斷點就不會設定到組合語言層級的函式開頭

(gdb) r

(gdb) p *(int*)($esp)

在i386上原則上引數全部入棧,取得第一個引數使用esp+4,因為i386架構中棧的開頭即esp+0,儲存返回地址。

下一個引數f的儲存地址要比上一個引數大8個位元組,因為i386架構中long long型和double型是8位元組

i386暫存器呼叫

fastcall快速呼叫:i386像x86_64一樣將部分引數放暫存器中。

__attribute__((regparm(3)))使用eax,edx和ecx傳遞開頭3個引數。

修改程式碼

#include <stdio.h>
#include <stdlib.h>
#define FAST 1

int v1 = 1;
float v2 = 0.01;

#ifdef FAST
__attribute__((regparm(3)))
#endif
void func(int a, long b, short c, char d, long long e,
          float f, double g, int *h, float *i, char*j)
{
    printf("a: %d, b: %ld, c: %d, d: %c, e: %lld\n"
           "f: %.3e, g: %.3e\nh: %p, i: %p, j: %p\n",
           a, b, c, d, e, f, g, h, i, j);
}

int main(void)
{
   func(100, 35000L, 5, 'A', 123456789LL, 3.14, 2.99792458e8,
        &v1, &v2, "string");

   return EXIT_SUCCESS;
}

第1,2,3個引數a ,b,c放在eax,edx,ecx中。

如果第1個引數為long long型別(64位),那麼就會組合使用eax ,edx 等暫存器來傳參。

如果第2個引數為long long型別(64位),那麼就只有在第一個引數為32位才能暫存器傳遞。

regparm

GCC中可以使用__attribute__((regparm(n)))指定最多可以使用n個暫存器(eax, edx, ecx)傳遞引數,n的範圍是0~3,超過n時則將引數壓入棧中(n=0表示不用暫存器傳遞引數)。

看下面例子,函式p1約定不使用暫存器傳遞引數,儘管只有1個引數,仍然將引數壓入棧中。

函式p2約定最多可使用3個暫存器傳遞引數,因為輸入引數有4個,所以前三個使用暫存器傳遞,最後一個壓入棧中。

int q = 5;

int t1 = 1;
int t2 = 2;
int t3 = 3;
int t4 = 4;

#define REGPARM3 __attribute((regparm(3)))
#define REGPARM0 __attribute((regparm(0)))

void REGPARM0 p1(int a)
{
q = a + 1;
}

void REGPARM3 p2(int a, int b, int c, int d)
{
q = a + b + c + d + 1;
}

同樣的程式碼我們看64位下的效果