從暫存器看I386和x64位中函式呼叫中引數傳遞
x86_64基本使用暫存器儲存函式引數,暫存器不夠才入棧;
而i386將所有引數儲存在棧上,通過gcc的擴充套件功能__attribute__((regparm()))即可實現部分引數的暫存器傳遞。
除錯語法:
--《深入理解計算機系統(原書第2版)》
程式碼
#include <stdio.h> #include <stdlib.h> int v1 = 1; float v2 = 0.01; #ifdef FAST __attribute__((regparm(3))) #endif void func(int a, long b, short c, char d, long long e, float f, double g, int *h, float *i, char*j) { printf("a: %d, b: %ld, c: %d, d: %c, e: %lld\n" "f: %.3e, g: %.3e\nh: %p, i: %p, j: %p\n", a, b, c, d, e, f, g, h, i, j); } int main(void) { func(100, 35000L, 5, 'A', 123456789LL, 3.14, 2.99792458e8, &v1, &v2, "string"); return EXIT_SUCCESS; }
編譯
gcc -g -Wall -o test test.c
啟動gdb
(gdb) b * func
說明:break中不加* 使用函式名就無法用於引數確認
不加*,斷點就不會設定到組合語言層級的函式開頭
(gdb) r
(gdb) p *(int*)($esp)
在i386上原則上引數全部入棧,取得第一個引數使用esp+4,因為i386架構中棧的開頭即esp+0,儲存返回地址。
下一個引數f的儲存地址要比上一個引數大8個位元組,因為i386架構中long long型和double型是8位元組
i386暫存器呼叫
fastcall快速呼叫:i386像x86_64一樣將部分引數放暫存器中。
__attribute__((regparm(3)))使用eax,edx和ecx傳遞開頭3個引數。
修改程式碼
#include <stdio.h> #include <stdlib.h> #define FAST 1 int v1 = 1; float v2 = 0.01; #ifdef FAST __attribute__((regparm(3))) #endif void func(int a, long b, short c, char d, long long e, float f, double g, int *h, float *i, char*j) { printf("a: %d, b: %ld, c: %d, d: %c, e: %lld\n" "f: %.3e, g: %.3e\nh: %p, i: %p, j: %p\n", a, b, c, d, e, f, g, h, i, j); } int main(void) { func(100, 35000L, 5, 'A', 123456789LL, 3.14, 2.99792458e8, &v1, &v2, "string"); return EXIT_SUCCESS; }
第1,2,3個引數a ,b,c放在eax,edx,ecx中。
如果第1個引數為long long型別(64位),那麼就會組合使用eax ,edx 等暫存器來傳參。
如果第2個引數為long long型別(64位),那麼就只有在第一個引數為32位才能暫存器傳遞。
regparm
GCC中可以使用__attribute__((regparm(n)))指定最多可以使用n個暫存器(eax, edx, ecx)傳遞引數,n的範圍是0~3,超過n時則將引數壓入棧中(n=0表示不用暫存器傳遞引數)。
看下面例子,函式p1約定不使用暫存器傳遞引數,儘管只有1個引數,仍然將引數壓入棧中。
函式p2約定最多可使用3個暫存器傳遞引數,因為輸入引數有4個,所以前三個使用暫存器傳遞,最後一個壓入棧中。
int q = 5;
int t1 = 1;
int t2 = 2;
int t3 = 3;
int t4 = 4;
#define REGPARM3 __attribute((regparm(3)))
#define REGPARM0 __attribute((regparm(0)))
void REGPARM0 p1(int a)
{
q = a + 1;
}
void REGPARM3 p2(int a, int b, int c, int d)
{
q = a + b + c + d + 1;
}
同樣的程式碼我們看64位下的效果