C語言實現printf函式,即引數可變函式原理
阿新 • • 發佈:2019-01-30
我們在C語言程式設計中會遇到一些引數個數可變的函式,例如printf()
這個函式,它的定義是這樣的:
int printf( const char* format, ...);
它除了有一個引數format固定以外,後面跟的引數的個數和型別是
可變的,例如我們可以有以下不同的呼叫方法:
printf("%d",i);
printf("%s",s);
printf("the number is %d ,string is:%s", i, s);
究竟如何寫可變引數的C函式以及這些可變引數的函式編譯器是如何實
現的呢?本文就這個問題進行一些探討,希望能對大家有些幫助.會C++的
網友知道這些問題在C++裡不存在,因為C++具有多型性.但C++是C的一個
超集,以下的技術也可以用於C++的程式中.限於本人的水平,文中如果有
不當之處,請大家指正.
(一)寫一個簡單的可變引數的C函式
下面我們來探討如何寫一個簡單的可變引數的C函式.寫可變引數的
C函式要在程式中用到以下這些巨集:
void va_start( va_list arg_ptr, prev_param );
type va_arg( va_list arg_ptr, type );
void va_end( va_list arg_ptr );
va在這裡是variable-argument(可變引數)的意思.
這些巨集定義在stdarg.h中,所以用到可變引數的程式應該包含這個
標頭檔案.下面我們寫一個簡單的可變引數的函式,改函式至少有一個整數
引數,第二個引數也是整數,是可選的.函式只是列印這兩個引數的值.
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
int j=0;
va_start(arg_ptr, i);
j=va_arg(arg_ptr, int);
va_end(arg_ptr);
printf("%d %d/n", i, j);
return;
}
我們可以在我們的標頭檔案中這樣宣告我們的函式:
extern void simple_va_fun(int i, ...);
我們在程式中可以這樣呼叫:
simple_va_fun(100);
simple_va_fun(100,200);
從這個函式的實現可以看到,我們使用可變引數應該有以下步驟:
1)首先在函式裡定義一個va_list型的變數,這裡是arg_ptr,這個變
量是指向引數的指標.
2)然後用va_start巨集初始化變數arg_ptr,這個巨集的第二個引數是第
一個可變引數的前一個引數,是一個固定的引數.
3)然後用va_arg返回可變的引數,並賦值給整數j. va_arg的第二個
引數是你要返回的引數的型別,這裡是int型.
4)最後用va_end巨集結束可變引數的獲取.然後你就可以在函式裡使
用第二個引數了.如果函式有多個可變引數的,依次呼叫va_arg獲
取各個引數.
如果我們用下面三種方法呼叫的話,都是合法的,但結果卻不一樣:
1)simple_va_fun(100);
結果是:100 -123456789(會變的值)
2)simple_va_fun(100,200);
結果是:100 200
3)simple_va_fun(100,200,300);
結果是:100 200
我們看到第一種呼叫有錯誤,第二種呼叫正確,第三種調用盡管結果
正確,但和我們函式最初的設計有衝突.下面一節我們探討出現這些結果
的原因和可變引數在編譯器中是如何處理的.
(二)可變引數在編譯器中的處理
我們知道va_start,va_arg,va_end是在stdarg.h中被定義成巨集的,
由於1)硬體平臺的不同 2)編譯器的不同,所以定義的巨集也有所不同,下
面以VC++中stdarg.h裡x86平臺的巨集定義摘錄如下(’/’號表示折行):
typedef char * va_list;
#define _INTSIZEOF(n) /
((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) )
#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )
#define va_arg(ap,t) /
( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
#define va_end(ap) ( ap = (va_list)0 )
定義_INTSIZEOF(n)主要是為了某些需要記憶體的對齊的系統.C語言的函
數是從右向左壓入堆疊的,圖(1)是函式的引數在堆疊中的分佈位置.我
們看到va_list被定義成char*,有一些平臺或作業系統定義為void*.再
看va_start的定義,定義為&v+_INTSIZEOF(v),而&v是固定引數在堆疊的
地址,所以我們執行va_start(ap, v)以後,ap指向第一個可變引數在堆
棧的地址,如圖:
高地址|-----------------------------|
|函式返回地址 |
|-----------------------------|
|....... |
|-----------------------------|
|第n個引數(第一個可變引數) |
|-----------------------------|<--va_start後ap指向
|第n-1個引數(最後一個固定引數)|
低地址|-----------------------------|<-- &v
圖( 1 )
然後,我們用va_arg()取得型別t的可變引數值,以上例為int型為例,我
們看一下va_arg取int型的返回值:
j= ( *(int*)((ap += _INTSIZEOF(int))-_INTSIZEOF(int)) );
首先ap+=sizeof(int),已經指向下一個引數的地址了.然後返回
ap-sizeof(int)的int*指標,這正是第一個可變引數在堆疊裡的地址
(圖2).然後用*取得這個地址的內容(引數值)賦給j.
高地址|-----------------------------|
|函式返回地址 |
|-----------------------------|
|....... |
|-----------------------------|<--va_arg後ap指向
|第n個引數(第一個可變引數) |
|-----------------------------|<--va_start後ap指向
|第n-1個引數(最後一個固定引數)|
低地址|-----------------------------|<-- &v
圖( 2 )
最後要說的是va_end巨集的意思,x86平臺定義為ap=(char*)0;使ap不再
指向堆疊,而是跟NULL一樣.有些直接定義為((void*)0),這樣編譯器不
會為va_end產生程式碼,例如gcc在linux的x86平臺就是這樣定義的.
在這裡大家要注意一個問題:由於引數的地址用於va_start巨集,所
以引數不能宣告為暫存器變數或作為函式或陣列型別.
關於va_start, va_arg, va_end的描述就是這些了,我們要注意的
是不同的作業系統和硬體平臺的定義有些不同,但原理卻是相似的.
(三)可變引數在程式設計中要注意的問題
因為va_start, va_arg, va_end等定義成巨集,所以它顯得很愚蠢,
可變引數的型別和個數完全在該函式中由程式程式碼控制,它並不能智慧
地識別不同引數的個數和型別.
有人會問:那麼printf中不是實現了智慧識別引數嗎?那是因為函式
printf是從固定引數format字串來分析出引數的型別,再呼叫va_arg
的來獲取可變引數的.也就是說,你想實現智慧識別可變引數的話是要通
過在自己的程式裡作判斷來實現的.
另外有一個問題,因為編譯器對可變引數的函式的原型檢查不夠嚴
格,對程式設計查錯不利.如果simple_va_fun()改為:
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
char *s=NULL;
va_start(arg_ptr, i);
s=va_arg(arg_ptr, char*);
va_end(arg_ptr);
printf("%d %s/n", i, s);
return;
}
可變引數為char*型,當我們忘記用兩個引數來呼叫該函式時,就會出現
core dump(Unix) 或者頁面非法的錯誤(window平臺).但也有可能不出
錯,但錯誤卻是難以發現,不利於我們寫出高質量的程式.
以下提一下va系列巨集的相容性.
System V Unix把va_start定義為只有一個引數的巨集:
va_start(va_list arg_ptr);
而ANSI C則定義為:
va_start(va_list arg_ptr, prev_param);
如果我們要用system V的定義,應該用vararg.h標頭檔案中所定義的
巨集,ANSI C的巨集跟system V的巨集是不相容的,我們一般都用ANSI C,所以
用ANSI C的定義就夠了,也便於程式的移植.
小結:
可變引數的函式原理其實很簡單,而va系列是以巨集定義來定義的,實
現跟堆疊相關.我們寫一個可變函式的C函式時,有利也有弊,所以在不必
要的場合,我們無需用到可變引數.如果在C++裡,我們應該利用C++的多
這個函式,它的定義是這樣的:
int printf( const char* format, ...);
它除了有一個引數format固定以外,後面跟的引數的個數和型別是
可變的,例如我們可以有以下不同的呼叫方法:
printf("%d",i);
printf("%s",s);
printf("the number is %d ,string is:%s", i, s);
究竟如何寫可變引數的C函式以及這些可變引數的函式編譯器是如何實
現的呢?本文就這個問題進行一些探討,希望能對大家有些幫助.會C++的
網友知道這些問題在C++裡不存在,因為C++具有多型性.但C++是C的一個
超集,以下的技術也可以用於C++的程式中.限於本人的水平,文中如果有
不當之處,請大家指正.
(一)寫一個簡單的可變引數的C函式
下面我們來探討如何寫一個簡單的可變引數的C函式.寫可變引數的
C函式要在程式中用到以下這些巨集:
void va_start( va_list arg_ptr, prev_param );
type va_arg( va_list arg_ptr, type );
void va_end( va_list arg_ptr );
va在這裡是variable-argument(可變引數)的意思.
這些巨集定義在stdarg.h中,所以用到可變引數的程式應該包含這個
標頭檔案.下面我們寫一個簡單的可變引數的函式,改函式至少有一個整數
引數,第二個引數也是整數,是可選的.函式只是列印這兩個引數的值.
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
int j=0;
va_start(arg_ptr, i);
j=va_arg(arg_ptr, int);
va_end(arg_ptr);
printf("%d %d/n", i, j);
return;
}
我們可以在我們的標頭檔案中這樣宣告我們的函式:
extern void simple_va_fun(int i, ...);
我們在程式中可以這樣呼叫:
simple_va_fun(100);
simple_va_fun(100,200);
從這個函式的實現可以看到,我們使用可變引數應該有以下步驟:
1)首先在函式裡定義一個va_list型的變數,這裡是arg_ptr,這個變
量是指向引數的指標.
2)然後用va_start巨集初始化變數arg_ptr,這個巨集的第二個引數是第
一個可變引數的前一個引數,是一個固定的引數.
3)然後用va_arg返回可變的引數,並賦值給整數j. va_arg的第二個
引數是你要返回的引數的型別,這裡是int型.
4)最後用va_end巨集結束可變引數的獲取.然後你就可以在函式裡使
用第二個引數了.如果函式有多個可變引數的,依次呼叫va_arg獲
取各個引數.
如果我們用下面三種方法呼叫的話,都是合法的,但結果卻不一樣:
1)simple_va_fun(100);
結果是:100 -123456789(會變的值)
2)simple_va_fun(100,200);
結果是:100 200
3)simple_va_fun(100,200,300);
結果是:100 200
我們看到第一種呼叫有錯誤,第二種呼叫正確,第三種調用盡管結果
正確,但和我們函式最初的設計有衝突.下面一節我們探討出現這些結果
的原因和可變引數在編譯器中是如何處理的.
(二)可變引數在編譯器中的處理
我們知道va_start,va_arg,va_end是在stdarg.h中被定義成巨集的,
由於1)硬體平臺的不同 2)編譯器的不同,所以定義的巨集也有所不同,下
面以VC++中stdarg.h裡x86平臺的巨集定義摘錄如下(’/’號表示折行):
typedef char * va_list;
#define _INTSIZEOF(n) /
((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) )
#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )
#define va_arg(ap,t) /
( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
#define va_end(ap) ( ap = (va_list)0 )
定義_INTSIZEOF(n)主要是為了某些需要記憶體的對齊的系統.C語言的函
數是從右向左壓入堆疊的,圖(1)是函式的引數在堆疊中的分佈位置.我
們看到va_list被定義成char*,有一些平臺或作業系統定義為void*.再
看va_start的定義,定義為&v+_INTSIZEOF(v),而&v是固定引數在堆疊的
地址,所以我們執行va_start(ap, v)以後,ap指向第一個可變引數在堆
棧的地址,如圖:
高地址|-----------------------------|
|函式返回地址 |
|-----------------------------|
|....... |
|-----------------------------|
|第n個引數(第一個可變引數) |
|-----------------------------|<--va_start後ap指向
|第n-1個引數(最後一個固定引數)|
低地址|-----------------------------|<-- &v
圖( 1 )
然後,我們用va_arg()取得型別t的可變引數值,以上例為int型為例,我
們看一下va_arg取int型的返回值:
j= ( *(int*)((ap += _INTSIZEOF(int))-_INTSIZEOF(int)) );
首先ap+=sizeof(int),已經指向下一個引數的地址了.然後返回
ap-sizeof(int)的int*指標,這正是第一個可變引數在堆疊裡的地址
(圖2).然後用*取得這個地址的內容(引數值)賦給j.
高地址|-----------------------------|
|函式返回地址 |
|-----------------------------|
|....... |
|-----------------------------|<--va_arg後ap指向
|第n個引數(第一個可變引數) |
|-----------------------------|<--va_start後ap指向
|第n-1個引數(最後一個固定引數)|
低地址|-----------------------------|<-- &v
圖( 2 )
最後要說的是va_end巨集的意思,x86平臺定義為ap=(char*)0;使ap不再
指向堆疊,而是跟NULL一樣.有些直接定義為((void*)0),這樣編譯器不
會為va_end產生程式碼,例如gcc在linux的x86平臺就是這樣定義的.
在這裡大家要注意一個問題:由於引數的地址用於va_start巨集,所
以引數不能宣告為暫存器變數或作為函式或陣列型別.
關於va_start, va_arg, va_end的描述就是這些了,我們要注意的
是不同的作業系統和硬體平臺的定義有些不同,但原理卻是相似的.
(三)可變引數在程式設計中要注意的問題
因為va_start, va_arg, va_end等定義成巨集,所以它顯得很愚蠢,
可變引數的型別和個數完全在該函式中由程式程式碼控制,它並不能智慧
地識別不同引數的個數和型別.
有人會問:那麼printf中不是實現了智慧識別引數嗎?那是因為函式
printf是從固定引數format字串來分析出引數的型別,再呼叫va_arg
的來獲取可變引數的.也就是說,你想實現智慧識別可變引數的話是要通
過在自己的程式裡作判斷來實現的.
另外有一個問題,因為編譯器對可變引數的函式的原型檢查不夠嚴
格,對程式設計查錯不利.如果simple_va_fun()改為:
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
char *s=NULL;
va_start(arg_ptr, i);
s=va_arg(arg_ptr, char*);
va_end(arg_ptr);
printf("%d %s/n", i, s);
return;
}
可變引數為char*型,當我們忘記用兩個引數來呼叫該函式時,就會出現
core dump(Unix) 或者頁面非法的錯誤(window平臺).但也有可能不出
錯,但錯誤卻是難以發現,不利於我們寫出高質量的程式.
以下提一下va系列巨集的相容性.
System V Unix把va_start定義為只有一個引數的巨集:
va_start(va_list arg_ptr);
而ANSI C則定義為:
va_start(va_list arg_ptr, prev_param);
如果我們要用system V的定義,應該用vararg.h標頭檔案中所定義的
巨集,ANSI C的巨集跟system V的巨集是不相容的,我們一般都用ANSI C,所以
用ANSI C的定義就夠了,也便於程式的移植.
小結:
可變引數的函式原理其實很簡單,而va系列是以巨集定義來定義的,實
現跟堆疊相關.我們寫一個可變函式的C函式時,有利也有弊,所以在不必
要的場合,我們無需用到可變引數.如果在C++裡,我們應該利用C++的多
態性來實現可變引數的功能,儘量避免用C語言的方式來實現.
原始碼如下:
#include <stdio.h>
#include <stdlib.h>
#include<stdarg.h>
void _printf(const char * format,...)
{
va_list ap;
char ch;
va_start(ap,format);
char buff[80];
vsnprintf(buff,80,format,ap);
va_end(ap);
}
int main(){
_printf("Hello World=%s,%s,%s","NB","KOBE","geili");
}