C語言實現printf函式，即引數可變函式原理

阿新 • • 發佈：2019-01-30

我們在C語言程式設計中會遇到一些引數個數可變的函式,例如printf()
這個函式,它的定義是這樣的:
int printf( const char* format, ...);
它除了有一個引數format固定以外,後面跟的引數的個數和型別是
可變的,例如我們可以有以下不同的呼叫方法:
printf("%d",i);
printf("%s",s);
printf("the number is %d ,string is:%s", i, s);
究竟如何寫可變引數的C函式以及這些可變引數的函式編譯器是如何實
現的呢?本文就這個問題進行一些探討,希望能對大家有些幫助.會C++的
網友知道這些問題在C++裡不存在,因為C++具有多型性.但C++是C的一個

超集,以下的技術也可以用於C++的程式中.限於本人的水平,文中如果有
不當之處,請大家指正.

(一)寫一個簡單的可變引數的C函式

下面我們來探討如何寫一個簡單的可變引數的C函式.寫可變引數的
C函式要在程式中用到以下這些巨集:
void va_start( va_list arg_ptr, prev_param );

type va_arg( va_list arg_ptr, type );

void va_end( va_list arg_ptr );
va在這裡是variable-argument(可變引數)的意思.
這些巨集定義在stdarg.h中,所以用到可變引數的程式應該包含這個
標頭檔案.下面我們寫一個簡單的可變引數的函式,改函式至少有一個整數

引數,第二個引數也是整數,是可選的.函式只是列印這兩個引數的值.
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
int j=0;

va_start(arg_ptr, i);
j=va_arg(arg_ptr, int);
va_end(arg_ptr);
printf("%d %d/n", i, j);
return;
}
我們可以在我們的標頭檔案中這樣宣告我們的函式:
extern void simple_va_fun(int i, ...);
我們在程式中可以這樣呼叫:
simple_va_fun(100);
simple_va_fun(100,200);

從這個函式的實現可以看到,我們使用可變引數應該有以下步驟:
1)首先在函式裡定義一個va_list型的變數,這裡是arg_ptr,這個變
量是指向引數的指標.
2)然後用va_start巨集初始化變數arg_ptr,這個巨集的第二個引數是第
一個可變引數的前一個引數,是一個固定的引數.
3)然後用va_arg返回可變的引數,並賦值給整數j. va_arg的第二個
引數是你要返回的引數的型別,這裡是int型.
4)最後用va_end巨集結束可變引數的獲取.然後你就可以在函式裡使
用第二個引數了.如果函式有多個可變引數的,依次呼叫va_arg獲
取各個引數.
如果我們用下面三種方法呼叫的話,都是合法的,但結果卻不一樣:
1)simple_va_fun(100);
結果是:100 -123456789(會變的值)
2)simple_va_fun(100,200);
結果是:100 200
3)simple_va_fun(100,200,300);
結果是:100 200
我們看到第一種呼叫有錯誤,第二種呼叫正確,第三種調用盡管結果
正確,但和我們函式最初的設計有衝突.下面一節我們探討出現這些結果
的原因和可變引數在編譯器中是如何處理的.

(二)可變引數在編譯器中的處理

我們知道va_start,va_arg,va_end是在stdarg.h中被定義成巨集的,
由於1)硬體平臺的不同 2)編譯器的不同,所以定義的巨集也有所不同,下
面以VC++中stdarg.h裡x86平臺的巨集定義摘錄如下(’/’號表示折行):

typedef char * va_list;

#define _INTSIZEOF(n) /
((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) )

#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )

#define va_arg(ap,t) /
( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )

#define va_end(ap) ( ap = (va_list)0 )

定義_INTSIZEOF(n)主要是為了某些需要記憶體的對齊的系統.C語言的函
數是從右向左壓入堆疊的,圖(1)是函式的引數在堆疊中的分佈位置.我
們看到va_list被定義成char*,有一些平臺或作業系統定義為void*.再
看va_start的定義,定義為&v+_INTSIZEOF(v),而&v是固定引數在堆疊的
地址,所以我們執行va_start(ap, v)以後,ap指向第一個可變引數在堆
棧的地址,如圖:

高地址|-----------------------------|
|函式返回地址 |
|-----------------------------|
|....... |
|-----------------------------|
|第n個引數(第一個可變引數) |
|-----------------------------|<--va_start後ap指向
|第n-1個引數(最後一個固定引數)|
低地址|-----------------------------|<-- &v
圖( 1 )

然後,我們用va_arg()取得型別t的可變引數值,以上例為int型為例,我
們看一下va_arg取int型的返回值:
j= ( *(int*)((ap += _INTSIZEOF(int))-_INTSIZEOF(int)) );
首先ap+=sizeof(int),已經指向下一個引數的地址了.然後返回
ap-sizeof(int)的int*指標,這正是第一個可變引數在堆疊裡的地址
(圖2).然後用*取得這個地址的內容(引數值)賦給j.

高地址|-----------------------------|
|函式返回地址 |
|-----------------------------|
|....... |
|-----------------------------|<--va_arg後ap指向
|第n個引數(第一個可變引數) |
|-----------------------------|<--va_start後ap指向
|第n-1個引數(最後一個固定引數)|
低地址|-----------------------------|<-- &v
圖( 2 )

最後要說的是va_end巨集的意思,x86平臺定義為ap=(char*)0;使ap不再
指向堆疊,而是跟NULL一樣.有些直接定義為((void*)0),這樣編譯器不
會為va_end產生程式碼,例如gcc在linux的x86平臺就是這樣定義的.
在這裡大家要注意一個問題:由於引數的地址用於va_start巨集,所
以引數不能宣告為暫存器變數或作為函式或陣列型別.
關於va_start, va_arg, va_end的描述就是這些了,我們要注意的
是不同的作業系統和硬體平臺的定義有些不同,但原理卻是相似的.

(三)可變引數在程式設計中要注意的問題

因為va_start, va_arg, va_end等定義成巨集,所以它顯得很愚蠢,
可變引數的型別和個數完全在該函式中由程式程式碼控制,它並不能智慧
地識別不同引數的個數和型別.
有人會問:那麼printf中不是實現了智慧識別引數嗎?那是因為函式
printf是從固定引數format字串來分析出引數的型別,再呼叫va_arg
的來獲取可變引數的.也就是說,你想實現智慧識別可變引數的話是要通
過在自己的程式裡作判斷來實現的.
另外有一個問題,因為編譯器對可變引數的函式的原型檢查不夠嚴
格,對程式設計查錯不利.如果simple_va_fun()改為:
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
char *s=NULL;

va_start(arg_ptr, i);
s=va_arg(arg_ptr, char*);
va_end(arg_ptr);
printf("%d %s/n", i, s);
return;
}
可變引數為char*型,當我們忘記用兩個引數來呼叫該函式時,就會出現
core dump(Unix) 或者頁面非法的錯誤(window平臺).但也有可能不出
錯,但錯誤卻是難以發現,不利於我們寫出高質量的程式.
以下提一下va系列巨集的相容性.
System V Unix把va_start定義為只有一個引數的巨集:
va_start(va_list arg_ptr);
而ANSI C則定義為:
va_start(va_list arg_ptr, prev_param);
如果我們要用system V的定義,應該用vararg.h標頭檔案中所定義的
巨集,ANSI C的巨集跟system V的巨集是不相容的,我們一般都用ANSI C,所以
用ANSI C的定義就夠了,也便於程式的移植.

小結:
可變引數的函式原理其實很簡單,而va系列是以巨集定義來定義的,實
現跟堆疊相關.我們寫一個可變函式的C函式時,有利也有弊,所以在不必
要的場合,我們無需用到可變引數.如果在C++裡,我們應該利用C++的多

態性來實現可變引數的功能,儘量避免用C語言的方式來實現.

原始碼如下：

#include <stdio.h>

#include <stdlib.h>

#include<stdarg.h>

void _printf(const char * format,...)
{
va_list ap;
char ch;
va_start(ap,format);
char buff[80];
vsnprintf(buff,80,format,ap);
va_end(ap);
}

int main(){

_printf("Hello World=%s,%s,%s","NB","KOBE","geili");

}

C語言實現printf函式，即引數可變函式原理

C語言實現printf函式，即引數可變函式原理

純c語言實現連結串列，實現連結串列增刪改查

c語言實現輸入成績，輸出評分

C語言實現讀取檔案，並統計每個字元出現的個數

C語言：預定義，設定列印除錯函式

c語言多檔案程式設計，即main檔案呼叫其他.c檔案的方法

C語言實現括號匹配，中綴表示式轉字尾表示式並計算的演算法

C語言pthread_create傳遞帶多個引數的函式& pthread_join

C語言實現：獲取ifconfig相關引數

C語言實現printf的基本格式輸出%d,%c,%p,%s

使用c語言實現執行緒池以及執行緒池原理

【C語言】自己編寫程式實現strrchr函式，即在給定字串中找特定的字元並返回最後出現的位置

c語言實現一個函式，判斷一個數是不是素數

C語言實現一個函式，可以左旋字串中的k個字元

基於求導的快速exp()演算法，exp()快速計算，exp導數演算法，exp函式C語言實現

整型陣列處理演算法（十四）不用庫函式，用C語言實現將一整型數轉換成字串

c語言利用指標變數，用函式實現將3個整數按從大到小的順序輸出

c語言的一級指標和二級指標作為函式引數，連結串列，malloc中的分配等等總結

linux環境下C語言實現非阻塞方式讀取字串資料的串列埠測試程式，即串列埠工具的編寫

geek青年的狀態機，查表，純C語言實現

C語言實現printf函式，即引數可變函式原理

相關推薦