1. 程式人生 > >c可變引數

c可變引數

原文地址:http://www.programfan.com/club/showbbs.asp?id=82615

一、什麼是可變引數
我們在C語言程式設計中有時會遇到一些引數個數可變的函式,例如printf()函式,其函式原型為:
int printf( const char* format, ...);
它除了有一個引數format固定以外,後面跟的引數的個數和型別是可變的(用三個點“…”做引數佔位符),實際呼叫時可以有以下的形式: printf("%d",i);
printf("%s",s);
printf("the number is %d ,string is:%s", i, s);
以上這些東西已為大家所熟悉。但是究竟如何寫可變引數的C函式以及這些可變引數的函式編譯器是如何實現,這個問題卻一直困擾了我好久。希望能對大家有些幫助.
long sum(int i,...)
{
int *p,j;
long s = 0;
p = &i+1;
for (j=0;j<i;j++)
s += p[j];
return s;
}
long Sum = sum(3,1,2,3);
printf("%ld",Sum);
Sum == 6
二、寫一個簡單的可變引數的C函式
先看例子程式。該函式至少有一個整數引數,其後佔位符…,表示後面引數的個數不定. 在這個例子裡,所有的輸入引數必須都是整數,函式的功能只是列印所有引數的值.
函式程式碼如下:
//示例程式碼1:可變引數函式的使用
#include "stdio.h"
#include "stdarg.h"
void simple_va_fun(int start, ...)
{
va_list arg_ptr;
int nArgValue =start;
int nArgCout=0; //可變引數的數目
va_start(arg_ptr,start); //以固定引數的地址為起點確定變參的記憶體起始地址。
do
{
++nArgCout;
printf("the %d th arg: %d",nArgCout,nArgValue); //輸出各引數的值
nArgValue = va_arg(arg_ptr,int); //得到下一個可變引數的值
} while(nArgValue != -1);
return;
}
int main(int argc, char* argv[])
{
simple_va_fun(100,-1);
simple_va_fun(100,200,-1);
return 0;
}
下面解釋一下這些程式碼
從這個函式的實現可以看到,我們使用可變引數應該有以下步驟:
⑴由於在程式中將用到以下這些巨集:
void va_start( va_list arg_ptr, prev_param );
type va_arg( va_list arg_ptr, type );
void va_end( va_list arg_ptr );
va在這裡是variable-argument(可變引數)的意思.
這些巨集定義在stdarg.h中,所以用到可變引數的程式應該包含這個標頭檔案.
⑵函式裡首先定義一個va_list型的變數,這裡是arg_ptr,這個變
量是儲存引數地址的指標.因為得到引數的地址之後,再結合引數的型別,才能得到引數的值。
⑶然後用va_start巨集初始化⑵中定義的變數arg_ptr,這個巨集的第二個引數是可變引數列表的前一個引數,即最後一個固定引數.
⑷然後依次用va_arg巨集使arg_ptr返回可變引數的地址,得到這個地址之後,結合引數的型別,就可以得到引數的值。
⑸設定結束條件,這裡的條件就是判斷引數值是否為-1。注意被調的函式在呼叫時是不知道可變引數的正確數目的,程式設計師必須自己在程式碼中指明結束條件。至於為什麼它不會知道引數的數目,讀者在看完這幾個巨集的內部實現機制後,自然就會明白。




--------------------------------------------------------------------------------


(二)可變引數在編譯器中的處理
我們知道va_start,va_arg,va_end是在stdarg.h中被定義成巨集的, 由於1)硬體平臺的不同 2)編譯器的不同,所以定義的巨集也有所不同,下面看一下VC++6.0中stdarg.h裡的程式碼(檔案的路徑為VC安裝目錄下的\vc98\ include\stdarg.h)
typedef char * va_list;
#define _INTSIZEOF(n) ((sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) )
#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )
#define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
#define va_end(ap) ( ap = (va_list)0 )
下面我們解釋這些程式碼的含義:
1、首先把va_list被定義成char*,這是因為在我們目前所用的PC機上,字元指標型別可以用來儲存記憶體單元地址。而在有的機器上va_list是被定義成void*的
2、定義_INTSIZEOF(n)主要是為了某些需要記憶體的對齊的系統.這個巨集的目的是為了得到最後一個固定引數的實際記憶體大?gt;>T諼業幕魃現苯佑胹izeof運朔創媯猿絛虻腦誦薪峁掛裁揮杏跋臁#ê笪慕吹轎易約旱氖迪鄭?
3、va_start的定義為 &v+_INTSIZEOF(v) ,這裡&v是最後一個固定引數的起始地址,再加上其實際佔用大小後,就得到了第一個可變引數的起始記憶體地址。所以我們執行va_start (ap, v)以後,ap指向第一個可變引數在的記憶體地址,有了這個地址,以後的事情就簡單了。
這裡要知道兩個事情:
⑴在intel+windows的機器上,函式棧的方向是向下的,棧頂指標的記憶體地址低於棧底指標,所以先進棧的資料是存放在記憶體的高地址處。
(2)在VC等絕大多數C編譯器中,預設情況下,引數進棧的順序是由右向左的,因此,引數進棧以後的記憶體模型如下圖所示:最後一個固定引數的地址位於第一個可變引數之下,並且是連續儲存的。
|——————————————————————————|
| 最後一個可變引數 | ->高記憶體地址處
|——————————————————————————|
...................
|——————————————————————————|
| 第N個可變引數 | ->va_arg(arg_ptr,int)後arg_ptr所指的地方,
| | 即第N個可變引數的地址。
|——————————————— |
………………………….
|——————————————————————————|
| 第一個可變引數 | ->va_start(arg_ptr,start)後arg_ptr所指的地方
| | 即第一個可變引數的地址
|——————————————— |
|———————————————————————— ——|
| |
| 最後一個固定引數 | -> start的起始地址
|—————————————— —| .................
|—————————————————————————— |
| |
|——————————————— | -> 低記憶體地址處

(4) va_arg():有了va_start的良好基礎,我們取得了第一個可變引數的地址,在va_arg()裡的任務就是根據指定的引數型別取得本引數的值,並且把指標調到弦桓霾問鈉鶚嫉刂貳?
因此,現在再來看va_arg()的實現就應該心中有數了:
#define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
這個巨集做了兩個事情,
①用使用者輸入的型別名對引數地址進行強制型別轉換,得到使用者所需要的值
②計算出本引數的實際大小,將指標調到本引數的結尾,也就是下一個引數的首地址,以便後續處理。
(5)va_end巨集的解釋:x86平臺定義為ap=(char*)0;使ap不再指向堆疊,而是跟NULL一樣.有些直接定義為((void*)0),這樣編譯器不會為va_end產生程式碼,例如gcc在linux的x86平臺就是這樣定義的. 在這裡大家要注意一個問題:由於引數的地址用於va_start巨集,所以引數不能宣告為暫存器變數或作為函式或陣列型別. 關於va_start, va_arg, va_end的描述就是這些了,我們要注意的 是不同的作業系統和硬體平臺的定義有些不同,但原理卻是相似的.

(三)可變引數在程式設計中要注意的問題
因為va_start, va_arg, va_end等定義成巨集,所以它顯得很愚蠢, 可變引數的型別和個數完全在該函式中由程式程式碼控制,它並不能智慧 地識別不同引數的個數和型別. 有人會問:那麼printf中不是實現了智慧識別引數嗎?那是因為函式 printf是從固定引數format字串來分析出引數的型別,再呼叫va_arg 的來獲取可變引數的.也就是說,你想實現智慧識別可變引數的話是要通過在自己的程式裡作判斷來實現的. 例如,在C的經典教材《the c programming language》的7.3節中就給出了一個printf的可能實現方式,由於篇幅原因這裡不再敘述。
(四)小結:
1、標準C庫的中的三個巨集的作用只是用來確定可變引數列表中每個引數的記憶體地址,編譯器是不知道引數的實際數目的。
2、在實際應用的程式碼中,程式設計師必須自己考慮確定引數數目的辦法,如
⑴在固定引數中設標誌—— printf函式就是用這個辦法。後面也有例子。
⑵在預先設定一個特殊的結束標記,就是說多輸入一個可變引數,呼叫時要將最後一個可變引數的值設定成這個特殊的值,在函式體中根據這個值判斷是否達到引數的結尾。本文前面的程式碼就是採用這個辦法.
無論採用哪種辦法,程式設計師都應該在文件中告訴呼叫者自己的約定。
3、實現可變引數的要點就是想辦法取得每個引數的地址,取得地址的辦法由以下幾個因素決定:
①函式棧的生長方向
②引數的入棧順序
③CPU的對齊方式
④記憶體地址的表達方式
結合原始碼,我們可以看出va_list的實現是由④決定的,_INTSIZEOF(n)的引入則是由③決定的,他和①②又一起決定了va_start的實現,最後va_end的存在則是良好程式設計風格的體現,將不再使用的指標設為NULL,這樣可以防止以後的誤操作。
4、取得地址後,再結合引數的型別,程式設計師就可以正確的處理引數了。理解了以上要點,相信稍有經驗的讀者就可以寫出適合於自己機器的實現來。下面臼且桓隼?
(五)擴充套件——自己實現簡單的可變引數的函式。
下面是一個簡單的printf函式的實現,參考了<The C Programming Language>中的156頁的例子,讀者可以結合書上的程式碼與本文參照。
#include "stdio.h"
#include "stdlib.h"
void myprintf(char* fmt, ...) //一個簡單的類似於printf的實現,//引數必須都是int 型別
{
char* pArg=NULL; //等價於原來的va_list
char c;

pArg = (char*) &fmt; //注意不要寫成p = fmt !!因為這裡要對//引數取址,而不是取值
pArg += sizeof(fmt); //等價於原來的va_start

do
{
c =*fmt;
if (c != '%')
{
putchar(c); //照原樣輸出字元
}
else
{
//按格式字元輸出資料
switch(*++fmt)
{
case 'd':
printf("%d",*((int*)pArg));
break;
case 'x':
printf("%#x",*((int*)pArg));
break;
default:
break;
}
pArg += sizeof(int); //等價於原來的va_arg
}
++fmt;
}while (*fmt != '\0');
pArg = NULL; //等價於va_end
return;
}
int main(int argc, char* argv[])
{
int i = 1234;
int j = 5678;

myprintf("the first test:i=%d",i,j);
myprintf("the secend test:i=%d; %x;j=%d;",i,0xabcd,j);
system("pause");
return 0;
}
在intel+win2k+vc6的機器執行結果如下:
the first test:i=1234
the secend test:i=1234; 0xabcd;j=5678;
#include <stdarg.h>//不定數目引數需要的巨集
int max(int n,int num,...)
{
va_list x;//說明變數x
va_start(x,num);//x被初始化為指向num後的第一個引數
int m=num;
for(int i=1;i<n;i++)
{
//將變數x所指向的int型別的值賦給y,同時使x指向下一個引數
int y=va_arg(x,int);
if(y>m)m=y;
}
va_end(x);//清除變數x
return m;
}
main()
{
printf("%d,%d",max(3,5,56),max(6,0,4,32,45,533));
}