1. 程式人生 > >比較全面的巨集定義解析

比較全面的巨集定義解析

歡迎訪問我的部落格新地址:點選這裡

巨集定義

巨集定義是C提供的三種預處理功能的其中一種,這三種預處理包括:巨集定義、檔案包含、條件編譯。

引數

不帶引數

巨集定義又稱為巨集代換、巨集替換,簡稱“巨集”。 格式: #define 識別符號 字串 其中的識別符號就是所謂的符號常量,也稱為“巨集名”。 預處理(預編譯)工作也叫做巨集展開:將巨集名替換為字串。 掌握"巨集"概念的關鍵是“換”。一切以換為前提、做任何事情之前先要換,準確理解之前就要“換”。 即在對相關命令或語句的含義和功能作具體分析之前就要換: 例: #define Pi 3.1415926 把程式中出現的Pi全部換成3.1415926
說明: (1)巨集名一般用大寫 (2)使用巨集可提高程式的通用性和易讀性,減少不一致性,減少輸入錯誤和便於修改。例如:陣列大小常用巨集定義 (3)預處理是在編譯之前的處理,而編譯工作的任務之一就是語法檢查,預處理不做語法檢查。 (4)巨集定義末尾不加分號; (5)巨集定義寫在函式的花括號外邊,作用域為其後的程式,通常在檔案的最開頭。 (6)可以用#undef命令終止巨集定義的作用域 (7)巨集定義允許巢狀 (8)字串" "中永遠不包含巨集 (9)巨集定義不分配記憶體,變數定義分配記憶體。 (10)巨集定義不存在型別問題,它的引數也是無型別的。[2]

帶引數

除了一般的字串替換,還要做引數代換
格式: #define巨集名(引數表) 字串 例如:#define S(a,b) a*b area=S(3,2);第一步被換為area=a*b; ,第二步被換為area=3*2; 類似於函式呼叫,有一個啞實結合的過程: (1)實參如果是表示式容易出問題 #define S(r) r*r area=S(a+b);第一步換為area=r*r;,第二步被換為area=a+b*a+b; 正確的巨集定義是#define S(r) ((r)*(r)) (2)巨集名和引數的括號間不能有空格 (3)巨集替換隻作替換,不做計算,不做表示式求解 (4)函式呼叫在編譯後程序執行時進行,並且分配記憶體。巨集替換在編譯前進行,不分配記憶體
(5)巨集的啞實結合不存在型別,也沒有型別轉換。 (6)函式只有一個返回值,利用巨集則可以設法得到多個值 (7)巨集展開使源程式變長,函式呼叫不會 (8)巨集展開不佔執行時間,只佔編譯時間,函式呼叫佔執行時間(分配記憶體、保留現場、值傳遞、返回值)[3]

冷門重點

1.#define用法

1、 用無參巨集定義一個簡單的常量 #define LEN 12 這個是最常見的用法,但也會出錯。 比如下面幾個知識點你會嗎?可以看下: (1)#define NAME "zhangyuncong" 程式中有"NAME"則,它會不會被替換呢? (2)#define 0x abcd 可以嗎?也就是說,可不可以用不是識別符號的字母替換成別的東西? (3)#define NAME "zhang 這個可以嗎? (4)#define NAME "zhangyuncong" 程式中有上面的巨集定義,並且,程式裡有句: NAMELIST這樣,會不會被替換成"zhangyuncong"LIST 四個題答案都是十分明確的。 第一個,""內的東西不會被巨集替換。這一點應該大都知道。 第二個,巨集定義前面的那個必須是合法的使用者識別符號 第三個,巨集定義也不是說後面東西隨便寫,不能把字串的兩個""拆開。 第四個:只替換識別符號,不替換別的東西。NAMELIST整體是個識別符號,而沒有NAME識別符號,所以不替換。 也就是說,這種情況下記住:#define第一位置第二位置 (1) 不替換程式中字串裡的東西。 (2) 第一位置只能是合法的識別符號(可以是關鍵字) (3) 第二位置如果有字串,必須把""配對。 (4) 只替換與第一位置完全相同的識別符號 還有就是老生常談的話:記住這是簡單的替換而已,不要在中間計算結果,一定要替換出表示式之後再算。

2、 帶參巨集一般用法

比如#define MAX(a,b) ((a)>(b)?(a):(b)) 則遇到MAX(1+2,value)則會把它替換成: ((1+2)>(value)?(1+2):(value)) 注意事項和無參巨集差不多。 但還是應注意 #define FUN(a) "a" 則,輸入FUN(345)會被替換成什麼? 其實,如果這麼寫,無論巨集的實參是什麼,都不會影響其被替換成"a"的命運。 也就是說,""內的字元不被當成形參,即使它和一模一樣。 那麼,你會問了,我要是想讓這裡輸入FUN(345)它就替換成"345"該怎麼實現呢? 請看下面關於#的用法

3、 有參巨集定義中#的用法

需要注意的是凡巨集定義裡有用'#'或'##'的地方巨集引數是不會再展開,被當做字串處理
#define STR(str) #str #用於把巨集定義中的引數兩端加上字串的"" 比如,這裡STR(my#name)會被替換成"my#name" 一般由任意字元都可以做形參,但以下情況會出錯: STR())這樣,編譯器不會把“)”當成STR()的引數。 STR(,)同上,編譯器不會把“,”當成STR的引數。 STR(A,B)如果實參過多,則編譯器會把多餘的引數捨去。(VC++2008為例) STR((A,B))會被解讀為實參為:(A,B),而不是被解讀為兩個實參,第一個是(A第二個是B)。

4、 有參巨集定義中##的用法

#define WIDE(str) L##str 則會將形參str的前面加上L 比如:WIDE("abc")就會被替換成L"abc" 如果有#defineFUN(a,b) vo##a##b() 那麼FUN(id ma,in)會被替換成void main()

5、 多行巨集定義:

#define doit(m,n) for(int i=0;i<(n);++i)\ {\ m+=i;\ }

巨集定義 轉自 百度百科

C語言巨集定義##連線符和#符的使用

C語言中如何使用巨集C(和C++)中的巨集(Macro)屬於編譯器預處理的範疇,屬於編譯期概念(而非執行期概念)。下面對常遇到的巨集的使用問題做了簡單總結。
巨集中"#"和"##"的用法 

一般用法 

我們使用#把巨集引數變為一個字串,用##把兩個巨集引數貼合在一起(這裡說的是在預處理是對原始檔的操作)
用法: 
#include<cstdio> 
#include<climits> 
using namespace std;

#define STR(s)     #s 
#define CONS(a,b) int(a##e##b)

int main() 

printf(STR(vck));           // 輸出字串"vck" 
printf("%d/n", CONS(2,3)); // 2e3 輸出:2000 
return 0; 
}

當巨集引數是另一個巨集的時候 

需要注意的是凡巨集定義裡有用''#''或''##''的地方巨集引數是不會再展開.

1, 非''#''和''##''的情況 
#define TOW      (2) 
#define MUL(a,b) (a*b)

printf("%d*%d=%d/n", TOW, TOW, MUL(TOW,TOW)); 
這行的巨集會被展開為: 
printf("%d*%d=%d/n", (2), (2), ((2)*(2))); 
MUL裡的引數TOW會被展開為(2).

2, 當有''#''或''##''的時候 
#define A          (2) 
#define STR(s)     #s 
#define CONS(a,b) int(a##e##b)

printf("int max: %s/n", STR(INT_MAX));    // INT_MAX #include<climits> 
這行會被展開為: 
printf("int max: %s/n", "INT_MAX");           //而不是0x7FFFFFFF INT_MAX不展開了

printf("%s/n", CONS(A, A));               // compile error 
這一行則是: 
printf("%s/n", int(AeA));

INT_MAX和A都不會再被展開, 然而解決這個問題的方法很簡單. 加多一層中間轉換巨集. 
加這層巨集的用意是把所有巨集的引數在中間層裡全部展開, 那麼在轉換巨集裡的那一個巨集(_STR)就能得到正確的巨集引數.

#define A           (2) 
#define _STR(s)     #s 
#define STR(s)      _STR(s)         // 轉換巨集 
#define _CONS(a,b) int(a##e##b) 
#define CONS(a,b)   _CONS(a,b)                     // 轉換巨集

printf("int max: %s/n", STR(INT_MAX));            // INT_MAX,int型的最大值,為一個變數 #include<climits> 
輸出為: int max: 0x7fffffff 
STR(INT_MAX) --> _STR(0x7fffffff) 然後再轉換成字串;

printf("%d/n", CONS(A, A)); 
輸出為:200 
CONS(A, A) --> _CONS((2), (2)) --> int((2)e(2))

''#''和''##''的一些應用特例 

1、合併匿名變數名 
#define ___ANONYMOUS1(type, var, line) type var##line 
#define __ANONYMOUS0(type, line) ___ANONYMOUS1(type, _anonymous, line) 
#define ANONYMOUS(type) __ANONYMOUS0(type, __LINE__) 
例:ANONYMOUS(static int); 即: static int _anonymous70; 70表示該行行號; 
第一層:ANONYMOUS(static int); --> __ANONYMOUS0(static int, __LINE__); 
第二層:                        --> ___ANONYMOUS1(static int, _anonymous, 70); 
第三層:                        --> static int _anonymous70; 
即每次只能解開當前層的巨集,所以__LINE__在第二層才能被解開;

2、填充結構 
#define FILL(a)   {a, #a}

enum IDD{OPEN, CLOSE}; 
typedef struct MSG{ 
IDD id; 
const char * msg; 
}MSG;

MSG _msg[] = {FILL(OPEN), FILL(CLOSE)}; 
相當於: 
MSG _msg[] = {{OPEN, "OPEN"}, 
{CLOSE, "CLOSE"}};

3、記錄檔名 
#define _GET_FILE_NAME(f)   #f 
#define GET_FILE_NAME(f)    _GET_FILE_NAME(f) 
static char FILE_NAME[] = GET_FILE_NAME(__FILE__);

4、得到一個數值型別所對應的字串緩衝大小 
#define _TYPE_BUF_SIZE(type) sizeof #type 
#define TYPE_BUF_SIZE(type)   _TYPE_BUF_SIZE(type) 
char buf[TYPE_BUF_SIZE(INT_MAX)]; 
--> char buf[_TYPE_BUF_SIZE(0x7fffffff)]; 
--> char buf[sizeof "0x7fffffff"]; 
這裡相當於: 
char buf[11];

變參巨集 消除多餘的分號 Duplication of Side Effects


關於變參的使用

...在C巨集中稱為Variadic Macro,也就是變參巨集。比如:

#define myprintf(templt,...) fprintf(stderr,templt,__VA_ARGS__)

// 或者

#define myprintf(templt,args...) fprintf(stderr,templt,args)

第一個巨集中由於沒有對變參起名,我們用預設的巨集__VA_ARGS__來替代它。第二個巨集 中,我們顯式地命名變參為args,那麼我們在巨集定義中就可以用args來代指變參了。同C語言的stdcall一樣,變參必須作為引數表的最有一項出 現。當上面的巨集中我們只能提供第一個引數templt時,C標準要求我們必須寫成:

myprintf(templt,);

的形式。這時的替換過程為:

myprintf("Error!/n",);

替換為:

fprintf(stderr,"Error!/n",);

這是一個語法錯誤,不能正常編譯。這個問題一般有兩個解決方法。首先,GNU CPP提供的解決方法允許上面的巨集呼叫寫成:

myprintf(templt);

而它將會被通過替換變成:

fprintf(stderr,"Error!/n",);

很明顯,這裡仍然會產生編譯錯誤(非本例的某些情況下不會產生編譯錯誤)。除了這種方式外,c99和GNU CPP都支援下面的巨集定義方式:

#define myprintf(templt, ...) fprintf(stderr,templt, ##__VAR_ARGS__)

這時,##這個連線符號充當的作用就是當__VAR_ARGS__為空的時候,消除前面的那個逗號。那麼此時的翻譯過程如下:

myprintf(templt);

被轉化為:

fprintf(stderr,templt);

這樣如果templt合法,將不會產生編譯錯誤。 這裡列出了一些巨集使用中容易出錯的地方,以及合適的使用方式。

消除多餘的分號-Semicolon Swallowing

通常情況下,為了使函式模樣的巨集在表面上看起來像一個通常的C語言呼叫一樣,通常情況下我們在巨集的後面加上一個分號,比如下面的帶參巨集:

MY_MACRO(x);

但是如果是下面的情況:

#define MY_MACRO(x) {	/* line 1 */	/* line 2 */	/* line 3 */ }

//...

if (condition())

MY_MACRO(a);

else

{...}

這樣會由於多出的那個分號產生編譯錯誤。為了避免這種情況出現同時保持MY_MACRO(x);的這種寫法,我們需要把巨集定義為這種形式:

#define MY_MACRO(x) do {

/* line 1 */	/* line 2 */	/* line 3 */ } while(0)

這樣只要保證總是使用分號,就不會有任何問題。

Duplication of Side Effects

這裡的Side Effect是指巨集在展開的時候對其引數可能進行多次Evaluation(也就是取值),但是如果這個巨集引數是一個函式,那麼就有可能被呼叫多次從而達到不一致的結果,甚至會發生更嚴重的錯誤。比如:

#define min(X,Y) ((X) > (Y) ? (Y) : (X))

//...

c = min(a,foo(b));

這時foo()函式就被呼叫了兩次。為了解決這個潛在的問題,我們應當這樣寫min(X,Y)這個巨集:

#define min(X,Y) ({	typeof (X) x_ = (X);	typeof (Y) y_ = (Y);	(x_ < y_) ? x_ : y_; })

({...})的作用是將內部的幾條語句中最後一條的值返回,它也允許在內部宣告變數(因為它通過大括號組成了一個區域性Scope)。

ANSI C標準中有幾個標準預定義巨集:__FILE__     __DATE__   __TIME___    __LINE__   等

__LINE__:在原始碼中插入當前原始碼行號;

__FILE__:在原始檔中插入當前原始檔名;

__DATE__:在原始檔中插入當前的編譯日期

__TIME__:在原始檔中插入當前編譯時間;

__STDC__:當要求程式嚴格遵循ANSI C標準時該標識被賦值為1;

__cplusplus:當編寫C++程式時該識別符號被定義。

_FUNCTION_  當前所在函式名

這幾個巨集比較有用

在除錯程式時或編譯時,__LINE__比較有用,可以用來列印邏輯錯誤的行號~~~~~~~,例子:

switch(x)

{

         case 1:

                   ....;

                   break;

         case 2:

                   .....;

                  break;

          default:

            printf("logic erro line number%d!/n",__LINE__);

            break;

}

又如利用__DATE__和__TIME__可以插入編譯時間。

程式碼:

void print_version_info(void)

{

         printf("Date Compiled:%s/n",__DATE__);

         printf("TimeCompiled:%s/n",__TIME__);

}

輸出格式為:mm dd yy 和 hh:mm:ss

對於__FILE__,__LINE__,__func__這樣的巨集,在除錯程式時是很有用的,因為你可以很容易的知道程式執行到了哪個檔案的那一 行,是哪個函式。

       下面一個例子是列印上面這些預定義的巨集的。

__DATE__,__FILE__,__LINE__,__TIME__,__FUNCTION__ C標準中指定了一些預定義的巨集,對於程式設計經常會用到。下面這個表中就是一些常常用到的預定義巨集。

__DATE_ %s_
進行預處理的日期(“Mmm dd yyyy”形式的字串文字)

__FILE__  %s
代表當前原始碼檔名的字串文字

__LINE__    %d
代表當前原始碼中的行號的整數常量

__TIME__  %s
原始檔編譯時間,格式微“hh:mm:ss”

__FUNCTION__(__func__)  %s
當前所在函式名

__PRETTY_FUNCTION__ %s

當前所在函式名,包括返回型別和引數型別。

例如:printf("__PRETTY_FUNCTION__:%s/n", __PRETTY_FUNCTION__);

輸出:__PRETTY_FUNCTION__:int main(int, char**)


#include <stdio.h>
#include <stdlib.h>
void why_me();
int main()
{
    printf( "The file is %s./n", __FILE__ );
    printf( "The date is %s./n", __DATE__ );
    printf( "The time is %s./n", __TIME__ );
    printf( "This is line %d./n", __LINE__ );
    printf( "This function is %s./n", __FUNCTION__ );
    why_me();
    return 0;
}

void why_me()
{
    printf( "This function is %s/n", __func__ );
    printf( "The file is %s./n", __FILE__ );
    printf( "This is line %d./n", __LINE__ );
}  

c,c++ ANSI中預定義 _cplusplus 簡介

經常在/usr/include目錄下看到這種字句:

#ifdef __cplusplus
extern "C" {
#endif
...
#ifdef __cplusplus
}
#endif


不太明白是怎麼用的。今天閱讀autobook,在第53頁看到了作者的解釋:C/C++編譯器對函式和變數名的命名方法不一樣(例如C++中過載的函式有多個名字,而C的函式只有一個名字),這樣當C編譯器去引用C++編譯器編譯出來的符號時,會找不到連結。因此,當一個頭檔案可能既被C程式引用,又被C++程式引用時,需要使用如上程式碼進行區分。

上面的寫法太複雜了,況且兩個大括號{和}分離,會造成有些編輯器的縮排錯誤。更好的手法是將如下程式碼定義在一個公共標頭檔案中,然後所有其它標頭檔案去引用它:

#ifdef __cplusplus
#  define BEGIN_C_DECLS         extern "C" {
#  define END_C_DECLS           }
#else
#  define BEGIN_C_DECLS
#  define END_C_DECLS
#endif