1. 程式人生 > >【linux C】C語言中常用的幾個函式的總結【一】

【linux C】C語言中常用的幾個函式的總結【一】

1、memset函式

定義變數時一定要進行初始化,尤其是陣列和結構體這種佔用記憶體大的資料結構。在使用陣列的時候經常因為沒有初始化而產生“燙燙燙燙燙燙”這樣的野值,俗稱“亂碼”。
每種型別的變數都有各自的初始化方法,memset() 函式可以說是初始化記憶體的“萬能函式”,通常為新申請的記憶體進行初始化工作。它是直接操作記憶體空間,mem即“記憶體”(memory)的意思。該函式的原型為:

# include <string.h>
void *memset(void *s, int c, unsigned long n);

函式的功能是:將指標變數 s 所指向的前 n 位元組的記憶體單元用一個“整數” c 替換,注意 c 是 int 型。s 是 void* 型的指標變數,所以它可以為任何型別的資料進行初始化



memset() 的作用是在一段記憶體塊中填充某個給定的值。因為它只能填充一個值,所以該函式的初始化為原始初始化,無法將變數初始化為程式中需要的資料。用memset初始化完後,後面程式中再向該記憶體空間中存放需要的資料。

memset 一般使用“0”初始化記憶體單元,而且通常是給陣列或結構體進行初始化。一般的變數如 char、int、float、double 等型別的變數直接初始化即可,沒有必要用 memset。如果用 memset 的話反而顯得麻煩。

當然,陣列也可以直接進行初始化,但 memset 是對較大的陣列或結構體進行清零初始化的最快方法,因為它是直接對記憶體進行操作的

這時有人會問:“字串陣列不是最好用'\0'進行初始化嗎?那麼可以用 memset 給字串陣列進行初始化嗎?也就是說引數 c 可以賦值為'\0'嗎?”

可以的。雖然引數 c 要求是一個整數,但是整型和字元型是互通的。但是賦值為 '\0' 和 0 是等價的,因為字元 '\0' 在記憶體中就是 0。所以在 memset 中初始化為 0 也具有結束標誌符 '\0' 的作用,所以通常我們就寫“0”。

memset 函式的第三個引數 n 的值一般用 sizeof()  獲取
,這樣比較專業。注意,如果是對指標變數所指向的記憶體單元進行清零初始化,那麼一定要先對這個指標變數進行初始化,即一定要先讓它指向某個有效的地址。而且用memset給指標變數如p所指向的記憶體單元進行初始化時,n 千萬別寫成 sizeof(p),這是新手經常會犯的錯誤。因為 p 是指標變數,不管 p 指向什麼型別的變數,sizeof(p) 的值都是 4。

下面舉例說明此處容易出現的問題:

 1 # include <stdio.h>
 2 # include <string.h>
 3 int main(void)
 4 {
 5     int i;  //迴圈變數
6 char str[10]; 7 char *p = str; 8 memset(str, 0, sizeof(str)); //只能寫sizeof(str), 不能寫sizeof(p) 9 for (i=0; i<10; ++i) 10 { 11 printf("%d\x20", str[i]); 12 } 13 printf("\n"); 14 return 0; 15 }
根據memset函式的不同,輸出結果也不同,分為以下幾種情況:
memset(p, 0, sizeof(p));  //地址的大小都是4位元組
0 0 0 0 -52 -52 -52 -52 -52 -52

memset(p, 0, sizeof(*p));  //*p表示的是一個字元變數, 只有一位元組
0 -52 -52 -52 -52 -52 -52 -52 -52 -52

memset(p, 0, sizeof(str));
0 0 0 0 0 0 0 0 0 0

memset(str, 0, sizeof(str));
0 0 0 0 0 0 0 0 0 0

memset(p, 0, 10);  //直接寫10也行, 但不專業
0 0 0 0 0 0 0 0 0 0

 

2、gets函式

從鍵盤輸入字串是使用 scanf 和 %s。其實還有更簡單的方法,即使用 gets() 函式。該函式的原型為:

# include <stdio.h>
char *gets(char *str);

這個函式很簡單,只有一個引數。引數型別為 char* 型,即 str 可以是一個字元指標變數名,也可以是一個字元陣列名。

gets() 函式的功能是從輸入緩衝區中讀取一個字串儲存到字元指標變數 str 所指向的記憶體空間

下面將前面中使用 scanf 輸入字串的程式改一下:

# include <stdio.h>
int main(void)
{
    char str[20] = "\0";  //字元陣列初始化\0
    printf("請輸入字串:");
    gets(str);
    printf("%s\n", str);
    return 0;
}

輸出結果是:
請輸入字串:i love you
i love you

可見,gets() 函式不僅比 scanf 簡潔,而且,就算輸入的字串中有空格也可以直接輸入,不用像 scanf 那樣要定義多個字元陣列。也就是說:

gets(str);

完全可以取代:

scanf("%s", string);

不僅程式碼更簡潔,而且可以直接輸入帶空格的字串。對字元指標變數所指向的記憶體單元進行初始化也可以用 gets(),例如線面的程式,將 scanf 換成 gets():

 1 # include <stdio.h>
 2 int main(void)
 3 {
 4     char str[30];
 5     char *string = str;  //一定要先將指標變數初始化
 6     printf("請輸入字串:");
 7     gets(string);  //也可以寫成gets(str);
 8     printf("%s\n", string);  //輸出引數是已經定義好的“指標變數名”
 9     return 0;
10 }

輸出結果是:
請輸入字串:Hi i...like you
Hi i...like you

此外,關於使用 gets() 函式需要注意:使用 gets() 時,系統會將最後“敲”的換行符從緩衝區中取出來,然後丟棄,所以緩衝區中不會遺留換行符。這就意味著,如果前面使用過 gets(),而後面又要從鍵盤給字元變數賦值的話就不需要吸收回車清空緩衝區了,因為緩衝區的回車已經被 gets() 取出來扔掉了。下面寫一個程式驗證一下:

 1 # include <stdio.h>
 2 int main(void)
 3 {
 4     char str[30];
 5     char ch;
 6     printf("請輸入字串:");
 7     gets(str);
 8     printf("%s\n", str);
 9     scanf("%c", &ch);
10     printf("ch = %c\n", ch);
11     return 0;
12 }

輸出結果是:
請輸入字串:i love you
i love you
Y
ch = Y

我們看到,沒有清空緩衝區照樣可以輸入'Y',因為 gets() 已經將緩衝區中的回車取出來丟掉了。如果前面使用的不是 gets() 而是 scanf,那麼通過鍵盤給 ch 賦值前就必須先使用 getchar() 清空緩衝區。

這裡補充一下getchar的相關知識

C中的getchar()和EOF的行為:轉自 https://www.cnblogs.com/QLinux/articles/2465329.html

大師級經典的著作,要字斟句酌的去讀,去理解。以前在看K&R的The C Programming Language(Second Edition)中第1.5節的字元輸入/輸出,很迷惑getchar()和EOF的行為。因此,感覺很有必要總結一下,不然,很多瑣碎的知識點長時間過後就會淡忘的,只有寫下來才是最好的方法。

一、對getchar的兩點總結:


1. getchar是以行為單位進行存取的。
當呼叫getchar函式讀取輸入時,只有當輸入字元為換行符'/n'或檔案結束符EOF時,getchar才會停止執行,整個程式將會往下執行。並且,如果輸入行是以EOF結束的(EOF之前不是換行符),則EOF會被“吃掉”(即不會被getchar讀取到)。譬如下面程式段:

1 while((c = getchar()) != EOF)
2 {
3     putchar(c);
4 }



執行程式,輸入:abc,然後回車。則程式就會去執行puchar(c),然後輸出abc和一個回車。然後可以繼續輸入,再次遇到換行符的時候,程式又會把 那一行的輸入的字元輸出在終端上。令人迷惑的是,getchar不是以字元為單位讀取的嗎?那麼,既然我輸入了第一個字元a,肯定滿足while迴圈(c = getchar()) != EOF的條件,那麼應該執行putchar(c)在終端輸出一個字元a。但是程式就偏偏不這樣執行,而是必需讀到一個換行符或者檔案結束符EOF才進行一次輸出

 

造成這種結果的一種解釋是,輸入終端驅動處於一次一行 的模式下。也就是雖然getchar()和putchar()確實是按照每次一個字元進行的。但是終端驅動處於一次一行的模式,它的輸入只有到'/n'或 者EOF時才結束。在本例中,程式段呼叫了getchar函式,則控制權從程式段轉移到getchar函式,而getchar函式要依賴於作業系統的驅動 來讀取輸入,沒遇到換行符或者EOF,驅動不會通知getchar函式,getchar函式處於“阻 塞”狀態。而遇到換行符或者EOF後,getchar函式解除“阻塞”,讀取一個字元,控制權返回程 序段,執行putchar函式,迴圈執行。直到遇到EOF字元或者這行輸入全部處理完。


2. getchar()的返回值一般情況下是非負 值,但也可能是負值,即返回EOF。這個EOF在函式庫裡一般定義為-1。正確的定義方法如下(K&R C中特別提到了這個問題):

int c;
c = getchar();

二、EOF的兩點總結(主要指普通終端中的EOF)
1. EOF作為檔案結束符時的情況:

EOF雖然是檔案結束符,但並不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠實現檔案結束的功能,只有在下列的條件下,才作為檔案結束符。
(1)遇到getcahr函式執行時,要輸入第一個字元時就直接輸入Ctrl+D;
(2)在前面輸入的字元為換行符時, 接著輸入Ctrl+D;
(3)在前面有字元輸入且不為換行符時,要連著輸入兩次Ctrl+D,這時第二次輸入的Ctrl+D起到檔案結束符的功能,至於第一次的
Ctrl+D作為行結束符(如1.1所講)。


其實,這三種情況都可以總結為只有在getchar()提示新的一次輸入時, 直接輸入Ctrl+D才相當於檔案結束符


2. EOF作為行結束符時的情況,這時候輸入Ctrl+D作為行結束的標誌能結束getchar()的“阻塞”,使getchar()逐個字元讀入,但是EOF會被“吃掉”,並不會被讀取

 

以上面的程式碼段為例, 如果執行時輸入abc,然後 Ctrl+D,程式輸出結果為:
abcabc

(第一組為輸入 第二組為輸出)

注意:第一組abc是你從終端輸入的,然後輸入Ctrl+D,getchar逐個字元讀取並逐個輸出打印出第二組abc,同時游標停在第二組字元的c後面,然後可以進行新一次的輸入。這時如果再次輸入Ctrl+D,就會起到了檔案結束符的作用,因為EOF是一行輸入的第一個字元。如果輸入abc之後,然後回車,輸入換行符的話,則終端顯示為:
abc'/n'
abc'/n'
//第三行

其中第一行為你是終端輸入的,第二行是終端輸出(含換行符),游標停在了第三行處,等待新一次的終端輸入。從這裡也 可以看出Ctrl+D和換行符分別作為行結束符時,輸出的不同結果。

大師級經典的著作,要字斟句酌的去讀,去理解。以前在看K&R的The C Programming Language(Second Edition)中第1.5節的字元輸入/輸出,很迷惑getchar()和EOF的行為。因此,感覺很有必要總結一下,不然,很多瑣碎的知識點長時間過後就會淡忘的,只有寫下來才是最好的方法。

一、對getchar的兩點總結:


1. getchar是以行為單位進行存取的。
當呼叫getchar函式讀取輸入時,只有當輸入字元為換行符'/n'或檔案結束符EOF時,getchar才會停止執行,整個程式將會往下執行。並且,如果輸入行是以EOF結束的(EOF之前不是換行符),則EOF會被“吃掉”(即不會被getchar讀取到)。譬如下面程式段:

1 while((c = getchar()) != EOF)
2 {
3     putchar(c);
4 }



執行程式,輸入:abc,然後回車。則程式就會去執行puchar(c),然後輸出abc和一個回車。然後可以繼續輸入,再次遇到換行符的時候,程式又會把 那一行的輸入的字元輸出在終端上。令人迷惑的是,getchar不是以字元為單位讀取的嗎?那麼,既然我輸入了第一個字元a,肯定滿足while迴圈(c = getchar()) != EOF的條件,那麼應該執行putchar(c)在終端輸出一個字元a。但是程式就偏偏不這樣執行,而是必需讀到一個換行符或者檔案結束符EOF才進行一次輸出

 

造成這種結果的一種解釋是,輸入終端驅動處於一次一行 的模式下。也就是雖然getchar()和putchar()確實是按照每次一個字元進行的。但是終端驅動處於一次一行的模式,它的輸入只有到'/n'或 者EOF時才結束。在本例中,程式段呼叫了getchar函式,則控制權從程式段轉移到getchar函式,而getchar函式要依賴於作業系統的驅動 來讀取輸入,沒遇到換行符或者EOF,驅動不會通知getchar函式,getchar函式處於“阻 塞”狀態。而遇到換行符或者EOF後,getchar函式解除“阻塞”,讀取一個字元,控制權返回程 序段,執行putchar函式,迴圈執行。直到遇到EOF字元或者這行輸入全部處理完。


2. getchar()的返回值一般情況下是非負 值,但也可能是負值,即返回EOF。這個EOF在函式庫裡一般定義為-1。正確的定義方法如下(K&R C中特別提到了這個問題):

int c;
c = getchar();

二、EOF的兩點總結(主要指普通終端中的EOF)
1. EOF作為檔案結束符時的情況:

EOF雖然是檔案結束符,但並不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠實現檔案結束的功能,只有在下列的條件下,才作為檔案結束符。
(1)遇到getcahr函式執行時,要輸入第一個字元時就直接輸入Ctrl+D;
(2)在前面輸入的字元為換行符時, 接著輸入Ctrl+D;
(3)在前面有字元輸入且不為換行符時,要連著輸入兩次Ctrl+D,這時第二次輸入的Ctrl+D起到檔案結束符的功能,至於第一次的
Ctrl+D作為行結束符(如1.1所講)。


其實,這三種情況都可以總結為只有在getchar()提示新的一次輸入時, 直接輸入Ctrl+D才相當於檔案結束符


2. EOF作為行結束符時的情況,這時候輸入Ctrl+D作為行結束的標誌能結束getchar()的“阻塞”,使getchar()逐個字元讀入,但是EOF會被“吃掉”,並不會被讀取

 

以上面的程式碼段為例, 如果執行時輸入abc,然後 Ctrl+D,程式輸出結果為:
abcabc

(第一組為輸入 第二組為輸出)

注意:第一組abc是你從終端輸入的,然後輸入Ctrl+D,getchar逐個字元讀取並逐個輸出打印出第二組abc,同時游標停在第二組字元的c後面,然後可以進行新一次的輸入。這時如果再次輸入Ctrl+D,就會起到了檔案結束符的作用,因為EOF是一行輸入的第一個字元。如果輸入abc之後,然後回車,輸入換行符的話,則終端顯示為:
abc'/n'
abc'/n'
//第三行

其中第一行為你是終端輸入的,第二行是終端輸出(含換行符),游標停在了第三行處,等待新一次的終端輸入。從這裡也 可以看出Ctrl+D和換行符分別作為行結束符時,輸出的不同結果。