1. 程式人生 > >fgets、gets、scanf函式讀入字串比較

fgets、gets、scanf函式讀入字串比較

首先,說說這個函式的使用方法。程式碼如下:

char str[10];
fgets(str, 10, stdin);//stdin表示從輸入流中讀入,也可以是其他檔案指標。
gets(str);
scanf("%s", str);
其中fgets函式是安全的,gets和scanf函式都是不安全的。當輸入的字元大於等於10時,會陣列越界。編譯不會儲存,甚至執行時也不會儲存。但極可能因為對str陣列越界寫入,導致更改了其他變數的值。

在上述程式碼中fgets的第二個引數10制定了最多讀入的字元小於10。也就是說,上述fgets函式呼叫最多從stdin(標準輸入流,通常是鍵盤)中讀入9個字元。之所以要空出一個,是因為C語言中字串有一個結束標誌'\0',fgets為str中空出的這一個陣列元素,就是為'\0'準備的。

其次,如果輸入的字元小於陣列長度,fgets、gets、scanf函式讀入的是怎樣的字串。

首先:fgets讀入的是帶'\n'的字串。也就是說,在不超過第二個引數的情況下,fgets從第三個引數(檔案指標,輸入流)中不斷的讀入字元。直到遇到'\n',並將'\n'從輸入流中取出

其次:gets函式不檢測讀入的字元的個數。僅僅是不斷的從標準輸入流(鍵盤)中讀入字元,直到遇到'\n'。與fgets不同的是,雖然gets函式也會將'\n'從輸入流中取出,但卻只是取出,然後丟掉。並不儲存在目標字串中(上述程式碼中既是str)。

最後:scanf函式不檢測讀入的字元的個數。僅僅是不斷的從標準輸入流(鍵盤)中讀入字元,直到遇到“空白符

。和fgets/gets不同的是,scanf從輸入流中取出“空白符”。

空白符:換頁符、縱向製表符、橫向製表符('\t')、空格(' ')、換行符('\n')、回車符('\r')

鑑於scanf和gets函式對'\n'的不同態度,將他們混合使用是不恰當的。例如下述程式碼:

int n;
char str[80];
scanf("%d", &n);
gets(str);
printf("%s\n", str);
執行上述程式碼,輸入1958 ustc,str的值為" ustc",程式輸出"ustc"及一個換行;輸入1958↙ustc,str的值為"\n",(其中↙表示鍵盤輸入回車),程式輸出兩個換行。推薦的解決方案如下:
scanf("%d ", &n);//
%d後有一個空格,這樣就過濾掉了'\n'以及可能出現的'\r'——輸入流被重定向到檔案時會有這樣的情況,詳見後文。

關於回車('\r')和換行(‘\n’)。網上流傳著如下的說法:

在計算機還沒有出現之前,有一種叫做電傳打字機(Teletype Model 33)的玩意,每秒鐘可以打10個字元。但是它有一個問題,就是打完一行換行的時候,要用去0.2秒,正好可以打兩個字元。要是在這0.2秒裡面,又有新的字元傳過來,那麼這個字元將丟失。 
於是,研製人員想了個辦法解決這個問題,就是在每行後面加兩個表示結束的字元。一個叫做“回車”,告訴打字機把列印頭定位在左邊界;另一個叫做“換行”,告訴打字機把紙向下移一行。 
這就是“換行”和“回車”的來歷,從它們的英語名字上也可以看出一二。 
後來,計算機發明瞭,這兩個概念也就被般到了計算機上。那時,儲存器很貴,一些科學家認為在每行結尾加兩個字元太浪費了,加一個就可以。於是,就出現了分歧。 
Unix系統裡,每行結尾只有“<換行>”(即'\n');Windows系統裡面,每行結尾是“<回車><換行>”,即“\r\n”;Mac系統裡,每行結尾是“<回車>”('\r')。一個直接後果是,Unix/Mac系統下的檔案在Windows裡開啟的話,所有文字會變成一行;而Windows裡的檔案在Unix/Mac下開啟的話,在每行的結尾可能會多出一個^M符號。 

以上摘自:http://javaeye-mao.iteye.com/blog/211354

<CR><LF>的說法源於印表機打字           <CR>(Carriage   return):  \r   (return)   0x0d           <LF>(Line   feed):   \n   (new   line)   0x0a  

      這個東西的說法來自打字機,以前的打字機要新起一行的時候有兩步:               1.   打字的機頭回到開始位置,這就是回車          2.   紙張往上推進一行,這就是換行   

以上摘自:http://blog.163.com/[email protected]/blog/static/14202144320104704030821/

要時刻牢記的是,'\r'是空白符,scanf函式不會讀入它。但是fgets和gets函式會讀取它!尤為重要的是,ACM的線上評測系統(OJ),通常是執行在Linux下,採用檔案重定向的方式重檔案中讀取輸入。我們也可以通過freopen函式將輸入輸出流重定向到檔案,以減少程式除錯時的輸出。詳見利用freopen函式重定向輸入輸出,輔助程式除錯

在Windows環境下,生成的檔案中的換行,通常都是【CR】【LF】,即"\r\n"。非常坑爹的是:即便是檔案重定向了,在Windows下,fgets、gets函式並不會讀入'\r'。但是在Linux下,如果檔案中換行是"\r\n",那麼悲劇的是,fgets和gets會讀入'\r'。因為如前所述,Linux系統下的換行,是不包含的'\r'的,所以Linux系統並不會像Windows系統那樣對''\r'採取特殊的處理!很多同學利用gets函式讀入字串後,預設字串最後一位是字串結束符標誌'\0',在程式中沒有考慮到'\r'的情況。最後導致在Windows下能夠除錯通過,但是提交到ACM平臺卻通不過的抓狂場景。

在USTCOJ上,題1362的測試資料的輸入檔案中換行是'\n'。而題1365的測試資料的輸入檔案中換行是'\r\n'。

最後,如果想要知道一個檔案中的換行是怎樣的,可以通過Notepad++軟體開啟,“檢視”->“顯示符號”->“顯示所有字元”。顯示效果如下圖: