1. 程式人生 > >Linux與Windows下txt檔案區別

Linux與Windows下txt檔案區別

 
一、區別
換行符:    
1.windows中的換行符是\r\n,
2. linux/unix下的換行符是\n。
其中:
回車符:\r=0x0d (13) return; #回車(carriage return)
換行符:\n=0x0a (10) newline。#換行(newline)
     
二、檔案格式互轉命令
1.unix2dos:將具有unix風格的格式檔案轉化為具有window下的格式檔案。
2.dos2unix:將具有windows風格的格式檔案轉化為unix下的格式檔案。
 
Reply-text mb10程式碼  
<span style="">windows的換行符是\r\n Linux採用的是\n  
可以採用unix2dos或dos2unix轉換文字檔案 </span>  
 
三、回車換行符的歷史背景
早期的計算機輸出裝置不是顯示器,而是電傳打字機,結構與普通的打字機差不多。有一個列印頭在紙上打字,同時有一個電動機控制紙張的進出。當列印頭到達行尾的時候,需要兩個動作才能夠到達下一行的行首:首先執行回車動作,將列印頭移動到本行的行首,然後進行換行動作,電動機將紙張向上移動一行,這樣列印頭就處於下一行的行首,可以繼續進行列印。回車和換行對應的控制字元分別是\r和\n,這就是windows中換行符為\r\n的由來。後來由於經常連續執行,所以在印表機中將這兩個控制字元簡化為一個控制字元,這就是linux/unix中的換行符\n的由來。
Unix系統裡,每行結尾只有“<換行>”,即“\n”;Windows系統裡面,每行結尾是“ <回車><換行>”,即“\r\n”;Mac系統裡,每行結尾是“<回車>”。一個直接後果是,Unix/Mac系統下的檔案在Windows裡開啟的話,所有文字會變成一行;而Windows裡的檔案在Unix/Mac下開啟的話,在每行的結尾可能會多出一個^M符號.
 
四、引起的現象和問題:
 
1.問題一
​ 做一個日誌檔案的時候發現由printWriter寫出來的檔案在windows上開啟 是混亂的,因為在linux下執行printLn方法時 寫入的換行符是\n ,在windows沒法識別\r\n才能被認為是換行
 
2. 問題二 
有時在WIN下編輯好的指令碼檔案上傳到LINUX伺服器中不能正常執行,開始誤認為是LINUX配置問題,後來發現,是WIN與LINUX儲存檔案時的換行符標誌不同造成的。在DOS使用的換行符為 ^M$,我們稱為CR與LF兩個符號。而在Linux中,則僅有LF ($) 這個換行符。
  可以用如下命令完成格式轉換:$dos2unix,$unix2dos。但這兩個命令在Ubuntu發行版本中不存在,可通過:
  $sudo apt-get install tofrodos
  命令安裝。之後,再次使用如下文所示的格式即可。
  [
[email protected]
~]# dos2unix [-kn] file [newfile]
  [[email protected] ~]# unix2dos [-kn] file [newfile]
  引數:
  -k : 保留該檔案原來的mtime時間格式(不更新檔案上次內容經過修改的時間)
  -n : 保留原來的舊檔案,將轉換後的內容輸出到新檔案,如:dos2unix -n old new
  範例:
  範例一:將提供的hosts檔案格式更新為dos格式。
  [[email protected] ~]# unix2dos -k hosts
  unix2dos: converting file hosts to DOS format ...
  # 此時hosts檔案的時間不會改變,但內容主要將換行符修改成為DOS的CRLF了。
  範例二:將範例一已經變成DOS格式的hosts改名為hosts.dos,並且轉換Linux
  格式到hosts.linux
  [
[email protected]
~]# mv hosts hosts.dos
  [[email protected] ~]# dos2unix -k -n hosts.dos hosts.linux
  dos2unix: converting file hosts.dos to file hosts.linux in UNIX format ...
  [[email protected] ~]# ll
  -rw-r--r-- 1 root root 288 Aug 1 13:30 hosts.dos
  -rw------- 1 root root 279 Aug 1 13:30 hosts.linux
  # 由於DOS格式中多了CR字元,所以,檔案比較大。
 
3. 現象三
先生成一個換行(\n, 0x0A)和回車(\r, 0x0D)組合的文字
$ echo -en '12\n34\r56\n\r78\r\n' > tmp
以十六進位制方式檢視文字
$ od -t x1 tmp
0000000 31 32 0a 33 34 0d 35 36 0a 0d 37 38 0d 0a
0000016
 
五、程式設計相關
 
文字檔案的行結束符,傳統上 PC機 用 CRLF,蘋果機用CR,unix 用 LF。【CR -- 回車符,c語言'\r'】。【LF -- 換行符, c語言'\n'】。
不同計算機上c語言統一規定為::文字檔案的行結束符一律變成一個符號LF,也就是換行符,也就是new line符, 也就是'\n'. “回車和換行符轉換成一個換行符”
-- 對PC機而言,文字檔案行結束符,CRLF讀入後,丟掉CR,留 LF. 例如fgets() 讀入一行,行尾只有LF,沒有CR.
在解析文字或其他格式的檔案內容時,常常要碰到判定回車換行的地方,這個時候就要注意既要判定"\r\n"又要判定"\n"。寫程式時可能得到一行,將其進行trim掉'\r',這樣能得到你所需要的string了。
'\n' 10 換行(newline)
'\r' 13 回車(return)
 
最後:
ctrl+M: ^M 也稱回車鍵