1. 程式人生 > >linux shell 用sed命令在文字的行尾或行首新增字元

linux shell 用sed命令在文字的行尾或行首新增字元

昨天寫一個指令碼花了一天的2/3的時間,而且大部分時間都耗在了sed命令上,今天不總結一下都對不起昨天流逝的時間啊~~~

用sed命令在行首或行尾新增字元的命令有以下幾種:

假設處理的文字為test.file

在每行的頭新增字元,比如"HEAD",命令如下:

sed 's/^/HEAD&/g' test.file

在每行的行尾新增字元,比如“TAIL”,命令如下:

sed 's/$/&TAIL/g' test.file

執行結果如下圖:

幾點說明:

1."^"代表行首,"$"代表行尾

2.'s/$/&TAIL/g'中的字元g代表每行出現的字元全部替換,如果想在特定字元處新增,g就有用了,否則只會替換每行第一個,而不繼續往後找了

例:

3.如果想匯出檔案,在命令末尾加"> outfile_name";如果想在原檔案上更改,新增選項"-i",如

4.也可以把兩條命令和在一起,在test.file的每一行的行頭和行尾分別新增字元"HEAD"、“TAIL”,命令:sed '/./{s/^/HEAD&/;s/$/&TAIL/}' test.file

以上其實都還OK,昨天花太多時間,主要因為被處理的檔案是用mysql從資料庫提取的結果匯出來的,別人給我之後我就直接處理,太腦殘了= -我一直有點懷疑之所以結果不對,有可能是windows和linux換行的問題,可是因為對sed不熟,就一直在搞sed。。。。。。。

眾所周知(= -),window和linux的回車換行之云云,如果你知道了,跳過這一段,不知道,讀一下唄:

Unix系統裡,每行結尾只有“<換行>”,即“\n”;Windows系統裡面,每行結尾是“<換行><回 車>”,即“\n\r”。一個直接後果是,Unix系統下的檔案在Windows裡開啟的話,所有文字會變成一行;而Windows裡的檔案在 Unix下開啟的話,在每行的結尾可能會多出一個^M符號。

好了,所以我的問題就出在被處理的檔案的每行末尾都有^M符號,而這通常是看不出來的。可以用"cat -A test.file"命令檢視。因此當我想在行尾新增字元的時候,它總是新增在行首且會覆蓋掉原來行首的字元。

要把檔案轉換一下,有兩種方法:

1.命令dos2unix test.file

2.去掉"\r" ,用命令sed -i 's/\r//' test.file

好了,這樣處理完,就OK啦!!!