1. 程式人生 > >windows到Linux文字處理

windows到Linux文字處理

1、去掉^M符號

vi編輯下使用ctrl V + ctrl M打出^M符號,然後替換為空即可。(window下^M\n結尾)

%s/^M//g

2、去掉UTF-8檔案BOM頭

vim下:使用命令

:set nobomb

儲存即可

3、格式轉換,使用iconv工具:

iconv -f GB18030 -t UTF-8  shanghaihua_corpus.trans  -o  shanghaihua_corpus_utf8.trans

4、批量去掉utf8 bom頭

sed -i 's/^\xEF\xBB\xBF//g' *