1. 程式人生 > >ubuntu下用vim打開出現中文亂碼

ubuntu下用vim打開出現中文亂碼

開啟終端:

 在檔案末尾新增如下程式碼:

set fileencodings=gb2312,utf-8  
set fileencoding=gb2312  
set termencoding=utf-8  

 儲存後退出,問題解決。

1、支援中文編碼的基礎

Vim要更好地支援中文編碼需要兩個特性:+multi_byte和+iconv,可以用|:version|命令檢查當前使用的Vim是否支援,否則的話需要重新編譯。

2、影響中文編碼的設定項

Vim中有幾個選項會影響對多位元組編碼的支援:

  • encoding(enc):encoding是Vim的內部使用編碼,encoding的設定會影響Vim內部的Buffer、訊息文字等。在 Unix環境下,encoding的預設設定等於locale;Windows環境下會和當前內碼表相同。在中文Windows環境下encoding的 預設設定是cp936(GBK)。
  • fileencodings(fenc):Vim在開啟檔案時會根據fileencodings選項來識別檔案編碼,fileencodings可以同時設定多個編碼,Vim會根據設定的順序來猜測所開啟檔案的編碼。
  • fileencoding(fencs) :Vim在儲存新建檔案時會根據fileencoding的設定編碼來儲存。如果是開啟已有檔案,Vim會根據開啟檔案時所識別的編碼來儲存,除非在儲存時重新設定fileencoding。
  • termencodings(tenc):在終端環境下使用Vim時,通過termencoding項來告訴Vim終端所使用的編碼。

3、Vim中的編碼轉換

Vim內部使用iconv庫進行編碼轉換,如果這幾個選項所設定的編碼不一致,Vim就有可能會轉換編碼。開啟已有檔案時會從檔案編碼轉換到 encoding所設定的編碼;儲存檔案時會從encoding設定的編碼轉換到fileencoding對應的編碼。經常會看到Vim提示[已轉換],這是表明Vim內部作了編碼轉換。終端環境下使用Vim,會從termencoding設定的編碼轉換到encoding設定的編碼。

可以用|:help encoding-values|列出Vim支援的所有編碼。

4、具體應用環境的設定

  • 只編輯GBK編碼的檔案

set fileencodings=cp936
set fileencoding=cp936
set encoding=cp936

  • 只編輯UTF-8編碼的中文檔案

set fileencodings=utf-8
set fileencoding=utf-8
set encoding=cp936 或者 set encoding=utf-8

  • 同時支援GBK和UTF-8編碼

set fileencodings=ucs-bom,utf-8,cp936
set fileencoding=utf-8
set encoding=cp936 或者 set encoding=utf-8

  • 如果在終端環境下使用Vim,需要設定termencoding和終端所使用的編碼一致。例如:

set termencoding=cp936 或者 set termencoding=utf-8

Windows記事本編輯UTF-8編碼檔案時會在檔案頭上加上三個位元組的BOM:EFBBBF。如果fileencodings中設 置ucs-bom的目的就是為了能夠相容用記事本編輯的檔案,不需要的話可以去掉。Vim在儲存UTF-8編碼的檔案時會去掉BOM。去掉BOM的最大好 處是在Unix下能夠使用cat a b>c來正確合併檔案,這點經常被忽略。

5、FAQ

  1. 為什麼在Vim中一次只能刪除半個漢字?

    因為encoding設定錯誤,把encoding設定為cp936就可以解決此問題。在Unix環境下Vim會根據locale來設定預設的encoding,如果沒有正確設定locale並且沒有設定encoding就會一次只能刪除半個漢字。

  2. VIM為什麼不能輸入繁體字?

    把euc-cn或者GB2312改為cp936就可以了。euc-cn是GB2312的別名,不支援繁體漢字。cp936是GBK的別名,是GB2312的超集,可以支援繁體漢字。

  3. VIM為什麼提示不能轉換?

    因為在編譯Vim時沒有加入iconv選項,重新編譯Vim才能解決。

  4. 如何開啟一個GBK編碼的檔案並另存為UTf-8編碼?

    儲存檔案時執行命令|:set fileencoding=utf-8|就可以了。