1. 程式人生 > >ubuntu中文亂碼--新增中文字符集

ubuntu中文亂碼--新增中文字符集

在Ubuntu支援中文後(方法見上篇文章),預設是UTF-8編碼,而Windows中文版預設是GBK編碼。為了一致性,通常要把Ubuntu的預設 編碼改為GBK。當然你也可以不改,但這會導致我們在兩個系統之間共享檔案變得非常不方便,Samba共享的檔案也總會有亂碼出現。總不能每次傳完檔案都 人肉轉碼一次吧。

ubuntu轉碼需要分為幾個部分分別進行:

1. 系統級

Ubuntu預設是不支援GBK的。這裡若不更改,則後續步驟均無法生效。

新增中文字元編碼:

  1. $sudo vim /var/lib/locales/supported.d/local  

#新增下面的中文字符集

  1. zh_CN.GBK GBK  
  2. zh_CN.GB2312 GB2312  
  3. zh_CN.GB18030 GB18030  

使其生效:

  1. $sudo dpkg-reconfigure locales  

2. vim

雖然Ubuntu已經支援GBK了,但預設的輸入/顯示方式仍然是UTF-8,要想改變就需要我們逐一去設定。VIM首當其衝。 開啟vim的配置檔案,位置在/etc/vim/vimrc 在其中加入

  1. set fileencodings=utf-8,gb2312,gbk,gb18030  
  2. set termencoding=utf-8  
  3. set encoding=gbk

儲存退出

  1. source /etc/vim/vimrc  

此時vim就能正確顯示中文了。 --------------------------------------------------------------'

3. 讓Terminal預設GBK

雖然VIM已經能夠編寫/開啟GBK檔案,但cat <filename>時我們發現仍然是亂碼。此時我們需要更改Terminal的預設編碼方式。

在terminal面板上選擇選單欄中的termianl-->set character encoding-->add or remove,然後在左側選擇GB2312或GBK,新增到右側,關閉。

然後在terminal面板上的 termianl-->set character encoding選定增加的中文編碼,然後就可以正常顯示中文了。4. pdf

  1. $sudo apt-get install xpdf-chinese-simplifiedxpdf-chinese-traditional #安裝pdf的中文字型  
  1. $sudo apt-get install poppler-data #安裝解決pdf中文顯示亂碼的軟體  
  2. $cd /etc/fonts/conf.d   
  3. $sudo cp 49-sansserif.conf 49-sansserif.conf_backup #先備份下  
  4. $sudo rm 49-sansserif.conf #刪除  

在開啟pdf檔案,就能呢個正常顯示中文了5. gedit 預設配置下,用 Ubuntu 的文字編輯器(gedit)開啟 GB18030/GBK/GB2312 等型別的中文編碼文字檔案時,將會出現亂碼。 出現這種情況的原因是,gedit 使用一個編碼匹配列表,只有在這個列表中的編碼才會進行匹配,不在這個列表中的編碼將顯示為亂碼。您要做的就是將 GB18030 加入這個匹配列表。 命令列方式,適用於所有 Ubuntu 使用者。 複製以下命令到終端中,然後回車即可: gconftool-2 --set --type=list --list-type=string /apps/gedit-2/preferences/encodings/auto_detected "[UTF-8,CURRENT,GB18030,BIG5-HKSCS,UTF-16]" 圖形化方式,適用於 Ubuntu 使用者,而不適用於 KUbuntu/XUbuntu 使用者。 您可以遵循以下步驟,使您的 gedit 正確顯示中文編碼檔案。 按下 Alt-F2,開啟“執行應用程式”對話方塊。 在文字框中鍵入“gconf-editor”,並按下回車鍵,開啟“配置編輯器”。 展開左邊的樹節點,找到 /apps/gedit-2/preferences/encodings 節點並單擊它。 雙擊右邊的 auto_detected 鍵,開啟“編輯鍵”對話方塊。 單擊列表右邊的“新增”按鈕,輸入“GB18030”,單擊確定按鈕。 列表的最底部新增加了一個“GB18030”。單擊選中它,並單擊右邊的 “向上” 按鈕直到 “GB18030” 位於列表的頂部為止。 單擊確定按鈕,關閉配置編輯器。 gedit3.x版本設定 終端輸入dconf-editor 展開org/gnome/gedit/preferences/encodings auto-detected的value中加入’GB18030′,加在uft8後面; show-in-menu的value中加入’GB18030′ 現在,您的 gedit 應該能夠順利開啟 GB18030 編碼的文字檔案了。 gedit 3.X版本命令設定:gsettings set org.gnome.gedit.preferences.encodings auto-detected "['UTF-8','GB18030','GB2312','GBK','BIG5','CURRENT','UTF-16']"

6. 中文檔名亂碼轉換

因為以前使用zh_CN.GB* 現在使用zh_CN.UTF-8,所以檔名編碼有問題。 convmv -f gbk -t utf-8 -r --notest /filePath

參考: