1. 程式人生 > >Linux中通過locale來設定字符集

Linux中通過locale來設定字符集

/********************************************************************************************************************

轉載原因:在學習shell指令碼時,用[a-z]和[A-Z]來判斷大小寫時,結果會不對,原來是可能是Linux發行版中的字符集排列的問題。用到了:LC_COLLATE。

*********************************************************************************************************************/

在Linux中通過locale來設定程式執行的不同語言環境,locale由ANSI C提供支援。locale的命名規則為<語言>_<地區>.<字符集編碼>,如zh_CN.UTF-8,zh代表中文,CN代表大陸地區,UTF-8表示字符集。在locale環境中,有一組變數,代表國際化環境中的不同設定:

1.    LC_COLLATE
定義該環境的排序和比較規則

2.    LC_CTYPE
用於字元分類和字串處理,控制所有字元的處理方式,包括字元編碼,字元是單位元組還是多位元組,如何列印等。是最重要的一個環境變數。

3.    LC_MONETARY
貨幣格式

4.    LC_NUMERIC
非貨幣的數字顯示格式

5.    LC_TIME
時間和日期格式

6.    LC_MESSAGES
提示資訊的語言。另外還有一個LANGUAGE引數,它與LC_MESSAGES相似,但如果該引數一旦設定,則LC_MESSAGES引數就會失效。LANGUAGE引數可同時設定多種語言資訊,如LANGUANE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"。

7.    LANG
LC_*的預設值,是最低級別的設定,如果LC_*沒有設定,則使用該值。類似於 LC_ALL。

8.    LC_ALL
它是一個巨集,如果該值設定了,則該值會覆蓋所有LC_*的設定值。注意,LANG的值不受該巨集影響。

一個例子:

設定前,使用預設locale:
debian:~# locale
LANG="POSIX"
LC_CTYPE="POSIX"
LC_NUMERIC="POSIX"
LC_TIME="POSIX"
LC_COLLATE="POSIX"
LC_MONETARY="POSIX"
LC_MESSAGES="POSIX"
LC_PAPER="POSIX"
LC_NAME="POSIX"
LC_ADDRESS="POSIX"
LC_TELEPHONE="POSIX"
LC_MEASUREMENT="POSIX"
LC_IDENTIFICATION="POSIX"
LC_ALL= 
設定後,使用zh_CN.GDK中文locale:
debian:~# export LC_ALL=zh_CN.GBK
debian:~# locale
LANG=zh_CN.UTF-8
LC_CTYPE="zh_CN.GBK"
LC_NUMERIC="zh_CN.GBK"
LC_TIME="zh_CN.GBK"
LC_COLLATE="zh_CN.GBK"
LC_MONETARY="zh_CN.GBK"
LC_MESSAGES="zh_CN.GBK"
LC_PAPER="zh_CN.GBK"
LC_NAME="zh_CN.GBK"
LC_ADDRESS="zh_CN.GBK"
LC_TELEPHONE="zh_CN.GBK"
LC_MEASUREMENT="zh_CN.GBK"
LC_IDENTIFICATION="zh_CN.GBK"
LC_ALL=zh_CN.GBK

"C"是系統預設的locale,"POSIX"是"C"的別名。所以當我們新安裝完一個系統時,預設的locale就是C或POSIX。

在Debian中安裝locales的方法如下:

· 通過apt-get install locales命令安裝locales包
· 安裝完成locales包後,系統會自動進行locale配置,你只要選擇所需的locale,可以多選。最後指定一個系統預設的locale。這樣系統就會幫你自動生成相應的locale和配置好系統的locale。

· 增加新的locale也很簡單,用dpkp-reconfigure locales重新配置locale即可。

· 我們也可手動增加locale,只要把新的locale增加到/etc/locale.gen檔案中,再執行locale-gen命令即可生成新的locale。再通過設定上面介紹的LC_*變數就可設定系統的locale了。下是一個locale.gen檔案的樣例。

· # This file lists locales that you wish to have built. You can find a list
· # of valid supported locales at /usr/share/i18n/SUPPORTED. Other
· # combinations are possible, but may not be well tested. If you change
· # this file, you need to rerun locale-gen.
· #
·zh_CN.GBK GBK
·zh_CN.UTF-8 UTF-8