1. 程式人生 > >locale的設定及其LANG、LC_ALL、LANGUAGE環境變數的區別

locale的設定及其LANG、LC_ALL、LANGUAGE環境變數的區別

locale命令

locale這個單詞中文翻譯成地區或者地域,其實這個單詞包含的意義要寬泛很多。Locale是根據計算機使用者所使用的語言,所在國家或者地區,以及當地的文化傳統所定義的一個軟體執行時的語言環境。

[[email protected] ~]$ locale
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=en_US.UTF-8
[

[email protected] ~]$ 

 

locale分類

locale把按照所涉及到的文化傳統的各個方面分成12個大類,這12個大類分別是:

1、語言符號及其分類(LC_CTYPE) 
2、數字(LC_NUMERIC) 
3、比較和排序習慣(LC_COLLATE) 
4、時間顯示格式(LC_TIME) 
5、貨幣單位(LC_MONETARY) 
6、資訊主要是提示資訊,錯誤資訊,狀態資訊,標題,標籤,按鈕和選單等(LC_MESSAGES) 
7、姓名書寫方式(LC_NAME) 
8、地址書寫方式(LC_ADDRESS) 
9、電話號碼書寫方式(LC_TELEPHONE) 
10、度量衡表達方式 (LC_MEASUREMENT) 
11、預設紙張尺寸大小(LC_PAPER) 
12、對locale自身包含資訊的概述(LC_IDENTIFICATION)。

所以說,locale就是某一個地域內的人們的語言習慣和文化傳統和生活習慣。


 

字符集


上面我們說到了zh_CN.GB18030的前半部分,後半部分是什麼呢?大部分Linux使用者都知道是系統採用的字符集。

zh_CN.GB2312到底是在說什麼? Locale是軟體在執行時的語言環境, 它包括語言(Language), 地域 (Territory) 和字符集(Codeset)。一個locale的書寫格式為: 語言[_地域[.字符集]]。所以說呢,locale總是和一定的字符集相聯絡的。下面舉幾個例子:

1、我說中文,身處中華人民共和國,使用國標2312字符集來表達字元。zh_CN.GB2312=中文_中華人民共和國+國標2312字符集。 

2、我說中文,身處中華人民共和國,使用國標18030字符集來表達字元。zh_CN.GB18030=中文_中華人民共和國+國標18030字符集。 

3、我說中文,身處中華人民共和國臺灣省,使用國標Big5字符集來表達字元。zh_TW.BIG5=中文_臺灣.大五碼字符集 

4、我說英文,身處大不列顛,使用ISO-8859-1字符集來表達字元。 en_GB.ISO-8859-1=英文_大不列顛.ISO-8859-1字符集 

5、我說德語,身處德國,使用UTF-8字符集,習慣了歐洲風格。

[email protected]=德語_德國.UTF-8字符集@按照歐洲習慣加以修正,注意不是[email protected]-8,所以完全的locale表達方式是 [語言[_地域][.字符集] [@修正值]。 

其中,與中文輸入關係最密切的就是LC_CTYPE,LC_CTYPE規定了系統內有效的字元以及這些字元的分類,諸如什麼是大寫字母,小寫字母,大小寫轉換,標點符號、可列印字元和其他的字元屬性等方面。而locale定 義zh_CN中最最重要的一項就是定義了漢字(Class“hanzi”)這一個大類,當然也是用Unicode描述的,這就讓中文字元在Linux系統中成為合法的有效字元,而且不論它們是用什麼字符集編碼的。
 

怎樣設定locale


設定locale就是設定12大類的locale分類屬性,即12個LC_*。除了這12個變數可以設定以外,為了簡便起見,還有兩個變數:LC_ALL和LANG。它們之間有一個優先順序的關係:LC_ALL > LC_* >LANG可以這麼說,LC_ALL是最上級設定或者強制設定,而LANG是預設設定值。

1、如果你設定了LC_ALL=zh_CN.UTF-8,那麼不管LC_*和LANG設定成什麼值,它們都會被強制服從LC_ALL的設定,成為 zh_CN.UTF-8。

2、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_*=en_US.UTF-8,並且沒有設定LC_ALL的話,那麼系統的locale設定以LC_*=en_US.UTF-8。

3、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_*,和LC_ALL均未設定的話,系統會將LC_*設定成預設值,也就是LANG的值zh_CN.UTF-8。

4、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_CTYPE=en_US.UTF-8,其他的LC_*,和LC_ALL均未設定的話,那麼系統的locale設定將是:LC_CTYPE=en_US.UTF-8,其餘的 LC_COLLATE,LC_MESSAGES等等均會採用預設值,也就是 LANG的值,也就是LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=zh_CN.UTF-8。

所以,locale是這樣設定的: 

1、如果你需要一個純中文的系統的話,設定LC_ALL= zh_CN.XXXX,或者LANG=zh_CN.XXXX都可以,當然你可以兩個都設定,但正如上面所講,LC_ALL的值將覆蓋所有其他的locale設定,不要作無用功。

2、如果你只想要一個可以輸入中文的環境,而保持選單、標題,系統資訊等等為英文介面,那麼只需要設定 LC_CTYPE=zh_CN.XXXX,LANG=en_US.XXXX就可以了。這樣LC_CTYPE=zh_CN.XXXX,而LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=en_US.XXXX。

3、假如你高興的話,可以把12個LC_*一一設定成你需要的值,打造一個古靈精怪的系統: LC_CTYPE=zh_CN.GBK/GBK(使用中文編碼內碼GBK字符集); LC_NUMERIC=en_GB.ISO-8859-1(使用大不列顛的數字系統) [email protected](德國的度量衡使用ISO-8859-15字符集) 羅馬的地址書寫方式,美國的紙張設定……。估計沒人這麼幹吧。

4、假如你什麼也不做的話,也就是LC_ALL,LANG和LC_*均不指定特定值的話,系統將採用POSIX作為lcoale,也就是C locale。

 

Local設定的命令

    顯示已安裝locale:
    locale -a
    編譯locale檔案:
    localedef -c -f UTF-8 -i zh_CN zh_CN.utf8 
    設定編碼:

    export LC_ALL=zh_CN.utf8 

  執行localedef --help能檢視當前編碼檔案所在的路徑。如果要永久更改編碼,執行:

  echo "export LC_ALL=zh_CN.utf8" >> /etc/profile 

系統預設locale

"C"是系統預設的locale,"POSIX"是"C"的別名。所以當我們新安裝完一個系統時,預設的locale就是C或POSIX。

"POSIX" :Specifies the minimal environmentfor C-language translation called the POSIX locale.If setlocale() is not invoked, the POSIXlocale is the default

"C"  Equivalentto "POSIX".

LANG和LANGUAGE的區別


LANG - Specifies the default locale for all unset locale variables
LANGUAGE - Most programs use this for the language of its interface
LANGUAGE是設定應用程式的介面語言。而LANG是優先順序很低的一個變數,它指定所有與locale有關的變數的預設值

 

[Visual Studio C++] [函式] setlocale()函式使用講解

Setlocale()是一個計算機函式,功能是用來配置地域的資訊,設定當前程式使用的本地化資訊。

setlocale()函式 
設定或讀取地域化資訊。

函式使用     

 ①.原型:

char *setlocale(int category, const char *locale) ;

 ②.引數:

category  這是一個已命名的常量,指定了受區域設定影響的函式類別。

LC_ALL  包括下面的所有選項。

LC_COLLATE  字串比較。參見 strcoll()。

LC_CTYPE  字元分類和轉換。例如 strtoupper()。

LC_MONETARY  貨幣格式,針對 localeconv()。

LC_NUMERIC  小數點分隔符,針對 localeconv()。

LC_TIME  日期和時間格式,針對 strftime()。

LC_MESSAGES  系統響應。

locale  如果 locale 是 NULL 或空字串 "",則區域名稱將根據環境變數值來設定,其名稱與上述的類別名稱相同。

 ③.返回值:

如果成功呼叫 setlocale(),則返回一個對應於區域設定的不透明的字串。如果請求無效,則返回值是 NULL。

④.例項:

#include <locale.h>

#include <stdio.h>

#include <time.h>

int main ()

{

   time_t currtime;

   struct tm *timer;

   char buffer[100];

   time( &currtime );

   timer = localtime( &currtime );

   printf("Locale is: %s\n", setlocale(LC_ALL, "en_GB"));

   strftime(buffer,100,"%c", timer );

   printf("Date is: %s\n", buffer);

   printf("Locale is: %s\n", setlocale(LC_ALL, "de_DE"));

   strftime(buffer,100,"%c", timer );

   printf("Date is: %s\n", buffer);

   return(0);

}