1. 程式人生 > >漢字編碼標準GBK、GB2312和GB18030

漢字編碼標準GBK、GB2312和GB18030

GBK是一個漢字編碼標準,全稱《漢字內碼擴充套件規範》,於1995 年制定。GB2312是1980年國家制定的漢字內碼規範。

GBK標準中收錄了2萬多漢字及符號,因其最早被WINDOWS採用,所以其應用範圍非常廣。GB2312中收錄了6千多漢字及符號,通常所說的一、二級漢字型檔就全部包含在GB2312中。

雖然GB2312包含了絕大部分的常用簡體漢字,但是由於中文的複雜性,所以GB2312目前已經越來越不能適應需要了,特別是因為人名、地名中包含的很多字GB2312中都沒有,如朱鎔基的‘鎔’字,GB2312中就沒有包含,這樣導致很多混亂。

正因為GB2312的這些問題,國家標準化委員會又制定了GB13000,GB13000制定的原則與GB2312不同,GB13000以國際化為目標, 該標準編碼參照了Unicode 2.0 標準編碼,與GB2312完全不相容,因早期的計算機中的漢卡採用了GB2312,無法順利向GB13000過渡,所以GB13000變成了一個紙面上的 標準,無法推廣。

有了以上經驗,國家標準化委員會制定了GBK標準,他相容GB2312標準,同時在GB2312標準的基礎上擴充套件了GB13000包含的字,但編碼修改 了,該標準一經推出,就被WINDOWS95所採用(另一種說法是微軟協助制定了此標準,這也可以印證為什麼GBK標準一直沒有出現在官方的標準目錄 中)。因有微軟的支援,該標準迅速得到廣泛的應用。

GBK之後又有GB18030標準,因GB18030較GBK又多了幾千漢字,碼位不足,GB18030使用了2byte與4byte混合編碼方式,這又給軟體增加了難題,所以雖然GB18030推出了近5年,仍然沒有得到廣泛應用。