如何理解字符集和字元編碼
阿新 • • 發佈:2019-02-01
- 概念
- GBK到Utf-8的轉換過程
GBK等都屬於GB碼值的表現形式
Utf-8等都屬於Unicode碼值的表現形式
所以如果GBK要轉變成utf-8,則首先先將GBK對應的GB碼值轉換成Unicode碼值(這可以通過相關演算法和查表來完成),然後將Unicode碼值用utf-8編碼方式將其編碼(最終在記憶體中的表現方式)。
- Java一切基於unicode編碼
GBK等都屬於GB碼值的表現形式
Utf-8等都屬於Unicode碼值的表現形式
所以如果GBK要轉變成utf-8,則首先先將GBK對應的GB碼值轉換成Unicode碼值(這可以通過相關演算法和查表來完成),然後將Unicode碼值用utf-8編碼方式將其編碼(最終在記憶體中的表現方式)。