1. 程式人生 > >Java中char是unicode 佔幾個位元組呢?

Java中char是unicode 佔幾個位元組呢?

1:“位元組”是byte,“位”是bit ;

  2: 1 byte = 8 bit ;

  char 在java中是2個位元組。java採用unicode,2個位元組(16位)來表示一個字元。

例子程式碼如下:

[java] view plaincopyprint?
  1. publicclass Test {  
  2. publicstaticvoid main(String[] args) {  
  3.         String str= "中";  
  4. char x ='中';  
  5. byte[] bytes=null;  
  6. byte[] bytes1=null;  
  7. try {  
  8.             bytes = str.getBytes("utf-8"
    );  
  9.             bytes1 = charToByte(x);  
  10.         } catch (UnsupportedEncodingException e) {  
  11. // TODO Auto-generated catch block
  12.             e.printStackTrace();  
  13.         }  
  14.         System.out.println("bytes 大小:"+bytes.length);  
  15.         System.out.println("bytes1大小:"+bytes1.length);  
  16.     }  
  17. publicstatic
    byte[] charToByte(char c) {   
  18. byte[] b = newbyte[2];   
  19.         b[0] = (byte) ((c & 0xFF00) >> 8);   
  20.         b[1] = (byte) (c & 0xFF);   
  21. return b;   
  22.     }  
  23. }  


執行結果:

bytes 大小:3
bytes1大小:2

java是用unicode來表示字元,"中"這個中文字元的unicode就是2個位元組。

 String.getBytes(encoding)方法是獲取指定編碼的byte陣列表示,

通常gbk/gb2312是2個位元組,utf-8是3個位元組

如果不指定encoding則取系統預設的encoding。