1. 程式人生 > >java判斷檔案編碼格式

java判斷檔案編碼格式

 按照給定的字符集儲存檔案時,在檔案的最開頭的三個位元組中就有可能儲存著編碼資訊,所以,基本的原理就是隻要讀出檔案前三個位元組,判定這些位元組的值,就可以得知其編碼的格式。其實,如果專案執行的平臺就是中文作業系統,如果這些文字檔案在專案內產生,即開發人員可以控制文字的編碼格式,只要判定兩種常見的編碼就可以了:GBK和UTF-8。由於中文Windows預設的編碼是GBK,所以一般只要判定UTF-8編碼格式。