【R語言】R讀取含中文excel檔案,read.xlsx亂碼問題
阿新 • • 發佈:2019-01-09
最近在做一個汽車銷售量的分析,在匯入xlsx檔案的時候總是出現亂碼,因為本來就在excel裡做了部分的資料清洗和整理,所以資料其實已經挺乾淨的,但就是會出現亂碼
這是原始的資料表:
匯入的時候使用xlsx.read
錯誤1:沒有插入Encoding引數
檔案中含有中文,但使用xlsx.read時不插入Encoding=UTF-8,會導致亂碼
錯誤2:檔案不是UTF-8的編碼
檔案的編碼和encoding應該一致
更改excel檔案的編碼:
錯誤3:表格名為中文名
更改了錯誤1、2後,發現表格名也會影響
錯誤4:表格裡面含有表格格式
在一開始的表當中,因為在Excel檔案中為了好看,套用了表格格式
刪除所有的格式只剩下值以後:
再一次使用read.xlsx()
沒有亂碼了…
總結一下,用R語言的xlsx包裡面的read.xlsx( )匯入含有中文的excel檔案時,會因為以下問題出現亂碼:
1.沒有插入encoding的正確引數(一般為UTF-8)
2.檔案的編碼方式應該與encoding一致(因為Excel一般預設GB2312)
3.excel檔案含有中文名
4.excel檔案中含有表格格式