1. 程式人生 > >【R語言】R讀取含中文excel檔案,read.xlsx亂碼問題

【R語言】R讀取含中文excel檔案,read.xlsx亂碼問題

最近在做一個汽車銷售量的分析,在匯入xlsx檔案的時候總是出現亂碼,因為本來就在excel裡做了部分的資料清洗和整理,所以資料其實已經挺乾淨的,但就是會出現亂碼
這是原始的資料表:
原始資料表

匯入的時候使用xlsx.read
錯誤1:沒有插入Encoding引數

檔案中含有中文,但使用xlsx.read時不插入Encoding=UTF-8,會導致亂碼

R語言encoding

錯誤2:檔案不是UTF-8的編碼

檔案的編碼和encoding應該一致

R語言encoding

更改excel檔案的編碼:
更改Excel檔案編碼

錯誤3:表格名為中文名

更改了錯誤1、2後,發現表格名也會影響
R語言read.xlsx亂碼

錯誤4:表格裡面含有表格格式
在一開始的表當中,因為在Excel檔案中為了好看,套用了表格格式
原始資料表


刪除所有的格式只剩下值以後:
無格式原始資料表

再一次使用read.xlsx()
正確匯入excel檔案

沒有亂碼了…
總結一下,用R語言的xlsx包裡面的read.xlsx( )匯入含有中文的excel檔案時,會因為以下問題出現亂碼:
1.沒有插入encoding的正確引數(一般為UTF-8)
2.檔案的編碼方式應該與encoding一致(因為Excel一般預設GB2312)
3.excel檔案含有中文名
4.excel檔案中含有表格格式