1. 程式人生 > >pandas讀取csv處理時報錯:ParserError: Error tokenizing data. C error: Expected 1 fields in line 29, saw 2

pandas讀取csv處理時報錯:ParserError: Error tokenizing data. C error: Expected 1 fields in line 29, saw 2

csv檔案預設的是以逗號為分隔符,但是中文中逗號的使用率很高,爬取中文資料時就容易造成混淆,所以使用pandas寫入csv時可以設定引數 sep=’\t’ ,即以tab為分隔符寫入。畢竟tab在中文習慣裡用的很少嘛。
那這樣在後面讀取csv進行資料處理時,一定記得加上一個引數delimiter:

delimiter="\t"
#這樣讀入:
df=pd.read_csv('path',delimiter="\t")

不然你把dataframe打印出來看看就是擠在一團,沒有分列的,後面對csv進行處理的時候還可能會出現標題那樣的錯誤

ParserError: Error tokenizing data. C error
: Expected 1 fields in line 29, saw 2