1. 程式人生 > >python寫入csv、txt檔案編碼問題

python寫入csv、txt檔案編碼問題

最近剛接觸爬蟲,爬蟲很好玩,但是,編碼超煩人!!!

隨便爬個東西,想列印在命令列,就會發現以下問題:

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: illegal multibyte sequence

最終,我選擇了使用 jupyter notebook 來日常測試程式碼,列印什麼字元都沒問題了,但是在 寫入檔案時 又會遇到以上的問題。

在我的不懈努力下,終於找到了解決方法:

使用 codecs 模組

具體使用如下 :

import codecs
f = codecs.open('test.txt'
, 'w', 'utf-8') # test.txt 也可以換成 test.csv

然後再寫入的時候就不會發生錯誤了。