UnicodeDecodeError- 'utf-8' codec can't decode byte 0xc4 in position 0- invalid continuation byte的解決
在用pandas讀入csv文件是,因為文件中有中文所以會出現讀取不了的錯誤。錯誤的原因是'utf-8'編解碼器無法解碼0位的位元組0xc4
解決方案:
在讀入檔案後面加encoding=’gbk’,
如:pddata=pd.read_csv('felipus.csv',encoding='gbk')
有興趣的繼續看原因!
眾所周知,我們用python預設的是utf-8編碼。關於編碼方式的介紹,我推薦看一下廖大的python教程——“字串和編碼”。既然utf-8格式不能正確的讀取帶中文的csv檔案,那麼我們就選取一個可以讀取中文字元的格式不就好了嗎。
那麼什麼格式可以讀取中文字元呢?我們開啟Python3官方網站: 找到關於標準字元的部分。如下圖:
那麼到底要改成什麼格式呢?可以看到表格第三列Language表示的是此種編碼支援什麼語言。那麼我們找找看。
!
表格就不在這裡展示給大家看了,有興趣的自己去網站上看吧。反正在我仔細的尋找下一共有big5;big5hkscs;gb2312;gbk;gb18030;hz;iso2022_jp_2
這5種格式可能支援中文。經過我的測試,發現gb2312;gbk;gb18030
這3種格式可以順利的讀取帶中文的csv檔案。(既然3種都可以,那麼我們就記個好記的’gbk’吧)
It works!
相關推薦
UnicodeDecodeError- 39;utf-839; codec can39;t decode byte 0xc4 in position 0- invalid continuation byte的解決
在用pandas讀入csv文件是,因為文件中有中文所以會出現讀取不了的錯誤。錯誤的原因是'utf-8'編解碼器無法解碼0位的位元組0xc4 解決方案: 在讀入檔案後面加encoding=’gbk’, 如:pddata=pd.read_csv('felipus.cs
UnicodeDecodeError: 39;utf-839; codec can39;t decode byte 0xd0 in position 0: invalid continuation byte
原因 osi png utf ati src 另存為 ima inf 用pandas打開csv文件可能會出現這種情況,原因可能是excel自己新建一個*.csv文件時候容易出錯。進入文件另存為,然後選擇csv文件即可。UnicodeDecodeError: 'ut
UnicodeDecodeError: 39;utf-839; codec can39;t decode byte 0xc3 in position 0: invalid continuation byte
__main__ 需求 tts auto att inf 登錄 == not 需求:python如何實現普通用戶登錄服務器後切換到root用戶再執行命令 解決參考: 代碼: def verification_ssh(host,username,password,port
TensorFlow學習筆記(UTF-8 問題解決 UnicodeDecodeError: 39;utf-839; codec can39;t decode byte 0xff in position 0: invalid start byte)
show 學習 github red star ims fas can pri 我使用VS2013 Python3.5 TensorFlow 1.3 的開發環境 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte
UnicodeDecodeError: 39;utf839; codec can39;t decode byte 0xb1 in position 0: invalid start byte[TOC]解決辦法
@UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xb1 in position 0: invalid start byte[TOC]解決辦法 老師發給我們的檔案是在Linux系統下生成的,而我們用它是在Windows下, 兩種方法解
UnicodeDecodeError: 39;utf839; codec can39;t decode byte 0x81 in position 0: invalid start byte
原始碼: mes['value'][1] = win10-32 data = "reboot+" + mes['value'][1] g_conn_pool[key].send('%c%c%s' % (0x81, len(mes['value'][1]), mes['value'][1])) #將資訊d
解決UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte問題
本文最後更新於2018-6-20,可能會因為沒有更新而失效。如已失效或需要修正,請聯絡我! 早上在用Flask框架時出現了這個問題,我在原始碼裡寫的是 @app.route('/hello') def hello(): return render_te
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte解決方法
最近在學機器學習,看《機器學習實戰》,因為書上的程式碼是在Python2下編寫的,所以轉到Python3會有許多問題需要修改。 第3章決策樹有一個函式如下: def grabTree(filename): import pickle fr = open(f
'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
‘utf-8’ codec can’t decode byte 0xff in position 0: invalid start byte 覺得有用的話,歡迎一起討論相互學習~Follow Me 今天使用語句 image_raw_data_jpg
【Python】讀取cvs文件報錯:UnicodeDecodeError: 39;utf-839; codec can39;t decode byte 0xb1 in position 6: invalid start byte
spl 重慶 http posit nbsp div ack lin pan 現在有文件data.csv 文件編碼格式為:ANSI data.csv 1|1|1|北京市 2|1|2|天津市 3|1|3|上海市 4|1|4|重慶市 5|1|5|石家莊市 6|
UnicodeDecodeError: 39;utf-839; codec can39;t decode byte 0xb9 in position 16: invalid start byte
nbsp 打開 invalid read osi erro class IT art 讀取一個csv文件失敗,提示: UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb9 in position 16: inv
編碼錯誤UnicodeDecodeError at / 39;utf-839; codec can39;t decode byte 0xb1 in position 30: invalid start byte
類似這種UnicodeDecodeError at / 'utf-8' codec can't decode byte 0xb1 in position 30: invalid start byte編碼錯誤,分析解決方案如下: 1、檢視控制檯報錯,找出引發錯誤的檔案,任何程式設計師自己編寫的檔案都
python 讀取資料出現UnicodeDecodeError:: 39;utf-839; codec can39;t decode byte 0xc8 in position 0: invalid contin
之前寫程式時也出現過類似錯誤,每次解決了到第二次遇見又忘了具體方法,這次記錄一下。 一、字元編碼問題 先介紹一下字元編碼問題 1.ASCLL與GB2312 由於計算機是美國人發明的,因此,最早只有127個字元被編碼到計算機裡,也就是大小寫英文字母、數字和一些符號,這個編碼表被稱為
Python3解決UnicodeDecodeError:39;utf-839; codec can39;t decode byte 0x8b in position 1: invalid start byte
有兩種辦法: 這個時候可以選擇修改字符集引數,一般這種情況出現得較多是在國標碼(GBK)和utf8之間選擇出現了問題。 出現異常報錯是由於設定了decode()方法的第二個引數errors為嚴格(strict)形式造成的,因為預設就是這個引數,將其更改為ignore等即可。例如:
python 讀取資料出現UnicodeDecodeError:: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid contin
之前寫程式時也出現過類似錯誤,每次解決了到第二次遇見又忘了具體方法,這次記錄一下。 一、字元編碼問題 先介紹一下字元編碼問題 1.ASCLL與GB2312 由於計算機是美國人發明的,因此,最早只有127個字元被編碼到計算機裡,也就是大小寫英文字母、數字和一些符號,這個
【轉】UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 1: invalid continuation 漢字編碼
如果在python 3裡面碰到下面的Error message: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 1: invalid continuation byte。 你很可
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc4 in position 0: i報錯問題
在網上搜了很多人的處理方法是在程式的頂部加 import sys reload( sys ) sys.setdefaultencoding('gbk') 可是我自己試一了,程式錯是不報了,但是實際沒有執行 最後,我在程度的頂部加了下面兩行就好了,中文也可以正常顯示了
python 編碼問題 UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xb4 in position 0: invalid start byt
心好累呀,作為一個菜鳥,進了銀行實習,銀行還沒有網路,不能查詢,只能靠自己的流量;而且銀行也不能將檔案輸入輸出,造成了我更加懵逼的狀態。腳還扭傷了,兩週沒有去,進度更不上。 windows配spark的環境老不行,問題也不能解決。等會把問題抄一下吧 先把編碼的問題寫上來
mysql-connector-python取二進位制位元組時報錯UnicodeDecodeError:39;utf-839; codec can39;t decode byte 0xb0 in position 0
在儲存使用者密碼時,我使用了hmac演算法對使用者密碼加密,加密出來的hash值是一個二進位制位元組串,我把這個位元組串存到mysql的password欄位,password欄位的資料型別是varbinary。 在驗證使用者密碼時,我把使用者輸入的密碼經過同樣的hmac演算法得到hash值,然後從資
【轉載】讀取txt檔案報錯:UnicodeDecodeError: 39;utf-839; codec can39;t decode byte 0xc8 in position 0
python在open讀取txt檔案時,出現UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc8 in position 0: invalid continuation byte報錯 解決辦法有二: ①把編碼方式utf-8