Python用Scrapy爬蟲報錯UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' ，解決方案

阿新 • • 發佈：2018-11-03

錯誤：UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position 7: illegal multibyte sequence
解決：import io
     import sys
     sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030')

從網上抓取網站寫下面這段程式碼時，發現報UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX 錯誤

from urllib import request
req=request.Request("https://www.baidu.com")
req.add_header("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:51.0) Gecko/20100101 Firefox/51.0")
resp=request.urlopen(req)
print(resp.read().decode('utf-8'))

查了一下發現瞭解決辦法原來是print()函式自身有限制，不能完全列印所有的unicode字元。

其實print()函式的侷限就是

Python預設編碼的侷限，因為系統是win7的，python的預設編碼不是'utf-8',改一下python的預設編碼成'utf-8'就行了

import io  
import sys 
from urllib import request
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') #改變標準輸出的預設編碼
req=request.Request("https://www.baidu.com")
req.add_header("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:51.0) Gecko/20100101 Firefox/51.0")
resp=request.urlopen(req)
print(resp.read().decode('utf-8'))

雖然可以解決了報錯，但發現中文亂碼，原來是cmd編碼的不相容utf-8，若要解決這問題，改一下python的預設編碼成'gb18030'就行了

sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030')         #改變標準輸出的預設編碼

轉載自：https://blog.csdn.net/qq_28359387/article/details/54974578

Python用Scrapy爬蟲報錯UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' ，解決方案

錯誤：UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position 7: illegal multibyte sequence 解決：import io import sys sys.st

python 網絡爬蟲報錯“UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position”解決方案

accept wid python3 header style 設置方法能夠 error: posit Python3.x爬蟲，發現報錯“UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x8b in positi

[python基礎] csv.wirterow()報錯UnicodeEncodeError

div 這樣的編碼 pen result 解決 write 格式數據 python在安裝時，默認的編碼是ascii，當程序中出現非ascii編碼時，python的處理常常會報這樣的錯，python沒辦法處理非ascii編碼的，此時需要自己設置將python的默認編碼，一

python setup.py install 報錯：error: [WinError 3] 系統找不到指定的路徑。: 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\PlatformSDK\\lib

Outline 在通過 setup.py 安裝python模組時，遇到了以下報錯： # 執行 python setup.py install # 報錯： error: [WinError 3] 系統找不到指定的路徑。: 'C:\\Program Files (x86)\\Microsof

scrapy爬蟲報錯“Temporaty failure in name resolution”

原因不明，根據一個帖子，進行了如下修改後，仍未解決該問題： $ vim /etc/resolv.conf然後修改檔案中的nameserver 該方法無效。後連線vpn後再次執行該爬蟲，就不報這個錯誤了。而是報錯： $ apt-get update $

【Python學習】爬蟲報錯處理bs4.FeatureNotFound

rom 學習 uninstall 報錯卸載 install har ren 這樣的【BUG回顧】在學習Python爬蟲時，運Pycharm中的文件出現了這樣的報錯： bs4.FeatureNotFound: Couldn’t find a tree b

windows下python 安裝igraph庫報錯 Cannot find the C core of igraph on this system using pkg-config.的解決

筆者在執行網上給的機器學習程式碼的時候，發現Anaconda 2.5.0 (64-bit)並沒有提供該庫，後來我在github上找到了官方的igraph，結果安裝的時候出現如下錯誤：缺少c模組經過長時間的摸索，沒有找到c模組對應的處理辦法。但是從stacko

python 鏈接codis 報錯解決辦法 command 'EXEC' is not allowed

command 'exec' is not allowed python redis codis [[email protected]/* */ ceph]# python ../pkg/redisbase.py Traceback (most recent cal

python報錯問題解決：'ascii' codec can't encode character

odi char 格式中修改 asc 編碼出現 imp ges python在安裝時，默認的編碼是ascii，當程序中出現非ascii編碼時，python的處理常常會報這樣的錯，python沒辦法處理非ascii編碼的，此時需要自己設置將python的默認編碼，一般設置

Django：創建用戶模型報錯: (admin.E108) The value of 'list_display[4]'解決方案

png str 行數 div bool 解析創建 delet sts 參考資料：蟲師-《web接口開發與自動化測試：基於python語言》日常學習Django框架中，創建了用戶模型，但是頁面功能驗證時候，提示不能進行列表字段操作，debug好久，才找到問題原因，心累。。

Python import matplotlb.pyplot報錯：ImportError: No module named '_tkinter', please install the python3

Python import matplotlb.pyplot報錯：ImportError: No module named ‘_tkinter’, please install the python3 本文記錄了博主在遇到這個大坑以後重新登入Python中遇到的import matp

如何解決在Python中使用Win32api報錯的問題 ModuleNotFoundError: No module named 'win32api'

如何解決在Python中使用Win32api報錯的問題 ModuleNotFoundError: No module named 'win32api' 解決方法 pip install pypiwin32或pip3 install pypiwin32 或 python -

python報錯：'ascii' codec can't encode character u'\xed' in position 8: ordinal not in range(128)

這類問題是因為要處理的內容中含有非英文的字元，可能是漢字也可能是一些其他特殊字元。例如：我今天遇到的“CONNECTOR❤️️”這個“❤️”圖案作為輸入輸出的一部分，輸出可以正常輸出，但是寫入到txt檔案，就會出現標題中的錯誤。檢視網上的一些說法，很多是說寫這樣幾行命令：

python 3.X系列報錯：No module named 'urllib2'

查閱Python官方文件裡面已有說明： Note The urllib2 module has been split across several modules in Python 3.0 named urllib.request and urllib.error. The

jupyter notebook下.ipynb格式執行SSD程式碼正常，但是轉換為.py格式在終端用python 指令執行就報錯，請問這是為什麼？

nvidia-smi檢視自己的gpu資訊 export CUDA_VISIBLE_DEVICES=''　在終端python 之前輸入，勉強能用，ssd速度為４fps太慢解決方法一：一些部落格（https://blog.csdn.net/zjc910997316/article/

Python嗶哩嗶哩爬蟲報錯403

學校最近給了個爬蟲作業，作業要求用Python寫，按照了部分文章寫了個B站的爬蟲。但訪問網站獲取視訊時間的時候頁面老是報403(許可權錯誤)。下面是出問題的部分程式碼： import requests response2 = requests.get(apiur

python爬蟲報錯 urlopen error [Errno 10061]

有的說通過關閉IE代理伺服器即可，而我在關閉IE代理伺服器之後執行爬蟲程式仍然報錯誤。解決方法：先開啟IE瀏覽器，發現不能正常上網，所以通過我的上一篇文章的方法：http://blog.csdn.net/hungryfoolisher/article/details/7936

python 寫入檔案時，報錯：UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1806: ille

最近用到python 爬取智聯招聘上的網頁，想把頁面儲存本地： def writeintofile(filename, str): # 開啟檔案 fo = open(filename, 'w') # 寫的方式開啟檔案 prin

【案例】解決：給python安裝選擇器scrapy失敗報錯 C++ is required

參考：Microsoft Visual C++ 14.0 is required|http://blog.csdn.net/hhhhhhhhhhan/article/details/77194149http://blog.csdn.net/nima1994/article/d

osx升級到10.10後，用pod install報錯終於解決的方法

... tar font tails http fat error: hat space 先依照這個文章做：http://blog.csdn.net/dqjyong/article/details/37958067 大概過程例如以下： Open Xcode 6O

Python用Scrapy爬蟲報錯UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' ，解決方案

相關推薦