python讀取txt檔案時的中文亂碼問題

阿新 • • 發佈：2019-01-28

今晚在做

https://github.com/Yixiaohan/show-me-the-code

上的python小練習0011題時，一直出現以下‘utf-8’無法decode的問題：

utf8' codec can't decode byte 0xb1 in position 0: invalid start byte

即使我借鑑

http://stackoverflow.com/questions/12468179/unicodedecodeerror-utf8-codec-cant-decode-byte-0x9c

中errors = ‘replace’的形式，雖然錯誤沒有了，但訓練目標卻也達不到。

摸索了很長世間，最後還是用gb18030編碼解決了問題，只是原因尚不自知，在此附上程式碼，下次若出現類似問題，多用幾種編碼形式試試。

__author__ = 'moon.d.carl'
# -*- coding:'utf-8' -*-
#敏感詞文字檔案 filtered_words.txt，裡面的內容為以下內容，當用戶輸入敏感詞語時，則打印出 Freedom，否則打印出 Human Rights。

import sys

reload(sys)
sys.setdefaultencoding('utf-8')


path = 'E:/python_practise_material/0011.txt'

filtered_words = [words.strip('\n').decode('gb18030') for words in open(path, 'r')]

input_word = raw_input()

print 'Freedom' if unicode(input_word, 'gb18030') in filtered_words else 'Human Rights'

C#讀取txt檔案時中文亂碼

解決辦法使用GB2312中文字符集 StreamReader reader = new StreamReader(txtUrl, Encoding.GetEncoding(“gb2312”)); 或使用utf-8中文字符集 StreamReader r

python讀取txt檔案時的中文亂碼問題

今晚在做 https://github.com/Yixiaohan/show-me-the-code 上的python小練習0011題時，一直出現以下‘utf-8’無法decode的問題： utf8' codec can't decode byte 0xb1 in pos

Python讀取TXT檔案時出現“ufeff“字元

Python讀取TXT檔案時出現“\ufeff“字元文章目錄 Python讀取TXT檔案時出現“\ufeff“字元問題描述：原因：解決方案：

java讀取txt檔案出現中文亂碼

在保證程式碼沒有問題的前提下，讀取txt檔案出現瞭如下亂碼。解決方法： 1.檢視檔案程式碼的編碼方式是否是ANSI（我使用的文字編輯器為EditPlus） 2.檢視.txt檔案的編碼方式是否是ANSI 修改儲存，結果如下這裡附如上讀取txt檔案的程式

輸入輸出流的讀取輸出 .txt 檔案的中文亂碼問題未解決

package interview; import java.io.*; public class TestInOrOutStream { public static void main(String[] args) { int c; try { I

node.js在讀取檔案時中文亂碼問題

斷更很久了........從今天開始會努力的持續更博，積極學習。言歸正傳。今天在寫node.js的demo時發現一個bug。我在node中讀取本地的text檔案時，發現英文的內容可以被讀取，但是中文的就顯示的是亂碼。如下圖產生這種問題的原因是： Windows下預設的編碼格式是AS

輸入輸出流的讀取輸出 .txt 檔案的中文亂碼問題未解決

package interview; public class TestInOrOutStream { public static void main(String[] args) { int c; try { InputSt

以位元組流讀取檔案時中文亂碼解決（二）

在上一節中說明了每次讀取一個位元組時亂碼解決方法，這一節我將闡述每次讀取多個位元組亂碼的解決。問題：中文字元佔2個位元組，非中文佔一個位元組例如："abc中國" 當我們以每四個位元組

第一篇-Win10開啟txt檔案出現中文亂碼

如果剛開始安裝的是英文的Win10系統，那麼開啟txt檔案時很容易出現亂碼問題。包括開啟cmd視窗，也是不能顯示中文的。當然，麻煩的處理方法是：在cmd中想要顯示中文：先輸入chcp 936，之後中文就可以正常顯示。 txt檔案中想能夠看見中文，就在儲存檔案時點選另存為，然後選擇旁邊的編碼為utf-8，

Python讀取txt檔案的三種方式

文字處理是經常碰到的一個問題，Python的文字讀取有三個方法可以呼叫： read() readaline() readlines() 直接看名字就大概能猜出什麼意思。第一個函式就是直接把文字內容全部讀取出來第二個函式是逐行讀取第三個函式是逐行全部讀取

python讀取txt檔案的錯誤 gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence”的解決辦法

眾所周知，python對檔案讀寫不友好在我匯入一個新建utf-8 txt檔案依然報錯之後最終 data11=open("D:/Downloads/盜墓筆記全集.txt").read().en

python讀取txt檔案，將檔案中第一列顯示出來

檔案：程式碼： try: file=open('food.txt',"r") #以讀模式開啟檔案 except FileNotFoundError: #如果檔案不存在，給提示 print("file is not found") else

解決Windows系統下python利用matplotlib繪圖時中文亂碼的問題

不講道理，直接上解決方案第一步：進入windows系統自帶的字型資料夾中，自己電腦能支援的所有字型都在這裡面。進入方法：控制面板-->外觀和個性化-->字型，進入後的介面如下圖所示：第二步：在這個資料夾中找到“

Python讀取txt檔案

按行讀取，把txt檔案轉換成list file_name = 'example.txt' data = [] for line in open(file_name): line = line.split() data.append(line)

python-讀取txt檔案

TXT檔案內容：1.全部讀取程式碼：file = open("E:\others\測試.txt","r")#開啟檔案 f_all = file.read()#讀取所有檔案內容 print(f_all)

python讀取.txt檔案資料和將資料寫入檔案.txt

一.讀取.txt檔案中的資料到張量中說明：將data_x.txt和data_y.txt中的資料分別讀取到x_data張量中 #!/usr/bin/python # coding=utf-8 im

python 讀取txt檔案，將內容寫入excel表格

# -*- coding: UTF-8 -*- import os import time import openpyxl as openpyxl Parser_version = 'version_1.0' print Parser_version items = os.listdir(".")

用python 讀取txt檔案並儲存為array

Reading Text Tables with Python Reading tables is a pretty common thing to do and there are a number of ways to read tables besides writi

python讀取 .txt檔案

1 test_order.txt 檔案內容：atbd12345|apple|5.50|2|1|11.00|tony|beijingatb345|apple|5.50|2|1|11.00|tony|beijingatg12345|apple|5.50|2|1|11.00

FeilUtils---下載檔案時中文亂碼

import java.io.IOException; import java.net.URLEncoder; import sun.misc.BASE64Encoder; public clas

python讀取txt檔案時的中文亂碼問題

相關推薦