1. 程式人生 > >python筆記5-python2寫csv文件中文亂碼問題

python筆記5-python2寫csv文件中文亂碼問題

tde unicode編碼 [] utf set 分享圖片 lis ber utf-8

前言

python2最大的坑在於中文編碼問題,遇到中文報錯首先加u,再各種encode、decode。
當list、tuple、dict裏面有中文時,打印出來的是Unicode編碼,這個是無解的。
對中文編碼糾結的建議盡快換python3吧,python2且用且珍惜!

csv中文亂碼

1.open打開csv文件,用writer寫入帶有中文的數據時

  • writer寫入單行
  • writers寫入多行
# coding:utf-8
import csv

f = open("xieru.csv", ‘wb‘)
writer = csv.writer(f)

# 需要寫入的信息
data = ["客戶名稱", "行業類型", "客戶聯系人", "職位", "聯系方式", "郵箱","地址"]

writer.writerow(data)       # 寫入單行
# writer.writerows(datas)    # 寫入多行

f.close()

2.打開csv文件,發現寫入的中文亂碼了

技術分享圖片

編碼與解碼

1.中文亂碼問題一直是python2揮之不去的痛,這裏先弄清楚亂碼原因:

  • python2本身內部代碼的編碼有str和unicode兩種編碼
  • 然而文件寫入到windows系統時候,windows上的是gb2312編碼

所以就導致了亂碼問題

2.先把python裏面的中文字符串decode成utf-8,再encode為gbk編碼

data.decode(‘utf-8‘).encode(‘gbk‘)

3.如果是讀取csv文件的話,就反過來:

data.decode(‘gbk‘).encode(‘utf-8‘)

解決方案

1.方案一:對字符串轉換編碼(這個太麻煩了,不推薦)

# coding:utf-8
import csv

f = open("xieru1.csv", ‘wb‘)
writer = csv.writer(f)

# 需要寫入的信息
data = ["客戶名稱", "行業類型", "客戶聯系人", "職位", "聯系方式", "郵箱","地址"]

a = []
for i in data:
    a.append(i.decode("utf-8").encode("gbk"))

writer.writerow(a)           # 寫入單行
# writer.writerows(datas)    # 寫入多行

f.close()

2.方法二:用codecs提供的open方法來指定打開的文件的語言編碼,它會在讀取的時候自動轉換為內部unicode (推薦)

# coding:utf-8
import csv, codecs

import sys
reload(sys)
sys.setdefaultencoding(‘utf8‘)

f = codecs.open("xx.csv", ‘wb‘, "gbk")
writer = csv.writer(f)
writer.writerow(["客戶名稱", "行業類型", "客戶聯系人", "職位", "聯系方式", "郵箱","地址"])

# 多組數據存放list列表裏面
datas = [
    ["客戶名稱", "行業類型", "客戶聯系人", "職位", "聯系方式", "郵箱","地址"],
    ["客戶名稱", "行業類型", "客戶聯系人", "職位", "聯系方式", "郵箱","地址"],
    ["客戶名稱", "行業類型", "客戶聯系人", "職位", "聯系方式", "郵箱","地址"],
       ]

writer.writerows(datas)
f.close()

python筆記5-python2寫csv文件中文亂碼問題