python2 和python3 開啟檔案注意事項（兩者decode和encode函式的區別）

阿新 • • 發佈：2019-02-10

比如，需要開啟的資料檔案puk_training.utf8的樣式如圖所示

一、python2 開啟檔案：

import sys
print(sys.getdefaultencoding()) #系統預設編碼方式

f = file(".\\pku_training.utf8") #以file來開啟檔案
print type(f)                    #獲取f的資料型別

data = f.read()[3:].decode('utf-8')  #比如讀取資料的的3及其以後資料，注意decode解碼
f.close()
print type(data)

data = data.encode('utf-8')  #以utf-8方式編碼
print type(data)

data = data.decode('utf-8')  #以utf-8方式解碼
print type(data)

tokens = data.split('  ') #以數按空格切分詞，存放到list裡邊
print type(tokens)        #列印tokens的資料型別
print type(tokens[1])     #列印tokens裡邊資料的資料型別

print tokens[1].encode('utf-8') #直接列印tokens[1]會出錯，需要列印str型別
print tokens[1]

輸出結果：

#輸出結果：
ascii

<type 'file'>

<type 'unicode'>

<type 'str'>

<type 'unicode'>

<type 'list'>

<type 'unicode'>

#測試資料型別列印
充滿 #tokens[1].encode('utf-8')的值
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)  #報錯，不能直接列印unicode編碼

python2中，我們使用decode()和encode()來進行解碼和編碼

在python2中，使用unicode型別作為編碼的基礎型別。即

decode() encode()

str -----------> unicode ---------->str

注：python2中，不能直接列印unicode編碼，需要將unicode轉換成str才能進行列印輸出，否則會報錯。

二、python3開啟檔案

import sys
print(sys.getdefaultencoding()) #系統預設編碼方式

f=open(".\\pku_training.utf8", encoding='utf-8') # encoding表示編碼或者解碼的方式，此處為解碼
print(type(f))

data = f.read()[3:]
print(type(data))
f.close()

data = data.encode('utf-8')
print(type(data))

data = data.decode('utf-8')
print(type(data))

tokens = data.split('  ')
print(type(tokens))
print(type(tokens[1]))

print(tokens[1])  # str 型別可以列印
print(tokens[1].encode('utf-8')) # bytes 也可以列印

輸出結果：

#輸出結果：
utf-8

<class '_io.TextIOWrapper'>

<class 'str'>

<class 'bytes'>

<class 'str'>

<class 'list'>

<class 'str'>

#測試資料型別列印
充滿
b'\xe5\x85\x85\xe6\xbb\xa1'

python3中，encoding表徵的編碼或者解碼方式；

decode() encode()

bytes -------------> str ------------->bytes

注：python 3中的str型別物件有點像Python2中的unicode，而decode是將str轉為unicode編碼，所以str僅有一個encode方法，呼叫這個方法後將產生一個編碼後的byte型別的字元。

python3 的print( )可以列印str和bytes行資料型別。

總結：

1、python2中的str對應python3中的bytes，unicode對應str；

2、python2系統預設編碼方式為ascii，而python3預設為utf-8；

參考：

python2 和python3 開啟檔案注意事項（兩者decode和encode函式的區別）

比如，需要開啟的資料檔案puk_training.utf8的樣式如圖所示一、python2 開啟檔案： import sys print(sys.getdefaultencoding()) #系統預設編碼方式 f = file(".\\pku_training

Linux C ftruncate 函式清空檔案注意事項（要使用 lseek 重置偏移量）

DESCRIPTION The truncate() and ftruncate() functions cause the regular file named by path or referenced by fd to be truncated to a size of precisely

ubuntu下安裝caffe和python3配合安裝注意事項

1 先解除安裝掉你通過apt-get 安裝的protobuf，用sudo apt-get remove libprotobuf-dev libprotoc-dev進行解除安裝，不然編譯caffe會出現莫名其妙的錯誤 2 安裝protobuf 3.0.0，直接從github上

vue之watch監聽物件或者一個值時注意事項（深度觀察deep:true慎用！）

vue中想在某個值改變的時候能夠做一些其他事情，可以使用其提供的監聽機制，使用watch。注意，本篇不講技術問題，只是講解如何應用，因為筆者也是一個前端的小白例：經手專案中就有使用，截圖如下：下面來分析上面分別是怎樣實現監聽的：其實除了畫紅線的地方，別的都沒什

開發證書和開發描述檔案的配置（釋出證書和釋出描述檔案）

iOS開發過程中需要進行真機除錯時，需要使用開發證書和開發描述檔案。後期進行釋出時，需要使用釋出證書和釋出描述檔案。開發證書和開發描述檔案的配置需要在App Developer官網進行。且在設定證書時，需要先在本地電腦上生成證書請求檔案。具體操作流程如下：一、生成證書請求檔案

Qt如何彈出子視窗以及注意事項（某位大神的講解）

第一種方法：自己新增一個設計介面類或者只用程式碼的類，設計一個介面，像其他對話方塊一樣，使用就可以了第一個是對話方塊下面是主視窗 QWidget （這也會生成ui文字可以拖控制元件，實現自定義的子視窗）下面的視窗部件是可選的，另外，還可以（這個生成不帶u

JS中setInterval()和clearInterval()的使用以及注意事項（實用，贊）

原文出處：https://blog.csdn.net/YDesire/article/details/81124331 延伸閱讀：clearInterval(timer)和timer = null的區別 setInterval()：間隔指定的毫秒數不停地執行指定的程式碼，定時器 clear

Redis 設定 Key/value 的規則定義和注意事項（附工具類）

對於redis的儲存key/value鍵值對，經過多次踩坑之後，我們總結了一套規則；這篇文章主要講解定義key/value鍵值對時的定義規則和注意事項。前面一篇文章講了如何定義Redis的客戶端和Dubbo整合儲存器；當我們真正開始開發的時候，就會突然發現，有點不知道如何去定義Redis的K

Redis設定Key/value的規則定義和注意事項（附工具類）

小程式成長之路_給頁面新增tabBar 和新增tabBar時的注意事項（三）

上篇部落格我們已經成功建立頁面，並且顯示我們自己所建立頁面的內容，那麼我們都知道每個專案下面都會有tab bar,當然大部分都有，也不排除沒有的情況啊，那麼這篇我主要是來新增一個tabBar並且總結一下寫的過程中一個小程式小白開發者遇到讓人頭疼的問題，並講解解決方法，也許

微信小程式和微信公眾號開發注意事項（有些是從微信開發文件中摘抄出來的）

先從簡單的說起（會提醒你的一些注意事項） 1、微信公眾號和小程式名稱可以由中文、數字、英文。長度在3-20個字元之間，一箇中文字等於2個字元。 2、微信公眾號和小程式名稱不得與公眾平臺已有的訂閱號

JavaScript之ES6中解構原理及注意事項（陣列和物件）

//ES6中的解構原理(常用型別)： //陣列解構： //陣列的元素是按次序排列的，變數的取值由它的位置決定； let [a,b,c] = [1,2,3]; console.log(a,b,c) //結果為： 1,2,3; //物件解構變數同名(

jquery的非同步提交表單（非同步上傳檔案）及jquery.form.js上傳檔案注意事項

方法一：jquery的ajax方式，通過FormaData獲取表單資料（1）這種方式只需要jquery-1.7.js外掛；（2）通過`jquery中的FormaData類：自動搜尋表單資訊(表單內沒有name屬性的input不會被搜尋到)，IE<=9

Linux核心編譯和grub安裝注意事項（修改預設啟動項）

一般的過程不多說。下載核心原始碼，make menuconfig , make , make modules_install, make install等一系列。要注意的事情： 1.安裝模組時，要用特殊引數，否則編譯出來的initrd.img特別大有300M，而

關於在真實物理機器上用cloudermanger或ambari搭建大資料叢集注意事項總結、經驗和感悟心得（圖文詳解）

寫在前面的話　　（1）最近一段時間，因擔任我團隊實驗室的大資料環境叢集真實物理機器工作，至此，本人秉持負責、認真和細心的態度，先分別在虛擬機器上模擬搭建ambari（基於CentOS6.5版本）和cloudermanager（基於CentOS6.5或Ubuntu14.04版本）。　　（2）大

併發注意事項（2）併發工具優先於wait和notify

自jdk1.5以後java提供了更為高階的併發工具，他們可以完成wait和notify所能完成的工作。在java.util.conturrent包中更高階的併發工具分成三類：Executor Framework,併發集合（Concurrent Collection）以及同

PDM匯出sql的方法和注意事項（本人…

PDM生成sql的方法（應用oracle）：工具欄裡的Database--》Database Generation（Ctrl + G） Directory：匯出路徑 File name：匯出名（我寫的是myself.sql）點選“確定”。如果報錯：Generation aborted due to

WSAEventselect模型中的一些注意事項（尤其是event和事件的關聯與重置；FD_WRITE事件的作用）

1. 需要包含winsock2.h，連結ws2_32.llib 2. 把#include <winsock2.h>放到最前面至於原因，那是因為windows.h這個標頭檔案已經包含了winsock.h,winsock.h和winsock2.h貌似有衝突

關於整型保留的注意事項（非原創）

c語言，%d %.2d %2d %02d的區別： %d就是普通的輸出了 %2d是將數字按寬度為2，採用右對齊方式輸出，若資料位數不到2位，則左邊補空格 %02d，和%2d差不多，只不過左邊補0 %.2d沒見過，但從執行效果來看，和%02d一樣原稿：https://blog.

mybatis寫mapper檔案注意事項

xml中某些特殊符號作為內容資訊時需要做轉義,否則會對檔案的合法性和使用造成影響 Html程式碼 < < >&n

python2 和python3 開啟檔案注意事項（兩者decode和encode函式的區別）

總結：

相關推薦