1. 程式人生 > >Python學習筆記__12.3章 base64

Python學習筆記__12.3章 base64

編程語言 Python

# 這是學習廖雪峰老師python教程的學習筆記


Base64是一種用64個字符來表示任意二進制數據的方法。

Base64是一種最常見的二進制編碼方法,用作二進制到字符串的轉換

1、Base64的原理

1)準備一個包含64個字符的數組:

['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']

2)對二進制數據進行處理,每3個字節一組,一共是3x8=24bit,劃為4組,每組正好6個bit:

技術分享圖片

這樣我們得到4個數字作為索引,然後查表,獲得相應的4個字符,就是編碼後的字符串。

Base64編碼把3字節的二進制數據編碼為4字節的文本數據後,雖然長度增加33%,但好處是編碼後的文本數據可以在郵件正文、網頁等直接顯示。

如果要編碼的二進制數據不是3的倍數,最後會剩下1個或2個字節。Base64會用\x00字節在末尾補足後,再在編碼的末尾加上1個或2=號,表示補了多少字節,解碼的時候,會自動去掉。

2Base64應用

1)Python內置的base64可以直接進行base64的編解碼

>>> import base64

>>> base64.b64encode

(b'binary\x00string') #編碼

b'YmluYXJ5AHN0cmluZw=='

>>> base64.b64decode(b'YmluYXJ5AHN0cmluZw==') #解碼

b'binary\x00string'

2)"url safe"的base64編碼

由於標準的Base64編碼後可能出現字符+和/,在URL中就不能直接作為參數,所以又有一種"url safe"的base64編碼,其實就是把字符+和/分別變成-和_:

>>> base64.b64encode(b'i\xb7\x1d\xfb\xef\xff')

b'abcd++//'

>>> base64.urlsafe_b64encode(b'i\xb7\x1d\xfb\xef\xff')

b'abcd--__'

>>> base64.urlsafe_b64decode('abcd--__')

b'i\xb7\x1d\xfb\xef\xff'

3、小結

1)可以自己定義64個字符的排列順序,這樣就可以自定義Base64編碼,不過,通常情況下完全沒有必要。

2)Base64是一種通過查表的編碼方法,不能用於加密,即使使用自定義的編碼表也不行

3)Base64適用於小段內容的編碼,比如數字證書簽名、Cookie的內容等。

4)由於=字符也可能出現在Base64編碼中,但=用在URL、Cookie裏面會造成歧義,所以,很多Base64編碼後會把=去掉。解碼時會自動加上

# 標準Base64:

'abcd' -> 'YWJjZA=='

# 自動去掉=:

'abcd' -> 'YWJjZA'

  1. Base64是一種任意二進制到文本字符串的編碼方法,常用於在URLCookie、網頁中傳輸少量二進制數據。

4、例子

1、請寫一個能處理去掉=的base64解碼函數:

# -*- coding: utf-8 -*-
import base64

def safe_base64_decode(s):

s += b'===' #為數據加上三個=

return base64.b64decode(s[:-1*(len(s)%4)]) #s[:-1*(len(s)%4)] 不顯示最後幾個元素

# 測試:
assert b'abcd' == safe_base64_decode(b'YWJjZA=='), safe_base64_decode('YWJjZA==')
assert b'abcd' == safe_base64_decode(b'YWJjZA'), safe_base64_decode('YWJjZA')
print('ok')


Python學習筆記__12.3章 base64