1. 程式人生 > >借著Python-3來聊聊utf-8字符集

借著Python-3來聊聊utf-8字符集

文字 編碼 固定 tro 銀行 自然 就是 我們 進行

關於文本文件

  文本文件也是以二進制序列的方式保存在磁盤中的,磁盤並不能保存文本;我們打開文本文件的時候之所以能看到文字,是因為

  軟件根據文件所用編碼的字符集對文件進行解碼的原因。

以utf-8字符集為例

  字符集就是一種編碼規則,如字母‘a‘在磁盤中是以 01100001 這個二進制串的形式保存;事實上生活中也有字符集這樣的規則存在

  比如600036這個號碼對於“股民”來說這個就是“招商銀行”;有點跑題了,回到重點上來,字符集就是一種編碼規則。

  utf-8自然也是一套編碼規則啦,股票代碼的長度是相對固定的,而utf-8編碼後的二進制串的長度是不固定的;

---

借著Python-3來聊聊utf-8字符集