藉著Python-3來聊聊utf-8字符集
【關於文字檔案】
文字檔案也是以二進位制序列的方式儲存在磁碟中的,磁碟並不能儲存文字;我們開啟文字檔案的時候之所以能看到文字,是因為
軟體根據檔案所用編碼的字符集對檔案進行解碼的原因。
【以utf-8字符集為例】
字符集就是一種編碼規則,如字母'a'在磁碟中是以 01100001 這個二進位制串的形式儲存;事實上生活中也有字符集這樣的規則存在
比如600036這個號碼對於“股民”來說這個就是“招商銀行”;有點跑題了,回到重點上來,字符集就是一種編碼規則。
utf-8自然也是一套編碼規則啦,股票程式碼的長度是相對固定的,而utf-8編碼後的二進位制串的長度是不固定的;
---