1. 程式人生 > >計算機編碼方式

計算機編碼方式

sci 方便 alt ascii 內置 技術 空間 可能 其他

首先需要弄明白一件事,計算機只能識別0,1。因此字符什麽的需要編碼進行存儲。

計算機是由老外發明的,他們可沒有什麽漢字 ,只有ABCD....,所以呢,最早的編碼

是ASCII編碼,最開始是給128個字符進行編碼。

但這顯然是不行的啊,世界上除了英語,還有那麽多其他語言,因此ASCII碼顯然不適合

這種情況。

於是又有了Unicode編碼方式,俗稱萬國碼,可以存儲好幾萬個字符。但是又有新的問題

出現了,Unicode碼不適合存儲啊,因為Unicode是定長編碼,非常浪費存儲空間,

這裏又有了一種新的編碼方式:utf-8。utf-8繼承了unicode碼,采用的是不定長編碼,大大

節約了存儲空間。在數據存儲和傳輸方面非常方便。

當然還有像gbk專門針對中文的編碼方式,Shift_JIS針對日文的編碼方式.....................

總之,編碼方式很多,但在計算機內存中的編碼方式一定是unicode編碼,因為操作系統不可能

內置好幾十種編碼方式,而是在內存中采用unicode編碼,這樣的話從其他編碼方式解碼成unicode

碼這一過程就可以讓其他程序開發者來完成。

以下圖為例:

技術分享圖片

一個文本文檔的讀取和保存到磁盤的過程如上圖所示

計算機編碼方式