1. 程式人生 > >一. 計算機語言基礎知識:

一. 計算機語言基礎知識:

1.  程式語言的執行原理:

 程式語言是將人能看懂的語言轉換成機器可以使用的命令語言的工具。

  其中高階語言是程式設計師經常用的語言型別,包含C語言、C++語言以及Python等我們經常會用到的編輯語言

  而高階語言在轉換為二進位制數字的機器語言之前通常需要先轉換為組合語言。這是一種機器語言的簡單翻譯版。雖然組合語言的多數程式碼都是使用英文單詞進行表達的,但是這種語言要比高階語言複雜的多。但是通過這樣的語言,我們就可以將我們輸入的命令順利轉換成二級制數字傳輸給CPU進行執行。

 

  高階語言又分為兩種:編譯型和解釋型:

 

  其中:編譯型語言是一次寫好整體執行,需要先編譯成機器語言再執行。具有執行速度快的優點,但是同時,也會耗費大量的時間成本,修改起來困難,跨平臺性很差。

  解釋型語言需要安裝直譯器才能執行,這種語言再編寫的過程中就會自動將程式碼解釋為可執行的機器語言,但是執行的速度會很慢。相反這樣的語言編寫的時間成本低,且修改容易,跨平臺性強。

 

2. 我們常用的編碼:

  計算機接受的資料是二進位制的數字,每8個二進位制的數字組成資料的最小單位,也就是byte,位元組。

  我們最常使用的就是以1位元組進行表示的ascii碼。

  ascii碼可以表示256個字元。支援表示數字,字母和一些特殊字元以及標點符號。

  以下是ascii編碼表:

  

 

  但是ascii僅僅可以表示英文,不能表示其他各國語言的字母以及我國的漢字。

  所以我國就自己研發出了一套中文編碼,GBK

  GBK在華銷售電腦的預設編碼模式,使用2位位元組表示一個漢字,可以表達多達65536個字元,支援大部分漢字,繁體字,古漢字,以及周邊國家語言,例如:俄語,日語和韓語中的字元。

  萬國碼:Unicode

  由於各國間使用的編碼不一致,Unicode作為一種包含世界幾乎所有地區的字元的編碼應運而生。

  unicode使用2位位元組表達所有的字元,包括漢字,英文字母等都是使用2位位元組。這就導致英文字母的要比使用ascii碼時多佔用一倍的空間。

  所以後續又推出了utf-8的升級版本。

  utf-8採用浮動位表示不同的語言字元。

  例如:中文漢字使用3位位元組進行表示,而英文只需要使用1位,歐洲文字使用2位位元組。

  這樣就在很大程度上能節約英文字元的佔用空間了。