1. 程式人生 > >程式語言的分類(編譯型-解釋型;動態型別-靜態型別;強型別-弱型別)

程式語言的分類(編譯型-解釋型;動態型別-靜態型別;強型別-弱型別)

  在軟考期間,學習了程式語言的翻譯方式有多種:解釋、和編譯。那到底什麼是解釋和編譯呢。另外程式語言除了編譯型和解釋型,還有靜態語言、動態語言、強型別語言、弱型別語言。那麼每種語言型別是什麼樣子的呢,下面讓我們來看看吧。
  但是在此之前,我們需要先了解一下計算機原因的發展史,從低階語言到高階語言的轉變。

1、高階語言和低階語言:

  最初的計算機程式都是用0和1的序列表示的,程式設計師直接使用的是機器指令,無需翻譯,從紙帶打孔輸入即可執行得到結果。後來為了方便記憶,就將用0、1序列表示的機器指令都用符號助記,這些與機器指令一一對應的助記符就成了彙編指令,從而誕生了組合語言。無論是機器指令還是彙編指令都是面向機器的,統稱為低階語言

。因為是針對特定機器的機器指令的助記符,所以組合語言是無法獨立於機器(特定的CPU體系結構)的。但組合語言也是要經過翻譯成機器指令才能執行的,所以也有將執行在一種機器上的組合語言翻譯成執行在另一種機器上的機器指令的方法,那就是交叉彙編技術。

  高階語言是從人類的邏輯思維角度出發的計算機語言,抽象程度大大提高,需要經過編譯成特定機器上的目的碼才能執行,一條高階語言的語句往往需要若干條機器指令來完成。高階語言獨立於機器的特性是靠編譯器為不同機器生成不同的目的碼(或機器指令)來實現的。那具體的說,要將高階語言編譯到什麼程度呢,這又跟編譯的技術有關了,既可以編譯成直接可執行的目的碼,也可以編譯成一種中間表示,然後拿到不同的機器和系統上去執行,這種情況通常又需要支撐環境,比如直譯器或虛擬機器的支援,Java程式編譯成bytecode,再由不同平臺上的虛擬機器執行就是很好的例子。所以,說高階語言不依賴於機器,是指在不同的機器或平臺上高階語言的程式本身不變,而通過編譯器編譯得到的目的碼去適應不同的機器。從這個意義上來說,通過交叉彙編,一些彙編程式也可以獲得不同機器之間的可移植性,但這種途徑獲得的移植性遠遠不如高階語言來的方便和實用性大。

  大致瞭解了以上的內容,下面我們正式解釋各種語言型別就簡單多了。

2)編譯型和解釋型

  我們先看看編譯型,其實它和組合語言是一樣的:也是有一個負責翻譯的程式來對我們的原始碼進行轉換,生成相對應的可執行程式碼。這個過程說得專業一點,就稱為編譯(Compile),而負責編譯的程式自然就稱為編譯器(Compiler)。如果我們寫的程式程式碼都包含在一個原始檔中,那麼通常編譯之後就會直接生成一個可執行檔案,我們就可以直接運行了。但對於一個比較複雜的專案,為了方便管理,我們通常把程式碼分散在各個原始檔中,作為不同的模組來組織。這時編譯各個檔案時就會生成目標檔案(Object file)而不是前面說的可執行檔案。一般一個原始檔的編譯都會對應一個目標檔案。這些目標檔案裡的內容基本上已經是可執行程式碼了,但由於只是整個專案的一部分,所以我們還不能直接執行。待所有的原始檔的編譯都大功告成,我們就可以最後把這些半成品的目標檔案“打包”成一個可執行檔案了,這個工作由另一個程式負責完成,由於此過程好像是把包含可執行程式碼的目標檔案連線裝配起來,所以又稱為連結

(Link),而負責連結的程式就叫……就叫連結程式連結程式(Linker)。連結程式除了連結目標檔案外,可能還有各種資源,像圖示檔案啊、聲音檔案啊什麼的,還要負責去除目標檔案之間的冗餘重複程式碼,等等,所以……也是挺累的。連結完成之後,一般就可以得到我們想要的可執行檔案了。

  現在再看看解釋型。噢,從字面上看,“編譯”和“解釋”的確都有“翻譯”的意思,它們的區別則在於翻譯的時機安排不大一樣。打個比方:假如你打算閱讀一本外文書,而你不知道這門外語,那麼你可以找一名翻譯,給他足夠的時間讓他從頭到尾把整本書翻譯好,然後把書的母語版交給你閱讀;或者,你也立刻讓這名翻譯輔助你閱讀,讓他一句一句給你翻譯,如果你想往回看某個章節,他也得重新給你翻譯。

  兩種方式,前者就相當於我們剛才所說的編譯型:一次把所有的程式碼轉換成機器語言,然後寫成可執行檔案;而後者就相當於我們要說的解釋型:在程式執行的前一刻,還只有源程式而沒有可執行程式;而程式每執行到源程式的某一條指令,則會有一個稱之為解釋程式的外殼程式將原始碼轉換成二進位制程式碼以供執行,總言之,就是不斷地解釋、執行、解釋、執行……所以,解釋型程式是離不開解釋程式的。像早期的BASIC就是一門經典的解釋型語言,要執行BASIC程式,就得進入BASIC環境,然後才能載入程式原始檔、執行。解釋型程式中,由於程式總是以原始碼的形式出現,因此只要有相應的直譯器,移植幾乎不成問題。編譯型程式雖然原始碼也可以移植,但前提是必須針對不同的系統分別進行編譯,對於複雜的工程來說,的確是一件不小的時間消耗,況且很可能一些細節的地方還是要修改原始碼。而且,解釋型程式省卻了編譯的步驟,修改除錯也非常方便,編輯完畢之後即可立即執行,不必像編譯型程式一樣每次進行小小改動都要耐心等待漫長的Compiling…Linking…這樣的編譯連結過程。不過凡事有利有弊,由於解釋型程式是將編譯的過程放到執行過程中,這就決定了解釋型程式註定要比編譯型慢上一大截,像幾百倍的速度差距也是不足為奇的。

  編譯型與解釋型,兩者各有利弊。前者由於程式執行速度快,同等條件下對系統要求較低,因此像開發作業系統、大型應用程式、資料庫系統等時都採用它,像C/C++、Pascal/Object Pascal(Delphi)、VB等基本都可視為編譯語言,而一些網頁尾本、伺服器指令碼及輔助開發介面這樣的對速度要求不高、對不同系統平臺間的相容性有一定要求的程式則通常使用解釋性語言,如Java、JavaScript、VBScript、Perl、Python等等。

  但既然編譯型與解釋型各有優缺點又相互對立,所以一批新興的語言都有把兩者折衷起來的趨勢,例如Java語言雖然比較接近解釋型語言的特徵,但在執行之前已經預先進行一次預編譯,生成的程式碼是介於機器碼和Java原始碼之間的中介程式碼,執行的時候則由JVM(Java的虛擬機器平臺,可視為直譯器)解釋執行。它既保留了原始碼的高抽象、可移植的特點,又已經完成了對原始碼的大部分預編譯工作,所以執行起來比“純解釋型”程式要快許多。而像VB6(或者以前版本)、C#這樣的語言,雖然表面上看生成的是.exe可執行程式檔案,但VB6編譯之後實際生成的也是一種中介碼,只不過編譯器在前面安插了一段自動呼叫某個外部直譯器的程式碼(該解釋程式獨立於使用者編寫的程式,存放於系統的某個DLL檔案中,所有以VB6編譯生成的可執行程式都要用到它),以解釋執行實際的程式體。C#(以及其它.net的語言編譯器)則是生成.net目的碼,實際執行時則由.net解釋系統(就像JVM一樣,也是一個虛擬機器平臺)進行執行。當然.net目的碼已經相當“低階”,比較接近機器語言了,所以仍將其視為編譯語言,而且其可移植程度也沒有Java號稱的這麼強大,Java號稱是“一次編譯,到處執行”,而.net則是“一次編碼,到處編譯”。呵呵,當然這些都是題外話了。總之,隨著設計技術與硬體的不斷髮展,編譯型與解釋型兩種方式的界限正在不斷變得模糊。

3)動態語言和靜態語言

  通常我們所說的動態語言、靜態語言是指動態型別語言和靜態型別語言。
1)動態型別語言:
  動態型別語言是指在執行期間才去做資料型別檢查的語言,也就是說,在用動態型別的語言程式設計時,永遠也不用給任何變數指定資料型別,該語言會在你第一次賦值給變數時,在內部將資料型別記錄下來。Python和Ruby就是一種典型的動態型別語言,其他的各種指令碼語言如VBScript也多少屬於動態型別語言。
2)靜態型別語言:
  靜態型別語言與動態型別語言剛好相反,它的資料型別是在編譯其間檢查的,也就是說在寫程式時要宣告所有變數的資料型別,C/C++是靜態型別語言的典型代表,其他的靜態型別語言還有C#、JAVA等。

4)強型別定義語言和弱型別定義語言

1)強型別定義語言:
  強制資料型別定義的語言。也就是說,一旦一個變數被指定了某個資料型別,如果不經過強制轉換,那麼它就永遠是這個資料型別了。舉個例子:如果你定義了一個整型變數a,那麼程式根本不可能將a當作字串型別處理。強型別定義語言是型別安全的語言。
2)弱型別定義語言:
  資料型別可以被忽略的語言。它與強型別定義語言相反, 一個變數可以賦不同資料型別的值。
  強型別定義語言在速度上可能略遜色於弱型別定義語言,但是強型別定義語言帶來的嚴謹效能夠有效的避免許多錯誤。另外,“這門語言是不是動態語言”與“這門語言是否型別安全”之間是完全沒有聯絡的!
  例如:Python是動態語言,是強型別定義語言(型別安全的語言); VBScript是動態語言,是弱型別定義語言(型別不安全的語言); JAVA是靜態語言,是強型別定義語言(型別安全的語言)。