在Linux下進行C語言程式設計,必然要採用GNU GCC來編譯C原始碼生成可執行程式。

一、GCC快速入門

Gcc指令的一般格式為:Gcc [選項] 要編譯的檔案 [選項] [目標檔案]

其中,目標檔案可預設,Gcc預設生成可執行的檔名為:編譯檔案.out

我們來看一下經典入門程式"Hello World!"

# vi hello.c  

#include <stdlib.h>
#include <stdio.h>
void main(void)
{
printf("hello world!\r\n");
}

用gcc編譯成執行程式。

#gcc hello.c

該命令將hello.c直接生成最終二進位制可執行程式a.out

這條命令隱含執行了(1)預處理、(2)彙編、(3)編譯並(4)連結形成最終的二進位制可執行程式。這裡未指定輸出檔案,預設輸出為a.out。

如何要指定最終二進位制可執行程式名,那麼用-o選項來指定名稱。比如需要生成執行程式hello.exe

那麼

#gcc hello.c -o hello.exe

二、GCC的命令剖析--四步走

從上面我們知道GCC編譯原始碼生成最終可執行的二進位制程式,GCC後臺隱含執行了四個階段步驟。

GCC編譯C原始碼有四個步驟:

預處理-----> 編譯 ----> 彙編 ----> 連結

現在我們就用GCC的命令選項來逐個剖析GCC過程。

1)預處理(Pre-processing)

在該階段,編譯器將C原始碼中的包含的標頭檔案如stdio.h編譯進來,使用者可以使用gcc的選項”-E”進行檢視。

用法:#gcc -E hello.c -o hello.i

作用:將hello.c預處理輸出hello.i檔案。

[root]# gcc -E hello.c -o hello.i
[root]# ls
hello.c   hello.i
[root]# vi hello.i
# 1 "hello.c"
# 1 "<built-in>"
# 1 "<command line>"
# 1 "hello.c"
# 1 "/usr/include/stdlib.h" 1 3
# 25 "/usr/include/stdlib.h" 3
# 1 "/usr/include/features.h" 1 3
# 291 "/usr/include/features.h" 3
# 1 "/usr/include/sys/cdefs.h" 1 3
# 292 "/usr/include/features.h" 2 3
# 314 "/usr/include/features.h" 3
# 1 "/usr/include/gnu/stubs.h" 1 3
# 315 "/usr/include/features.h" 2 3
# 26 "/usr/include/stdlib.h" 2 3
# 3 "hello.c" 2
void main(void)
{
printf("hello world!\r\n");
}

2)編譯階段(Compiling)

第二步進行的是編譯階段,在這個階段中,Gcc首先要檢查程式碼的規範性、是否有語法錯誤等,以確定程式碼的實際要做的工作,在檢查無誤後,Gcc把程式碼翻譯成組合語言。使用者可以使用”-S”選項來進行檢視,該選項只進行編譯而不進行彙編,生成彙編程式碼。

選項 -S

用法:[root]# gcc –S hello.i –o hello.s  


作用:將預處理輸出檔案hello.i彙編成hello.s檔案。

[[email protected] hello-gcc]# ls

hello.c   hello.i   hello.s

如下為hello.s彙編程式碼

[[email protected] hello-gcc]# vi hello.s
.file    "hello.c"
.section     .rodata
.LC0:
.string "hello world!\r\n"
.text
.globl main
.type    main,@function
main:
pushl    %ebp
movl     %esp, %ebp
subl     $8, %esp
andl     $-16, %esp
movl     $0, %eax
subl     %eax, %esp
subl     $12, %esp
pushl    $.LC0
call     printf
addl     $16, %esp
movl     $0, %eax
leave
ret
.Lfe1:
.size    main,.Lfe1-main
.ident   "GCC: (GNU) 3.2.2 20030222 (Red Hat Linux 3.2.2-5)"

3)彙編階段(Assembling)

彙編階段是把編譯階段生成的”.s”檔案轉成二進位制目的碼.

選項 -c

用法:[root]# gcc –c hello.s –o hello.o

作用:將彙編輸出檔案test.s編譯輸出test.o檔案。

[root]# gcc -c hello.s -o hello.o

[root]# ls

hello.c   hello.i   hello.o   hello.s

4)連結階段(Link)

在成功編譯之後,就進入了連結階段。

無選項鍊接

用法:[root]# gcc hello.o –o hello.exe

作用:將編譯輸出檔案hello.o連結成最終可執行檔案hello.exe。

[root]# ls

hello.c   hello.exe   hello.i   hello.o   hello.s  


執行該可執行檔案,出現正確的結果如下。

[[email protected] Gcc]# ./hello

Hello World!

在這裡涉及到一個重要的概念:函式庫。

讀者可以重新檢視這個小程式,在這個程式中並沒有定義”printf”的函式實現,且在預編譯中包含進的”stdio.h”中也只有該函式的宣告,而沒有定義函式的實現,那麼,是在哪裡實現”printf”函式的呢?最後的答案是:系統把這些函式實現都被做到名為libc.so.6的庫檔案中去了,在沒有特別指定時,gcc會到系統預設的搜尋路徑”/usr/lib”下進行查詢,也就是連結到libc.so.6庫函式中去,這樣就能實現函式”printf” 了,而這也就是連結的作用。

你可以用ldd命令檢視動態庫載入情況:

[root]# ldd hello.exe

libc.so.6 => /lib/tls/libc.so.6 (0x42000000)

/lib/ld-linux.so.2 => /lib/ld-linux.so.2 (0x40000000)

函式庫一般分為靜態庫和動態庫兩種。靜態庫是指編譯連結時,把庫檔案的程式碼全部加入到可執行檔案中,因此生成的檔案比較大,但在執行時也就不再需要庫檔案了。其後綴名一般為”.a”。動態庫與之相反,在編譯連結時並沒有把庫檔案的程式碼加入到可執行檔案中,而是在程式執行時由執行時連結檔案載入庫,這樣可以節省系統的開銷。動態庫一般字尾名為”.so”,如前面所述的libc.so.6就是動態庫。gcc在編譯時預設使用動態庫。