1. 程式人生 > >linux程式分析工具介紹—ldd,nm

linux程式分析工具介紹—ldd,nm

本文要介紹的ldd和nm是linux下,兩個用來分析程式很實用的工具。ldd是用來分析程式執行時需要依賴的動態庫的工具;nm是用來檢視指定程式中的符號表相關內容的工具。下面通過例子,分別來介紹一下這兩個工具:


1. ldd, 先看下面的例子, 用ldd檢視cs程式所依賴的動態庫:


  1. $ ldd cs  
  2. linux-gate.so.1 =>  (0xffffe000)  
  3. libz.so.1 => /lib/libz.so.1 (0xb7f8c000)  
  4. libpthread.so.0 => /lib/libpthread.so.0 (0xb7f75000)  
  5. libcrypto.so.0.9.8 => /usr/lib/libcrypto.so.0.9.8 (0xb7e4d000)  
  6. libpcre.so.0 => /usr/lib/libpcre.so.0 (0xb7e21000)  
  7. libstdc++.so.6 => /usr/local/gcc4.5.1/lib/libstdc++.so.6 (0xb7d40000)  
  8. libm.so.6 => /lib/libm.so.6 (0xb7d18000)  
  9. libgcc_s.so.1 => /usr/local/gcc4.5.1/lib/libgcc_s.so.1 (0xb7cfd000)  
  10. libc.so.6 => /lib/libc.so.6 (0xb7bbc000)  
  11. /lib/ld-linux.so.2 (0xb7fab000)  
  12. libdl.so.2 => /lib/libdl.so.2 (0xb7bb7000)  


在上面的例子中,ldd的結果可以分為三列來看:


•第一列:程式需要依賴什麼庫
•第二列: 系統提供的與程式需要的庫所對應的庫
•第三列:庫載入的開始地址
通過上面的資訊,我們可以得到以下幾個資訊:


•(1) 通過對比第一列和第二列,我們可以分析程式需要依賴的庫和系統實際提供的,是否相匹配
•(2) 通過觀察第三列,我們可以知道在當前的庫中的符號在對應的程序的地址空間中的開始位置
2. nm, 通過下面的例子,我們來介紹nm工具:
先看一下這個簡單的程式:


  1. #include "iostream"
  2. usingnamespace std;  
  3. class Test  
  4. {  
  5. public:  
  6.     void
     Hello()  
  7.     {  
  8.         cout < < "Hello world!" << endl;  
  9.     }  
  10. };  
  11. int main()  
  12. {  
  13.     Test test;  
  14.     test.Hello();  
  15. }  


}接下來,我們編譯該程式,然後看nm的結果: 

  1. $ g++ test.cc -o test  
  2. c$ nm test  
  3. 08049f10 d _DYNAMIC  
  4. 08049ff4 d _GLOBAL_OFFSET_TABLE_  
  5. 080486f0 t _GLOBAL__I_main  
  6. 080487fc R _IO_stdin_used  
  7.          w _Jv_RegisterClasses  
  8. 080486b0 t _Z41__static_initialization_and_destruction_0ii  
  9. 0804870c W _ZN4Test5HelloEv  
  10.          U [email protected]@GLIBCXX_3.4  
  11.          U [email protected]@GLIBCXX_3.4  
  12.          U [email protected]@GLIBCXX_3.4  
  13. 0804a040 B [email protected]@GLIBCXX_3.4  
  14.          U [email protected]@GLIBCXX_3.4  
  15. 0804a0d4 b _ZStL8__ioinit  
  16.          U [email protected]@GLIBCXX_3.4  
  17. 08049f00 d __CTOR_END__  
  18. 08049ef8 d __CTOR_LIST__  
  19. 08049f08 D __DTOR_END__  
  20. 08049f04 d __DTOR_LIST__  
  21. 080488c8 r __FRAME_END__  
  22. 08049f0c d __JCR_END__  
  23. 08049f0c d __JCR_LIST__  
  24. 0804a02c A __bss_start  
  25.          U [email protected]@GLIBC_2.1.3  
  26. 0804a024 D __data_start  
  27. 080487b0 t __do_global_ctors_aux  
  28. 08048610 t __do_global_dtors_aux  
  29. 0804a028 D __dso_handle  
  30.          w __gmon_start__  
  31.          U [email protected]@CXXABI_1.3  
  32. 080487aa T __i686.get_pc_thunk.bx  
  33. 08049ef8 d __init_array_end  
  34. 08049ef8 d __init_array_start  
  35. 08048740 T __libc_csu_fini  
  36. 08048750 T __libc_csu_init  
  37.          U [email protected]@GLIBC_2.0  
  38. 0804a02c A _edata  
  39. 0804a0d8 A _end  
  40. 080487dc T _fini  
  41. 080487f8 R _fp_hw  
  42. 08048508 T _init  
  43. 080485e0 T _start  
  44. 0804a0cc b completed.7065  
  45. 0804a024 W data_start  
  46. 0804a0d0 b dtor_idx.7067  
  47. 08048670 t frame_dummy  
  48. 08048694 T main  


上面便是test這個程式中所有的符號,首先需要介紹一下上面的內容的格式:


•第一列:當前符號的地址
•第二列:當前符號的型別
•第三列:當前符號的名稱
在上面的結果中,像_ZN4Test5HelloEv這樣的符號,很多讀者朋友可能會被它搞暈,這裡介紹個小技巧,在nm的時候,加上-C選項,就可以把這些難以識別的符號,轉換成便於我們閱讀的符號TestHello()。這個主要是c++中的mangle機制所導致的,加上-C就是指定列出的符號是demangle了的。說了這麼多,到底nm對我們程式有啥具體的幫助呢,我覺得主要有以下幾個方面:
(1)判斷指定程式中有沒有定義指定的符號 (比較常用的方式:nm -C proc | grep symbol)
(2)解決程式編譯時undefined reference的錯誤,以及mutiple definition的錯誤

(3)檢視某個符號的地址,以及在程序空間的大概位置(bss, data, text區,具體可以通過第二列的型別來判斷)

附:nm輸出中,部分符合型別說明 ,詳細見 nm 的幫助




該符號的值是絕對的,在以後的連結過程中,不允許進行改變。這樣的符號值,常常出現在中斷向量表中,例如用符號來表示各個中斷向量函式在中斷向量表中的位置。 



該符號的值出現在非初始化資料段(bss)中。例如,在一個檔案中定義全域性static int test。則該符號test的型別為b,位於bss section中。其值表示該符號在bss段中的偏移。一般而言,bss段分配於RAM中 



該符號為common。common symbol是未初始話資料段。該符號沒有包含於一個普通section中。只有在連結過程中才進行分配。符號的值表示該符號需要的位元組數。例如在一個c檔案中,定義int test,並且該符號在別的地方會被引用,則該符號型別即為C。否則其型別為B。 



該符號位於初始話資料段中。一般來說,分配到data section中。例如定義全域性int baud_table[5] = {9600, 19200, 38400, 57600, 115200},則會分配於初始化資料段中。 



該符號也位於初始化資料段中。主要用於small object提高訪問small data object的一種方式。 



該符號是對另一個符號的間接引用。 



該符號是一個debugging符號。 



該符號位於只讀資料區。例如定義全域性const int test[] = {123, 123};則test就是一個只讀資料區的符號。注意在cygwin下如果使用gcc直接編譯成MZ格式時,原始檔中的test對應_test,並且其符號型別為D,即初始化資料段中。但是如果使用m6812-elf-gcc這樣的交叉編譯工具,原始檔中的test對應目標檔案的test,即沒有新增下劃線,並且其符號型別為R。一般而言,位於rodata section。值得注意的是,如果在一個函式中定義const char *test = “abc”, const char test_int = 3。使用nm都不會得到符號資訊,但是字串“abc”分配於只讀儲存器中,test在rodata section中,大小為4。 



符號位於非初始化資料區,用於small object。 



該符號位於程式碼區text section。 



該符號在當前檔案中是未定義的,即該符號的定義在別的檔案中。例如,當前檔案呼叫另一個檔案中定義的函式,在這個被呼叫的函式在當前就是未定義的;但是在定義它的檔案中型別是T。但是對於全域性變數來說,在定義它的檔案中,其符號型別為C,在使用它的檔案中,其型別為U。 



該符號是一個weak object。 



The symbol is a weak symbol that has not been specifically tagged as a weak object symbol. 



該符號是a.out格式檔案中的stabs symbol。 



該符號型別沒有定