1. 程式人生 > >u-boot.lds連結檔案詳解

u-boot.lds連結檔案詳解

GNU編譯器生成的目標檔案預設為elf格式,elf檔案由若干段(section)組成,如不特殊指明,由C源程式生成的目的碼中包含如下段:

  • .text(正文段)包含程式的指令程式碼;
  • .data(資料段)包含固定的資料,如常量、字串;
  • .bss(未初始化資料段)包含未初始化的變數、陣列等。

C++源程式生成的目的碼中還包括

  • .fini(解構函式程式碼)
  • .init(建構函式程式碼)等.

連結器的任務就是將多個目標檔案的.text、.data和.bss等段連結在一起,而連結指令碼檔案是告訴連結器從什麼地址開始放置這些段.簡而言之,由於一個工程中有多個.c檔案,當它們生成.o檔案後如何安排它們在可執行檔案中的順序,這就是連結指令碼的作用.

這裡以u-boot的lds為例說明uboot的連結過程,首先看一下GNU官方網站上對.lds檔案形式的完整描述:

SECTIONS {
...
secname start BLOCK(align) (NOLOAD) : AT ( ldadr )
{ contents } >region :phdr =fill
...
}

其中,secname和contents是必須的,前者用來命名這個段,後者用來確定程式碼中的什麼部分放在這個段,以下是對這個描述中的一些關鍵字的解釋。

  •  secname:段名

  •  contents:決定哪些內容放在本段,可以是整個目標檔案(如start.o),也可以是目標檔案中的某段(程式碼段、資料段等)(如start.o (.text .rodata))

  •  start:是段的重定位地址,本段連結(執行)的地址,如果程式碼中有位置無關指令,程式執行時這個段必須放在這個地址上。start可以用任意一種描述地址的符號來描述。

  •  AT(ldadr):定義本段儲存(載入)的地址,如果不使用這個選項,則載入地址等於執行地址,通過這個選項可以控制各段分別保存於輸出檔案中不同的位置。

例1

/* nand.lds */
SECTIONS {
firtst 0x00000000 : { head.o init.o }
second 0x30000000 : AT(4096) { main.o }
}

其中,

  1. head.o放在0x00000000地址開始處,init.o放在head.o後面,他們的執行地址也是0x00000000,即連結和儲存地址 相同(沒有AT指定);

  2. main.o放在4096(0x1000,是AT指定的,儲存地址)開始處,但它的執行地址在0x30000000,執行之前需要 從0x1000(載入地址處)複製到0x30000000(執行地址處),此過程也就需要讀取 flash,把程式拷貝到相應位置才能執行。儲存地址和執行地址,又稱為載入時域和執行時域,可以在.lds連結指令碼檔案中分別指定。

例2

ENTRY(begin) 
SECTION 

     .=0x00300000; 
     .text : { *(.text) } 
     .data: { *(.data) } 
     .bss: { *(.bss) } 
}  

其中,

  1.  ENTRY(begin)指明程式的入口點為begin標號;
  2.  .=0x00300000指明目的碼的起始地址為0x00300000,這一段地址可以是SDRAM的起始地址;
  3.  .text : { *(.text) }表示從0x00300000開始放置所有目標檔案的程式碼段,
  4.  .data: { *(.data) }表示資料段從程式碼段的末尾開始,
  5.  再後是.bss段.

二進位制化

連結生成的elf檔案不能直接下載到邏輯開發板上執行,通過objcopy工具可生成最終的二進位制檔案:

arm-linux-objcopy -O binary bootstrap.elf bootstrap.bin

所生成的目標二進位制檔案bootstrap.bin就可以直接寫入Flash中運行了.

其中:

    -O binary指定生成為二進位制格式檔案。

    Objcopy還可以生成S格式的檔案,只需將引數換成-O srec。

如果想將生成的目的碼反彙編,還可以用objdump工具:

arm-linux-objdump -dS bootstrap.elf

輸出可執行程式bootstrap.elf的反彙編程式碼

其中,

    -d:反彙編所有包含指令的段

    -D:反彙編所有段

    -S:原始碼和彙編程式碼穿插顯示(使用-g選項編譯)

 

編寫好的.lds檔案,在用arm-linux-ld連結命令時帶-Tfilename來呼叫執行,如

arm-linux-ld -Tnand.lds x.o y.o -o xy.o

也用-Ttext引數直接指定連結地址,如

arm-linux-ld –Ttext 0x30000000 x.o y.o –o xy.o。

既然程式有了兩種地址,就涉及到一些跳轉指令的區別。ARM彙編中,常有兩種跳轉方法:

  1. b跳轉指令
  2. ldr指令向PC賦值

要特別注意這兩條指令的意思:

b step

    b跳轉指令是相對跳轉,依賴當前PC的值,偏移量是通過該指令本身的 bit[23:0]算出來的,這使得使用b指令的程式不依賴於要跳到的程式碼的位置,只看指令本身。

ldr pc, =step

該指令是一個偽指令編譯後會生成以下程式碼:

ldr pc, 0x30008000
<0x30008000>
step

從記憶體中的某個位置(step)讀出資料並賦給PC,同樣依賴當前PC的值,但是偏移量是step的連結地址(執行時的地址),所以可以用它實現從Flash到RAM的程式跳轉。

此外,有必要回味一下adr偽指令,U-boot中那段relocate程式碼就是通過adr實現當前程式是在RAM中還是flash中:

relocate: /* 把U-Boot重新定位到RAM */
adr r0, _start /* r0是程式碼的當前位置 */

/* adr偽指令,彙編器自動通過當前PC的值算出這條指令中“_start"的值,執行到_start時PC的值放到r0中,當此段在flash中執行時r0 = _start = 0;當此段在RAM中執行時_start = _TEXT_BASE(在board/smdk2410/config.mk中指定的值為0x33F80000,即u-boot在把程式碼拷貝到RAM中去 執行的程式碼段的開始) */

ldr r1, _TEXT_BASE /* 測試判斷是從Flash啟動,還是RAM */

/* 此句執行的結果r1始終是0x33FF80000,因為此值是連結指定的 */

cmp r0, r1 /* 比較r0和r1,除錯的時候不要執行重定位 */

結合u-boot.lds談談連結指令碼。

OUTPUT_FORMAT("elf32-littlearm","elf32-littlearm","elf32-littlearm)    #指定輸出可執行檔案是elf格式,32位ARM指令,小端
OUTPUT_ARCH(arm)                    #指定輸出可執行檔案的平臺為ARM
ENTRY(_start)                       #指定輸出可執行檔案的起始程式碼段為_start.
SECTIONS
{
    . = 0x00000000;                 #定位當前地址為0地址
    . = ALIGN(4);                   #程式碼以4位元組對齊
    .text :                         #指定程式碼段:必須將start.o檔案放在程式碼段的開始位置,其它檔案可任意放
    {
        cpu/arm920t/start.o (.text) #程式碼段第一部分,指明start.s是入口程式,被放到程式碼段開頭
        *(.text)                    #其它程式碼部分.其中的*表示其它任意檔案,即所有其它檔案的程式碼段
    }

    . = ALIGN(4);
    .rodata : { *(.rodata) }        #指定只讀資料段,RO段

    . = ALIGN(4);
    .data : { *(.data) }            #指定讀/寫資料段,RW段

    . = ALIGN(4);
    .got : { *(.got) }              #指定got段, got段式是uboot自定義的一個段, 非標準段
    __u_boot_cmd_start = .          #把__u_boot_cmd_start賦值為當前位置, 即起始位置
    .u_boot_cmd : { *(.u_boot_cmd) }#指定u_boot_cmd段, uboot把所有的uboot命令放在該段.
    __u_boot_cmd_end = .            #把__u_boot_cmd_end賦值為當前位置,即結束位置

    . = ALIGN(4);
    __bss_start = .                 #把__bss_start賦值為當前位置,即bss段的開始位置
    .bss : { *(.bss) }              #指定bss段
    _end = .                        #把_end賦值為當前位置,即bss段的結束位置
}

通過上面的分析可以看出

  • 由於在連結指令碼中規定了檔案start.o(對應於start.S)作為整個uboot的起始點,因此啟動uboot時會執行首先執行start.S
  • 一般來說,記憶體空間可分為程式碼段、資料段、全域性變數段、未初始化變數區、棧區、堆區等.其中,棧區由指標SP決定,堆區實質上是由C程式碼實現的,其它段則由編譯器決定.從上面的分析可以看出,從0x00000000地址開始,編譯器首先將程式碼段放在最開始的位置,然後是資料段,然後是bss段(未初始化變數區).

附另一連結檔案

OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS {
  . = 0x30000000;
  . = ALIGN(4);
  .init : AT(0) {start.o nand.o}

  . = ALIGN(4);
  . = 0x30001000; 
  .text : AT(4096) { *(.text) }

  .rodata ALIGN(4) : AT((LOADADDR(.text)+SIZEOF(.text)+3)&~(0x03)) { *(.rodata*) }

  .data ALIGN(4) : AT((LOADADDR(.rodata)+SIZEOF(.rodata)+3)&~(0x03)) { *(.data) }

  . = ALIGN(4);
  __bss_start = .;
  .bss :{ *(.bss) *(COMMON)}
  __bss_end = .;
}