1. 程式人生 > >【轉】Linux 高級的視角來查看Linux引導過程

【轉】Linux 高級的視角來查看Linux引導過程

同時 查找 ref 情況 The 詳細介紹 模塊 block 內容

【原文】https://www.toutiao.com/i6594210975480545800/

1、概述

圖 1 是我們在20,000 英尺的高度看到的視圖。

技術分享圖片

當系統首次引導時,或系統被重置時,處理器會執行一個位於已知位置處的代碼。在個人計算機(PC)中,這個位置在基本輸入/輸出系統(BIOS)中,它保存在主板上的閃存中。嵌入式系統中的中央處理單元(CPU)會調用這個重置向量來啟動一個位於閃存/ROM中的已知地址處的程序。在這兩種情況下,結果都是相同的。因為PC提供了很多靈活性,BIOS必須確定要使用哪個設備來引導系統。稍後我們將詳細介紹這個過程。

當找到一個引導設備之後,第一階段的引導加載程序就被裝入RAM並執行。這個引導加載程序在大小上小於512 字節(一個扇區),其作用是加載第二階段的引導加載程序。

當第二階段的引導加載程序被裝入RAM 並執行時,通常會顯示一個動畫屏幕,並將Linux 和一個可選的初始 RAM磁盤(臨時根文件系統)加載到內存中。在加載映像時,第二階段的引導加載程序就會將控制權交給內核映像,然後內核就可以進行解壓和初始化了。在這個階段中,第二階段的引導加載程序會檢測系統硬件、枚舉系統鏈接的硬件設備、掛載根設備,然後加載必要的內核模塊。完成這些操作之後啟動第一個用戶空間程序(init),並執行高級系統初始化工作。

這就是 Linux引導的整個過程。現在讓我們深入挖掘一下這個過程,並深入研究一下Linux引導過程的一些詳細信息。

2、系統啟動

系統啟動階段依賴於引導Linux系統上的硬件。在嵌入式平臺中,當系統加電或重置時,會使用一個啟動環境。這方面的例子包括U-Boot、RedBoot和Lucent的MicroMonitor。嵌入式平臺通常都是與引導監視器搭配銷售的。這些程序位於目標硬件上的閃存中的某一段特殊區域,它們提供了將Linux內核映像下載到閃存並繼續執行的方法。除了可以存儲並引導Linux映像之外,這些引導監視器還執行一定級別的系統測試和硬件初始化過程。在嵌入式平臺中,這些引導監視器通常會涉及第一階段和第二階段的引導加載程序。

在 PC 中,引導Linux 是從 BIOS 中的地址0xFFFF0 處開始的。BIOS的第一個步驟是加電自檢(POST)。POST的工作是對硬件進行檢測。BIOS的第二個步驟是進行本地設備的枚舉和初始化。

給定 BIOS 功能的不同用法之後,BIOS由兩部分組成:POST 代碼和運行時服務。當POST 完成之後,它被從內存中清理了出來,但是BIOS運行時服務依然保留在內存中,目標操作系統可以使用這些服務。

要引導一個操作系統,BIOS運行時會按照CMOS的設置定義的順序來搜索處於活動狀態並且可以引導的設備。引導設備可以是軟盤、CD-ROM、硬盤上的某個分區、網絡上的某個設備,甚至是USB閃存。

通常,Linux都是從硬盤上引導的,其中主引導記錄(MBR)中包含主引導加載程序。MBR是一個512 字節大小的扇區,位於磁盤上的第一個扇區中(0道0 柱面1 扇區)。當 MBR 被加載到RAM 中之後,BIOS 就會將控制權交給MBR。

註意:要查看 MBR的內容,請使用下面的命令:

# ddif=/dev/hda of=mbr.bin bs=512 count=1#od -xambr.bin

這 個dd 命令需要以root用戶的身份運行,它從/dev/hda(第一個IDE 盤)上讀取前 512 個字節的內容,並將其寫入mbr.bin 文件中。od命令會以十六進制和ASCII碼格式打印這個二進制文件的內容。

MBR 中的主引導加載程序是一個512 字節大小的映像,其中包含程序代碼和一個小分區表(參見圖2)。前 446個字節是主引導加載程序,其中包含可執行代碼和錯誤消息文本。接下來的64個字節是分區表,其中包含4 個分區的記錄(每個記錄的大小是16 個字節)。MBR以兩個特殊數字的字節(0xAA55)結束。這個數字會用來進行MBR的有效性檢查。

圖2. MBR剖析

技術分享圖片

主引導加載程序的工作是查找並加載次引導加載程序(第二階段)。它是通過在分區表中查找一個活動分區來實現這種功能的。當找到一個活動分區時,它會掃描分區表中的其他分區,以確保它們都不是活動的。當這個過程驗證完成之後,就將活動分區的引導記錄從這個設備中讀入RAM中並執行它。

4、第二階段引導加載程序

次引導加載程序(第二階段引導加載程序)可以更形象地稱為內核加載程序。這個階段的任務是加載Linux內核和可選的初始 RAM磁盤。

在 x86 PC環境中,第一階段和第二階段的引導加載程序一起稱為Linux Loader(LILO)或GRand Unified Bootloader(GRUB)。由於LILO有一些缺點,而 GRUB克服了這些缺點,因此下面讓我們就來看一下GRUB。

關於 GRUB,很好的一件事情是它包含了有關Linux文件系統的知識。GRUB不像LILO 一樣使用裸扇區,而是可以從ext2 或 ext3 文件系統中加載Linux 內核。它是通過將兩階段的引導加載程序轉換成三階段的引導加載程序來實現這項功能的。階段1 (MBR)引導了一個階段1.5 的引導加載程序,它可以理解包含Linux 內核映像的特殊文件系統。這方面的例子包括reiserfs_stage1_5(要從Reiser日誌文件系統上進行加載)或e2fs_stage1_5(要從ext2或 ext3 文件系統上進行加載)。當階段1.5 的引導加載程序被加載並運行時,階段2的引導加載程序就可以進行加載了。

當階段2加載之後,GRUB就可以在請求時顯示可用內核列表(在/etc/grub.conf中進行定義,同時還有幾個軟符號鏈接/etc/grub/menu.lst和/etc/grub.conf)。我們可以選擇內核甚至修改附加內核參數。另外,我們也可以使用一個命令行的shell對引導過程進行高級手工控制。

GRUB階段引導加載程序:/boot/grub目錄中包含了stage1、stage1.5和stage2引導加載程序,以及很多其他加載程序(例如,CR-ROM使用的是iso9660_stage_1_5)。

將第二階段的引導加載程序加載到內存中之後,就可以對文件系統進行查詢了,並將默認的內核映像和initrd映像加載到內存中。當這些映像文件準備好之後,階段2 的引導加載程序就可以調用內核映像了。

5、內核

當內核映像被加載到內存中,並且階段2 的引導加載程序釋放控制權之後,內核階段就開始了。內核映像並不是一個可執行的內核,而是一個壓縮過的內核映像。通常它是一個zImage(壓縮映像,小於512KB)或一個bzImage(較大的壓縮映像,大於512KB),它是提前使用zlib進行壓縮過的。在這個內核映像前面是一個例程,它實現少量硬件設置,並對內核映像中包含的內核進行解壓,然後將其放入高端內存中,如果有初始RAM磁盤映像,就會將它移動到內存中,並標明以後使用。然後該例程會調用內核,並開始啟動內核引導的過程。

當 bzImage(用於i386映像)被調用時,我們從./arch/i386/boot/head.S的start 匯編例程開始執行(主要流程圖請參看圖3)。這個例程會執行一些基本的硬件設置,並調用./arch/i386/boot/compressed/head.S中的startup_32例程。此例程會設置一個基本的環境(堆棧等),並清除Block Started by Symbol(BSS)。然後調用一個叫做decompress_kernel的C 函數(在./arch/i386/boot/compressed/misc.c中)來解壓內核。當內核被解壓到內存中之後,就可以調用它了。這是另外一個startup_32函數,但是這個函數在./arch/i386/kernel/head.S中。

在這個新的 startup_32函數(也稱為清除程序或進程0)中,會對頁表進行初始化,並啟用內存分頁功能。然後會為任何可選的浮點單元(FPU)檢測CPU的類型,並將其存儲起來供以後使用。然後調用start_kernel函數(在init/main.c中),它會將您帶入與體系結構無關的Linux 內核部分。實際上,這就是Linux 內核的 main函數。

圖3. Linux內核i386引導的主要函數流程

技術分享圖片

註意函數decompress_kernel就是顯示我們通常看到的解壓消息的地方:

Uncompressing Linux... Ok, booting thekernel.

通過調用start_kernel,會調用一系列初始化函數來設置中斷,執行進一步的內存配置,並加載初始RAM磁盤。最後,要調用kernel_thread(在arch/i386/kernel/process.c中)來啟動init函數,這是第一個用戶空間進程(user-spaceprocess)。最後,啟動空任務,現在調度器就可以接管控制權了(在調用cpu_idle之後)。通過啟用中斷,搶占式的調度器就可以周期性地接管控制權,從而提供多任務處理能力。

在內核引導過程中,初始 RAM磁盤(initrd)是由階段2引導加載程序加載到內存中的,它會被復制到RAM 中並掛載到系統上。這個initrd 會作為RAM中的臨時根文件系統使用,並允許內核在沒有掛載任何物理磁盤的情況下完整地實現引導。由於與外圍設備進行交互所需要的模塊可能是initrd的一部分,因此內核可以非常小,但是仍然需要支持大量可能的硬件配置。在內核引導之後,就可以正式裝備根文件系統了(通過pivot_root):此時會將initrd根文件系統卸載掉,並掛載真正的根文件系統。

initrd函數讓我們可以創建一個小型的Linux內核,其中包括作為可加載模塊編譯的驅動程序。這些可加載的模塊為內核提供了訪問磁盤和磁盤上的文件系統的方法,並為其他硬件提供了驅動程序。由於根文件系統是磁盤上的一個文件系統,因此initrd函數會提供一種啟動方法來獲得對磁盤的訪問,並掛載真正的根文件系統。在一個沒有硬盤的嵌入式環境中,initrd可以是最終的根文件系統,或者也可以通過網絡文件系統(NFS)來掛載最終的根文件系統。

6、Init

當內核被引導並進行初始化之後,內核就可以啟動自己的第一個用戶空間應用程序了。這是第一個調用的使用標準C庫編譯的程序。在此之前,還沒有執行任何標準的C 應用程序。

在桌面 Linux 系統上,第一個啟動的程序通常是/sbin/init。但是這不是一定的。很少有嵌入式系統會需要使用init所提供的豐富初始化功能(這是通過/etc/inittab進行配置的)。在很多情況下,我們可以調用一個簡單的shell腳本來啟動必需的嵌入式應用程序。

7、結束語

與Linux本身非常類似,Linux的引導過程也非常靈活,可以支持眾多的處理器和硬件平臺。最初,加載引導加載程序提供了一種簡單的方法,不用任何花架子就可以引導Linux。LILO引導加載程序對引導能力進行了擴充,但是它卻缺少文件系統的感知能力。最新一代的引導加載程序,例如GRUB,允許Linux 從一些文件系統(從Minix 到 Reise)上進行引導。

【轉】Linux 高級的視角來查看Linux引導過程