1. 程式人生 > >獻給新手,如何閱讀Linux原始碼(轉)

獻給新手,如何閱讀Linux原始碼(轉)

常常有人問:我想學習核心,需要什麼基礎嗎?Linus Torvalds本人是這樣回答的:你必須使用過Linux。 這個……還是有點太泛了吧,我想下面幾個基礎可能還是需要的,儘管不一定必需: 

  1, 關於作業系統理論的最初級的知識。不需要通讀並理解《作業系統概念》《現代作業系統》等鉅著,但總要知道分時(time-shared)和實時(real-time)的區別是什麼,程序是個什麼東西,CPU和系統匯流排、記憶體的關係(很粗略即可),等等。 
  2, 關於C語言。不需要已經很精通C語言,只要能熟練編寫C程式,能看懂連結串列、散列表等資料結構的C實現,用過gcc編譯器,就可以了。當然,如果已經精通C語言顯然是大佔便宜的。 
  3, 關於CPU的知識。這塊兒可以在學習核心過程中補,但這樣的話你就需要看講解很詳細的書,比方後面將會提到的《情景分析》。你是否熟悉 Intel 80386 CPU?嘗試著回答這幾個問題來判斷一下:1)說出80386的中斷門和陷阱門的區別;2)說出保護模式與真實模式的區別;3)多處理器機器上,普通的讀-改-寫回一塊記憶體這樣的動作,為什麼需要特殊的手段來保護。等等。講解基於其它CPU的Linux核心的書,目前好象只有一本《IA64Linux核心:設計與實現》──也還是Intel的,其它都是講解基於IA32的。 
  以上算是知識方面吧,如果還要再補充一條,我想就是:動手編譯過核心。 


  好了,我們接下來走。好多人裝上Linux之後,第一件事找到核心原始碼所在的路徑,開啟一個C程式檔案,開始嘩嘩譁翻頁,看看大名鼎鼎的Linux核心程式碼到底長啥模樣──然後關閉。這是可理解的,但卻不是學習的方法。剛開始,必須從讀書入手。[color=red]至少要對核心有一個Overview 之後,才有可能帶著問題去試圖閱讀原始碼本身。 [/color]下面就講一下我讀過的幾本書: 
  1, 《Linux核心設計與實現》,英文名Linux Kernel Development(所以有人叫它LKD),機械工業出版社,¥35, 美國Robert Love著,陳莉君譯者。 評說: 
  此書是當今首屈一指的入門最佳圖書。作者是為2.6核心加入了搶佔的人,對排程部分非常精通,而排程是整個系統的核心,因此本書是很權威的。這本書講解淺顯易懂,全書沒有列舉一條彙編語句,但是給出了整個Linux作業系統2.6核心的概觀,使你能通過閱讀迅速獲得一個overview。而且對核心中較為混亂的部分(如下半部),它的講解是最透徹的。對沒怎麼深入核心的人來說,這是強烈推薦的一本書。 
   翻譯:翻譯水平、負責任程度都不錯,但是印刷存在一些錯誤。買了此書的朋友可以參考我在Linux高階應用版的《Linux核心設計與實現中文版勘誤》: 
http://bbs.chinaunix.net/forum/viewtopic.php?t=541234 
另外,此書2005年有了第二版,目前尚無中譯本面世。我就是對照著2nd-en勘誤1st-cn的。 

  2, 《Linux核心原始碼情景分析》上、下。毛德操、胡希明著,浙江大學出版社,上冊¥80,下冊¥70. 評說: 
  本書是基於2.4.0核心的,比較早,也沒聽說會出第二版。上冊講解記憶體管理、中斷、異常與系統呼叫、程序控制、檔案系統與傳統Unix IPC;下冊講解socket、裝置驅動、SMP和引導。關於這套書的評價褒貶不一,我個人認為其深度是同類著作中最優秀的。本書基於Intel IA32體系,由於厚度大,很多體系上的知識都捎帶講解了,所以如果你想深入瞭解核心的工作機制而又不非常熟悉Intel CPU的體系構造,本書是最合適的。缺點是:版本較老,沒有TCP/IP協議棧部分(它講的socket只是Unix域協議的),圖表太少,不適合初學者入門。還有就是對學生朋友來說,可能書價偏高,這樣的話可以考慮先買上冊,因為上冊是核心部分,下冊一大部分都在講具體PCI/ISA/USB裝置的驅動。 
  翻譯:沒什麼翻譯,作者是國人,而且行文流暢。本人書桌上諸多計算機經典圖書當中,這套是唯一又經典又無閱讀障礙的。 
  www.linuxforum.net核心版好多朋友已經把這書讀到六七遍了,我很慚愧,上冊差不多讀熟了,下冊就SMP部分還看過──但這就花費了整整1年的時間,還有好多弄不懂的。這裡順便說明另外一個研究核心常見的誤區:目標太龐大。要知道Linux核心(最新的2.6.13)bzip2壓縮之後 37M,解壓縮之後244M,根本不是哪個人能夠吃透的。即使是核心的核心開發團隊中,恐怕也只Linus Torvalds、Alan Cox、 David Miller、Ingo Molnar寥寥數人會有比較全面的瞭解,其它人都是做自己專門的部分。 我自己來說,目前已經決定放棄記憶體管理的全部(slab層、LRU、rbtree等)、檔案系統部分、外設驅動部分,暫時也沒打算弄IA32以外的其它體系的部分。 

  3, 《深入理解Linux核心》第二版。中國電力出版社。也是陳莉君譯。此書是Linux核心黑客在推薦圖書時的首選。 評說:
  此書C版的converse兄送了我一本第一版,因此就沒買第二版,比較後悔。因此只就第一版說一說,第一版基於2.2,第二版2.4 。我見 O'Reilly官方主頁上說第三版的英文版將於2005年11月出版,也不知咱們何時才能見到。此書圖表很多,形象地給出了關鍵資料結構的定義,與《情景分析》相比,本書內容緊湊,不會一個問題講解動輒上百頁,有提綱挈領的功用,但是深度上要遜於《情景分析》。 

  4, 其它的幾本書。市面上能見到的其它的Linux核心的圖書,象《Linux裝置驅動程式》、《Linux核心原始碼完全註釋》以及新出的《Linux核心分析及程式設計》等。 
  《Linux裝置驅動程式》第二版是基於2.4的,中文翻譯不錯,中國電力出版。這書強調動手實踐,但它是講解“裝置驅動”的,不是最核心的東西,而且有些東西沒硬體的話無法實踐,可能更適合驅動開發的程式設計師吧,不太適合那些For fun and profit的人。此書有第三版英文版,東南大學出版社影印,講解2.6的,行文流暢,講解的面也比第二版更廣泛,我讀過其中關於同步與互斥、記憶體分配的部分,感覺很不錯。 
  《Linux核心原始碼完全註釋》(機械工業出版社)是同濟大學的博士生趙炯的著作,講解0.1Linux核心,我沒買也沒看,有看過的朋友說一說。 
  《Linux核心分析及程式設計》(電子工業出版社)是剛剛出版的,國人寫的,講解2.6.11 。很多人說好,但有人說不夠系統,我沒買,不敢評說。 
  還有一本清華出的《Linux核心程式設計指南(第三版)》,原書應該是好書,但是翻譯、排版十分糟爛,脫字跳行,根本沒法看,我買了一本又扔掉了。 

  5, 其它資源。 TLDP(The Linux Documentation Project)有大量文件,其中不少是關於核心的,有些是在國外出版過的,象《Linux Kernel Interls》《The Linux Kernel》《Linux Kernel Module Programming Guide》等,作者都是親身參加開發的人,著作較為可信。 
Http://www.linuxforum.net 
  中國Linux論壇的核心版。該版是研究核心的中文Linux社群中水平最高的,有很多專家級別的牛人,強烈推薦去學習一下(但建議不要問太過分簡單的問題,人家脾氣再好也會煩的^_^),它的置頂貼簡直是一個包羅永珍的FAQ,精華區也有很多資料。只可惜太過曲高和寡,人氣不是很旺。 

  6, 一本不是講解Linux的書:《現代體系結構上的Unix系統:核心程式設計師的SMP和Caching技術》,人民郵電出版社2003版,定價¥39. 本書雖然不是講解Linux,但是對所有Unix核心都是適用的,適合對SMP和CPU的Cache這些組成原理知識不是很熟的朋友,而且是很多國外牛人推薦的書。中文版翻譯非常負責。 


  還有個很重要的問題:怎樣瀏覽核心原始碼。有的朋友喜歡在Windows上工作,用Source Insight;有的在Linux,用Source Navigator;還有專門瀏覽原始碼的軟體,象lxr (Linux Cross Reference);還有用ctags/ectags/cscope等,這些都是很優秀的軟體。我個人用Vim + ctags瀏覽(參考了www.linuxforum.net核心版wheelz大俠的文件,)。 

  此外,前邊已經提到的一個重要的問題是:你研究核心的目的是什麼, 開發? 樂趣?如果是開發,而且是國內做開發,把kernel API熟悉一下就差不太多了(你也知道國內的水平有多差),比方說copy_from_user()、kmalloc()函式等,kernel API在Internet上找得到,編譯核心時也可以用 DocBook生成(具體請參考核心原始碼包下的README檔案);如果是研究,那就差別很大了,需要下很大的苦功:會用kmalloc()絕不說明你懂得Linux核心的虛存管理子系統,正如同會講漢語不說明你懂中國文化一樣。 

地址:http://blog.chinaunix.net/uid-479984-id-2114888.html