Linux C程式設計--fork 詳解
分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow
也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!
在Linux系統下學習一個系統函式最好的方法就是閱讀其原始碼,首先,給出fork函式的原始碼
/** linux/kernel/fork.c* //--fork()用於建立子程序* (C) 1991 Linus Torvalds*/ /** 'fork.c' contains the help-routines for the 'fork' system call* (see also system_call.s), and some misc functions ('verify_area').* Fork is rather simple, once you get the hang of it, but the memory* management can be a bitch. See 'mm/mm.c': 'copy_page_tables()'*/#include <errno.h>#include <linux/sched.h>#include <linux/kernel.h>#include <asm/segment.h>#include <asm/system.h> //--寫頁面驗證,若頁面不可寫,則複製頁面 extern void write_verify(unsigned long address);long last_pid=0; //--程序空間區域寫前驗證函式void verify_area(void * addr,int size){ unsigned long start; start = (unsigned long) addr; size += start & 0xfff; start &= 0xfffff000; start += get_base(current->ldt[2]); //--邏輯地址到線性地址的轉換 while (size>0) { size -= 4096; write_verify(start); start += 4096; }}int copy_mem(int nr,struct task_struct * p) //--複製記憶體頁表{ //--由於採用寫時複製技術,這裡只複製目錄和頁表項,不分配記憶體 unsigned long old_data_base,new_data_base,data_limit; unsigned long old_code_base,new_code_base,code_limit; code_limit=get_limit(0x0f); //--取段限長 data_limit=get_limit(0x17); old_code_base = get_base(current->ldt[1]); old_data_base = get_base(current->ldt[2]); if (old_data_base != old_code_base) panic("We don't support separate I&D"); if (data_limit < code_limit) panic("Bad data_limit"); new_data_base = new_code_base = nr * TASK_SIZE; p->start_code = new_code_base; set_base(p->ldt[1],new_code_base); set_base(p->ldt[2],new_data_base); if (copy_page_tables(old_data_base,new_data_base,data_limit)) { //--複製頁表 free_page_tables(new_data_base,data_limit); return -ENOMEM; } return 0;}/** Ok, this is the main fork-routine. It copies the system process* information (task[nr]) and sets up the necessary registers. It* also copies the data segment in it's entirety.*/ //--fork()子程式,它複製系統程序資訊,設定暫存器,複製資料段(程式碼段)int copy_process(int nr,long ebp,long edi,long esi,long gs,long none, long ebx,long ecx,long edx, long orig_eax, long fs,long es,long ds, long eip,long cs,long eflags,long esp,long ss) //--複製程序{ struct task_struct *p; int i; struct file *f; p = (struct task_struct *) get_free_page(); //--為新任務資料結構分配記憶體 if (!p) return -EAGAIN; task[nr] = p; *p = *current; /* NOTE! this doesn't copy the supervisor stack */ p->state = TASK_UNINTERRUPTIBLE; p->pid = last_pid; p->counter = p->priority; p->signal = 0; p->alarm = 0; p->leader = 0; /* process leadership doesn't inherit */ p->utime = p->stime = 0; p->cutime = p->cstime = 0; p->start_time = jiffies; p->tss.back_link = 0; p->tss.esp0 = PAGE_SIZE + (long) p; p->tss.ss0 = 0x10; p->tss.eip = eip; p->tss.eflags = eflags; p->tss.eax = 0; p->tss.ecx = ecx; p->tss.edx = edx; p->tss.ebx = ebx; p->tss.esp = esp; p->tss.ebp = ebp; p->tss.esi = esi; p->tss.edi = edi; p->tss.es = es & 0xffff; p->tss.cs = cs & 0xffff; p->tss.ss = ss & 0xffff; p->tss.ds = ds & 0xffff; p->tss.fs = fs & 0xffff; p->tss.gs = gs & 0xffff; p->tss.ldt = _LDT(nr); p->tss.trace_bitmap = 0x80000000; if (last_task_used_math == current) __asm__("clts ; fnsave %0 ; frstor %0"::"m" (p->tss.i387)); if (copy_mem(nr,p)) { task[nr] = NULL; free_page((long) p); return -EAGAIN; } for (i=0; i<NR_OPEN;i++) //--如果父程序中有檔案是開啟的,則將對應檔案的開啟次數增1 if (f=p->filp[i]) f->f_count++; if (current->pwd) current->pwd->i_count++; if (current->root) current->root->i_count++; if (current->executable) current->executable->i_count++; if (current->library) current->library->i_count++; set_tss_desc(gdt+(nr<<1)+FIRST_TSS_ENTRY,&(p->tss)); //--在GDT表中設定新任務的TSS和LDT set_ldt_desc(gdt+(nr<<1)+FIRST_LDT_ENTRY,&(p->ldt)); p->p_pptr = current; p->p_cptr = 0; p->p_ysptr = 0; p->p_osptr = current->p_cptr; if (p->p_osptr) p->p_osptr->p_ysptr = p; current->p_cptr = p; p->state = TASK_RUNNING; /* do this last, just in case */ return last_pid;}int find_empty_process(void) //--為新程序取得不重複的程序號last_pid{ int i; repeat: if ((++last_pid)<0) last_pid=1; for(i=0 ; i<NR_TASKS ; i++) if (task[i] && ((task[i]->pid == last_pid) || (task[i]->pgrp == last_pid))) goto repeat; for(i=1 ; i<NR_TASKS ; i++) if (!task[i]) return i; return -EAGAIN;}
以下給出說明:
fork函式
#include <sys/types.h>
#include <unistd.h> pid_t fork(void);
fork
呼叫失敗則返回-1,呼叫成功的返回值見下面的解釋。我們通過一個例子來理解fork
是怎樣建立新程序的。
這個程式的執行過程如下圖所示。
父程序初始化。
父程序呼叫
fork
,這是一個系統呼叫,因此進入核心。核心根據父程序複製出一個子程序,父程序和子程序的PCB資訊相同,使用者態程式碼和資料也相同。因此,子程序現在的狀態看起來和父程序一樣,做完了初始化,剛呼叫了
fork
進入核心,還沒有從核心返回。現在有兩個一模一樣的程序看起來都呼叫了
fork
進入核心等待從核心返回(實際上fork
只調用了一次),此外系統中還有很多別的程序也等待從核心返回。是父程序先返回還是子程序先返回,還是這兩個程序都等待,先去排程執行別的程序,這都不一定,取決於核心的排程演算法。如果某個時刻父程序被排程執行了,從核心返回後就從
fork
函式返回,儲存在變數pid
中的返回值是子程序的id,是一個大於0的整數,因此執下面的else
分支,然後執行for
迴圈,列印"This is the parent\n"
三次之後終止。如果某個時刻子程序被排程執行了,從核心返回後就從
fork
函式返回,儲存在變數pid
中的返回值是0,因此執行下面的if (pid == 0)
分支,然後執行for
迴圈,列印"This is the child\n"
六次之後終止。fork
呼叫把父程序的資料複製一份給子程序,但此後二者互不影響,在這個例子中,fork
呼叫之後父程序和子程序的變數message
和n
被賦予不同的值,互不影響。父程序每列印一條訊息就睡眠1秒,這時核心排程別的程序執行,在1秒這麼長的間隙裡(對於計算機來說1秒很長了)子程序很有可能被排程到。同樣地,子程序每列印一條訊息就睡眠1秒,在這1秒期間父程序也很有可能被排程到。所以程式執行的結果基本上是父子程序交替列印,但這也不是一定的,取決於系統中其它程序的執行情況和核心的排程演算法,如果系統中其它程序非常繁忙則有可能觀察到不同的結果。另外,讀者也可以把
sleep(1);
去掉看程式的執行結果如何。這個程式是在Shell下執行的,因此Shell程序是父程序的父程序。父程序執行時Shell程序處於等待狀態,當父程序終止時Shell程序認為命令執行結束了,於是列印Shell提示符,而事實上子程序這時還沒結束,所以子程序的訊息列印到了Shell提示符後面。最後游標停在
This is the child
的下一行,這時使用者仍然可以敲命令,即使命令不是緊跟在提示符後面,Shell也能正確讀取。
fork
函式的特點概括起來就是“呼叫一次,返回兩次”,在父程序中呼叫一次,在父程序和子程序中各返回一次。從上圖可以看出,一開始是一個控制流程,呼叫fork
之後發生了分叉,變成兩個控制流程,這也就是“fork”(分叉)這個名字的由來了。子程序中fork
的返回值是0,而父程序中fork
的返回值則是子程序的id(從根本上說fork
是從核心返回的,核心自有辦法讓父程序和子程序返回不同的值),這樣當fork
函式返回後,程式設計師可以根據返回值的不同讓父程序和子程序執行不同的程式碼。
fork
的返回值這樣規定是有道理的。fork
在子程序中返回0,子程序仍可以呼叫getpid
函式得到自己的程序id,也可以呼叫getppid
函式得到父程序的id。在父程序中用getpid
可以得到自己的程序id,然而要想得到子程序的id,只有將fork
的返回值記錄下來,別無它法。
fork
的另一個特性是所有由父程序開啟的描述符都被複制到子程序中。父、子程序中相同編號的檔案描述符在核心中指向同一個file
結構體,也就是說,file
結構體的引用計數要增加。