1. 程式人生 > >程式的可重入與不可重入

程式的可重入與不可重入

可重入程式是指該程式被某程式呼叫,但還未結束,又被另一個程式呼叫。 可重入程式是通過減少對換資訊量來改善系統響應時間的。

文章主要轉自 http://www.cppblog.com/prayer/archive/2009/07/05/89270.html

這種情況出現在多工系統當中,在任務執行期間捕捉到訊號並對其進行處理時,程序正在執行的指令序列就被訊號處理程式臨時中斷。如果從訊號處理程式返回,則繼續執行程序斷點處的正常指令序列,從重新恢復到斷點重新執行的過程中,函式所依賴的環境沒有發生改變,就說這個函式是可重入的,反之就是不可重入的。

眾所周知,在程序中斷期間,系統會儲存和恢復程序的上下文,然而恢復的上下文僅限於返回地址,cpu暫存器等之類的少量上下文,而函式內部使用的諸如全域性或靜態變數,buffer等並不在保護之列,所以如果這些值在函式被中斷期間發生了改變,那麼當函式回到斷點繼續執行時,其結果就不可預料了。打個比方,比如malloc,將如一個程序此時正在執行malloc分配堆空間,此時程式捕捉到訊號發生中斷,執行訊號處理程式中恰好也有一個malloc,這樣就會對程序的環境造成破壞,
因為malloc通常為它所分配的儲存區維護一個連結表,插入執行訊號處理函式時,程序可能正在對這張表進行操作,而訊號處理函式的呼叫剛好覆蓋了程序的操作,造成錯誤。

滿足下面條件之一的多數是不可重入函式:
(1)使用了靜態資料結構;
(2)呼叫了malloc或free;
(3)呼叫了標準I/O函式;標準io庫很多實現都以不可重入的方式使用全域性資料結構。
(4)進行了浮點運算.許多的處理器/編譯器中,浮點一般都是不可重入的 (浮點運算大多使用協處理器或者軟體模擬來實現。

1) 訊號處理程式A內外都呼叫了同一個不可重入函式B;B在執行期間被訊號打斷,進入A (A中呼叫了B),完事之後返回B被中斷點繼續執行,這時B函式的環境可能改變,其結果就不可預料了。

2) 多執行緒共享程序內部的資源,如果兩個執行緒A,B呼叫同一個不可重入函式F,A執行緒進入F後,執行緒排程,切換到B,B也執行了F,那麼當再次切換到執行緒A時,其呼叫F的結果也是不可預料的。
在訊號處理程式中即使呼叫可重入函式也有問題要注意。作為一個通用的規則,當在訊號處理程式中呼叫可重入函式時,應當在其前儲存errno,並在其後恢復errno。(因為每個執行緒只有一個errno變數,訊號處理函式可能會修改其值,要了解經常被捕捉到的訊號是SIGCHLD,其訊號處理程式通常要呼叫一種wait函式,而各種wait函式都能改變errno。)

可重入函式列表:

_exit()、 access()、alarm()、cfgetispeed()、cfgetospeed()、cfsetispeed()、cfsetospeed ()、chdir()、chmod()、chown()、close()、creat()、dup()、dup2()、execle()、 execve()、fcntl()、fork()、fpathconf ()、fstat()、fsync()、getegid()、 geteuid()、getgid()、getgroups()、getpgrp()、getpid()、getppid()、getuid()、 kill()、link()、lseek()、mkdir()、mkfifo()、 open()、pathconf()、pause()、pipe()、raise()、read()、rename()、rmdir()、setgid ()、setpgid()、setsid()、setuid()、 sigaction()、sigaddset()、sigdelset()、sigemptyset()、sigfillset()、 sigismember()、signal()、sigpending()、sigprocmask()、sigsuspend()、sleep()、 stat()、sysconf()、tcdrain()、tcflow()、tcflush()、tcgetattr()、tcgetpgrp()、 tcsendbreak()、tcsetattr()、tcsetpgrp()、time()、times()、 umask()、uname()、unlink()、utime()、wait()、waitpid()、write()。

書上關於訊號處理程式中呼叫不可重入函式的例子:

#include <stdlib.h>
#include <stdio.h>
#include <pwd.h>

static void func(int signo)
{
    struct passwd *rootptr;
    if( ( rootptr = getpwnam( "root" ) ) == NULL )
    {
        err_sys( "getpwnam error" );
    }
    signal(SIGALRM,func);
    alarm(1);
}

int main(int argc, char** argv)
{
    signal(SIGALRM,func);
    alarm(1);
    for(;;)
    {
        if( ( ptr = getpwnam("sar") ) == NULL )
        {
            err_sys( "getpwnam error" );
        }
    }
    return 0;
}

signal了一個SIGALRM,而後設定一個定時器,在for函式執行期間的某個時刻,也許就是在getpwnam函式執行期間,相應訊號發生中斷,進入訊號處理函式func,在執行func期間又收到alarm發出的訊號,getpwnam可能再次中斷,這樣就很容易發生不可預料的問題。

可重入函式與不可重入函式

主要用於多工環境中,一個可重入的函式簡單來說就是可以被中斷的函式,也就是說,可以在這個函式執行的任何時刻中斷它,轉入OS排程下去執行另外一段程式碼,而返回控制時不會出現什麼錯誤;而不可重入的函式由於使用了一些系統資源,比如全域性變數區,中斷向量表等,所以它如果被中斷的話,可能會出現問題,這類函式是不能執行在多工環境下的。

也可以這樣理解,重入即表示重複進入,首先它意味著這個函式可以被中斷,其次意味著它除了使用自己棧上的變數以外不依賴於任何環境(包括static),這樣的函式就是purecode(純程式碼)可重入,可以允許有該函式的多個副本在執行,由於它們使用的是分離的棧,所以不會互相干擾。如果確實需要訪問全域性變數(包括static),一定要注意實施互斥手段。可重入函式在並行執行環境中非常重要,但是一般要為訪問全域性變數付出一些效能代價。

編寫可重入函式時,若使用全域性變數,則應通過關中斷、訊號量(即P、V操作)等手段對其加以保護。

說明:若對所使用的全域性變數不加以保護,則此函式就不具有可重入性,即當多個程序呼叫此函式時,很有可能使有關全域性變數變為不可知狀態。

示例:假設Exam是int型全域性變數,函式Squre_Exam返回Exam平方值。那麼如下函式不具有可重入性。

unsigned int example( int para ) {

     unsigned int temp;
         Exam = para; // (**)
         temp = Square_Exam( );
         return temp;
     }
    此函式若被多個程序呼叫的話,其結果可能是未知的,因為當(**)語句剛執行完後,另外一個使用本函式的程序可能正好被啟用,那麼當新啟用的程序執行到此函式時,將使Exam賦與另一個不同的para值,所以當控制重新回到“temp = Square_Exam( )”後,計算出的temp很可能不是預想中的結果。此函式應如下改進。

     unsigned int example( int para ) {
         unsigned int temp;
         [申請訊號量操作] //(1)
         Exam = para;
         temp = Square_Exam( );
         [釋放訊號量操作]
         return temp;
     }
     (1)若申請不到“訊號量”,說明另外的程序正處於給Exam賦值並計算其平方過程中(即正在使用此訊號),本程序必須等待其釋放訊號後,才可繼續執行。若申請到訊號,則可繼續執行,但其它程序必須等待本程序釋放訊號量後,才能再使用本訊號。

    保證函式的可重入性的方法:
    在寫函式時候儘量使用區域性變數(例如暫存器、堆疊中的變數),對於要使用的全域性變數要加以保護(如採取關中斷、訊號量等方法),這樣構成的函式就一定是一個可重入的函式。
     VxWorks中採取的可重入的技術有:
     * 動態堆疊變數(各子函式有自己獨立的堆疊空間)
     * 受保護的全域性變數和靜態變數
     * 任務變數

--------------------------------------------------
    在實時系統的設計中,經常會出現多個任務呼叫同一個函式的情況。如果這個函式不幸被設計成為不可重入的函式的話,那麼不同任務呼叫這個函式時可能修改其他任務呼叫這個函式的資料,從而導致不可預料的後果。那麼什麼是可重入函式呢?
所謂可重入函式是指一個可以被多個任務呼叫的過程,任務在呼叫時不必擔心資料是否會出錯。不可重入函式在實時系統設計中被視為不安全函式。

滿足下列條件的函式多數是不可重入的:
     1) 函式體內使用了靜態的資料結構;
     2) 函式體內呼叫了malloc()或者free()函式;
     3) 函式體內呼叫了標準I/O函式。

    下面舉例加以說明。
     A. 可重入函式
     void strcpy(char *lpszDest, char *lpszSrc){
         while(*lpszDest++=*lpszSrc++);
         *dest=0;
     }

     B. 不可重入函式1
     charcTemp;//全域性變數
     void SwapChar1(char *lpcX, char *lpcY){
         cTemp=*lpcX;
         *lpcX=*lpcY;
         lpcY=cTemp;//訪問了全域性變數
     }

     C. 不可重入函式2
     void SwapChar2(char *lpcX,char *lpcY){
         static char cTemp;//靜態區域性變數
         cTemp=*lpcX;
         *lpcX=*lpcY;
         lpcY=cTemp;//使用了靜態區域性變數
     }

    問題1,如何編寫可重入的函式?
    答:在函式體內不訪問那些全域性變數,不使用靜態區域性變數,堅持只使用區域性變數,寫出的函式就將是可重入的。如果必須訪問全域性變數,記住利用互斥訊號量來保護全域性變數。

    問題2,如何將一個不可重入的函式改寫成可重入的函式?
    答:把一個不可重入函式變成可重入的唯一方法是用可重入規則來重寫它。其實很簡單,只要遵守了幾條很容易理解的規則,那麼寫出來的函式就是可重入的。
     1) 不要使用全域性變數。因為別的程式碼很可能覆蓋這些變數值。
     2) 在和硬體發生互動的時候,切記執行類似disinterrupt()之類的操作,就是關閉硬體中斷。完成互動記得開啟中斷,在有些系列上,這叫做“進入/退出核心”。
     3) 不能呼叫其它任何不可重入的函式。
     4) 謹慎使用堆疊。最好先在使用前先OS_ENTER_KERNAL。

    堆疊操作涉及記憶體分配,稍不留神就會造成益出導致覆蓋其他任務的資料,所以,請謹慎使用堆疊!最好別用!很多黑客程式就利用了這一點以便系統執行非法程式碼從而輕鬆獲得系統控制權。還有一些規則,總之,時刻記住一句話:保證中斷是安全的!

    例項問題:曾經設計過如下一個函式,在程式碼檢視的時候被提醒有bug,因為這個函式是不可重入的,為什麼?
     unsigned int sum_int( unsigned int base ) {
         unsigned int index;
         static unsigned int sum = 0; // 注意,是static型別
         for (index = 1; index <= base; index++)
             sum += index;
         return sum;
     }


    分析:所謂的函式是可重入的(也可以說是可預測的),即只要輸入資料相同就應產生相同的輸出。這個函式之所以是不可預測的,就是因為函式中使用了static變數,因為static變數的特徵,這樣的函式被稱為:帶“內部儲存器”功能的的函式。因此如果需要一個可重入的函式,一定要避免函式中使用static變數,這種函式中的static變數,使用原則是,能不用盡量不用。
    將上面的函式修改為可重入的函式,只要將宣告sum變數中的static關鍵字去掉,變數sum即變為一個auto型別的變數,函式即變為一個可重入的函式。
    當然,有些時候,在函式中是必須要使用static變數的,比如當某函式的返回值為指標型別時,則必須是static的區域性變數的地址作為返回值,若為auto型別,則返回為錯指標。