1. 程式人生 > >同步IO、非同步IO、阻塞IO、非阻塞IO之間的聯絡與區別

同步IO、非同步IO、阻塞IO、非阻塞IO之間的聯絡與區別

POSIX

同步IO、非同步IO、阻塞IO、非阻塞IO,這幾個詞常見於各種各樣的與網路相關的文章之中,往往不同上下文中它們的意思是不一樣的,以致於我在很長一段時間對此感到困惑,所以想寫一篇文章整理一下。

POSIX(可移植作業系統介面)把同步IO操作定義為導致程序阻塞直到IO完成的操作,反之則是非同步IO

按POSIX的描述似乎把同步和阻塞劃等號,非同步和非阻塞劃等號,但是為什麼有的人說同步IO不等於阻塞IO呢?先來說說幾種常見的IO模型吧。

IO模型

這裡統一使用Linux下的系統呼叫recv作為例子,它用於從套接字上接收一個訊息,因為是一個系統呼叫,所以呼叫時會從使用者程序空間切換到核心空間執行一段時間再切換回來

。預設情況下recv會等到網路資料到達並且複製到使用者程序空間或者發生錯誤時返回,而第4個引數flags可以讓它馬上返回。

  • 阻塞IO模型

使用recv的預設引數一直等資料直到拷貝到使用者空間,這段時間內程序始終阻塞。A同學用杯子裝水,開啟水龍頭裝滿水然後離開。這一過程就可以看成是使用了阻塞IO模型,因為如果水龍頭沒有水,他也要等到有水並裝滿杯子才能離開去做別的事情。很顯然,這種IO模型是同步的。

image

  • 非阻塞IO模型

改變flags,讓recv不管有沒有獲取到資料都返回,如果沒有資料那麼一段時間後再呼叫recv看看,如此迴圈。B同學也用杯子裝水,開啟水龍頭後發現沒有水,它離開了,過一會他又拿著杯子來看看……在中間離開的這些時間裡,B同學離開了裝水現場(回到使用者程序空間),可以做他自己的事情。這就是非阻塞IO模型。但是它只有是檢查無資料的時候是非阻塞的,在資料到達的時候依然要等待複製資料到使用者空間(等著水將水杯裝滿),因此它還是同步IO。

image

  • IO複用模型

這裡在呼叫recv前先呼叫select或者poll,這2個系統呼叫都可以在核心準備好資料(網路資料到達核心)時告知使用者程序,這個時候再呼叫recv一定是有資料的。因此這一過程中它是阻塞於select或poll,而沒有阻塞於recv,有人將非阻塞IO定義成在讀寫操作時沒有阻塞於系統呼叫的IO操作(不包括資料從核心複製到使用者空間時的阻塞,因為這相對於網路IO來說確實很短暫),如果按這樣理解,這種IO模型也能稱之為非阻塞IO模型,但是按POSIX來看,它也是同步IO,那麼也和樓上一樣稱之為同步非阻塞IO吧。

這種IO模型比較特別,分個段。因為它能同時監聽多個檔案描述符(fd)。這個時候C同學來裝水,發現有一排水龍頭,舍管阿姨告訴他這些水龍頭都還沒有水,等有水了告訴他。於是等啊等(select呼叫中),過了一會阿姨告訴他有水了,但不知道是哪個水龍頭有水,自己看吧。於是C同學一個個開啟,往杯子裡裝水(recv)。這裡再順便說說鼎鼎大名的epoll(高效能的代名詞啊),epoll也屬於IO複用模型,主要區別在於舍管阿姨會告訴C同學哪幾個水龍頭有水了,不需要一個個開啟看(當然還有其它區別)。

image

  • 訊號驅動IO模型

通過呼叫sigaction註冊訊號函式,等核心資料準備好的時候系統中斷當前程式,執行訊號函式(在這裡面呼叫recv)。D同學讓舍管阿姨等有水的時候通知他(註冊訊號函式),沒多久D同學得知有水了,跑去裝水。是不是很像非同步IO?很遺憾,它還是同步IO(省不了裝水的時間啊)。

image

  • 非同步IO模型

呼叫aio_read,讓核心等資料準備好,並且複製到使用者程序空間後執行事先指定好的函式。E同學讓舍管阿姨將杯子裝滿水後通知他。整個過程E同學都可以做別的事情(沒有recv),這才是真正的非同步IO。

image

總結

IO分兩階段:

1.資料準備階段
2.核心空間複製回用戶程序緩衝區階段

一般來講:阻塞IO模型、非阻塞IO模型、IO複用模型(select/poll/epoll)、訊號驅動IO模型都屬於同步IO,因為階段2是阻塞的(儘管時間很短)。只有非同步IO模型是符合POSIX非同步IO操作含義的,不管在階段1還是階段2都可以幹別的事。