轉--select/poll/epoll到底是什麼一回事

阿新 • • 發佈：2018-11-12

面試題：說說select/poll/epoll的區別。 
這是面試後臺開發時的高頻面試題，屬於網路程式設計和IO那一塊的知識。Android裡面的Handler訊息處理機制的底層實現就用到了epoll。 
為此，我在Google上看了很多相關文章，才大概搞懂是怎麼一回事。

背景知識
檔案描述符fd
檔案描述符（File descriptor）是電腦科學中的一個術語，是一個用於表述指向檔案的引用的抽象化概念。

檔案描述符在形式上是一個非負整數。實際上，它是一個索引值，指向核心為每一個程序所維護的該程序開啟檔案的記錄表。當程式開啟一個現有檔案或者建立一個新檔案時，核心向程序返回一個檔案描述符。在程式設計中，一些涉及底層的程式編寫往往會圍繞著檔案描述符展開。但是檔案描述符這一概念往往只適用於UNIX、Linux這樣的作業系統。在Linux系統中，流在核心中可以表示成檔案的形式。

IO模型
IO可以理解成對流的操作。

一般對於一個read操作發生時，它會經歷兩個階段。

第一個階段是等待資料準備。
第二個階段是真正讀取的過程，將資料從核心緩衝區拷貝到使用者程序緩衝區中，
而五種常見的IO模型也是圍繞這兩個階段來區分的。

同步模型（synchronous IO） 
阻塞IO（bloking IO）
非阻塞IO（non-blocking IO）
多路複用IO（multiplexing IO）
訊號驅動式IO（signal-driven IO）
非同步IO（asynchronous IO）
其中，IO多路複用就是一種機制，實現一個程序可以監視多個描述符，一旦某個描述符就緒，就能夠通知程式進行相應的讀寫操作。IO多路複用相比於多執行緒的優勢在於系統的開銷小，系統不必建立和維護程序或執行緒，免去了執行緒或程序的切換帶來的開銷。而作業系統支援IO多路複用的系統呼叫有select，poll和epoll。

select
先來看看select的函式宣告：

int select (int n, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
1
fd_set是表示檔案描述符集合的資料結構。readfds，writefds和exceptfds分別對應三類檔案描述符集。當select被呼叫時，內部邏輯如下：

將3個fd集copy到核心，這裡限制了fd最大數量為1024
執行緒阻塞，直到超時或核心檢測到有fd可讀或可寫，核心會通知監控者select，select返回可讀或可寫的fd總數
那麼使用者程序如何找到可讀可寫的fd呢？select會將之前傳遞給核心的fd集從核心copy到使用者程序。使用者程序通過遍歷的方式找到可讀可寫的fd。
缺點：

copy次數過多，而且每次呼叫select方法都要進行fd集的copy操作
select監控fd數量有限
使用者程序通過遍歷的方式找到可讀寫的fd，時間複雜度為o(n)，IO效率隨著fd數量增多而線性下降
poll
先來看看poll的函式宣告：

int poll (struct pollfd *fds, unsigned int nfds, int timeout);
1
pollfd是表示檔案描述符集合的資料結構。

struct pollfd {
    int fd; //檔案描述符
    short events; //監視的請求事件
    short revents; //已發生的事件
};
1
2
3
4
5
poll與select差不多，但poll的pollfd沒有最大數量的限制，可是IO效率依舊沒有提升orz。

epoll
select/poll都只有一個方法，而epoll的操作過程有3個方法，分別是epoll_create()， epoll_ctl()，epoll_wait()。

epoll_create()
int epoll_create(int size)；//用於建立一個epoll的控制代碼，size是指監聽的描述符個數。
1
該方法會在核心建立專屬於epoll的高速cache區，並在該緩衝區建立紅黑樹和就緒連結串列，使用者態傳入的檔案控制代碼將被放到紅黑樹中。

epoll_ctl()
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)；
1
該方法對epoll_create()所建立的核心cache區進行操作的，操作物件是需要監聽的fd。

比如，把要監聽的fd註冊到cache內，那麼epoll_ctl()會將fd插入到紅黑樹中，並向核心註冊了該fd的回撥函式。核心在檢測到某fd可讀可寫時則呼叫該回調函式，而回調函式的工作是將fd放到就緒連結串列。

epoll_wait()
int epoll_wait(int epfd, struct epoll_event *events,int maxevents, int timeout);  
1
epoll_wait只需監控就緒連結串列，如果就緒連結串列有fd，則表示該fd可讀可寫，並返回給使用者態（少量的copy）；

該函式返回需要處理的事件數目，如返回0表示已超時。

小結
執行epoll_create時，在建立了紅黑樹和就緒連結串列。執行epoll_ctl時，如果增加fd，則檢查在紅黑樹中是否存在，存在立即返回，不存在則新增到樹上，然後向核心註冊回撥函式，用於當中斷事件到來時向準備就緒連結串列中插入資料。執行epoll_wait時返回就緒連結串列裡的資料即可。

因此，epoll比select和poll高效的原因是：

減少了使用者態和核心態之間檔案控制代碼的copy
降低了在檔案控制代碼集中查詢的時間複雜度。用紅黑樹維護fd集，可以將查詢fd的時間複雜度降為o(logn)。
參考
https://www.zhihu.com/question/20122137
http://www.jianshu.com/p/dfd940e7fca2#
http://gityuan.com/2015/12/06/linux_epoll/

轉--select/poll/epoll到底是什麼一回事

面試題：說說select/poll/epoll的區別。這是面試後臺開發時的高頻面試題，屬於網路程式設計和IO那一塊的知識。Android裡面的Handler訊息處理機制的底層實現就用到了epoll。為此，我在Google上看了很多相關文章，才大概搞懂是怎麼一回事。背景知識檔案描述符fd 檔案描述

[轉]select/poll/epoll對比分析

目錄 1.select 2.poll 3.epoll 3.1 epoll_create() 3.2 epoll_ctl() 3.3 epoll_wait() 4.對比 select/poll/e

Netty系列一：IO網路模型(select/poll/epoll)

一概念說明在進行解釋之前，首先要說明幾個概念： - 使用者空間和核心空間 - 程序切換 - 程序的阻塞 - 檔案描述符 - 快取 I/O 使用者空間與核心空間現在作業系統都是採用虛擬儲存器，那麼對32位作業系統而言，它的定址空間（虛

linux下select/poll/epoll機制的比較

解決方案 socket 下一步 linux 操作系統 select、poll、epoll簡介epoll跟select都能提供多路I/O復用的解決方案。在現在的Linux內核裏有都能夠支持，其中epoll是Linux所特有，而select則應該是POSIX所規定，一般操作系統均有實現sele

Linux內核中網絡數據包的接收-第二部分 select/poll/epoll

() 帶來 back 都是 tips ole sni 得到一次和前面文章的第一部分一樣，這些文字是為了幫別人或者自己理清思路的。而不是所謂的源代碼分析。想分析源代碼的，還是直接debug源代碼最好，看不論什麽文檔以及書都是下策。因此這類幫人理清思路的文章盡可能的記成

linux下select,poll,epoll的使用與重點分析

end 復用 cps typedef lis callback 指向 hub 機制好久沒用I/O復用了，感覺差點兒相同都快忘完了。記得當初剛學I/O復用的時候花了好多時間。可是因為那會不太愛寫博客，導致花非常多時間搞明確的東西，依舊非常easy忘記。俗

select poll epoll

模型執行 lec read sets 深入理解 lan 模式 vps 轉：https://zhidao.baidu.com/question/687563051895364284.html以一個生活中的例子來解釋. 假設你在大學中讀書,要等待一個朋友來訪,而這個朋友只知道

I/O多路復用之select,poll,epoll簡介

重新才會增長文件描述 brush 重新編譯 () 情況包含一、select 1.起源 select最早於1983年出現在4.2BSD中（BSD是早期的UNIX版本的分支）。它通過一個select()系統調用來監視多個文件描述符的數組，當select()返回後，該

I/O復用：select poll epoll相關問題

底層實現時有 ren time dset ble 設置指針類型等待 select： select每次都會將用戶態數據拷貝到內核態，包括三個fd_set和time_val，最後將更改後的數據從內核態重新拷貝到用戶態，這也是select效率低下的原因之一。參數time

Linux I/O復用中select poll epoll模型的介紹及其優缺點的比較

創建等待歸類好的第一個 class ews tor client 關於I/O多路復用： I/O多路復用(又被稱為“事件驅動”)，首先要理解的是。操作系統為你

select —— poll —— epoll

recv blocking int 服務端 exc __name__ gif 文件指針 soc import socket,select s=socket.socket() s.setblocking(False) s.setsockopt(socket.SOL_SOC

多程序、協程、事件驅動及select poll epoll

多執行緒的使用場景 IO操作不佔用CPU 計算佔用cpu python多執行緒不適合cpu密集型操作的任務，適合IO操作密集型的任務多程序簡單的一個多程序例子：（用於理解對多執行緒方法的使用）和執行緒的方法類似，下面是一個簡單的多程序程式碼 import time,

select\poll\epoll\kqueue\IOCP的區別及用法

先來看看linux manual對三者的介紹 1、select select() and pselect() allow a program to monitor multiple file descriptors, waiting until

select,poll,epoll的歸納總結區分

1 Select、Poll與Epoll簡介 Select select本質上是通過設定或者檢查存放fd標誌位的資料結構來進行下一步處理。這樣所帶來的缺點是： 1 單個程序可監視的fd數量被限制 2 需要維護一個用來存放大量fd的資料結構，這樣會使得使用者空間和核心空間在傳遞該結構時複製開銷大 3

select,poll,epoll的內部機制調研

在百度文庫中看到這個帖子，總體講的不錯，但是有點錯誤，所以轉帖過來並加以改正。另外在《Linux裝置驅動程式》中也有關於poll，select和epoll在驅動層面的支援的描述，可以參考。 1 等待佇列實現原理 1.1 功能介紹程序有多種狀態，當程序做好準備後，它

select,poll,epoll三種IO機制對比介紹

　select，poll，epoll都是IO多路複用的機制。I/O多路複用就通過一種機制，可以監視多個描述符，一旦某個描述符就緒（一般是讀就緒或者寫就緒），能夠通知程式進行相應的讀寫操作。但select，poll，epoll本質上都是同步I/O，因為他們都需要在讀寫事件就緒後自己負責進行讀寫，也就是

Linux多路複用之select/poll/epoll實現原理及優缺點對比

一、select的實現原理支援阻塞操作的裝置驅動通常會實現一組自身的等待佇列如讀/寫等待佇列用於支援上層(使用者層)所需的BLOCK或NONBLOCK操作。當應用程式通過裝置驅動訪問該裝置時(預設為

Linux I/O複用中select poll epoll模型的介紹及其優缺點的比較

關於I/O多路複用： I/O多路複用(又被稱為“事件驅動”)，首先要理解的是，作業系統為你提供了一個功能，當你的某個socket可讀或者可寫的時候，它可以給你一個通知。這樣當配合非阻塞的socket使用時，只有當系統通知我哪個描述符可讀了，我才去執行read操

select/poll/epoll對比分析

select/poll/epoll都是IO多路複用機制，可以同時監控多個描述符，當某個描述符就緒(讀或寫就緒)，則立刻通知相應程式進行讀或寫操作。本質上select/poll/epoll都是同步I/O，即讀寫是阻塞的。一、select 原型： int select (

Python非同步非阻塞IO多路複用Select/Poll/Epoll使用

有許多封裝好的非同步非阻塞IO多路複用框架，底層在linux基於最新的epoll實現，為了更好的使用，瞭解其底層原理還是有必要的。下面記錄下分別基於Select/Poll/Epoll的echo server實現。 Python Select Server，可監控事件數

轉--select/poll/epoll到底是什麼一回事

相關推薦