Epoll在LT和ET模式下的讀寫方式和區別

LT模式：epoll就是一個快速版poll，可讀可寫就緒條件和傳統poll一致
ET模式：為了避免Starvation，建議
         1）檔案描述符設定為非阻塞
         2）只在read或write返回EAGAIN後，才能呼叫下一次epoll_wait
         3）應用層維護一個就緒連結串列，進行輪詢，可以防止大量IO時在一個描述符上長期read或write（因為只有等到read
                或 write返回EAGAIN後才表示該描述符處理完畢）而令其它描述符starve

      理解ET的含義後，上面那些操作其實都是顯然的。以wirte為例說明，LT時只要有一定範圍的空閒寫快取區，每次epoll_wait都是可寫條件就緒，但是ET時從第一次可寫就緒後，epoll_wait不再得到該描述符可寫就緒通知直到程式使描述符變為非可寫就緒（比如write收到 EAGAIN）後，epoll_wait才可能繼續收到可寫就緒通知（比如有空閒可寫快取）

其實ET相對於LT來說，把檔案描述符狀態跟蹤的部分責任由核心空間推到使用者空間，核心只關心狀態切換即從未就緒到就緒切換時才通知使用者，至於保持就緒狀態的，核心不再通知使用者，這樣在實現非阻塞模型時更方便，不需要每次操作都先檢視檔案描述符狀態。

ET模式：

因為ET模式只有從unavailable到available才會觸發，所以

1、讀事件：需要使用while迴圈讀取完，一般是讀到EAGAIN，也可以讀到返回值小於緩衝區大小；

如果應用層讀緩衝區滿：那就需要應用層自行標記，解決OS不再通知可讀的問題

2、寫事件：需要使用while迴圈寫到EAGAIN，也可以寫到返回值小於緩衝區大小

如果應用層寫緩衝區空（無內容可寫）：那就需要應用層自行標記，解決OS不再通知可寫的問題。

LT模式：

因為LT模式只要available就會觸發，所以：

1、讀事件：因為一般應用層的邏輯是“來了就能讀”，所以一般沒有問題，無需while迴圈讀取到EAGAIN；

如果應用層讀緩衝區滿：就會經常觸發，解決方式如下；

2、寫事件：如果沒有內容要寫，就會經常觸發，解決方式如下。

LT經常觸發讀寫事件的解決辦法：修改fd的註冊事件，或者把fd移出epollfd。

總結：

目前好像還是LT方式應用較多，包括redis、libuv等。（nginx使用ET）

LT模式的優點在於：事件迴圈處理比較簡單，無需關注應用層是否有緩衝或緩衝區是否滿，只管上報事件。缺點是：可能經常上報，可能影響效能。

在一個非阻塞的socket上呼叫read/write函式, 返回EAGAIN或者EWOULDBLOCK(注: EAGAIN就是EWOULDBLOCK)
從字面上看, 意思是:EAGAIN: 再試一次，EWOULDBLOCK: 如果這是一個阻塞socket, 操作將被block，perror輸出: Resource temporarily unavailable

總結:
這個錯誤表示資源暫時不夠，能read時，讀緩衝區沒有資料，或者write時，寫緩衝區滿了。遇到這種情況，如果是阻塞socket，read/write就要阻塞掉。而如果是非阻塞socket，read/write立即返回-1，同時errno設定為EAGAIN。
所以，對於阻塞socket，read/write返回-1代表網路出錯了。但對於非阻塞socket，read/write返回-1不一定網路真的出錯了。可能是Resource temporarily unavailable。這時你應該再試，直到Resource available。

綜上，對於non-blocking的socket，正確的讀寫操作為:
讀：忽略掉errno = EAGAIN的錯誤，下次繼續讀
寫：忽略掉errno = EAGAIN的錯誤，下次繼續寫

對於select和epoll的LT模式，這種讀寫方式是沒有問題的。但對於epoll的ET模式，這種方式還有漏洞。

epoll的兩種模式LT和ET
二者的差異在於level-trigger模式下只要某個socket處於readable/writable狀態，無論什麼時候進行epoll_wait都會返回該socket；而edge-trigger模式下只有某個socket從unreadable變為readable或從unwritable變為writable時，epoll_wait才會返回該socket。

所以，在epoll的ET模式下，正確的讀寫方式為:
讀：只要可讀，就一直讀，直到返回0，或者 errno = EAGAIN
寫:只要可寫，就一直寫，直到資料傳送完，或者 errno = EAGAIN

正確的讀

n =0;

while((nread = read(fd, buf + n, BUFSIZ-1))>0){

n += nread;

}

if(nread ==-1&& errno != EAGAIN){

perror("read error");

}

正確的寫

int nwrite, data_size = strlen(buf);

n = data_size;

while(n >0){

nwrite = write(fd, buf + data_size - n, n);

if(nwrite < n){

if(nwrite ==-1&& errno != EAGAIN){

perror("write error");

}

break;

}

n -= nwrite;

}

正確的accept，accept 要考慮 2 個問題
(1) 阻塞模式 accept 存在的問題
考慮這種情況：TCP連線被客戶端夭折，即在伺服器呼叫accept之前，客戶端主動傳送RST終止連線，導致剛剛建立的連線從就緒佇列中移出，如果套介面被設定成阻塞模式，伺服器就會一直阻塞在accept呼叫上，直到其他某個客戶建立一個新的連線為止。但是在此期間，伺服器單純地阻塞在accept呼叫上，就緒佇列中的其他描述符都得不到處理。

解決辦法是把監聽套介面設定為非阻塞，當客戶在伺服器呼叫accept之前中止某個連線時，accept呼叫可以立即返回-1，這時源自Berkeley的實現會在核心中處理該事件，並不會將該事件通知給epool，而其他實現把errno設定為ECONNABORTED或者EPROTO錯誤，我們應該忽略這兩個錯誤。

(2)ET模式下accept存在的問題
考慮這種情況：多個連線同時到達，伺服器的TCP就緒佇列瞬間積累多個就緒連線，由於是邊緣觸發模式，epoll只會通知一次，accept只處理一個連線，導致TCP就緒佇列中剩下的連線都得不到處理。

解決辦法是用while迴圈抱住accept呼叫，處理完TCP就緒佇列中的所有連線後再退出迴圈。如何知道是否處理完就緒佇列中的所有連線呢？accept返回-1並且errno設定為EAGAIN就表示所有連線都處理完。

綜合以上兩種情況，伺服器應該使用非阻塞地accept，accept在ET模式下的正確使用方式為：

while((conn_sock = accept(listenfd,(struct sockaddr *)&remote,(size_t *)&addrlen))>0){

handle_client(conn_sock);

}

if(conn_sock ==-1){

if(errno != EAGAIN && errno != ECONNABORTED && errno != EPROTO && errno != EINTR)

perror("accept");

}

一道騰訊後臺開發的面試題
使用Linuxepoll模型，水平觸發模式；當socket可寫時，會不停的觸發socket可寫的事件，如何處理？

第一種最普遍的方式：
需要向socket寫資料的時候才把socket加入epoll，等待可寫事件。
接受到可寫事件後，呼叫write或者send傳送資料。
當所有資料都寫完後，把socket移出epoll。

這種方式的缺點是，即使傳送很少的資料，也要把socket加入epoll，寫完後在移出epoll，有一定操作代價。

一種改進的方式：
開始不把socket加入epoll，需要向socket寫資料的時候，直接呼叫write或者send傳送資料。如果返回EAGAIN，把socket加入epoll，在epoll的驅動下寫資料，全部資料傳送完畢後，再移出epoll。

這種方式的優點是：資料不多的時候可以避免epoll的事件處理，提高效率。

最後貼一個使用epoll,ET模式的簡單HTTP伺服器程式碼:

#include<sys/socket.h>

#include<sys/wait.h>

#include<netinet/in.h>

#include<netinet/tcp.h>

#include<sys/epoll.h>

#include<sys/sendfile.h>

#include<sys/stat.h>

#include<unistd.h>

#include<stdio.h>

#include<stdlib.h>

#include<string.h>

#include<strings.h>

#include<fcntl.h>

#include<errno.h>

#define MAX_EVENTS 10

#define PORT 8080

//設定socket連線為非阻塞模式

void setnonblocking

Epoll在LT和ET模式下的讀寫方式和區別

Epoll在LT和ET模式下的讀寫方式和區別

epoll在LT和ET模式下的讀寫方式

Spark -14：spark Hadoop 高可用模式下讀寫hdfs

epoll學習筆記（ET模式下事件觸發原理和資料收發存在的問題）

Modbus關於ASCII模式和RTU模式兩種傳輸方式的區別

android5及以前的版本user和userdebug模式下remount修改/system讀寫許可權

Epoll-ET模式下非阻塞讀寫之Buffer的封裝

epoll：EPOLLET模式下的正確讀寫方式

csv、parquet、orc讀寫效能和方式

apache FileUtils 和 IOUtils 工具類改寫普通檔案讀寫方式提高效率

c++ 以二進位制和以文字方式讀寫檔案的區別

python檔案處理，b模式的讀寫，rb, wb，編碼的兩種方式

Linux下實現以讀寫方式掛載NTFS格式磁碟使用ntfs-3g

POI事件驅動模式讀寫Excel和格式設定及2007EXCEL解析SAXParser類找不到

Spring配置動態數據源-讀寫分離和多數據源

Python常用的文件讀寫操作和字符串操作

python_py2和py3讀寫文本區別

UNICODE環境下讀寫txt文件操作

自旋鎖，讀寫鎖和順序鎖的實現原理

vim編輯和命令模式下的實踐

Epoll在LT和ET模式下的讀寫方式和區別

相關推薦