1. 程式人生 > >簡單理解Socket

簡單理解Socket

題外話

前幾天和朋友聊天,朋友問我怎麼最近不寫部落格了,一個是因為最近在忙著公司使用的一些控制元件的開發,瀏覽器相容性搞死人;但主要是因為這段時間一直在看html5的東西,看到web socket時覺得很有意思,動手寫幾個demo,但web socket需要特定的伺服器支援,由於標準制定工作還沒完成,所以沒有多少主流的伺服器支援,自己在網上下載了幾個實現,包括php的、C#的、甚至Node.js的,但一個是協議變化比較大,很多程式碼已經過時了,再就是有一些支援最新的標準,但是我想稍微改造一下,看人家原始碼的時候雲裡霧裡,看看別人的程式碼行數也不多,決定自己實現一個。

悲劇由此開始,雖然哥們兒國內非知名工科大學畢業,但好歹也是科班CS出身,但大學得過且過,什麼TCP/IP協議,什麼socket了都沒概念。為了做出一個簡單的支援廣播的websocket server,在網上找了很多相關程式碼,左抄一句,右抄一句,弄了一個星期竟然還是漏洞百出,除錯不起來,只好從頭來過了,先補一些基本知識,然後再一步步根據原理實現,今天終於實現了絕大部分功能,由此真的感受到了,搞計算機必須得有理論指導實踐,否則只能像個沒頭蒼蠅到處亂撞。

TCP/IP

要想理解socket首先得熟悉一下TCP/IP協議族,TCP/IPTransmission Control Protocol/Internet Protocol)即傳輸控制協議/網間協議,定義了主機如何連入因特網及資料如何再它們之間傳輸的標準,

從字面意思來看TCP/IP是TCP和IP協議的合稱,但實際上TCP/IP協議是指因特網整個TCP/IP協議族。不同於ISO模型的七個分層,TCP/IP協議參考模型把所有的TCP/IP系列協議歸類到四個抽象層中

應用層:TFTP,HTTP,SNMP,FTP,SMTP,DNS,Telnet 等等

傳輸層:TCP,UDP

網路層:IP,ICMP,OSPF,EIGRP,IGMP

資料鏈路層:SLIP,CSLIP,PPP,MTU

每一抽象層建立在低一層提供的服務上,並且為高一層提供服務,看起來大概是這樣子的

                       

估計有興趣開啟此文的同學都對此有一定了解了,加上我也是一知半解,所以就不詳細解釋,有興趣同學可以上網上搜一下資料

維基百科

百度百科

在TCP/IP協議中兩個因特網主機通過兩個路由器和對應的層連線。各主機上的應用通過一些資料通道相互執行讀取操作

socket

我們知道兩個程序如果需要進行通訊最基本的一個前提能能夠唯一的標示一個程序,在本地程序通訊中我們可以使用PID來唯一標示一個程序,但PID只在本地唯一,網路中的兩個程序PID衝突機率很大,這時候我們需要另闢它徑了,我們知道IP層的ip地址可以唯一標示主機,而TCP層協議和埠號可以唯一標示主機的一個程序,這樣我們可以利用ip地址+協議+埠號唯一標示網路中的一個程序。

能夠唯一標示網路中的程序後,它們就可以利用socket進行通訊了,什麼是socket呢?我們經常把socket翻譯為套接字,socket是在應用層和傳輸層之間的一個抽象層,它把TCP/IP層複雜的操作抽象為幾個簡單的介面供應用層呼叫已實現程序在網路中通訊。

socket起源於UNIX,在Unix一切皆檔案哲學的思想下,socket是一種"開啟—讀/寫—關閉"模式的實現,伺服器和客戶端各自維護一個"檔案",在建立連線開啟後,可以向自己檔案寫入內容供對方讀取或者讀取對方內容,通訊結束時關閉檔案。

socket通訊流程

socket是"開啟—讀/寫—關閉"模式的實現,以使用TCP協議通訊的socket為例,其互動流程大概是這樣子的

伺服器根據地址型別(ipv4,ipv6)、socket型別、協議建立socket

伺服器為socket繫結ip地址和埠號

伺服器socket監聽埠號請求,隨時準備接收客戶端發來的連線,這時候伺服器的socket並沒有被開啟

客戶端建立socket

客戶端開啟socket,根據伺服器ip地址和埠號試圖連線伺服器socket

伺服器socket接收到客戶端socket請求,被動開啟,開始接收客戶端請求,直到客戶端返回連線資訊。這時候socket進入阻塞狀態,所謂阻塞即accept()方法一直到客戶端返回連線資訊後才返回,開始接收下一個客戶端諒解請求

客戶端連線成功,向伺服器傳送連線狀態資訊

伺服器accept方法返回,連線成功

客戶端向socket寫入資訊

伺服器讀取資訊

客戶端關閉

伺服器端關閉

三次握手

在TCP/IP協議中,TCP協議通過三次握手建立一個可靠的連線

第一次握手:客戶端嘗試連線伺服器,向伺服器傳送syn包(同步序列編號Synchronize Sequence Numbers),syn=j,客戶端進入SYN_SEND狀態等待伺服器確認

第二次握手:伺服器接收客戶端syn包並確認(ack=j+1),同時向客戶端傳送一個SYN包(syn=k),即SYN+ACK包,此時伺服器進入SYN_RECV狀態

第三次握手:第三次握手:客戶端收到服務器的SYN+ACK包,向伺服器傳送確認包ACK(ack=k+1),此包傳送完畢,客戶端和伺服器進入ESTABLISHED狀態,完成三次握手

定睛一看,伺服器socket與客戶端socket建立連線的部分其實就是大名鼎鼎的三次握手

 socket程式設計API

前面提到socket是"開啟—讀/寫—關閉"模式的實現,簡單瞭解一下socket提供了哪些API供應用程式使用,還是以TCP協議為例,看看Unix下的socket API,其它語言都很類似(PHP甚至名字都幾乎一樣),這裡我就簡單解釋一下方法作用和引數,具體使用有興趣同學可以看看部落格參考中的連結或者上網搜尋

int socket(int domain, int type, int protocol);

根據指定的地址族、資料型別和協議來分配一個socket的描述字及其所用的資源。

domain:協議族,常用的有AF_INETAF_INET6AF_LOCALAF_ROUTE其中AF_INET代表使用ipv4地址

type:socket型別,常用的socket型別有,SOCK_STREAMSOCK_DGRAMSOCK_RAWSOCK_PACKETSOCK_SEQPACKET

protocol:協議。常用的協議有,IPPROTO_TCPIPPTOTO_UDPIPPROTO_SCTPIPPROTO_TIPC

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

把一個地址族中的特定地址賦給socket

sockfd:socket描述字,也就是socket引用

addr:要繫結給sockfd的協議地址

addrlen:地址的長度

通常伺服器在啟動的時候都會繫結一個眾所周知的地址(如ip地址+埠號),用於提供服務,客戶就可以通過它來接連伺服器;而客戶端就不用指定,有系統自動分配一個埠號和自身的ip地址組合。這就是為什麼通常伺服器端在listen之前會呼叫bind(),而客戶端就不會呼叫,而是在connect()時由系統隨機生成一個。

int listen(int sockfd, int backlog);

監聽socket

sockfd:要監聽的socket描述字

backlog:相應socket可以排隊的最大連線個數 

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

連線某個socket

sockfd:客戶端的socket描述字

addr:伺服器的socket地址

addrlen:socket地址的長度

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

 TCP伺服器監聽到客戶端請求之後,呼叫accept()函式取接收請求

sockfd:伺服器的socket描述字

addr:客戶端的socket地址

addrlen:socket地址的長度

ssize_t read(int fd, void *buf, size_t count);

讀取socket內容

fd:socket描述字

buf:緩衝區

count:緩衝區長度

ssize_t write(int fd, const void *buf, size_t count);

向socket寫入內容,其實就是傳送內容

fd:socket描述字

buf:緩衝區

count:緩衝區長度

int close(int fd);

socket標記為以關閉使相應socket描述字的引用計數-1,當引用計數為0的時候,觸發TCP客戶端向伺服器傳送終止連線請求。

參考

PS. 有同學看完後發現沒有demo示例,參考中的示例已經很不錯了,我就不班門弄斧了,而且我用C#實現了一個websocket server,接下來的部落格中會有介紹。另外由於剛剛實際接觸socket,文中謬誤較多,還望大家批評指正,文章內容主要參考上面兩個博文,圖片全部來源於網路,在百度圖片搜尋得來,無法註明第一源地址,如有版權問題請站內信聯絡,第一時間處理。

相關推薦

no