1. 程式人生 > >TCP與UDP比較 以及並發編程基礎知識

TCP與UDP比較 以及並發編程基礎知識

引用 層次 系統調用 指示 核心 () 樹形結構 list 設計

一、tcp比udp真正可靠地原因

1.為什麽tcp比udp傳輸可靠地原因:

我們知道在傳輸數據的時候,數據是先存在操作系統的緩存中,然後發送給客戶端,在客戶端也是要經過客戶端的操作系統的,因為這個過程涉及到計算機硬件,也就是物理層的一些東西,那麽==tcp協議在確認客戶端接收到完整的信息之後才會刪除服務端操作系統中的緩存==,否則就會繼續發,這才是TCP協議的可靠性根本原因,而UDP只管發送數據而不管客戶端有沒有收到,所以就會造成丟包現象。

TCP UDP 的socket

1.==基於tcp的套接字 無並發==

服務端

import socket

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.bind(("localhost", 9909))

sock.listen(5)
while True:
    conn, addr = sock.accept()  # 有加上一個死循環(連接循環)
    while True:
        try:   # 適應於window系統
            data = conn.recv(1024)  # 通訊循環
            if not data: break  # 適用於linux系統
            print(data)

            conn.send(data.upper())
        except ConnectionResetError:
            break

    conn.close()

sock.close()

客戶端

import socket

client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

client.connect(("127.0.0.1", 9909))
while True:
    msg = input(">>>:").strip()
    if not msg:
        continue
    client.send(msg.encode("utf8"))
    data = client.recv(1024)
    print(data.decode('utf8'))
client.close()

這種情況下並沒有並發效果,可以通過幾個客戶端連接到同一個服務端,所有的請求首先送到服務端半連接池,服務端再到伴了連接池取,
取出之後開始為第一個客戶端服務,只要客戶端不結束,那麽就一直為客戶端服務,不能為其他的客戶端服務,其他的可以建成連接,但是沒辦法交互.

解決訪問數量超過伴連接池報錯問題 --->sock.listen(5)

==2基於udp的套接字的收發消息==

TCP:流逝協議
UDP:數據報協議
服務端:
import socket
sever=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)
sever.bind((ip))
while True:
    client_data,client_addr=sever.recvfrom(1024)
    sever.sendto(client_data.upper(),client_addr)
    print(res)

客戶端:
import socket
client=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)

while True:
    msg=input(':')
    client.sendto((ip))
    sever_data,sever_addr=client.recvfrom(1024)
    print(sever_data,sever_addr)
    
UDP:可以在不開啟服務端的情況下,發消息,調用的為SOCK_DGRAM。

==UDP的特征==:

數據報協議,自帶報頭,完整的數據報,所以UDP沒有粘包現象,發與收一一對應,這一點與TCP是不一樣的,
UDP來發消息,穩定可靠的數據量就是512kb,所以我們定義一個1024就夠了。超過這個數就會容易造成丟包的現象,所以UDP一般用於數據量比較小的場景,比如我們平時聊天信息等

二、並發編程基礎知識
1.是什麽是進程?

顧名思義,進程即正在執行的一個過程。進程是對正在運行程序的一個抽象。
進程的概念起源於操作系統,是操作系統最核心的概念,也是操作系統提供的最古老也是最重要的抽象概念之一。操作系統的其他所有內容都是圍繞進程的概念展開的。

2.操作系統知識 -----> 操作系統理論知識請補充之!
3.總結

即使可以利用的cpu只有一個(早期的計算機確實如此),也能保證支持(偽)並發的能力。將一個單獨的cpu變成多個虛擬的cpu(多道技術:時間多路復用和空間多路復用+硬件上支持隔離),沒有進程的抽象,現代計算機將不復存在。

必備的理論知識:

一 操作系統的作用:
1:隱藏醜陋復雜的硬件接口,提供良好的抽象接口
2:管理、調度進程,並且將多個進程對硬件的競爭變得有序

二 多道技術:

1.產生背景:針對單核,實現並發
ps:
現在的主機一般是多核,那麽每個核都會利用多道技術
有4個cpu,運行於cpu1的某個程序遇到io阻塞,會等到io結束再重新調度,會被調度到4個
cpu中的任意一個,具體由操作系統調度算法決定。


2.空間上的復用:如內存中同時有多道程序
3.時間上的復用:復用一個cpu的時間片
   強調:遇到io切,占用cpu時間過長也切,核心在於切之前將進程的狀態保存下來,這樣
        才能保證下次切換回來時,能基於上次切走的位置繼續運行
4.並發編程之多進程

什麽是進程

進程:正在進行的一個過程或者說一個任務。而負責執行任務則是cpu。

二 進程與程序的區別

程序僅僅只是一堆代碼而已,而進程指的是程序的運行過程。

舉例:

想象一位有一手好廚藝的計算機科學家COOL正在為他的女兒元昊烘制生日蛋糕。

他有做生日蛋糕的食譜,

廚房裏有所需的原料:面粉、雞蛋、韭菜,蒜泥等。

在這個比喻中:

做蛋糕的食譜就是程序(即用適當形式描述的算法)

計算機科學家就是處理器(cpu)

而做蛋糕的各種原料就是輸入數據。

進程就是廚師閱讀食譜、取來各種原料以及烘制蛋糕等一系列動作的總和。

現在假設計算機科學家egon的兒子alex哭著跑了進來,說:Hey, Dad, my head got stung by a bee.

科學家COOL想了想,處理兒子alex蟄傷的任務比給女兒元昊做蛋糕的任務更重要,於是

計算機科學家就記錄下他照著食譜做到哪兒了(保存進程的當前狀態),然後拿出一本急救手冊,按照其中的指示處理蟄傷。這裏,我們看到處理機從一個進程(做蛋糕)切換到另一個高優先級的進程(實施醫療救治),每個進程擁有各自的程序(食譜和急救手冊)。當蜜蜂蟄傷處理完之後,這位計算機科學家又回來做蛋糕,從他
離開時的那一步繼續做下去。

需要強調的是:同一個程序執行兩次,那也是兩個進程,比如打開暴風影音,雖然都是同一個軟件,但是一個可以播放蒼井空,一個可以播放飯島愛.

三 並發與並行

一 並發:是偽並行,即看起來是同時運行。單個cpu+多道技術就可以實現並發

二 並行:同時運行,只有具備多個cpu才能實現並行

四 進程的創建

但凡是硬件,都需要有操作系統去管理,只要有操作系統,就有進程的概念,就需要有創建進程的方式,一些操作系統只為一個應用程序設計,比如微波爐中的控制器,一旦啟動微波爐,所有的進程都已經存在。

而對於通用系統(跑很多應用程序),需要有系統運行過程中創建或撤銷進程的能力,主要分為4中形式創建新的進程

系統初始化(查看進程linux中用ps命令,windows中用任務管理器,前臺進程負責與用戶交互,後臺運行的進程與用戶無關,運行在後臺並且只在需要時才喚醒的進程,稱為守護進程,如電子郵件、web頁面、新聞、打印)

一個進程在運行過程中開啟了子進程(如nginx開啟多進程,os.fork,subprocess.Popen等)

用戶的交互式請求,而創建一個新進程(如用戶雙擊暴風影音)

一個批處理作業的初始化(只在大型機的批處理系統中應用)

無論哪一種,新進程的創建都是由一個已經存在的進程執行了一個用於創建進程的系統調用而創建的:

在UNIX中該系統調用是:fork,fork會創建一個與父進程一模一樣的副本,二者有相同的存儲映像、同樣的環境字符串和同樣的打開文件(在shell解釋器進程中,執行一個命令就會創建一個子進程)

在windows中該系統調用是:CreateProcess,CreateProcess既處理進程的創建,也負責把正確的程序裝入新進程。

關於創建的子進程,UNIX和windows

1.相同的是:進程創建後,父進程和子進程有各自不同的地址空間(多道技術要求物理層面實現進程之間內存的隔離),任何一個進程的在其地址空間中的修改都不會影響到另外一個進程。

2.不同的是:在UNIX中,子進程的初始地址空間是父進程的一個副本,提示:子進程和父進程是可以有只讀的共享內存區的。但是對於windows系統來說,從一開始父進程與子進程的地址空間就是不同的

六 進程的終止(了解)

1.正常退出(自願,如用戶點擊交互式頁面的叉號,或程序執行完畢調用發起系統調用正常退出,在linux中用exit,在windows中用ExitProcess)

2.出錯退出(自願,python a.py中a.py不存在)

3.嚴重錯誤(非自願,執行非法指令,如引用不存在的內存,1/0等,可以捕捉異常,try...except...)

4.被其他進程殺死(非自願,如kill -9)

七 進程的層次結構

無論UNIX還是windows,進程只有一個父進程,不同的是:

1.在UNIX中所有的進程,都是以init進程為根,組成樹形結構。父子進程共同組成一個進程組,這樣,當從鍵盤發出一個信號時,該信號被送給當前與鍵盤相關的進程組中的所有成員。

2.在windows中,沒有進程層次的概念,所有的進程都是地位相同的,唯一類似於進程層次的暗示,是在創建進程時,父進程得到一個特別的令牌(稱為句柄),該句柄可以用來控制子進程,但是父進程有權把該句柄傳給其他子進程,這樣就沒有層次了。

八 進程的狀態

tail -f access.log |grep '404'

執行程序tail,開啟一個子進程,執行程序grep,開啟另外一個子進程,兩個進程之間基於管道'|'通訊,將tail的結果作為grep的輸入。

進程grep在等待輸入(即I/O)時的狀態稱為阻塞,此時grep命令都無法運行

其實在兩種情況下會導致一個進程在邏輯上不能運行,

進程掛起是自身原因,遇到I/O阻塞,便要讓出CPU讓其他進程去執行,這樣保證CPU一直在工作

與進程無關,是操作系統層面,可能會因為一個進程占用時間過多,或者優先級等原因,而調用其他的進程去使用CPU。
因而一個進程由三種狀態

技術分享圖片

TCP與UDP比較 以及並發編程基礎知識