1. 程式人生 > >python高階(2)—— 基礎回顧2

python高階(2)—— 基礎回顧2

 

回顧知識

 

一 作業系統的作用:

  • 隱藏醜陋複雜的硬體介面,提供良好的抽象介面
  • 管理、排程程序,並且將多個程序對硬體的競爭變得有序

 關於作業系統的發展史,可以參考我之前的一篇博文:傳送門

 

 

二 多道技術:

產生背景:針對單核,實現併發

現在的主機一般是多核,那麼每個核都會利用多道技術有4個cpu,運行於cpu1的某個程式遇到io阻塞,會等到io結束再重新排程,會被排程到4個 cpu中的任意一個,具體由作業系統排程演算法決定。

空間上的複用:如記憶體中同時有多道程式

時間上的複用:複用一個cpu的時間片

遇到io切,佔用cpu時間過長也切,核心在於切之前將程序的狀態儲存下來,這樣 才能保證下次切換回來時,能基於上次切走的位置繼續執行

 

多程序

什麼是程序

正在進行的一個過程或者說一個任務。而負責執行任務則是cpu

程序與程式的區別

程式僅僅只是一堆程式碼而已,而程序指的是程式的執行過程。

例:

  想象一位有一手好廚藝的電腦科學家egon正在為他的女兒元昊烘製生日蛋糕。他有做生日蛋糕的食譜,  廚房裡有所需的原料:麵粉、雞蛋、韭菜,蒜泥等。而做蛋糕的食譜就是程式(即用適當形式描述的演算法),電腦科學家就是處理器(cpu),而做蛋糕的各種原料就是輸入資料。程序就是廚師閱讀食譜、取來各種原料以及烘製蛋糕等一系列動作的總和

 

 

多程序的併發與並行

 

併發

是偽並行,即看起來是同時執行。單個cpu+多道技術就可以實現併發

例(單核+多道,實現多個程序的併發執行):

  我在一個時間段內有很多工要做,寫部落格,學習,看書,休息,睡覺等的任務,但我同一時刻只能做一個任務(cpu同一時間只能幹一個活),如何才能玩出多個任務併發執行的效果?我寫一會兒部落格,再看一會兒書,再休息下,再學習,然後再睡覺....這就保證了每個任務都在進行中

 

並行

同時執行,只有具備多個cpu才能實現並行

單核下,可以利用多道技術,多個核,每個核也都可以利用多道技術(多道技術是針對單核而言的),有四個核,六個任務,這樣同一時間有四個任務被執行,假設分別被分配給了cpu1,cpu2,cpu3,cpu4,一旦任務1遇到I/O就被迫中斷執行,此時任務5就拿到cpu1的時間片去執行,這就是單核下的多道技術,而一旦任務1的I/O結束了,作業系統會重新呼叫它(需知程序的排程、分配給哪個cpu執行,由作業系統說了算),可能被分配給四個cpu中的任意一個去執行

例:

  還是上面那個例子,我在一個時間段內有很多工要做,寫部落格,學習,看書,休息,睡覺等的任務,然後我學會兒火影忍者裡的隱分身術,實現多個我在同一時間完成不同的任務

 

程序的建立與終止

建立

 

只要是,都需要有作業系統去管理,只要有作業系統,就有程序的概念,就需要有建立程序的方式,一些作業系統只為一個應用程式設計,比如微波爐中的控制器,一旦啟動微波爐,所有的程序都已經存在。

 

對於通用系統(跑很多應用程式),需要有系統執行過程中建立或撤銷程序的能力,主要分為4中形式建立新的程序:

  1. 系統初始化(檢視程序linux中用ps命令,windows中用工作管理員,前臺程序負責與使用者互動,後臺執行的程序與使用者無關,執行在後臺並且只在需要時才喚醒的程序,稱為守護程序,如電子郵件、web頁面、新聞、列印)

  2. 一個程序在執行過程中開啟了子程序(如nginx開啟多程序,os.fork,subprocess.Popen等)

  3. 使用者的互動式請求,而建立一個新程序(如使用者雙擊暴風影音)

  4. 一個批處理作業的初始化(只在大型機的批處理系統中應用)

無論哪一種,新程序的建立都是由一個已經存在的程序執行了一個用於建立程序的系統呼叫而建立的:

  1. 在UNIX中該系統呼叫是:fork,fork會建立一個與父程序一模一樣的副本,二者有相同的儲存映像、同樣的環境字串和同樣的開啟檔案(在shell直譯器程序中,執行一個命令就會建立一個子程序)

  2. 在windows中該系統呼叫是:CreateProcess,CreateProcess既處理程序的建立,也負責把正確的程式裝入新程序。

 

在UNIX和windows平臺下建立的子程序:

相同的是:程序建立後,父程序和子程序有各自不同的地址空間(多道技術要求物理層面實現程序之間記憶體的隔離),任何一個程序的在其地址空間中的修改都不會影響到另外一個程序。

不同的是:在UNIX中,子程序的初始地址空間是父程序的一個副本,提示:子程序和父程序是可以有隻讀的共享記憶體區的。但是對於windows系統來說,從一開始父程序與子程序的地址空間就是不同的。

 

終止

 

  • 正常退出(自願,如使用者點選互動式頁面的叉號,或程式執行完畢呼叫發起系統呼叫正常退出,在linux中用exit,在windows中用ExitProcess)

  • 出錯退出(自願,python a.py中a.py不存在)

  • 嚴重錯誤(非自願,執行非法指令,如引用不存在的記憶體,1/0等,可以捕捉異常,try...except...)

  • 被其他程序殺死(非自願,如kill -9)

 

程序的層次結構

 

無論UNIX還是windows,程序只有一個父程序,不同的是:

  1. 在UNIX中所有的程序,都是以init程序為根,組成樹形結構。父子程序共同組成一個程序組,這樣,當從鍵盤發出一個訊號時,該訊號被送給當前與鍵盤相關的程序組中的所有成員。

  2. 在windows中,沒有程序層次的概念,所有的程序都是地位相同的,唯一類似於程序層次的暗示,是在建立程序時,父程序得到一個特別的令牌(稱為控制代碼),該控制代碼可以用來控制子程序,但是父程序有權把該控制代碼傳給其他子程序,這樣就沒有層次了。

 

程序的狀態

tail -f access.log |grep '404',執行程式tail,開啟一個子程序,執行程式grep,開啟另外一個子程序,兩個程序之間基於管道'|'通訊,將tail的結果作為grep的輸入。

程序grep在等待輸入(即I/O)時的狀態稱為阻塞,此時grep命令都無法執行

 

其實在兩種情況下會導致一個程序在邏輯上不能執行:

  1. 程序掛起是自身原因,遇到I/O阻塞,便要讓出CPU讓其他程序去執行,這樣保證CPU一直在工作

  2. 與程序無關,是作業系統層面,可能會因為一個程序佔用時間過多,或者優先順序等原因,而呼叫其他的程序去使用CPU。

因而一個程序由三種狀態

程序併發的實現

程序併發的實現在於,硬體中斷一個正在執行的程序,把此時程序執行的所有狀態儲存下來,為此,作業系統維護一張表格,即程序表(process table),每個程序佔用一個程序表項(這些表項也稱為程序控制塊)

該表存放了程序狀態的重要資訊:程式計數器、堆疊指標、記憶體分配狀況、所有開啟檔案的狀態、帳號和排程資訊,以及其他在程序由執行態轉為就緒態或阻塞態時,必須儲存的資訊,從而保證該程序在再次啟動時,就像從未被中斷過一樣

 

執行緒

在傳統作業系統中,每個程序有一個地址空間,而且預設就有一個控制執行緒

執行緒顧名思義,就是一條流水線工作的過程(流水線的工作需要電源,電源就相當於cpu),而一條流水線必須屬於一個車間,一個車間的工作過程是一個程序,車間負責把資源整合到一起,是一個資源單位,而一個車間內至少有一條流水線

 

程序與執行緒的區別:

  • 程序只是用來把資源集中到一起(程序只是一個資源單位,或者說資源集合),而執行緒才是cpu上的執行單位
  • 同一個程序內的多個執行緒共享該程序內的地址資源
  • 建立執行緒的開銷要遠小於建立程序的開銷(建立一個程序,就是建立一個車間,涉及到申請空間,而且在該空間內建至少一條流水線,但建立執行緒,就只是在一個車間內造一條流水線,無需申請空間,所以建立開銷小)

 

多執行緒:

多執行緒(即多個控制執行緒)的概念是,在一個程序中存在多個執行緒,多個執行緒共享該程序的地址空間,相當於一個車間內有多條流水線,都共用一個車間的資源

 

然後執行緒也有如下三種狀態

 

 

對於單執行緒下,我們不可避免程式中出現io操作,但如果我們能在自己的程式中(即使用者程式級別,而非作業系統級別)控制單執行緒下的多個任務能在一個任務遇到io阻塞時就切換到另外一個任務去計算,這樣就保證了該執行緒能夠最大限度地處於就緒態,即隨時都可以被cpu執行的狀態,相當於我們在使用者程式級別將自己的io操作最大限度地隱藏起來,從而可以迷惑作業系統,讓其看到:該執行緒好像是一直在計算,io比較少,從而更多的將cpu的執行許可權分配給我們的執行緒

 

協程:

 是單執行緒下的併發,又稱微執行緒,纖程。英文名Coroutine,協程是一種使用者態的輕量級執行緒,即協程是由使用者程式自己控制排程的

 

 特點:

  • 必須在只有一個單執行緒裡實現併發
  • 修改共享資料不需加鎖
  • 使用者程式裡自己儲存多個控制流的上下文棧
  • 附加:一個協程遇到IO操作自動切換到其它協程(如何實現檢測IO,yield、greenlet都無法實現,就用到了gevent模組(select機制)

 

 

以上的都是回顧理論,程式碼實現暫且略