作業系統學習筆記：程序同步

阿新 • • 發佈：2019-01-11

互相協作的程序之間有共享的資料，於是這裡就有一個併發情況下，如何確保有序操作這些資料、維護一致性的問題，即程序同步。

從底層到高階應用，同步機制依次有臨界區、訊號量、管程、原子事務。

1、臨界區

每個程序有一個程式碼段稱為臨界區，共享資料在此進行操作。沒有兩個程序同時在臨界區執行。

臨界區方案是一種協議，即每個程序進入臨界區操作都需要請求。實現這一請求的程式碼稱為進入區，從臨界區退出的善後工作由退出區，之後是剩餘區。

臨界區方案必須滿足三項要求：

1）互斥

兩個程序不能同時在臨界區操作

2）前進

臨界區空閒，如果有程序需要，且不在剩餘區，則可參加選擇

3）有限等待

程序只要有意願，總有一天會進入臨界區，因為程序進入臨界區的次數有上限。

作業系統內部的臨界區問題中，非搶佔式比較容易，因為程序沒有競爭條件；而搶佔式則困難得多，因為程序可能會執行在不同處理器上。但搶佔式核心更適合實時程式設計。

Peterson演算法是一種臨界區問題演算法。

對於臨界區問題，除了軟體上進行設計，也可以在硬體層面來解決。現代計算機系統提供了一些特殊硬體指令，可以原子地執行。

2、訊號量

臨界區方案比較複雜，可以使用訊號量這個同步工具。

訊號量是一個整數變數，除了初始化，只能通過兩個標準原子操作：wait()和signal()來訪問。

wait(s){
	while(s <= 0)
		;//當s<=0時，迴圈等待，直到S變為正數。如果將這個S看做可用資源，就很好理解了。S<=0，代表沒有資源
	s--;//可用資源減一
}

signal(s){
	s++;//可用資源加一
}

//使用訊號量實現臨界區問題方案
do{
	wait(mutex);
	//臨界區
	signal(mutex);
	//剩餘區
}while(true);

上述例子中，有迴圈等待，又叫忙等待。忙等待浪費了CPU時鐘，這在多道程式系統中，顯然是個問題，因為本可以讓給其他程序執行。

不過，這種依靠忙等待實現的訊號量又稱為自旋鎖（spinlock）。自旋鎖有一定的優越性，因為無須進行上下文切換，有時上下文切換相比之下更浪費時間）。通常，等待時間如果比較短，就適合用自旋鎖。自旋鎖常用在多處理器系統中，因為多執行緒可以用於多處理器，一個執行緒自旋，另一個執行緒可以在另一個處理器上執行。

不過，為了克服忙等的缺點，可以修改wait()和signal()的定義，採用程序堵塞來替代忙等：

typedef struct {
    int value;//記錄了這個訊號量的值 
    struct process *list;//儲存正在等待這個訊號量的程序 
} semaphore;

wait(semaphore *S) {
    S->value--;
    if(S->value < 0) {//沒有資源了
        add this process to S->list;//進入等待佇列
        block();//堵塞
    }
}

signal(semaphore *S) {
    S->value++;
    if(S->value <= 0) {//上面++後，S仍然還<=0，說明資源供不應求，等待者眾，於是喚醒等待佇列中的一個，意思是說，我做完了，你好自為之。至於是否可以獲得資源，看造化。。。就此別過，青山綠水，後會有期，good bye!
        remove a process P from S->list;
        wakeup(P);//切換到就緒狀態
    }
}

3、管程

訊號量比臨界區方便，但如果使用不正確，比如順序不當，仍然會導致一些錯誤。

管程用高階語言封裝了訊號量，方便程式設計師呼叫。

管程結構確保一次只有一個程序能在管程內活動。但是，程序在管程內應該怎麼理解？難道是程序在管程裡面執行？但看上去，是程序呼叫了管程，依管程的返回訊號而行事？

管程通常是用於管理資源的，因此管程中有程序等待佇列和相應的等待和喚醒操作。在管程入口有一個等待佇列，稱為入口等待佇列。當一個已進入管程的程序等待時，就釋放管程的互斥使用權；當已進入管程的一個程序喚醒另一個程序時，兩者必須有一個退出或停止使用管程。在管程內部，由於執行喚醒操作，可能存在多個等待程序（等待使用管程），稱為緊急等待佇列，它的優先順序高於入口等待佇列。

因此，一個程序進入管程之前要先申請，一般由管程提供一個enter過程；離開時釋放使用權，如果緊急等待佇列不空，則喚醒第一個等待者，一般也由管程提供外部過程leave。

管程內部有自己的等待機制。管程可以說明一種特殊的條件型變數：var c:condition；實際上是一個指標，指向一個等待該條件的PCB（程序控制塊）佇列。對條件型變數可執行wait和signal操作

wait(c):若緊急等待佇列不空，喚醒第一個等待者，否則釋放管程使用權。執行本操作的程序進入C佇列尾部；

signal(c):若C佇列為空，繼續原程序，否則喚醒佇列第一個等待者，自己進入緊急等待佇列尾部。

（額，從上述描述看，管程可以控制程序等待、喚醒等，從這點來說，程序在管程內是說得過去的）

生產者-消費者問題（有buffer）

問題描述：(一個倉庫可以存放K件物品。生產者每生產一件產品，將產品放入倉庫，倉庫滿了就停止生產。消費者每次從倉庫中去一件物品，然後進行消費，倉庫空時就停止消費。 
解答： 
管程：buffer=MODULE; 
（假設已實現一基本管程monitor，提供enter,leave,signal,wait等操作）

notfull,notempty:condition; // notfull控制緩衝區不滿,notempty控制緩衝區不空； 
count,in,out: integer; 　　  // count記錄共有幾件物品，in記錄第一個空緩衝區，out記錄第一個不空的緩衝區 
buf:array [0..k-1] of item_type; 
define deposit,fetch; 
use monitor.enter,monitor.leave,monitor.wait,monitor.signal;
 
procedure deposit(item); 
{ 
　　if(count=k) monitor.wait(notfull); 
　　buf[in]=item; 
　　in:=(in+1) mod k; 
　　count++; 
　　monitor.signal(notempty); 
} 
procedure fetch:Item_type; 
{ 
　　if(count=0) monitor.wait(notempty); 
　　item=buf[out]; 
　　in:=(in+1) mod k; 
　　count--; 
　　monitor.signal(notfull); 
　　return(item); 
} 
{ 
count=0; 
in=0; 
out=0; 
} 

程序：producer,consumer; 
producer（生產者程序）： 
Item_Type item; 
{ 
　　while (true) 
　　{ 
　　　　produce(&item); 
　　　　buffer.enter(); 
　　　　buffer.deposit(item); 
　　　　buffer.leave(); 
　　} 
} 

consumer（消費者程序）： 
Item_Type item; 
{ 
　　while (true) 
　　{ 
　　　　buffer.enter(); 
　　　　item=buffer.fetch(); 
　　　　buffer.leave(); 
　　　　consume(&item); 
　　} 
}

4、原子事務

有一些操作裡面的步驟必須一口氣全部執行完，不可分割，結果是要麼全部成功，要麼就失敗。

這點在資料庫技術上體現得淋漓盡致：事務。近來（什麼時候的事了？）有將資料庫技術應用於作業系統的熱潮。

1）日誌

資料庫的資料為什麼能儲存得那麼好？很大程度上是歸功於日誌。

最常用的方法是操作資料的時候，先記錄日誌，再操作資料。

每條日誌記錄：

（1）事務名稱

（2）資料項名稱

（3）舊值

（4）新值

事務開始前，記錄<t_start>記入日誌；

當事務提交時，記錄<t_commit>記入日誌；

如果事務失敗，或者系統故障，系統就會檢查日誌（這一步也許在系統重啟之時），凡有<t_start>記錄而無<t_commit>的，系統做回滾操作；兩條記錄都有的，系統則將資料重新寫一遍。（有些重寫可能是不必要的，但也不會引起錯誤）

但這種做法很浪費，因為絕大多數的事務都是成功的。於是引入檢查點（checkpoint）：

當系統將資料從記憶體寫入硬碟或穩定儲存裝置時，記錄一個<checkpoint>。以後系統重啟時只處理這個checkpoint之後的日誌記錄。

2）鎖及時間戳

在併發的情況下，多個事務同時執行，由於事務是原子性的，所以事務併發，其實相當於讓一個個事務序列化執行。這裡就牽扯到序列排程和非序列排程。

非序列排程不一定會引起錯誤，因為事務之間，裡面的步驟不一定會相關。將這些步驟打散、組合，可能效率會更高。

序列處理可以依靠：

（1）鎖

（2）時間戳

方案是資料讀寫時記錄時間值：

W-timestamp(Q)

R-timestamp(Q)

Q是資料項，只要操作Q，即記錄時間。

在一個事務中，如果發出read(Q)

(1)事務開始時間 < W-timestamp(Q)，表明值正在被改寫，read被拒絕，事務回滾；

(2)事務開始時間 >= W-timestamp(Q)，read，R-timestamp(Q) = MAX(R-timestamp(Q),事務時間)；

如果事務發出write(Q)

(1)事務開始時間 < R-timestamp(Q)，表明值正在被讀取，write被拒絕，事務回滾；

(2)事務開始時間 < W-timestamp(Q)，表明值正在被修改，write被拒絕，事務回滾；；

(3)否則，write

參考文章：

http://www.cnblogs.com/sonic4x/archive/2011/07/05/2098036.html

作業系統學習筆記：程序同步

互相協作的程序之間有共享的資料，於是這裡就有一個併發情況下，如何確保有序操作這些資料、維護一致性的問題，即程序同步。從底層到高階應用，同步機制依次有臨界區、訊號量、管程、原子事務。1、臨界區每個程序有一個程式碼段稱為臨界區，共享資料在此進行操作。沒有兩個程序同時在臨界區執行。

作業系統學習筆記：I/O輸入系統

計算機兩大主要任務：IO操作和計算處理。許多情況下，主要是IO操作，計算處理只是附帶的（而作業系統的兩大任務是管理物理裝置和為應用程式提供一個虛擬機器器的抽象）。作業系統在IO方面的作用是管理IO操作和IO裝置。一、概述 I/O裝置在功能與速度方面存在很大

作業系統學習筆記(3)——程序描述與程序狀態變化

一、程序的描述程序：是系統中佔用處理機及爭奪其它系統資源的實體；程式必須在程序中執行；程序執行必須有棧用於儲存現場。程序的引入：為了能實現同一作業的作業步併發在作業某作業步等I/O時，另一邏輯上可併發作業步能使用CPU執行引入程序後，邏輯上課併發的作業步在不同的程序

作業系統學習筆記：分散式系統結構

分散式系統是一組不共享記憶體和時鐘的處理器的集合，即每個處理器都有它自己的記憶體，處理器之間的通訊可通過各種通訊網路加以實現。一、動機建立分散式系統主要由4個方面的原因： 1、資源共享 2、加快計算速度 3、可靠性 4、通訊不同站點可以有

python爬蟲入門八：多程序/多執行緒 python佇列Queue Python多執行緒（2）——執行緒同步機制 python學習筆記——多程序中共享記憶體Value & Array python 之多程序 Python多程序 Python 使用multiprocessing 特別耗記

什麼是多執行緒/多程序引用蟲師的解釋：計算機程式只不過是磁碟中可執行的，二進位制（或其它型別）的資料。它們只有在被讀取到記憶體中，被作業系統呼叫的時候才開始它們的生命期。程序（有時被稱為重量級程序）是程式的一次執行。每個程序都有自己的地址空間，記憶體，資料棧以及其它記錄其執行軌跡的輔助資料

作業系統學習筆記：程序同步

作業系統學習筆記：程序同步

作業系統學習筆記：I/O輸入系統

作業系統學習筆記(3)——程序描述與程序狀態變化

作業系統學習筆記：分散式系統結構

python爬蟲入門八：多程序/多執行緒 python佇列Queue Python多執行緒（2）——執行緒同步機制 python學習筆記——多程序中共享記憶體Value & Array python 之多程序 Python多程序 Python 使用multiprocessing 特別耗記

Linux學習筆記：rpm程序包管理

20180821 Python學習筆記：如何獲取當前程序路徑

Qt學習筆記：清除用QAxObject建立的Office程序

Python學習筆記：多程序

作業系統（8）程序--同步互斥介紹；同步問題的三種解決方案：禁用硬體中斷、基於軟體、更高階抽象

python學習筆記(56) 程序的同步控制

Ubuntu作業系統學習筆記2（vi文字編輯器、程序的基本狀態及其轉換）

uCOS-II學習筆記：實時作業系統（一）

作業系統學習筆記--程序生命週期

作業系統原理讀書筆記之程序同步

筆記：程序間通訊——同步(互斥鎖、讀寫鎖、條件變數、訊號量）以及Linux中的RCU

作業系統概念（高等教育出版社，第七版）複習——第六章：程序同步

python3學習筆記：多程序分散式小例子

Linux學習筆記：存儲管理

學習筆記：javascript內置對象：數組對象

作業系統學習筆記：程序同步

相關推薦