1. 程式人生 > >資料庫死鎖原因及解決辦法

資料庫死鎖原因及解決辦法

死鎖(Deadlock)

所謂死鎖:是指兩個或兩個以上的程序在執行過程中,因爭奪資源而造成的一種互相等待的現象,若無外力作用,它們都將無法推進下去。此時稱系統處於死鎖狀態或系統產生了死鎖,這些永遠在互相等待的程序稱為死鎖程序。由於資源佔用是互斥的,當某個程序提出申請資源後,使得有關程序在無外力協助下,永遠分配不到必需的資源而無法繼續執行,這就產生了一種特殊現象死鎖。 一種情形,此時執行程式中兩個或多個執行緒發生永久堵塞(等待),每個執行緒都在等待被其他執行緒佔用並堵塞了的資源。例如,如果執行緒A鎖住了記錄1並等待記錄2,而執行緒B鎖住了記錄2並等待記錄1,這樣兩個執行緒就發生了死鎖現象。計算機系統中,如果系統的資源分配策略不當,更常見的可能是程式設計師寫的程式有錯誤等,則會導致程序因競爭資源不當而產生死鎖的現象。鎖有多種實現方式,比如意向鎖,共享-排他鎖,鎖表,樹形協議,時間戳協議等等。鎖還有多種粒度,比如可以在表上加鎖,也可以在記錄上加鎖。 

產生死鎖的原因主要是:

(1)系統資源不足。

(2) 程序執行推進的順序不合適。

(3)資源分配不當等。

如果系統資源充足,程序的資源請求都能夠得到滿足,死鎖出現的可能性就很低,否則就會因爭奪有限的資源而陷入死鎖。其次,程序執行推進順序與速度不同,也可能產生死鎖。

產生死鎖的四個必要條件:

(1) 互斥條件:一個資源每次只能被一個程序使用。
(2) 請求與保持條件:一個程序因請求資源而阻塞時,對已獲得的資源保持不放。
(3) 不剝奪條件:程序已獲得的資源,在末使用完之前,不能強行剝奪。
(4) 迴圈等待條件:若干程序之間形成一種頭尾相接的迴圈等待資源關係。

  這四個條件是死鎖的必要條件,只要系統發生死鎖,這些條件必然成立,而只要上述條件之一不滿足,就不會發生死鎖。

死鎖的預防和解除:

理解了死鎖的原因,尤其是產生死鎖的四個必要條件,就可以最大可能地避免、預防和解除死鎖。所以,在系統設計、程序排程等方面注意如何不讓這四個必要條件成立,如何確定資源的合理分配演算法,避免程序永久佔據系統資源。此外,也要防止程序在處於等待狀態的情況下佔用資源,在系統執行過程中,對程序發出的每一個系統能夠滿足的資源申請進行動態檢查,並根據檢查結果決定是否分配資源,若分配後系統可能發生死鎖,則不予分配,否則予以分配 。因此,對資源的分配要給予合理的規劃。

如何將死鎖減至最少

雖然不能完全避免死鎖,但可以使死鎖的數量減至最少。將死鎖減至最少可以增加事務的吞吐量並減少系統開銷,因為只有很少的事務回滾,而回滾會取消事務執行的所有工作。由於死鎖時回滾而由應用程式重新提交。

下列方法有助於最大限度地降低死鎖:

(1)按同一順序訪問物件。

(2)避免事務中的使用者互動。

(3)保持事務簡短並在一個批處理中。

(4)使用低隔離級別。

(5)使用繫結連線。

按同一順序訪問物件

如果所有併發事務按同一順序訪問物件,則發生死鎖的可能性會降低。例如,如果兩個併發事務獲得 Supplier 表上的鎖,然後獲得 Part 表上的鎖,則在其中一個事務完成之前,另一個事務被阻塞在 Supplier 表上。第一個事務提交或回滾後,第二個事務繼續進行。不發生死鎖。將儲存過程用於所有的資料修改可以標準化訪問物件的順序。

避免事務中的使用者互動

避免編寫包含使用者互動的事務,因為執行沒有使用者互動的批處理的速度要遠遠快於使用者手動響應查詢的速度,例如答覆應用程式請求引數的提示。例如,如果事務正在等待使用者輸入,而使用者去吃午餐了或者甚至回家過週末了,則使用者將此事務掛起使之不能完成。這樣將降低系統的吞吐量,因為事務持有的任何鎖只有在事務提交或回滾時才會釋放。即使不出現死鎖的情況,訪問同一資源的其它事務也會被阻塞,等待該事務完成。

保持事務簡短並在一個批處理中

在同一資料庫中併發執行多個需要長時間執行的事務時通常發生死鎖。事務執行時間越長,其持有排它鎖或更新鎖的時間也就越長,從而堵塞了其它活動並可能導致死鎖。

保持事務在一個批處理中,可以最小化事務的網路通訊往返量,減少完成事務可能的延遲並釋放鎖。

使用低隔離級別

確定事務是否能在更低的隔離級別上執行。執行提交讀允許事務讀取另一個事務已讀取(未修改)的資料,而不必等待第一個事務完成。使用較低的隔離級別(例如提交讀)而不使用較高的隔離級別(例如可序列讀)可以縮短持有共享鎖的時間,從而降低了鎖定爭奪。

使用繫結連線

使用繫結連線使同一應用程式所開啟的兩個或多個連線可以相互合作。次級連線所獲得的任何鎖可以象由主連接獲得的鎖那樣持有,反之亦然,因此不會相互阻塞。

用儲存過程查出引起死鎖的程序和SQL語句

假如發生了死鎖,我們怎麼去檢測具體發生死鎖的是哪條SQL語句或儲存過程?此時我們可以使用以下儲存過程來檢測,就可以查出引起死鎖的程序和SQL語句。

與鎖定有關的兩個問題--死鎖和阻塞

死鎖

死鎖是一種條件,不僅僅是在關係資料庫管理系統 (RDBMS) 中發生,在任何多使用者系統中都可以發生的。當兩個使用者(或會話)具有不同物件的鎖,並且每個使用者需要另一個物件的鎖時,就會出現死鎖。每個使用者都等待另一個使用者釋放他的鎖。當兩個連線陷入死鎖時,Microsoft® SQL Server? 會進行檢測。其中一個連線被選作死鎖犧牲品。該連線的事務回滾,同時應用程式收到錯誤。

如果死鎖變成單個公用事件,而且它們的回滾造成過多的效能降級,那麼就需要再次進行深入徹底的調查。使用跟蹤標記 1204。例如,下面的命令從命令提示符啟動 SQL Server,並啟用跟蹤標記 1204:

c:\mssql\binn\sqlservr -T1204

現在所有訊息都會顯示在啟動 SQL Server 的控制檯螢幕上和錯誤日誌中。

使用分散式事務時,也可能發生死鎖。

阻塞

任何基於鎖的併發系統都不可避免地具有可能在某些情況下發生阻塞的特徵。當一個連線控制了一個鎖,而另一個連線需要衝突的鎖型別時,將發生阻塞。其結果是強制第二個連線等待,或在第一個連線上阻塞。

在本主題中,術語"連線"是指資料庫的單個登入會話。每個連線都作為系統程序 ID (SPID) 出現。儘管每一個 SPID 一般都不是單獨的程序上下文,但這裡常常用來指一個程序。更確切的說,每個 SPID 都是由伺服器資源和資料結構(為給定客戶單個連線的請求提供服務)組成。單個客戶應用程式可能有一個或多個連線。就 SQL Server 而言,從單個客戶機上的單個客戶應用程式來的多個連線和從多個客戶應用程式或多個客戶機來的多個連線是沒有區別的。不管是來自同一應用程式還是來自兩臺不同客戶機上單獨的應用程式,一個連線都可以阻塞另一個連線。