1. 程式人生 > >JVM學習之java記憶體模型

JVM學習之java記憶體模型

JVM學習之java記憶體模型

以下blog內容來自《深入理解Java虛擬機器_JVM高階特性與最佳實踐》感謝作者!!
java虛擬機器規範定義了一種java記憶體模型(JMM)來遮蔽不同硬體和作業系統的差異,達到跨平臺執行效果,記憶體模型的定義一個宗旨就是併發記憶體訪問操作不會產生歧義。

類似C和C++等主流語言直接使用物理硬體和作業系統的記憶體模型,因此會由於不同平臺記憶體模型的差異導致程式在一個平臺上開發併發訪問執行正常,在另外一個平臺上併發訪問卻經常出錯,所以要不同平臺編寫不同的程式碼。

1 主記憶體和工作記憶體

java記憶體模型的主要目標是定義程式中各個變數的訪問規則,即在虛擬機器中將變數儲存到記憶體和從記憶體取出變數這樣的底層細節。此處變數不同於java程式設計過程中的變數,包括例項欄位,靜態欄位和構成陣列物件的元素,但不包括區域性變數和方法引數等執行緒私有的變數,不存在競爭問題。

java記憶體模型規定了所有的變數都儲存在主記憶體(Main Memory)中,此處的主記憶體是邏輯概念。每條執行緒還有自己的工作記憶體(Working Memory),執行緒的工作記憶體儲存了被該執行緒使用到的變數的主記憶體的副本拷貝,執行緒所有的對變數的操作(讀取,賦值等)都是在工作記憶體中進行,而不能直接讀寫主記憶體中的變數。

總結:主記憶體儲存了執行緒共享的變數,工作記憶體儲存了用到的主記憶體的變數的副本拷貝,執行緒操作的都是工作記憶體中的變數,執行緒間變數值得傳遞需要通過主記憶體,這裡就可以感覺到多執行緒操作會存在問題,因為可能同時在自己的工作記憶體修改了變數,主記憶體儲存的變數就可能發生問題。

為什麼如此設計?
每個執行緒只操作自己的私有工作記憶體,和每次都從主記憶體取值效率一定更高。

對應JVM執行時資料區,主記憶體主要對應堆區,工作記憶體則對應虛擬機器棧。

2 記憶體間互動操作

記憶體間的互動操作主要是主記憶體與工作記憶體之間具體的互動協議,也就是一個變數如何從主記憶體拷貝到工作記憶體,如何從工作記憶體同步回主記憶體的細節。java記憶體模型定義了八種操作來實現,每種操作都是原子的,不可再分的。

  • lock(鎖定):作用於主記憶體的變數,把一個變數標識為一條執行緒獨佔的狀態。
  • unclock(解鎖):作用於主記憶體的變數,把一個處於鎖定狀態的變數釋放出來,釋放後的變數才可以被其他執行緒鎖定。
  • read(讀取):作用於主記憶體的變數,把一個變數的值從主記憶體傳輸到執行緒的工作記憶體,以便隨後的load動作使用。
  • load(載入):作用於工作記憶體的變數,把read操作從主記憶體中得到的變數值放入工作記憶體的變數副本中。
  • use(使用):作用於工作記憶體的變數,把工作記憶體中一個變數的值傳遞給執行引擎。
  • assign(賦值):作用於工作記憶體的變數,把執行引擎接收到的值賦給工作記憶體的變數。
  • store(儲存):作用於工作記憶體的變數,把工作記憶體中一個變數的值傳送給主記憶體中,以便隨後的write操作使用。
  • write(寫入):作用於主記憶體的變數,把store操作從工作記憶體中得到的變數的值放入主記憶體的變數中。

利用上面指令 進行操作的規則:

  • 不允許read和load、store和write操作之一單獨出現,即不允許一個變數從主記憶體中讀取了但工作記憶體不接受,或者工作記憶體發起了回寫但主記憶體不接受的情況出現。
  • 不允許一個執行緒丟棄它的最近的assign操作,即變數在工作記憶體中改變了之後必須把該變化同步到主記憶體。
  • 不允許一個執行緒無原因地(沒有發生任何assign操作)把資料從執行緒的工作記憶體同步到主記憶體。
  • 一個新的變數只能在主記憶體中誕生,不允許在工作記憶體中直接使用一個未被初始化(load或assign)的變數,換句話說,就是對一個變數use、store操作之前,必須先執行過了assign和load操作。
  • 一個變數在同一時刻只允許一個執行緒對其進行lock操作,但lock操作可以被同一條執行緒重複執行多次,多次執行lock後,只有執行相同次數的unclock操作,變數才會被解鎖。
  • 如果對一個變數執行lock操作,那麼會清空工作記憶體次變數的值,在執行引擎使用這個變數前,需要重新執行load或assign操作初始化變數的值。
  • 如果對一個變數執行lock操作,那麼會清空工作記憶體次變數的值,在執行引擎使用這個變數前,需要重新執行load或assign操作初始化變數的值。
  • 對一個變數執行unclock之前,必須先把此變數同步回主記憶體中(執行store、write操作)。
    通過以上規則進行主記憶體和工作記憶體的互動。
    上面的規則是通用普通規則,jmm還規定了一系列特殊規則,請看下文:

(1)volatile 的實現原理這裡不特別說明(另有文章闡述),只說作用:

(1)變數定義為volatile之後,保證此變數對所有執行緒的可見性,可見性指一條執行緒修改了變數的值,新值對於其他執行緒來說可以立即得知。普通變數的值線上程間傳遞需要通過主記憶體來完成。
(2)volatile變數會禁止指令重排優化,可以保證變數的操作和程式碼順序一致。

指令重排:我們都知道變數的賦值不是一個原子操作,舉個例子一個執行緒進行一系列操作後對變數A賦值,另外一個執行緒取變數A的值,指令重排是對指令執行的優化,最終導致的結果就是可能沒有進行一系列操作時A已經被賦值,另外一個執行緒讀到的A就是錯誤的。(java記憶體模型中描述了“執行緒內表現為序列的語義”)

volatile變數被誤認為併發下是執行緒安全的是不對的,因為volatile只能保證可見性,卻不能保證原子性,類似一個i++自增操作其實是分成了好幾條指令執行的(取值,add,賦值),可能沒有執行add指令之前,i的值已經被修改了,所示還是需要新增同步處理。

既然volatile不能保證併發安全,它主要用在什麼地方呢?
當多執行緒操作中多個執行緒受一個變數的控制,改變變數則執行緒都立刻受到影響,此時就很適合使用volatile。

volatile原理是在指令中添加了記憶體屏障。

(2)long和double型別變數的特殊規則

java記憶體模型中的八種操作都具有原子性,但是對64位的資料結構,則規定允許虛擬機器將沒有被volatile修飾的64位資料的讀寫操作劃分為兩次32位的操作來進行,所以64位資料結構就可能不是原子操作。

3 原子性,可見性,有序性

java記憶體模型就是圍繞著併發過程中如何處理原子性,可見性,有序性三個特徵來建立的,下面逐一介紹三個操作的特性:

3.1、原子性(Atomicity)

原子性是指在一個操作中不可被中斷操作,要不執行完成,要不就不執行,具有原子性在多執行緒併發下不會出問題。
一個操作是原子操作,那麼我們稱它具有原子性。java的concurrent包下提供了一些原子類,AtomicInteger、AtomicLong、AtomicReference等。

記憶體模型8中操作中能保證原子性的操作包括read、load、use、assign、store,write,大致可以認為基礎資料型別的訪問和讀寫是具備原子性的(long,double特殊情況除外)。lock和unlock操作也可以保證一段程式碼的原子性。

3.2、可見性(Visibility)

可見性就是指當一個執行緒修改了執行緒共享變數的值,其它執行緒能夠立即得知這個修改。
Java記憶體模型是通過在變數修改後將新值同步回主記憶體,在變數讀取前從主記憶體重新整理變數值這種依賴主記憶體作為傳遞媒介的方法來實現可見性的,無論是普通變數還是volatile變數都是如此,普通變數與volatile變數的區別是volatile的特殊規則保證了新值能立即同步到主記憶體,以及每使用前立即從記憶體重新整理。

3.3、有序性(Ordering)

Java記憶體模型中的程式天然有序性可以總結為一句話:如果在本執行緒內觀察,所有操作都是有序的;如果在一個執行緒中觀察另一個執行緒,所有操作都是無序的。前半句是指“執行緒內表現為序列語義”,後半句是指“指令重排序”現象和“工作記憶體中主記憶體同步延遲”現象。

Java語言提供了volatile和synchronized兩個關鍵字來保證執行緒之間操作的有序性,volatile關鍵字本身就包含了禁止指令重排序的語義,而synchronized則是由“一個變數在同一時刻只允許一條執行緒對其進行lock操作”這條規則來獲得的,這個規則決定了持有同一個鎖的兩個同步塊只能序列地進入。