1. 程式人生 > >java關鍵字 volatile的作用及使用說明

java關鍵字 volatile的作用及使用說明

緩存 image 串行 最終 有序性 不能 重排序 設計 語義

先來看看這個關鍵字是什麽意思:
volatile [?v?l?ta?l]
adj. 易變的,不穩定的;
從翻譯上來看,volatile表示這個關鍵字是極易發生改變的。
volatile是java語言中,最輕量級的並發同步機制。這個關鍵字有如下兩個作用:
1、任何對volatile變量的修改,java中的其他線程都可以感知到
2、volatile會禁止指令沖排序優化
  在詳細講解volatile關鍵字之前,需要對java的內存模型有所理解,否則很難深入的認識到volatile的作用。java 內存可以像之前講的那樣,劃分為堆、棧、方法區等等。但是從結合物理設備的角度來看,內存模型的布局設計如下:

技術分享圖片

  之所以這樣設計內存模型,是因為:相對於cpu的處理速度來說,物理內存的IO操作耗時非常嚴重。這就造成了cpu線程快速計算結束後,需要浪費大量的時間來等待內存IO的操作。為了減少這種等待,java內存模型引入了工作內存的概念。工作內存主要是利用cpu或內存的寄存器、高速緩存等部分進行數據緩沖,減少cpu線程在內存IO期間的等待。


在java內存模型中,線程任何與數據有關的操作,都與並且只與工作內存相關。當線程需(防盜連接:本文首發自http://www.cnblogs.com/jilodream/ )要操作數據時,虛擬機會首先從主內存中讀取數據,然後放置一份拷貝的數據到工作內存中。接著java線程讀取工作內存中的拷貝數據,並操作得到一個全新的數據,然將將這個數據放回到工作內存中,覆蓋原有的值。
  這樣做可以充分利用物理硬件的優勢:
  (1)主內存,存儲區域大,但是速度不行,適於存儲,不適於快速讀寫
  (2)工作內存、存儲空間小,但是速度快,適於快速讀寫,不適於存儲
同時還避免了Java線程讀寫主內存中數據同步問題。因為主內存對於各個Java線程都是可見的。如果java線程並發操作,就會導致主內存中的數據需要進行同步保護,否則就會出現錯誤的語義。

  但是這樣做仍然會有一個問題:工作內存中的數據是拷貝數據。在Java線程操作的過程中,主內存中的數據可能已經發生改變,Java線程相當於是在用過時的值在計算和回寫。這個問題就是數據稱之為“同步”的含義所在,也是鎖要處理的可見性的問題(以後有文章我會專門講這個問題)。
如何解決這個問題呢?
  只能是通過“鎖”的形式來處理。volatile關鍵字的作用之一,就是形成這樣一個“鎖”:
  如果一個變量被定義了volatile,那麽每次Java線程在寫入這個變量時,都會加入一個“lock addl $Ox0"的操作指令。這樣會形成一個“內存屏障”,當cpu將這條指令寫入到主內存時,會告訴其他存有這份指令的工作內存加一個標識。表示這個變量已經發生了變化,當前工作內存中存儲的拷貝數據已經過時(這個過程被稱之為內核CacheInvalidate)。當其他線程需要使用該變量來操作時,系統會因為這個標識判定當前工作內存中的數據已經過時。從而主動刷新主內存中的值到自己下邊的工作內存中。由於在整個過程中,系統已經在線程操作數據之前,提前刷新了變量的值,所以線程無法看到已經過時的數據的。因此從表現上來看,可以認為是不存在數據不一致的問題。

  這裏需要專門強調下long、double型。對於內存模型中定義的指令來說,操作的數據都是32位的。如果數據是64位,那麽就需要兩次指令操作。對於虛擬機中64位數據類型:double、long型,就會因為需要兩次操作的時間差,導致其他線程拿到的是一種修改的中間值。
  但是volatile的內存屏障專門對這裏進行了處理,以保證這種中間值不會出現在其他cpu的工作內存中。同時目前商業的虛擬機已經都對這個問題專門進行了處理:對64位數據的讀寫也采用原子操作。為的就是防止long double這兩個常用類型,由於沒有增加volatile關鍵字,而導致在工作內存中出現奇怪的值。
  volatile的另外一個作用是禁止指令重排序的優化
  cpu線程在執行指令的過程中,為了保證速度更快,指令之間的順序往往是通過優化重排序以後的順序。為了保證重排序的指令不會有任何的歧義而僅僅是在速度上有所提升,系統會保證指令優化以後執行的結果是一致的。也就是你所獲得的結果與沒優化獲得到的結果是一樣的,不存在差異。但是由於指令順序發生了變化,所以系統是無法保證這個過程中,其他的線程獲取到的數據是能正確代表當前狀態的。這裏最經典的就是單例模式下,實例初始化的問題。請參見文章:設計模式之單例模式 的第3個方法。
由於指令重排,系統會在變量沒有初始化結束前,就已經給instance變量(防盜連接:本文首發自http://www.cnblogs.com/jilodream/ )賦予地址。這時候其他線程獲取到的變量就是有問題的:instance!=null,但是裏邊的值卻沒有初始化完成。這裏就需要使用volatile關鍵字禁止指令重排序:只有在實例初始化完畢後,才賦予變量instance引用。
  另外一個常見的例子是:
  線程B在刷新線程A的處理結果時,可能由於線程A還沒有對變量初始化完畢,卻提前刷新了變量,導致了線程B所獲取到的變量的狀態是錯誤的。
因此在定義多線程可見變量時,前邊一定要加volatile關鍵字,保證該變量不會被因為指令順序被優化,而導致其他線程獲取到的值是無意義的。
關於Java語言的有序性在《深入理解Java虛擬機》中有一句話,總結的非常好:如果在本線程內觀察,所有的操作都是有序的。如果在一個其它線程觀察本線程,則所有的操作都是無序的。
  前邊是指,無論虛擬機怎麽優化指令,當前線程在執行的語義和結果上都應該是一致的。(“線程內表現為串行的語義"Within-Thread-As-If-Serial-Semantics)。後邊是指指令會發生重排,其它線程中獲取到的值,不能代表什麽。
其實volatile的這兩個作用是互相關聯的:正是由於volatile需要保證變量的可見性,因此不能將系統無序的中間指令結果反映到主內存中,讓其它線程拿去使用可見,所以需要禁止掉指令重排序。保證拿到的結果是反映出當前的執行狀態的。(這裏涉及到一個happens-before原則的概念,我會在後邊的文章中介紹)
volatile存在的問題
  說了volatile的兩個作用,volatile也有自身的不足。那就是volatile不能保證原子性:
舉個前文講過的例子,volatile變量值被修改以後,會直接刷新到主內存中,並且其他線程能感知到。但是其他線程繼續使用這個變量進行計算時,卻不能保證其一直是最新的值。舉個經典例子

1 volatile int a=02 int add()
3 {
4     a++;
5 }

  兩個線程t1,t2先後執行add)方法,變量a發生了自增。但是a變量的最終結果可能是1也可能是2。這取決於t2讀取變量a的值是在第一個線程刷新a到主內存之前,還是主內存之後。
a++操作最終在執行時,會執行三條指令:
1、從主內存中讀取a值
2、a=a+1
3、寫入a的值到主內存中
  當t1執行完第二步時,假如此時t2也讀取了a的值,則:主內存a=0;t1工作內存為a=1;t2工作內存為a=0;接下來t1執行回寫a操作,但是t2由於已經讀取了a的值在工作內存中,因此t2在執行了a++操作後,仍然會回寫a=1到主內存中,這時盡管t1回寫後,生成內存屏障,但是t2已經讀取完畢,不會在自增階段再主動刷新。(防盜連接:本文首發自http://www.cnblogs.com/jilodream/ )否則如果需要執行連續的多條指令,每次都要主動刷新變量,一旦發生變化就重頭開始,這顯然是不可能的。這種情況就需要程序員通過代碼自己來保證沒有問題。
這裏我們可以發現a變量不會因為volatile關鍵字,而使得自身的指令在外界看來是原子的。
因此volatile的使用存在如下限制場景:
  1、volatile可以寫入,但是寫入的值不應該依賴舊值
  2、在確認某個狀態的不變性時,不能將volatile變量作為因子。
  這兩點在《java並發編程實戰》、《深入理解java虛擬機》中都有提到類似的語義。第一點比較容易理解。第二點比較抽象,這裏解釋一下:就是說volatile適合於判斷是否已經改變了,而不適合判斷是否還沒改變,因為volatile變量發生改變,則一定發生了變化,volatile沒有發生變化,則不能說明一定沒有發生變化。
如前文,a如果仍然等於0.此時不能認為:1、add方法沒有被調用過2、整體沒有被改變過。

java關鍵字 volatile的作用及使用說明