深入理解Java記憶體模型（六）——final

阿新 • • 發佈：2018-12-11

與前面介紹的鎖和volatile相比較，對final域的讀和寫更像是普通的變數訪問。對於final域，編譯器和處理器要遵守兩個重排序規則：

在建構函式內對一個final域的寫入，與隨後把這個被構造物件的引用賦值給一個引用變數，這兩個操作之間不能重排序。
初次讀一個包含final域的物件的引用，與隨後初次讀這個final域，這兩個操作之間不能重排序。

下面，我們通過一些示例性的程式碼來分別說明這兩個規則：

public class FinalExample {
    int i;                            //普通變數
    final int j;                      //final變數
    static FinalExample obj;

    public void FinalExample () {     //建構函式
        i = 1;                        //寫普通域
        j = 2;                        //寫final域
    }

    public static void writer () {    //寫執行緒A執行
        obj = new FinalExample ();
    }

    public static void reader () {       //讀執行緒B執行
        FinalExample object = obj;       //讀物件引用
        int a = object.i;                //讀普通域
        int b = object.j;                //讀final域
    }
}

這裡假設一個執行緒A執行writer ()方法，隨後另一個執行緒B執行reader ()方法。下面我們通過這兩個執行緒的互動來說明這兩個規則。

寫final域的重排序規則

寫final域的重排序規則禁止把final域的寫重排序到建構函式之外。這個規則的實現包含下面2個方面：

JMM禁止編譯器把final域的寫重排序到建構函式之外。
編譯器會在final域的寫之後，建構函式return之前，插入一個StoreStore屏障。這個屏障禁止處理器把final域的寫重排序到建構函式之外。

現在讓我們分析writer ()方法。writer ()方法只包含一行程式碼：finalExample = new FinalExample ()。這行程式碼包含兩個步驟：

構造一個FinalExample型別的物件；
把這個物件的引用賦值給引用變數obj。

假設執行緒B讀物件引用與讀物件的成員域之間沒有重排序（馬上會說明為什麼需要這個假設），下圖是一種可能的執行時序：

在上圖中，寫普通域的操作被編譯器重排序到了建構函式之外，讀執行緒B錯誤的讀取了普通變數i初始化之前的值。而寫final域的操作，被寫final域的重排序規則“限定”在了建構函式之內，讀執行緒B正確的讀取了final變數初始化之後的值。

寫final域的重排序規則可以確保：在物件引用為任意執行緒可見之前，物件的final域已經被正確初始化過了，而普通域不具有這個保障。以上圖為例，在讀執行緒B“看到”物件引用obj時，很可能obj物件還沒有構造完成（對普通域i的寫操作被重排序到建構函式外，此時初始值2還沒有寫入普通域i）。

讀final域的重排序規則

讀final域的重排序規則如下：

在一個執行緒中，初次讀物件引用與初次讀該物件包含的final域，JMM禁止處理器重排序這兩個操作（注意，這個規則僅僅針對處理器）。編譯器會在讀final域操作的前面插入一個LoadLoad屏障。

初次讀物件引用與初次讀該物件包含的final域，這兩個操作之間存在間接依賴關係。由於編譯器遵守間接依賴關係，因此編譯器不會重排序這兩個操作。大多數處理器也會遵守間接依賴，大多數處理器也不會重排序這兩個操作。但有少數處理器允許對存在間接依賴關係的操作做重排序（比如alpha處理器），這個規則就是專門用來針對這種處理器。

reader()方法包含三個操作：

初次讀引用變數obj;
初次讀引用變數obj指向物件的普通域j。
初次讀引用變數obj指向物件的final域i。

現在我們假設寫執行緒A沒有發生任何重排序，同時程式在不遵守間接依賴的處理器上執行，下面是一種可能的執行時序：

在上圖中，讀物件的普通域的操作被處理器重排序到讀物件引用之前。讀普通域時，該域還沒有被寫執行緒A寫入，這是一個錯誤的讀取操作。而讀final域的重排序規則會把讀物件final域的操作“限定”在讀物件引用之後，此時該final域已經被A執行緒初始化過了，這是一個正確的讀取操作。

讀final域的重排序規則可以確保：在讀一個物件的final域之前，一定會先讀包含這個final域的物件的引用。在這個示例程式中，如果該引用不為null，那麼引用物件的final域一定已經被A執行緒初始化過了。

如果final域是引用型別

上面我們看到的final域是基礎資料型別，下面讓我們看看如果final域是引用型別，將會有什麼效果？

請看下列示例程式碼：

public class FinalReferenceExample {
final int[] intArray;                     //final是引用型別
static FinalReferenceExample obj;

public FinalReferenceExample () {        //建構函式
    intArray = new int[1];              //1
    intArray[0] = 1;                   //2
}

public static void writerOne () {          //寫執行緒A執行
    obj = new FinalReferenceExample ();  //3
}

public static void writerTwo () {          //寫執行緒B執行
    obj.intArray[0] = 2;                 //4
}

public static void reader () {              //讀執行緒C執行
    if (obj != null) {                    //5
        int temp1 = obj.intArray[0];       //6
    }
}
}

這裡final域為一個引用型別，它引用一個int型的陣列物件。對於引用型別，寫final域的重排序規則對編譯器和處理器增加了如下約束：

在建構函式內對一個final引用的物件的成員域的寫入，與隨後在建構函式外把這個被構造物件的引用賦值給一個引用變數，這兩個操作之間不能重排序。

對上面的示例程式，我們假設首先執行緒A執行writerOne()方法，執行完後執行緒B執行writerTwo()方法，執行完後執行緒C執行reader ()方法。下面是一種可能的執行緒執行時序：

在上圖中，1是對final域的寫入，2是對這個final域引用的物件的成員域的寫入，3是把被構造的物件的引用賦值給某個引用變數。這裡除了前面提到的1不能和3重排序外，2和3也不能重排序。

JMM可以確保讀執行緒C至少能看到寫執行緒A在建構函式中對final引用物件的成員域的寫入。即C至少能看到陣列下標0的值為1。而寫執行緒B對陣列元素的寫入，讀執行緒C可能看的到，也可能看不到。JMM不保證執行緒B的寫入對讀執行緒C可見，因為寫執行緒B和讀執行緒C之間存在資料競爭，此時的執行結果不可預知。

如果想要確保讀執行緒C看到寫執行緒B對陣列元素的寫入，寫執行緒B和讀執行緒C之間需要使用同步原語（lock或volatile）來確保記憶體可見性。

為什麼final引用不能從建構函式內“逸出”

前面我們提到過，寫final域的重排序規則可以確保：在引用變數為任意執行緒可見之前，該引用變數指向的物件的final域已經在建構函式中被正確初始化過了。其實要得到這個效果，還需要一個保證：在建構函式內部，不能讓這個被構造物件的引用為其他執行緒可見，也就是物件引用不能在建構函式中“逸出”。為了說明問題，讓我們來看下面示例程式碼：

public class FinalReferenceEscapeExample {
final int i;
static FinalReferenceEscapeExample obj;

public FinalReferenceEscapeExample () {
    i = 1;                              //1寫final域
    obj = this;                          //2 this引用在此“逸出”
}

public static void writer() {
    new FinalReferenceEscapeExample ();
}

public static void reader {
    if (obj != null) {                     //3
        int temp = obj.i;                 //4
    }
}
}

假設一個執行緒A執行writer()方法，另一個執行緒B執行reader()方法。這裡的操作2使得物件還未完成構造前就為執行緒B可見。即使這裡的操作2是建構函式的最後一步，且即使在程式中操作2排在操作1後面，執行read()方法的執行緒仍然可能無法看到final域被初始化後的值，因為這裡的操作1和操作2之間可能被重排序。實際的執行時序可能如下圖所示：

從上圖我們可以看出：在建構函式返回前，被構造物件的引用不能為其他執行緒可見，因為此時的final域可能還沒有被初始化。在建構函式返回後，任意執行緒都將保證能看到final域正確初始化之後的值。

final語義在處理器中的實現

現在我們以x86處理器為例，說明final語義在處理器中的具體實現。

上面我們提到，寫final域的重排序規則會要求譯編器在final域的寫之後，建構函式return之前，插入一個StoreStore障屏。讀final域的重排序規則要求編譯器在讀final域的操作前面插入一個LoadLoad屏障。

由於x86處理器不會對寫-寫操作做重排序，所以在x86處理器中，寫final域需要的StoreStore障屏會被省略掉。同樣，由於x86處理器不會對存在間接依賴關係的操作做重排序，所以在x86處理器中，讀final域需要的LoadLoad屏障也會被省略掉。也就是說在x86處理器中，final域的讀/寫不會插入任何記憶體屏障！

JSR-133為什麼要增強final的語義

在舊的Java記憶體模型中，最嚴重的一個缺陷就是執行緒可能看到final域的值會改變。比如，一個執行緒當前看到一個整形final域的值為0（還未初始化之前的預設值），過一段時間之後這個執行緒再去讀這個final域的值時，卻發現值變為了1（被某個執行緒初始化之後的值）。最常見的例子就是在舊的Java記憶體模型中，String的值可能會改變（參考文獻2中有一個具體的例子，感興趣的讀者可以自行參考，這裡就不贅述了）。

為了修補這個漏洞，JSR-133專家組增強了final的語義。通過為final域增加寫和讀重排序規則，可以為java程式設計師提供初始化安全保證：只要物件是正確構造的（被構造物件的引用在建構函式中沒有“逸出”），那麼不需要使用同步（指lock和volatile的使用），就可以保證任意執行緒都能看到這個final域在建構函式中被初始化之後的值。

參考文獻

關於作者

程曉明，Java軟體工程師，國家認證的系統分析師、資訊專案管理師。專注於併發程式設計，就職於富士通南大。個人郵箱：[email protected]。

深入理解Java記憶體模型（六）——final

寫final域的重排序規則

讀final域的重排序規則

如果final域是引用型別

為什麼final引用不能從建構函式內“逸出”

final語義在處理器中的實現

JSR-133為什麼要增強final的語義

參考文獻

關於作者

深入理解Java記憶體模型（六）——final

深入理解Java記憶體模型（四）——volatile

深入理解Java記憶體模型（一）——基礎

深入理解Java記憶體模型（三）——順序一致性

深入理解Java記憶體模型（二）——重排序

深入理解Java記憶體模型（七）——總結

深入理解Java記憶體模型（五）——鎖

【併發程式設計】一文帶你讀懂深入理解Java記憶體模型（面試必備）

深入理解java虛擬機器（六）位元組碼指令簡介

《深入理解 Java 記憶體模型》讀書筆記（下）（乾貨，萬字長文）

《深入理解 Java 記憶體模型》讀書筆記（上）（乾貨，萬字長文）

深入理解Java虛擬機器（5）Java記憶體模型

深入理解java虛擬機器（一）----jvm記憶體模型

深入理解java虛擬機器（一）java虛擬機器的記憶體區域

深入理解java虛擬機器（一）java的記憶體區域

深入理解java虛擬機器（一）：java記憶體區域（記憶體結構劃分）

深入理解Java：註解（Annotation）--註解處理器

深入理解Java的註解（Annotation）：註解處理器（3）

深入理解Java虛擬機（筆記）

Java 記憶體模型（JMM）

深入理解Java記憶體模型（六）——final

寫final域的重排序規則

讀final域的重排序規則

如果final域是引用型別

為什麼final引用不能從建構函式內“逸出”

final語義在處理器中的實現

JSR-133為什麼要增強final的語義

參考文獻

關於作者

相關推薦