1. 程式人生 > >JAVA中JVM的重排序詳細介紹

JAVA中JVM的重排序詳細介紹

在併發程式中,程式設計師會特別關注不同程序或執行緒之間的資料同步,特別是多個執行緒同時修改同一變數時,必須採取可靠的同步或其它措施保障資料被正確地修改,這裡的一條重要原則是:不要假設指令執行的順序,你無法預知不同執行緒之間的指令會以何種順序執行。

但是在單執行緒程式中,通常我們容易假設指令是順序執行的,否則可以想象程式會發生什麼可怕的變化。理想的模型是:各種指令執行的順序是唯一且有序的,這個順序就是它們被編寫在程式碼中的順序,與處理器或其它因素無關,這種模型被稱作順序一致性模型,也是基於馮·諾依曼體系的模型。當然,這種假設本身是合理的,在實踐中也鮮有異常發生,但事實上,沒有哪個現代多處理器架構會採用這種模型,因為它是在是太低效了。而在編譯優化和CPU流水線中,幾乎都涉及到指令重排序。

編譯期重排序

編譯期重排序的典型就是通過調整指令順序,在不改變程式語義的前提下,儘可能減少暫存器的讀取、儲存次數,充分複用暫存器的儲存值。

假設第一條指令計算一個值賦給變數A並存放在暫存器中,第二條指令與A無關但需要佔用暫存器(假設它將佔用A所在的那個暫存器),第三條指令使用A的值且與第二條指令無關。那麼如果按照順序一致性模型,A在第一條指令執行過後被放入暫存器,在第二條指令執行時A不再存在,第三條指令執行時A重新被讀入暫存器,而這個過程中,A的值沒有發生變化。通常編譯器都會交換第二和第三條指令的位置,這樣第一條指令結束時A存在於暫存器中,接下來可以直接從暫存器中讀取A的值,降低了重複讀取的開銷。

重排序對於流水線的意義

現代CPU幾乎都採用流水線機制加快指令的處理速度,一般來說,一條指令需要若干個CPU時鐘週期處理,而通過流水線並行執行,可以在同等的時鐘週期內執行若干條指令,具體做法簡單地說就是把指令分為不同的執行週期,例如讀取、定址、解析、執行等步驟,並放在不同的元件中處理,同時在執行單元EU中,功能單元被分為不同的元件,例如加法元件、乘法元件、載入元件、儲存元件等,可以進一步實現不同的計算並行執行。

流水線架構決定了指令應該被並行執行,而不是在順序化模型中所認為的那樣。重排序有利於充分使用流水線,進而達到超標量的效果。

確保順序性

儘管指令在執行時並不一定按照我們所編寫的順序執行,但毋庸置疑的是,在單執行緒環境下,指令執行的最終效果應當與其在順序執行下的效果一致,否則這種優化便會失去意義。

通常無論是在編譯期還是執行期進行的指令重排序,都會滿足上面的原則。

Java儲存模型中的重排序

在Java儲存模型(Java Memory Model, JMM)中,重排序是十分重要的一節,特別是在併發程式設計中。JMM通過happens-before法則保證順序執行語義,如果想要讓執行操作B的執行緒觀察到執行操作A的執行緒的結果,那麼A和B就必須滿足happens-before原則,否則,JVM可以對它們進行任意排序以提高程式效能。

volatile關鍵字可以保證變數的可見性,因為對volatile的操作都在Main Memory中,而Main Memory是被所有執行緒所共享的,這裡的代價就是犧牲了效能,無法利用暫存器或Cache,因為它們都不是全域性的,無法保證可見性,可能產生髒讀。

volatile還有一個作用就是區域性阻止重排序的發生,對volatile變數的操作指令都不會被重排序,因為如果重排序,又可能產生可見性問題。

在保證可見性方面,鎖(包括顯式鎖、物件鎖)以及對原子變數的讀寫都可以確保變數的可見性。但是實現方式略有不同,例如同步鎖保證得到鎖時從記憶體裡重新讀入資料重新整理快取,釋放鎖時將資料寫回記憶體以保資料可見,而volatile變數乾脆都是讀寫記憶體。