1. 程式人生 > >JAVA高級篇(二、JVM內存模型、內存管理之第二篇)

JAVA高級篇(二、JVM內存模型、內存管理之第二篇)

字符串 data 第一步 系統開發 系統性能 sets 程序編譯 通信 war

本文轉自https://zhuanlan.zhihu.com/p/25713880。

JVM的基礎概念

JVM的中文名稱叫Java虛擬機,它是由軟件技術模擬出計算機運行的一個虛擬的計算機。

JVM也充當著一個翻譯官的角色,我們編寫出的Java程序,是不能夠被操作系統所直接識別的,這時候JVM的作用就體現出來了,它負責把我們的程序翻譯給系統“聽”,告訴它我們的程序需要做什麽操作。

我們都知道Java的程序需要經過編譯後,產生.Class文件,JVM才能識別並運行它,JVM針對每個操作系統開發其對應的解釋器,所以只要其操作系統有對應版本的JVM,那麽這份Java編譯後的代碼就能夠運行起來,這就是Java能一次編譯,到處運行的原因。



JVM的生命周期

JVM在Java程序開始執行的時候,它才運行,程序結束的時它就停止。

一個Java程序會開啟一個JVM進程,如果一臺機器上運行三個程序,那麽就會有三個運行中的JVM進程。

JVM中的線程分為兩種:守護線程和普通線程

守護線程是JVM自己使用的線程,比如垃圾回收(GC)就是一個守護線程。

普通線程一般是Java程序的線程,只要JVM中有普通線程在執行,那麽JVM就不會停止。

權限足夠的話,可以調用exit()方法終止程序。



JVM的結構體系

技術分享圖片

JVM的啟動過程

1、JVM的裝入環境和配置

在學習這個之前,我們需要了解一件事情,就是JDK和JRE的區別。

JDK是面向開發人員使用的SDK,它提供了Java的開發環境和運行環境,JDK中包含了JRE。

JRE是Java的運行環境,是面向所有Java程序的使用者,包括開發者。

JRE = 運行環境 = JVM。

如果安裝了JDK,會發現電腦中有兩套JRE,一套位於/Java/jre.../下,一套位於/Java/jdk.../jre下。那麽問題來了,一臺機器上有兩套以上JRE,誰來決定運行那一套呢?這個任務就落到java.exe身上,java.exe的任務就是找到合適的JRE來運行java程序。

java.exe按照以下的順序來選擇JRE:

1、自己目錄下有沒有JRE

2、父目錄下有沒有JRE

3、查詢註冊表: HKEY_LOCAL_MACHINE\SOFTWARE\JavaSoft\Java Runtime Environment\"當前JRE版本號"\JavaHome

這幾步的主要核心是為了找到JVM的絕對路徑。

jvm.cfg的路徑為:JRE路徑\lib\"CPU架構"\jvm.fig

jvm.cfg的內容大致如下:


-client KNOWN
-server KNOWN
-hotspot ALIASED_TO -client
-classic WARN
-native ERROR
-green ERROR

KNOWN 表示存在 、IGNORE 表示不存在 、ALIASED_TO 表示給別的JVM去一個別名
WARN 表示不存在時找一個替代 、ERROR 表示不存在拋出異常

2、裝載JVM

通過第一步找到JVM的路徑後,Java.exe通過LoadJavaVM來裝入JVM文件。
LoadLibrary裝載JVM動態連接庫,然後把JVM中的到處函數JNI_CreateJavaVM和JNI_GetDefaultJavaVMIntArgs 掛接到InvocationFunction 變量的CreateJavaVM和GetDafaultJavaVMInitArgs 函數指針變量上。JVM的裝載工作完成。

3、初始化JVM,獲得本地調用接口

調用InvocationFunction -> CreateJavaVM也就是JVM中JNI_CreateJavaVM方法獲得JNIEnv結構的實例。

4、運行Java程序

JVM運行Java程序的方式有兩種:jar包 與 Class
運行jar 的時候,Java.exe調用GetMainClassName函數,該函數先獲得JNIEnv實例然後調用JarFileJNIEnv類中getManifest(),從其返回的Manifest對象中取getAttrebutes("Main-Class")的值,即jar 包中文件:META-INF/MANIFEST.MF指定的Main-Class的主類名作為運行的主類。之後main函數會調用Java.c中LoadClass方法裝載該主類(使用JNIEnv實例的FindClass)。

運行Class的時候,main函數直接調用Java.c中的LoadClass方法裝載該類。



Class文件

Class文件由Java編譯器生成,我們創建的.Java文件在經過編譯器後,會變成.Class的文件,這樣才能被JVM所識別並運行。



類加載子系統

類加載子系統也可以稱之為類加載器,JVM默認提供三個類加載器:

1、BootStrap ClassLoader :稱之為啟動類加載器,是最頂層的類加載器,負責加載JDK中的核心類庫,如 rt.jar、resources.jar、charsets.jar等。

2、Extension ClassLoader:稱之為擴展類加載器,負責加載Java的擴展類庫,默認加載$JAVA_HOME中jre/lib/*.jar 或 -Djava.ext.dirs指定目錄下的jar包。

3、App ClassLoader:稱之為系統類加載器,負責加載應用程序classpath目錄下所有jar和class文件。

除了Java默認提供的三個ClassLoader(加載器)之外,我們還可以根據自身需要自定義ClassLoader,自定義ClassLoader必須繼承java.lang.ClassLoader 類。除了BootStrap ClassLoader 之外的另外兩個默認加載器都是繼承自java.lang.ClassLoader 。BootStrap ClassLoader 不是一個普通的Java類,它底層由C++編寫,已嵌入到了JVM的內核當中,當JVM啟動後,BootStrap ClassLoader 也隨之啟動,負責加載完核心類庫後,並構造Extension ClassLoader 和App ClassLoader 類加載器。

類加載器子系統不僅僅負責定位並加載類文件,它還嚴格按照以下步驟做了很多事情:

1、加載:尋找並導入Class文件的二進制信息
2、連接:進行驗證、準備和解析
     1)驗證:確保導入類型的正確性
     2)準備:為類型分配內存並初始化為默認值
     3)解析:將字符引用解析為直接引用
3、初始化:調用Java代碼,初始化類變量為指定初始值

詳細請參考另一篇文章:Java類加載機制 - 知乎專欄



方法區(Method Area)

在JVM中,類型信息和類靜態變量都保存在方法區中,類型信息是由類加載器在類加載的過程中從類文件中提取出來的信息。

需要註意的一點是,常量池也存放於方法區中。

程序中所有的線程共享一個方法區,所以訪問方法區的信息必須確保線程是安全的。如果有兩個線程同時去加載一個類,那麽只能有一個線程被允許去加載這個類,另一個必須等待。

在程序運行時,方法區的大小是可以改變的,程序在運行時可以擴展。

方法區也可以被垃圾回收,但條件非常嚴苛,必須在該類沒有任何引用的情況下,詳情可以參考另一篇文章:Java性能優化之JVM GC(垃圾回收機制) - 知乎專欄

類型信息包括什麽?

1、類型的全名(The fully qualified name of the type)

2、類型的父類型全名(除非沒有父類型,或者父類型是java.lang.Object)(The fully qualified name of the typeís direct superclass)

3、該類型是一個類還是接口(class or an interface)(Whether or not the type is a class )

4、類型的修飾符(public,private,protected,static,final,volatile,transient等)(The typeís modifiers)

5、所有父接口全名的列表(An ordered list of the fully qualified names of any direct superinterfaces)

6、類型的字段信息(Field information)

7、類型的方法信息(Method information)

8、所有靜態類變量(非常量)信息(All class (static) variables declared in the type, except constants)

9、一個指向類加載器的引用(A reference to class ClassLoader)

10、一個指向Class類的引用(A reference to class Class)

11、基本類型的常量池(The constant pool for the type)

方法列表(Method Tables)

為了更高效的訪問所有保存在方法區中的數據,在方法區中,除了保存上邊的這些類型信息之外,還有一個為了加快存取速度而設計的數據結構:方法列表。每一個被加載的非抽象類,Java虛擬機都會為他們產生一個方法列表,這個列表中保存了這個類可能調用的所有實例方法的引用,保存那些父類中調用的方法。



Java堆(JVM堆、Heap)

當Java創建一個類的實例對象或者數組時,都在堆中為新的對象分配內存。

虛擬機中只有一個堆,程序中所有的線程都共享它。

堆占用的內存空間是最多的。

堆的存取類型為管道類型,先進先出。

在程序運行中,可以動態的分配堆的內存大小。

堆的內存資源回收是交給JVM GC進行管理的,詳情請參考:Java性能優化之JVM GC(垃圾回收機制) - 知乎專欄



Java棧(JVM棧、Stack)

在Java棧中只保存基礎數據類型(參考:Java 基本數據類型 - 四類八種 - 知乎專欄)和自定義對象的引用,註意只是對象的引用而不是對象本身哦,對象是保存在堆區中的。

拓展知識:像String、Integer、Byte、Short、Long、Character、Boolean這六個屬於包裝類型,它們是存放於堆中的。

棧的存取類型為類似於水杯,先進後出。

棧內的數據在超出其作用域後,會被自動釋放掉,它不由JVM GC管理。

每一個線程都包含一個棧區,每個棧中的數據都是私有的,其他棧不能訪問。

每個線程都會建立一個操作棧,每個棧又包含了若幹個棧幀,每個棧幀對應著每個方法的每次調用,每個棧幀包含了三部分:

局部變量區(方法內基本類型變量、變量對象指針)

操作數棧區(存放方法執行過程中產生的中間結果)

運行環境區(動態連接、正確的方法返回相關信息、異常捕捉)



本地方法棧

本地方法棧的功能和JVM棧非常類似,用於存儲本地方法的局部變量表,本地方法的操作數棧等信息。

棧的存取類型為類似於水杯,先進後出。

棧內的數據在超出其作用域後,會被自動釋放掉,它不由JVM GC管理。

每一個線程都包含一個棧區,每個棧中的數據都是私有的,其他棧不能訪問。

本地方法棧是在程序調用或JVM調用本地方法接口(Native)時候啟用。

本地方法都不是使用Java語言編寫的,比如使用C語言編寫的本地方法,本地方法也不由JVM去運行,所以本地方法的運行不受JVM管理。

HotSpot VM將本地方法棧和JVM棧合並了。

程序計數器

在JVM的概念模型裏,字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令。分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。

JVM的多線程是通過線程輪流切換並分配處理器執行時間的方式來實現的,為了各條線程之間的切換後計數器能恢復到正確的執行位置,所以每條線程都會有一個獨立的程序計數器。

程序計數器僅占很小的一塊內存空間。

當線程正在執行一個Java方法,程序計數器記錄的是正在執行的JVM字節碼指令的地址。如果正在執行的是一個Natvie(本地方法),那麽這個計數器的值則為空(Underfined)。

程序計數器這個內存區域是唯一一個在JVM規範中沒有規定任何OutOfMemoryError(內存不足錯誤)的區域。

JVM執行引擎

Java虛擬機相當於一臺虛擬的“物理機”,這兩種機器都有代碼執行能力,其區別主要是物理機的執行引擎是直接建立在處理器、硬件、指令集和操作系統層面上的。而JVM的執行引擎是自己實現的,因此程序員可以自行制定指令集和執行引擎的結構體系,因此能夠執行那些不被硬件直接支持的指令集格式。

在JVM規範中制定了虛擬機字節碼執行引擎的概念模型,這個模型稱之為JVM執行引擎的統一外觀。JVM實現中,可能會有兩種的執行方式:解釋執行(通過解釋器執行)和編譯執行(通過即時編譯器產生本地代碼)。有些虛擬機只采用一種執行方式,有些則可能同時采用兩種,甚至有可能包含幾個不同級別的編譯器執行引擎。

輸入的是字節碼文件、處理過程是等效字節碼解析過程、輸出的是執行結果。在這三點上每個JVM執行引擎都是一致的。

本地方法接口(JNI)

JNI是Java Native Interface的縮寫,它提供了若幹的API實現了Java和其他語言的通信(主要是C和C++)。

JNI的適用場景

當我們有一些舊的庫,已經使用C語言編寫好了,如果要移植到Java上來,非常浪費時間,而JNI可以支持Java程序與C語言編寫的庫進行交互,這樣就不必要進行移植了。或者是與硬件、操作系統進行交互、提高程序的性能等,都可以使用JNI。需要註意的一點是需要保證本地代碼能工作在任何Java虛擬機環境。

JNI的副作用

一旦使用JNI,Java程序將丟失了Java平臺的兩個優點:

1、程序不再跨平臺,要想跨平臺,必須在不同的系統環境下程序編譯配置本地語言部分。

2、程序不再是絕對安全的,本地代碼的使用不當可能會導致整個程序崩潰。一個通用規則是,調用本地方法應該集中在少數的幾個類當中,這樣就降低了Java和其他語言之間的耦合。

JVM 常量池

JVM常量池也稱之為運行時常量池,它是方法區(Method Area)的一部分。用於存放編譯期間生成的各種字面量和符號引用。運行時常量池不要求一定只有在編譯器產生的才能進入,運行期間也可以將新的常量放入池中,這種特性被開發人員利用比較多的就是String.intern()方法。

由“用於存放編譯期間生成的各種字面量和符號引用”這句話可見,常量池中存儲的是對象的引用而不是對象的本身。

常量池的好處

常量池是為了避免頻繁的創建和銷毀對象而影響系統性能,它也實現了對象的共享。

例如字符串常量池:在編譯階段就把所有字符串文字放到一個常量池中。

1、節省內存空間:常量池中如果有對應的字符串,那麽則返回該對象的引用,從而不必再次創建一個新對象。

2、節省運行時間:比較字符串時,==比equals()快。對於兩個引用變量,==判斷引用是否相等,也就可以判斷實際值是否相等。

雙等號(==)的含義

基本數據類型之間使用雙等號,比較的是數值。

復合數據類型(類)之間使用雙等號,比較的是對象的引用地址是否相等。

八種基本類型的包裝類和常量池

Byte、Short、Integer、Long、Character、Boolean、String這7種包裝類都各自實現了自己的常量池。

//例子:
Integer i1 = 20;
Integer i2 = 20;
System.out.println(i1=i2);//輸出TRUE

Byte、Short、Integer、Long、Character這5種包裝類都默認創建了數值[-128 , 127]的緩存數據。當對這5個類型的數據不在這個區間內的時候,將會去創建新的對象,並且不會將這些新的對象放入常量池中。

//IntegerCache.low = -128
//IntegerCache.high = 127
public static Integer valueOf(int i) {
        if (i >= IntegerCache.low && i <= IntegerCache.high)
            return IntegerCache.cache[i + (-IntegerCache.low)];
        return new Integer(i);
    }
//例子
Integer i1 = 200;
Integer i2 = 200;
System.out.println(i1==i2);//返回FALSE

Float 和Double 沒有實現常量池。

String包裝類與常量池

String str1 = "aaa";

當以上代碼運行時,JVM會到字符串常量池查找 "aaa" 這個字面量對象是否存在?

存在:則返回該對象的引用給變量 str1 。

不存在:則在堆中創建一個相應的對象,將創建的對象的引用存放到常量池中,同時將引用返回給變量 str1 。

String str1 = "aaa";
String str2 = "aaa";
System.out.println(str1 == str2);//返回TRUE

因為變量str1 和str2 都指向同一個對象,所以返回true。

String str3 = new String("aaa");
System.out.println(str1 == str3);//返回FALSE

當我們使用了new來構造字符串對象的時候,不管字符串常量池中是否有相同內容的對象的引用,新的字符串對象都會創建。因為兩個指向的是不同的對象,所以返回FALSE 。

String.intern()方法

對於使用了new 創建的字符串對象,如果想要將這個對象引用到字符串常量池,可以使用intern() 方法。

調用intern() 方法後,檢查字符串常量池中是否有這個對象的引用,並做如下操作:

存在:直接返回對象引用給變量。

不存在:將這個對象引用加入到常量池,再返回對象引用給變量。

String interns = str3.intern();
System.out.println(interns == str1);//返回TRUE

假定常量池中都沒有以上字面量的對象,以下創建了多少個對象呢?

String str4 = "abc"+"efg";
String str5 = "abcefg";
System.out.println(str4 == str5);//返回TRUE

答案是三個。第一個:"abc" ,第一個:"efg",第三個:"abc"+"efg"("abcefg")

String str5 = "abcefg"; 這句代碼並沒有創建對象,它從常量池中找到了"abcefg" 的引用,所有str4 == str5 返回TRUE,因為它們都指向一個相同的對象。

什麽情況下會將字符串對象引用自動加入字符串常量池?

//只有在這兩種情況下會將對象引用自動加入到常量池
String str1 = "aaa";
String str2 = "aa"+"a";

//其他方式下都不會將對象引用自動加入到常量池,如下:
String str3 = new String("aaa");
String str4 = New StringBuilder("aa").append("a").toString();
StringBuilder sb = New StringBuilder();
sb.append("aa");
sb.append("a");
String str5 = sb.toString();

JAVA高級篇(二、JVM內存模型、內存管理之第二篇)