Java String字串深入詳解
Java中字串物件建立有兩種形式,一種為字面量形式,如String str = "hello";,另一種就是使用new這種標準的構造物件的方法,如String str = new String("hello");
對於這樣的常識,不再贅述。
首先String類是final類,為什麼定義成final形式呢?
簡單點說,對於如此高頻率被使用的資料型別,設計者們認為已經設計的足夠優秀了,不需要被繼承,否則胡亂繼承重寫可能會降低程式的效能。
正如標題所述,既然深入,那我們就挖下String在jvm層面的小動作。
先解釋字面量建立的形式:
當代碼中出現字面量形式建立字串物件時(官網:www.fhadmin.org),JVM首先會對這個字面量進行檢查,如果字串常量池中存在相同內容的字串物件的引用,則將這個引用返回,否則新的字串物件被建立,然後將這個引用放入字串常量池,並返回該引用。
如下所示:
String str1 = "hello" ;
當我們第一次建立的時候,這裡我們認為沒有內容為hello的物件存在。JVM通過字串常量池查詢不到內容為hello的字串物件存在,那麼會建立這個字串物件,然後將剛建立的物件的引用放入到字串常量池中,並且將引用返回給變數str1
如果接下來有這樣一段程式碼
String str2 = "hello" ;
同樣JVM還是要檢測這個字面量,JVM通過查詢字串常量池,發現內容為”hello”字串物件存在,於是將已經存在的字串物件的引用返回給變數str2。注意這裡不會重新建立新的字串物件。
驗證是否為str1和str2是否指向同一物件,我們可以通過這段程式碼
System.out.println(str1 == str2);
結果為true。
第二種使用new建立:
String str3 = new String("hello");
當我們使用了new來構造字串物件的時候,不管字串常量池中有沒有相同內容的物件的引用,新的字串物件都會建立。因此我們使用下面程式碼測試一下,
String str3 = new String("hello"); System.out.println(str1 == str3);
結果為false。說明這兩個引用指向不同的物件。
intern
對於上面使用new建立的字串物件,如果想將這個物件的引用加入到字串常量池,可以使用intern方法。
呼叫intern後,首先檢查字串常量池中是否有該物件的引用,如果存在,則將這個引用返回給變數,否則將引用加入並返回給變數。
String str4 = str3.intern();
System.out.println(str4 == str1);
結果為true。
疑難問題
前提條件?
字串常量池實現的前提條件就是Java中String物件是不可變的,這樣可以安全保證多個變數共享同一個物件。如果Java中的String物件可變的話,一個引用操作改變了物件的值,那麼其他的變數也會受到影響,(官網:www.fhadmin.org)顯然這樣是不合理的。
引用 or 物件
字串常量池中存放的時引用還是物件,這個問題是最常見的。字串常量池存放的是物件引用,不是物件。在Java中,物件都建立在堆記憶體中。字串常量池存在於堆記憶體中的永久代
優缺點
字串常量池的好處就是減少相同內容字串的建立,節省記憶體空間。
如果硬要說弊端的話,就是犧牲了CPU計算時間來換空間。CPU計算時間主要用於在字串常量池中查詢是否有內容相同物件的引用。不過其內部實現為HashTable,所以計算成本較低。
GC回收?
因為字串常量池中持有了共享的字串物件的引用,這就是說是不是會導致這些物件無法回收?
首先問題中共享的物件一般情況下都比較小。據我查證瞭解,在早期的版本中確實存在這樣的問題,但是隨著弱引用的引入,目前這個問題應該沒有了。
intern使用?
關於使用intern的前提就是你清楚自己確實需要使用。比如,我們這裡有一份上百萬的記錄,其中記錄的某個值多次為美國加利福尼亞州,我們不想建立上百萬條這樣的字串物件,(官網:www.fhadmin.org)我們可以使用intern只在記憶體中保留一份即可。
總有例外?
你知道下面的程式碼,會建立幾個字串物件,在字串常量池中儲存幾個引用麼?
String test = "a" + "b" + "c";
答案是隻建立了一個物件,在常量池中也只儲存一個引用。我們使用javap反編譯看一下即可得知。
實際上在編譯期間,已經將這三個字面量合成了一個。這樣做實際上是一種優化,避免了建立多餘的字串物件,也沒有發生字串拼接問題。