1. 程式人生 > >java---之string物件---new 與 常量字元的關係

java---之string物件---new 與 常量字元的關係

近日,有一個網友在小密圈提了一個問題,我本來覺得這個問題應該挺簡單的,沒想到這個問題在圈子裡引起了廣泛的討論。

問題:前輩,請教個問題,下面兩行程式碼,會在JAVA字串常量池中產生幾個字串。 String str1 = "ab"; String str2 = str1 + "c";

對這個引起熱烈討論的問題,我本來想寫一篇深度講解的文章,結果在網上發現了一篇很優秀的關於此題原理的文章,先分享給大家。

String:字串常量池

作為最基礎的引用資料型別,Java 設計者為 String 提供了字串常量池以提高其效能,那麼字串常量池的具體原理是什麼,我們帶著以下三個問題,去理解字串常量池:

字串常量池的設計意圖是什麼?

字串常量池在哪裡?

如何操作字串常量池?

字串常量池的設計思想

字串的分配,和其他的物件分配一樣,耗費高昂的時間與空間代價,作為最基礎的資料型別,大量頻繁的建立字串,極大程度地影響程式的效能

JVM為了提高效能和減少記憶體開銷,在例項化字串常量的時候進行了一些優化

為字串開闢一個字串常量池,類似於快取區

建立字串常量時,首先堅持字串常量池是否存在該字串

存在該字串,返回引用例項,不存在,例項化該字串並放入池中

實現的基礎

實現該優化的基礎是因為字串是不可變的,可以不用擔心資料衝突進行共享

執行時例項建立的全域性字串常量池中有一個表,總是為池中每個唯一的字串物件維護一個引用,這就意味著它們一直引用著字串常量池中的物件,所以,在常量池中的這些字串不會被垃圾收集器回收

程式碼:從字串常量池中獲取相應的字串

字串常量池在哪裡

在分析字串常量池的位置時,首先了解一下堆、棧、方法區:

儲存的是物件,每個物件都包含一個與之對應的class

JVM只有一個堆區(heap)被所有執行緒共享,堆中不存放基本型別和物件引用,只存放物件本身

物件的由垃圾回收器負責回收,因此大小和生命週期不需要確定

每個執行緒包含一個棧區,棧中只儲存基礎資料型別的物件和自定義物件的引用(不是物件)

每個棧中的資料(原始型別和物件引用)都是私有的

棧分為3個部分:基本型別變數區、執行環境上下文、操作指令區(存放操作指令)

資料大小和生命週期是可以確定的,當沒有引用指向資料時,這個資料就會自動消失

方法區

靜態區,跟堆一樣,被所有的執行緒共享

方法區中包含的都是在整個程式中永遠唯一的元素,如class,static變數

字串常量池則存在於方法區

程式碼:堆疊方法區儲存字串

字串物件的建立

面試題:String str4 = new String(“abc”) 建立多少個物件?

在常量池中查詢是否有“abc”物件

有則返回對應的引用例項

沒有則建立對應的例項物件

在堆中 new 一個 String("abc") 物件

將物件地址賦值給str4,建立一個引用

所以,常量池中沒有“abc”字面量則建立兩個物件,否則建立一個物件,以及建立一個引用

根據字面量,往往會提出這樣的變式題:

String str1 = new String("A"+"B") ; 會建立多少個物件?

String str2 = new String("ABC") + "ABC" ; 會建立多少個物件?

str1:

字串常量池:"A","B","AB" : 3個

堆:new String("AB") :1個

引用: str1 :1個

總共 : 5個

str2 :

字串常量池:"ABC" : 1個

堆:new String("ABC") :1個

引用: str2 :1個

總共 : 3個

程式碼:基礎型別的變數和常量,變數和引用儲存在棧中,常量儲存在常量池中

操作字串常量池的方式

JVM例項化字串常量池時

String.intern()

通過new操作符建立的字串物件不指向字串池中的任何物件,但是可以通過使用字串的intern()方法來指向其中的某一個。java.lang.String.intern()返回一個保留池字串,就是一個在全域性字串池中有了一個入口。如果以前沒有在全域性字串池中,那麼它就會被新增到裡面

補充:字面量和常量池初探

字串物件內部是用字元陣列儲存的,那麼看下面的例子:

會分配一個11長度的char陣列,並在常量池分配一個由這個char陣列組成的字串,然後由m去引用這個字串

用n去引用常量池裡邊的字串,所以和n引用的是同一個物件

生成一個新的字串,但內部的字元陣列引用著m內部的字元陣列

同樣會生成一個新的字串,但內部的字元陣列引用常量池裡邊的字串內部的字元陣列,意思是和u是同樣的字元陣列

使用圖來表示的話,情況就大概是這樣的(使用虛線只是表示兩者其實沒什麼特別的關係):

測試demo:

結論:

m和n是同一個物件

m,u,v都是不同的物件

m,u,v,n但都使用了同樣的字元陣列,並且用equal判斷的話也會返回true

原文出處:https://segmentfault.com/a/1190000009888357#articleHeader0

上述文章只是講解了此問題的原理,並沒有直接回答開頭網友的問題,那麼親愛的小夥伴們,在看完後,你對問題的答案是什麼呢?歡迎大家來小密圈討論或者在文章下面留言。