1. 程式人生 > >JVM 參數配置及詳解 -Xms -Xmx -Xmn -Xss 調優總結

JVM 參數配置及詳解 -Xms -Xmx -Xmn -Xss 調優總結

同事 turn windows系統 程序運行時間 ria 設定 是不是 total 適用於

堆大小設置

JVM 中最大堆大小有三方面限制:相關操作系統的數據模型(32-bt還是64-bit)限制;系統的可用虛擬內存限制;系統的可用物理內存限制.32位系統 下,一般限制在1.5G~2G;64為操作系統對內存無限制.我在Windows Server 2003 系統,3.5G物理內存,JDK5.0下測試,最大可設置為1478m.

典型設置:

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k

-Xmx3550m:設置JVM最大可用內存為3550M.

-Xms3550m:設置JVM促使內存為3550m.此值可以設置與-Xmx相同,以避免每次垃圾回收完成後JVM重新分配內存.

-Xmn2g:設置年輕代大小為2G.整個堆大小=年輕代大小 + 年老代大小 + 持久代大小.持久代一般固定大小為64m,所以增大年輕代後,將會減小年老代大小.此值對系統性能影響較大,Sun官方推薦配置為整個堆的3/8.

-Xss128k:設置每個線程的堆棧大小.JDK5.0以後每個線程堆棧大小為1M,以前每個線程堆棧大小為256K.更具應用的線程所需內存大小進行 調整.在相同物理內存下,減小這個值能生成更多的線程.但是操作系統對一個進程內的線程數還是有限制的,不能無限生成,經驗值在3000~5000左右.

java -Xmx3550m -Xms3550m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m -XX:MaxTenuringThreshold=0

-XX:NewRatio=4:設置年輕代(包括Eden和兩個Survivor區)與年老代的比值(除去持久代).設置為4,則年輕代與年老代所占比值為1:4,年輕代占整個堆棧的1/5

-XX:SurvivorRatio=4:設置年輕代中Eden區與Survivor區的大小比值.設置為4,則兩個Survivor區與一個Eden區的比值為2:4,一個Survivor區占整個年輕代的1/6

-XX:MaxPermSize=16m:設置持久代大小為16m.

-XX:MaxTenuringThreshold=0:設置垃圾最大年齡.如果設置為0的話,則年輕代對象不經過Survivor區,直接進入年老代. 對於年老代比較多的應用,可以提高效率.如果將此值設置為一個較大值,則年輕代對象會在Survivor區進行多次復制,這樣可以增加對象再年輕代的存活 時間,增加在年輕代即被回收的概論.

回收器選擇

JVM給了三種選擇:串行收集器,並行收集器,並發收集器,但是串行收集器只適用於小數據量的情況,所以這裏的選擇主要針對並行收集器和並發收集器.默認 情況下,JDK5.0以前都是使用串行收集器,如果想使用其他收集器需要在啟動時加入相應參數.JDK5.0以後,JVM會根據當前系統配置進行判斷.

吞吐量優先的並行收集器

如上文所述,並行收集器主要以到達一定的吞吐量為目標,適用於科學技術和後臺處理等.

典型配置:

java -Xmx3800m -Xms3800m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20

-XX:+UseParallelGC:選擇垃圾收集器為並行收集器.此配置僅對年輕代有效.即上述配置下,年輕代使用並發收集,而年老代仍舊使用串行收集.

-XX:ParallelGCThreads=20:配置並行收集器的線程數,即:同時多少個線程一起進行垃圾回收.此值最好配置與處理器數目相等.

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20 -XX:+UseParallelOldGC

-XX:+UseParallelOldGC:配置年老代垃圾收集方式為並行收集.JDK6.0支持對年老代並行收集.

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100

-XX:MaxGCPauseMillis=100:設置每次年輕代垃圾回收的最長時間,如果無法滿足此時間,JVM會自動調整年輕代大小,以滿足此值.

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100 -XX:+UseAdaptiveSizePolicy

-XX:+UseAdaptiveSizePolicy:設置此選項後,並行收集器會自動選擇年輕代區大小和相應的Survivor區比例,以達到目標系統規定的最低相應時間或者收集頻率等,此值建議使用並行收集器時,一直打開.

響應時間優先的並發收集器

如上文所述,並發收集器主要是保證系統的響應時間,減少垃圾收集時的停頓時間.適用於應用服務器,電信領域等.

典型配置:

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:ParallelGCThreads=20 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC

-XX:+UseConcMarkSweepGC:設置年老代為並發收集.測試中配置這個以後,-XX:NewRatio=4的配置失效了,原因不明.所以,此時年輕代大小最好用-Xmn設置.

-XX:+UseParNewGC:設置年輕代為並行收集.可與CMS收集同時使用.JDK5.0以上,JVM會根據系統配置自行設置,所以無需再設置此值.

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseConcMarkSweepGC -XX:CMSFullGCsBeforeCompaction=5 -XX:+UseCMSCompactAtFullCollection

-XX:CMSFullGCsBeforeCompaction:由於並發收集器不對內存空間進行壓縮,整理,所以運行一段時間以後會產生"碎片",使得運行效率降低.此值設置運行多少次GC以後對內存空間進行壓縮,整理.

-XX:+UseCMSCompactAtFullCollection:打開對年老代的壓縮.可能會影響性能,但是可以消除碎片

輔助信息

JVM提供了大量命令行參數,打印信息,供調試使用.主要有以下一些:

-XX:+PrintGC

輸出形式:[GC 118250K->113543K(130112K), 0.0094143 secs]

[Full GC 121376K->10414K(130112K), 0.0650971 secs]

-XX:+PrintGCDetails

輸出形式:[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs]

[GC [DefNew: 8614K->8614K(9088K), 0.0000665 secs][Tenured: 112761K->10414K(121024K), 0.0433488 secs] 121376K->10414K(130112K), 0.0436268 secs]

-XX:+PrintGCTimeStamps -XX:+PrintGC:PrintGCTimeStamps可與上面兩個混合使用

輸出形式:11.851: [GC 98328K->93620K(130112K), 0.0082960 secs]

-XX:+PrintGCApplicationConcurrentTime:打印每次垃圾回收前,程序未中斷的執行時間.可與上面混合使用

輸出形式:Application time: 0.5291524 seconds

-XX:+PrintGCApplicationStoppedTime:打印垃圾回收期間程序暫停的時間.可與上面混合使用

輸出形式:Total time for which application threads were stopped: 0.0468229 seconds

-XX:PrintHeapAtGC:打印GC前後的詳細堆棧信息

輸出形式:

34.702: [GC {Heap before gc invocations=7:

def new generation total 55296K, used 52568K [0x1ebd0000, 0x227d0000, 0x227d0000)

eden space 49152K, 99% used [0x1ebd0000, 0x21bce430, 0x21bd0000)

from space 6144K, 55% used [0x221d0000, 0x22527e10, 0x227d0000)

to space 6144K, 0% used [0x21bd0000, 0x21bd0000, 0x221d0000)

tenured generation total 69632K, used 2696K [0x227d0000, 0x26bd0000, 0x26bd0000)

the space 69632K, 3% used [0x227d0000, 0x22a720f8, 0x22a72200, 0x26bd0000)

compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)

the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)

ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)

rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)

34.735: [DefNew: 52568K->3433K(55296K), 0.0072126 secs] 55264K->6615K(124928K)Heap after gc invocations=8:

def new generation total 55296K, used 3433K [0x1ebd0000, 0x227d0000, 0x227d0000)

eden space 49152K, 0% used [0x1ebd0000, 0x1ebd0000, 0x21bd0000)

from space 6144K, 55% used [0x21bd0000, 0x21f2a5e8, 0x221d0000)

to space 6144K, 0% used [0x221d0000, 0x221d0000, 0x227d0000)

tenured generation total 69632K, used 3182K [0x227d0000, 0x26bd0000, 0x26bd0000)

the space 69632K, 4% used [0x227d0000, 0x22aeb958, 0x22aeba00, 0x26bd0000)

compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)

the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)

ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)

rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)

}

, 0.0757599 secs]

-Xloggc:filename:與上面幾個配合使用,把相關日誌信息記錄到文件以便分析.

常見配置匯總

堆設置

-Xms:初始堆大小

-Xmx:最大堆大小

-XX:NewSize=n:設置年輕代大小

-XX:NewRatio=n:設置年輕代和年老代的比值.如:為3,表示年輕代與年老代比值為1:3,年輕代占整個年輕代年老代和的1/4

-XX:SurvivorRatio=n:年輕代中Eden區與兩個Survivor區的比值.註意Survivor區有兩個.如:3,表示Eden:Survivor=3:2,一個Survivor區占整個年輕代的1/5

-XX:MaxPermSize=n:設置持久代大小

收集器設置

-XX:+UseSerialGC:設置串行收集器

-XX:+UseParallelGC:設置並行收集器

-XX:+UseParalledlOldGC:設置並行年老代收集器

-XX:+UseConcMarkSweepGC:設置並發收集器

垃圾回收統計信息

-XX:+PrintGC

-XX:+PrintGCDetails

-XX:+PrintGCTimeStamps

-Xloggc:filename

並行收集器設置

-XX:ParallelGCThreads=n:設置並行收集器收集時使用的CPU數.並行收集線程數.

-XX:MaxGCPauseMillis=n:設置並行收集最大暫停時間

-XX:GCTimeRatio=n:設置垃圾回收時間占程序運行時間的百分比.公式為1/(1+n)

並發收集器設置

-XX:+CMSIncrementalMode:設置為增量模式.適用於單CPU情況.

-XX:ParallelGCThreads=n:設置並發收集器年輕代收集方式為並行收集時,使用的CPU數.並行收集線程數.

調優總結

年輕代大小選擇

響應時間優先的應用:盡可能設大,直到接近系統的最低響應時間限制(根據實際情況選擇).在此種情況下,年輕代收集發生的頻率也是最小的.同時,減少到達年老代的對象.

吞吐量優先的應用:盡可能的設置大,可能到達Gbit的程度.因為對響應時間沒有要求,垃圾收集可以並行進行,一般適合8CPU以上的應用.

年老代大小選擇

響應時間優先的應用:年老代使用並發收集器,所以其大小需要小心設置,一般要考慮並發會話率和會話持續時間等一些參數.如果堆設置小了,可以會造成內存碎 片,高回收頻率以及應用暫停而使用傳統的標記清除方式;如果堆大了,則需要較長的收集時間.最優化的方案,一般需要參考以下數據獲得:

並發垃圾收集信息

持久代並發收集次數

傳統GC信息

花在年輕代和年老代回收上的時間比例

減少年輕代和年老代花費的時間,一般會提高應用的效率

吞吐量優先的應用:一般吞吐量優先的應用都有一個很大的年輕代和一個較小的年老代.原因是,這樣可以盡可能回收掉大部分短期對象,減少中期的對象,而年老代盡存放長期存活對象.

較小堆引起的碎片問題

因為年老代的並發收集器使用標記,清除算法,所以不會對堆進行壓縮.當收集器回收時,他會把相鄰的空間進行合並,這樣可以分配給較大的對象.但是,當堆空 間較小時,運行一段時間以後,就會出現"碎片",如果並發收集器找不到足夠的空間,那麽並發收集器將會停止,然後使用傳統的標記,清除方式進行回收.如果 出現"碎片",可能需要進行如下配置:

-XX:+UseCMSCompactAtFullCollection:使用並發收集器時,開啟對年老代的壓縮.

-XX:CMSFullGCsBeforeCompaction=0:上面配置開啟的情況下,這裏設置多少次Full GC後,對年老代進行壓縮

在同一個工程下,有兩個類,這兩個類中只有很少的變動,而最關健的FOR卻沒有一點變動,可是當我分別運行這兩個程序的時候卻出現一個很嚴重的問題,一個程序循環的快,一個循環的慢.這到底是怎麽回事呢~???苦苦尋找了半天也沒有想到是為什麽,因為程序改變的部分根不影響我循環的速度,可是結果卻是有很大的差別,一個大約是在一分鐘這內就可以循環完,可是另一個卻需要六七分鐘,這根本就不是一個數據理級的麻.兩個完全一樣的循環,從代碼上根本上是看不出有什麽問題.不得以求助同事吧,可是同事看了也感覺很詭異,兩個人在那訂著代碼又看了一個多小時,最後同事讓我來個幹凈點的,關機重啟.我到也聽話,就順著同事的意思去了,可就在關機的這個時候他突然說是不是內存的問題,我也空然想到了,還真的有可能是內存的問題,因為快的那個在我之前運行程序之前可給過1G的內存啊,而後來的這個我好像是沒有設過內存啊,機器起來了,有了這個想法進去看看吧,結果正中要害,果真是慢的那個沒有開內存,程序運行時只不過是JVM默認開的內存.我初步分析是因為內存太小,而我的程序所用內存又正好卡在JVM所開內存邊上,不至於溢出.當程序運行時就得花費大部分時間去調用GC去,這樣就導致了為什麽相同的循環出現兩種不同的效率~!

內存使用情況的方法:

public static String getMemUsage() {

long free = java.lang.Runtime.getRuntime().freeMemory();

long total = java.lang.Runtime.getRuntime().totalMemory();

StringBuffer buf = new StringBuffer();

buf.append("[Mem: used ").append((total-free)>>20)

.append("M free ").append(free>>20)

.append("M total ").append(total>>20).append("M]");

return buf.toString();

}

google一下,大概就說JVM是這樣來操作內存:

堆(Heap)和非堆(Non-heap)內存

按照官方的說法:"Java 虛擬機具有一個堆,堆是運行時數據區域,所有類實例和數組的內存均從此處分配.堆是在 Java 虛擬機啟動時創建的.""在JVM中堆之外的內存稱為非堆內存(Non-heap memory)".可以看出JVM主要管理兩種類型的內存:堆和非堆.簡單來說堆就是Java代碼可及的內存,是留給開發人員使用的;非堆就是JVM留給自己用的,所以方法區,JVM內部處理或優化所需的內存(如JIT編譯後的代碼緩存),每個類結構(如運行時常數池,字段和方法數據)以及方法和構造方法的代碼都在非堆內存中.

堆內存分配

JVM初始分配的內存由-Xms指定,默認是物理內存的1/64;JVM最大分配的內存由-Xmx指定,默認是物理內存的1/4.默認空余堆內存小於40%時,JVM就會增大堆直到-Xmx的最大限制;空余堆內存大於70%時, JVM會減少堆直到-Xms的最小限制.因此服務器一般設置-Xms,-Xmx相等以避免在每次GC 後調整堆的大小.

非堆內存分配

JVM使用-XX:PermSize設置非堆內存初始值,默認是物理內存的1/64;由XX:MaxPermSize設置最大非堆內存的大小,默認是物理內存的1/4.

JVM內存限制(最大值)

首先JVM內存首先受限於實際的最大物理內存,假設物理內存無限大的話,JVM內存的最大值跟操作系統有很大的關系.簡單的說就32位處理器雖然可控內存空間有4GB,但是具體的操作系統會給一個限制,這個限制一般是 2GB-3GB(一般來說Windows系統下為1.5G-2G,Linux系統下為2G-3G),而64bit以上的處理器就不會有限制了

JVM內存的調優

1. Heap設定與垃圾回收Java Heap分為3個區,Young,Old和Permanent.Young保存剛實例化的對象.當該區被填滿時,GC會將對象移到Old區.Permanent區則負責保存反射對象,本文不討論該區.JVM的Heap分配可以使用-X參數設定,

-Xms

初始Heap大小

-Xmx

java heap最大值

-Xmn

young generation的heap大小

JVM有2個GC線程.第一個線程負責回收Heap的Young區.第二個線程在Heap不足時,遍歷Heap,將Young 區升級為Older區.Older區的大小等於-Xmx減去-Xmn,不能將-Xms的值設的過大,因為第二個線程被迫運行會降低JVM的性能.

為什麽一些程序頻繁發生GC?有如下原因:

l 程序內調用了System.gc()或Runtime.gc().

l 一些中間件軟件調用自己的GC方法,此時需要設置參數禁止這些GC.

l Java的Heap太小,一般默認的Heap值都很小.

l 頻繁實例化對象,Release對象.此時盡量保存並重用對象,例如使用StringBuffer()和String().

如果你發現每次GC後,Heap的剩余空間會是總空間的50%,這表示你的Heap處於健康狀態.許多Server端的Java程序每次GC後最好能有65%的剩余空間.經驗之談:

1.Server端JVM最好將-Xms和-Xmx設為相同值.為了優化GC,最好讓-Xmn值約等於-Xmx的1/3[2].

2.一個GUI程序最好是每10到20秒間運行一次GC,每次在半秒之內完成[2].

註意:

1.增加Heap的大小雖然會降低GC的頻率,但也增加了每次GC的時間.並且GC運行時,所有的用戶線程將暫停,也就是GC期間,Java應用程序不做任何工作.

2.Heap大小並不決定進程的內存使用量.進程的內存使用量要大於-Xmx定義的值,因為Java為其他任務分配內存,例如每個線程的Stack等.

2.Stack的設定

每個線程都有他自己的Stack.

-Xss

每個線程的Stack大小

Stack的大小限制著線程的數量.如果Stack過大就好導致內存溢漏.-Xss參數決定Stack大小,例如-Xss1024K.如果Stack太小,也會導致Stack溢漏.

3.硬件環境

硬件環境也影響GC的效率,例如機器的種類,內存,swap空間,和CPU的數量.

如果你的程序需要頻繁創建很多transient對象,會導致JVM頻繁GC.這種情況你可以增加機器的內存,來減少Swap空間的使用[2].

4.4種GC

第一種為單線程GC,也是默認的GC.,該GC適用於單CPU機器.

第二種為Throughput GC,是多線程的GC,適用於多CPU,使用大量線程的程序.第二種GC與第一種GC相似,不同在於GC在收集Young區是多線程的,但在Old區和第一種一樣,仍然采用單線程.-XX:+UseParallelGC參數啟動該GC.

第三種為Concurrent Low Pause GC,類似於第一種,適用於多CPU,並要求縮短因GC造成程序停滯的時間.這種GC可以在Old區的回收同時,運行應用程序.-XX:+UseConcMarkSweepGC參數啟動該GC.

第四種為Incremental Low Pause GC,適用於要求縮短因GC造成程序停滯的時間.這種GC可以在Young區回收的同時,回收一部分Old區對象.-Xincgc參數啟動該GC.

JVM 參數配置及詳解 -Xms -Xmx -Xmn -Xss 調優總結