1. 程式人生 > >JVM調優總結(目前看過最全的)

JVM調優總結(目前看過最全的)

Xms 是指設定程式啟動時佔用記憶體大小。一般來講,大點,程式會啟動的快一點,但是也可能會導致機器暫時間變慢。

Xmx 是指設定程式執行期間最大可佔用的記憶體大小。如果程式執行需要佔用更多的記憶體,超出了這個設定值,就會丟擲OutOfMemory異常。

Xss 是指設定每個執行緒的堆疊大小。這個就要依據你的程式,看一個執行緒大約需要佔用多少記憶體,可能會有多少執行緒同時執行等。

以上三個引數的設定都是預設以Byte為單位的,也可以在數字後面新增[k/K]或者[m/M]來表示KB或者MB。而且,超過機器本身的記憶體大小也是不可以的,否則就等著機器變慢而不是程式變慢了。

 

  1. -Xms 為jvm啟動時分配的記憶體,比如-Xms200m,表示分配200M
  2. -Xmx 為jvm執行過程中分配的最大記憶體,比如-Xms500m,表示jvm程序最多隻能夠佔用500M記憶體
  3. -Xss 為jvm啟動的每個執行緒分配的記憶體大小,預設JDK1.4中是256K,JDK1.5+中是1M

 

maxMemory()這個方法返回的是java虛擬機器(這個程序)能構從作業系統那裡挖到的最大的記憶體,以位元組為單位,如果在執行java程式的時候,沒有新增-Xmx引數,那麼就是64兆,也就是說maxMemory()返回的大約是64*1024*1024位元組,這是java虛擬機器預設情況下能從作業系統那裡挖到的最大的記憶體。如果添加了-Xmx引數,將以這個引數後面的值為準,例如java -cp you_classpath -Xmx512m your_class,那麼最大記憶體就是512*1024*1024位元組。

    totalMemory()這個方法返回的是java虛擬機器現在已經從作業系統那裡挖過來的記憶體大小,也就是java虛擬機器這個程序當時所佔用的所有記憶體。如果在執行java的時候沒有新增-Xms引數,那麼,在java程式執行的過程的,記憶體總是慢慢的從作業系統那裡挖的,基本上是用多少挖多少,直到挖到maxMemory()為止,所以totalMemory()是慢慢增大的。如果用了-Xms引數,程式在啟動的時候就會無條件的從作業系統中挖 -Xms後面定義的記憶體數,然後在這些記憶體用的差不多的時候,再去挖。

    freeMemory()是什麼呢,剛才講到如果在執行java的時候沒有新增-Xms引數,那麼,在java程式執行的過程的,記憶體總是慢慢的從作業系統那裡挖的,基本上是用多少挖多少,但是java虛擬機器100%的情況下是會稍微多挖一點的,這些挖過來而又沒有用上的記憶體,實際上就是 freeMemory(),所以freeMemory()的值一般情況下都是很小的,但是如果你在執行java程式的時候使用了-Xms,這個時候因為程式在啟動的時候就會無條件的從作業系統中挖-Xms後面定義的記憶體數,這個時候,挖過來的記憶體可能大部分沒用上,所以這個時候freeMemory()可能會有些大。

 

  1. 堆大小設定
    JVM 中最大堆大小有三方面限制:相關作業系統的資料模型(32-bt還是64-bit)限制;系統的可用虛擬記憶體限制;系統的可用實體記憶體限制。32位系統下,一般限制在1.5G~2G;64為作業系統對記憶體無限制。我在Windows Server 2003 系統,3.5G實體記憶體,JDK5.0下測試,最大可設定為1478m。
    典型設定:
    • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k
      - Xmx3550m
       :設定JVM最大可用記憶體為3550M。
      -Xms3550m :設定JVM促使記憶體為3550m。此值可以設定與-Xmx相同,以避免每次垃圾回收完成後JVM重新分配記憶體。
      -Xmn2g
       :設定年輕代大小為2G。整個堆大小=年輕代大小 + 年老代大小 + 持久代大小 。持久代一般固定大小為64m,所以增大年輕代後,將會減小年老代大小。此值對系統性能影響較大,Sun官方推薦配置為整個堆的3/8。
      -Xss128k :設定每個執行緒的堆疊大小。JDK5.0以後每個執行緒堆疊大小為1M,以前每個執行緒堆疊大小為256K。更具應用的執行緒所需記憶體大小進行調整。在相同實體記憶體下,減小這個值能生成更多的執行緒。但是作業系統對一個程序內的執行緒數還是有限制的,不能無限生成,經驗值在3000~5000左右。
    • java -Xmx3550m -Xms3550m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m -XX:MaxTenuringThreshold=0
      -XX:NewRatio=4
       :設定年輕代(包括Eden和兩個Survivor區)與年老代的比值(除去持久代)。設定為4,則年輕代與年老代所佔比值為1:4,年輕代佔整個堆疊的1/5
      -XX:SurvivorRatio=4 :設定年輕代中Eden區與Survivor區的大小比值。設定為4,則兩個Survivor區與一個Eden區的比值為2:4,一個Survivor區佔整個年輕代的1/6
      -XX:MaxPermSize=16m :設定持久代大小為16m。
      -XX:MaxTenuringThreshold=0 :設定垃圾最大年齡。如果設定為0的話,則年輕代物件不經過Survivor區,直接進入年老代 。對於年老代比較多的應用,可以提高效率。如果將此值設定為一個較大值,則年輕代物件會在Survivor區進行多次複製,這樣可以增加物件再年輕代的存活時間 ,增加在年輕代即被回收的概論。
  2. 回收器選擇
    JVM給了三種選擇:序列收集器、並行收集器、併發收集器 ,但是序列收集器只適用於小資料量的情況,所以這裡的選擇主要針對並行收集器和併發收集器。預設情況下,JDK5.0以前都是使用序列收集器,如果想使用其他收集器需要在啟動時加入相應引數。JDK5.0以後,JVM會根據當前系統配置 進行判斷。
    1. 吞吐量優先 的並行收集器
      如上文所述,並行收集器主要以到達一定的吞吐量為目標,適用於科學技術和後臺處理等。
      典型配置 :
      • java -Xmx3800m -Xms3800m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20
        -XX:+UseParallelGC
         :選擇垃圾收集器為並行收集器。 此配置僅對年輕代有效。即上述配置下,年輕代使用併發收集,而年老代仍舊使用序列收集。
        -XX:ParallelGCThreads=20
         :配置並行收集器的執行緒數,即:同時多少個執行緒一起進行垃圾回收。此值最好配置與處理器數目相等。
      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20 -XX:+UseParallelOldGC
        -XX:+UseParallelOldGC
         :配置年老代垃圾收集方式為並行收集。JDK6.0支援對年老代並行收集。
      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100
        -XX:MaxGCPauseMillis=100 :
         設定每次年輕代垃圾回收的最長時間,如果無法滿足此時間,JVM會自動調整年輕代大小,以滿足此值。
      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100 -XX:+UseAdaptiveSizePolicy
        -XX:+UseAdaptiveSizePolicy
         :設定此選項後,並行收集器會自動選擇年輕代區大小和相應的Survivor區比例,以達到目標系統規定的最低相應時間或者收集頻率等,此值建議使用並行收集器時,一直開啟。
    2. 響應時間優先 的併發收集器
      如上文所述,併發收集器主要是保證系統的響應時間,減少垃圾收集時的停頓時間。適用於應用伺服器、電信領域等。
      典型配置 :
      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:ParallelGCThreads=20 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC
        -XX:+UseConcMarkSweepGC
         :設定年老代為併發收集。測試中配置這個以後,-XX:NewRatio=4的配置失效了,原因不明。所以,此時年輕代大小最好用-Xmn設定。
        -XX:+UseParNewGC :設定年輕代為並行收集。可與CMS收集同時使用。JDK5.0以上,JVM會根據系統配置自行設定,所以無需再設定此值。
      • java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseConcMarkSweepGC -XX:CMSFullGCsBeforeCompaction=5 -XX:+UseCMSCompactAtFullCollection
        -XX:CMSFullGCsBeforeCompaction
         :由於併發收集器不對記憶體空間進行壓縮、整理,所以執行一段時間以後會產生“碎片”,使得執行效率降低。此值設定執行多少次GC以後對記憶體空間進行壓縮、整理。
        -XX:+UseCMSCompactAtFullCollection :開啟對年老代的壓縮。可能會影響效能,但是可以消除碎片
  3. 輔助資訊
    JVM提供了大量命令列引數,列印資訊,供除錯使用。主要有以下一些:
    • -XX:+PrintGC
      輸出形式:[GC 118250K->113543K(130112K), 0.0094143 secs]

                      [Full GC 121376K->10414K(130112K), 0.0650971 secs]

    • -XX:+PrintGCDetails
      輸出形式:[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs]

                      [GC [DefNew: 8614K->8614K(9088K), 0.0000665 secs][Tenured: 112761K->10414K(121024K), 0.0433488 secs] 121376K->10414K(130112K), 0.0436268 secs]

    • -XX:+PrintGCTimeStamps -XX:+PrintGC:PrintGCTimeStamps可與上面兩個混合使用
      輸出形式:11.851: [GC 98328K->93620K(130112K), 0.0082960 secs]
    • -XX:+PrintGCApplicationConcurrentTime: 列印每次垃圾回收前,程式未中斷的執行時間。可與上面混合使用
      輸出形式:Application time: 0.5291524 seconds
    • -XX:+PrintGCApplicationStoppedTime :列印垃圾回收期間程式暫停的時間。可與上面混合使用
      輸出形式:Total time for which application threads were stopped: 0.0468229 seconds
    • -XX:PrintHeapAtGC :列印GC前後的詳細堆疊資訊
      輸出形式:
      34.702: [GC {Heap before gc invocations=7:
      def new generation   total 55296K, used 52568K [0x1ebd0000, 0x227d0000, 0x227d0000)
      eden space 49152K, 99% used [0x1ebd0000, 0x21bce430, 0x21bd0000)
      from space 6144K, 55% used [0x221d0000, 0x22527e10, 0x227d0000)
      to   space 6144K,   0% used [0x21bd0000, 0x21bd0000, 0x221d0000)
      tenured generation   total 69632K, used 2696K [0x227d0000, 0x26bd0000, 0x26bd0000)
      the space 69632K,   3% used [0x227d0000, 0x22a720f8, 0x22a72200, 0x26bd0000)
      compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)
         the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)
          ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)
          rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)
      34.735: [DefNew: 52568K->3433K(55296K), 0.0072126 secs] 55264K->6615K(124928K)Heap after gc invocations=8:
      def new generation   total 55296K, used 3433K [0x1ebd0000, 0x227d0000, 0x227d0000)
      eden space 49152K,   0% used [0x1ebd0000, 0x1ebd0000, 0x21bd0000)
      from space 6144K, 55% used [0x21bd0000, 0x21f2a5e8, 0x221d0000)
      to   space 6144K,   0% used [0x221d0000, 0x221d0000, 0x227d0000)
      tenured generation   total 69632K, used 3182K [0x227d0000, 0x26bd0000, 0x26bd0000)
      the space 69632K,   4% used [0x227d0000, 0x22aeb958, 0x22aeba00, 0x26bd0000)
      compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)
         the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)
          ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)
          rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)
      }
      , 0.0757599 secs]
    • -Xloggc:filename :與上面幾個配合使用,把相關日誌資訊記錄到檔案以便分析。
  4. 常見配置彙總
    1. 堆設定
      • -Xms :初始堆大小
      • -Xmx :最大堆大小
      • -XX:NewSize=n :設定年輕代大小
      • -XX:NewRatio=n: 設定年輕代和年老代的比值。如:為3,表示年輕代與年老代比值為1:3,年輕代佔整個年輕代年老代和的1/4
      • -XX:SurvivorRatio=n :年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區佔整個年輕代的1/5
      • -XX:MaxPermSize=n :設定持久代大小
    2. 收集器設定
      • -XX:+UseSerialGC :設定序列收集器
      • -XX:+UseParallelGC :設定並行收集器
      • -XX:+UseParalledlOldGC :設定並行年老代收集器
      • -XX:+UseConcMarkSweepGC :設定併發收集器
    3. 垃圾回收統計資訊
      • -XX:+PrintGC
      • -XX:+PrintGCDetails
      • -XX:+PrintGCTimeStamps
      • -Xloggc:filename
    4. 並行收集器設定
      • -XX:ParallelGCThreads=n :設定並行收集器收集時使用的CPU數。並行收集執行緒數。
      • -XX:MaxGCPauseMillis=n :設定並行收集最大暫停時間
      • -XX:GCTimeRatio=n :設定垃圾回收時間佔程式執行時間的百分比。公式為1/(1+n)
    5. 併發收集器設定
      • -XX:+CMSIncrementalMode :設定為增量模式。適用於單CPU情況。
      • -XX:ParallelGCThreads=n :設定併發收集器年輕代收集方式為並行收集時,使用的CPU數。並行收集執行緒數。

四、調優總結

  1. 年輕代大小選擇
    • 響應時間優先的應用 :儘可能設大,直到接近系統的最低響應時間限制 (根據實際情況選擇)。在此種情況下,年輕代收集發生的頻率也是最小的。同時,減少到達年老代的物件。
    • 吞吐量優先的應用 :儘可能的設定大,可能到達Gbit的程度。因為對響應時間沒有要求,垃圾收集可以並行進行,一般適合8CPU以上的應用。
  2. 年老代大小選擇
    • 響應時間優先的應用 :年老代使用併發收集器,所以其大小需要小心設定,一般要考慮併發會話率 和會話持續時間 等一些引數。如果堆設定小了,可以會造成記憶體碎片、高回收頻率以及應用暫停而使用傳統的標記清除方式;如果堆大了,則需要較長的收集時間。最優化的方案,一般需要參考以下資料獲得:
      • 併發垃圾收集資訊
      • 持久代併發收集次數
      • 傳統GC資訊
      • 花在年輕代和年老代回收上的時間比例
      減少年輕代和年老代花費的時間,一般會提高應用的效率
    • 吞吐量優先的應用 :一般吞吐量優先的應用都有一個很大的年輕代和一個較小的年老代。原因是,這樣可以儘可能回收掉大部分短期物件,減少中期的物件,而年老代盡存放長期存活物件。
  3. 較小堆引起的碎片問題
    因為年老代的併發收集器使用標記、清除演算法,所以不會對堆進行壓縮。當收集器回收時,他會把相鄰的空間進行合併,這樣可以分配給較大的物件。但是,當堆空間較小時,執行一段時間以後,就會出現“碎片”,如果併發收集器找不到足夠的空間,那麼併發收集器將會停止,然後使用傳統的標記、清除方式進行回收。如果出現“碎片”,可能需要進行如下配置:
    • -XX:+UseCMSCompactAtFullCollection :使用併發收集器時,開啟對年老代的壓縮。
    • -XX:CMSFullGCsBeforeCompaction=0 :上面配置開啟的情況下,這裡設定多少次Full GC後,對年老代進行壓縮

我在tomcat中的jvm連線數,和tomcat優化的使用如下:

 

1、 tomcat7安裝目錄\bin\catalina.bat   (linux修改的是catalina.sh檔案)

新增如下語句:

JAVA_OPTS=-Djava.awt.headless=true -Dfile.encoding=UTF-8 -server -Xms1024m -Xmx1024m -Xss1m -XX:NewSize=256m -XX:MaxNewSize=512m -XX:PermSize=256M  -XX:MaxPermSize=512m 

-XX:+DisableExplicitGC

2、檢視tomcat的JVM記憶體

tomcat7中預設沒有使用者的,我們首先要新增使用者有:

修改tomcat7安裝目錄下\conf\tomcat-users.xml


<!--############################################################-->
<!--新增tomcat使用者管理-->
<rol rolename="manager-gui"/>
<user username="tomcat" password="tomcat" roles="manager-gui"/>
<!--############################################################-->

password是可以自由定義的。

 

3、檢查webapps下是否有Manager目錄,一般釋出時我們都把這個目錄刪除了,現在看來刪除早了,在除錯期要保留啊!

 

4、訪問地址:

http://localhost:8080/manager/status

檢視記憶體配置情況,經測試-Xms512m -Xmx512m與-Xms1024m -Xmx1024m記憶體使用情況不一樣,使用1024的時候有一項記憶體使用99%。所以看來這個設定多少與實際機器有關,需要Manager進行檢視後確定。

 

5、在啟動Tomcat中發現,有同志釋出程式時把我們在TOMCAT7中引用的外部JAR包重複釋出到LIB目錄下了,我們以後在釋出時要檢查LIB下是不是包括

el-api.jar jsp-api servlet-api,特別注意的是最後一個servlet-api,我發現兩個專案都把它拷貝到了LIB目錄下!!被我刪除了。

 

6、使用TOMAT的連線池:

<Executor name="tomcatThreadPool" namePrefix="catalina-exec-" maxThreads="300" minSpareThreads="50" maxIdleTime="15000"/>


<Connector port="8080

  executor="tomcatThreadPool"

  protocol="org.apache.coyote.http11.Http11NioProtocol"
  redirectPort="8443"

  connectionTimeout="30000" 

  enableLookups="false" 

  keepAliveTimeout="15000" 

  URIEncoding="UTF-8"

  maxHttpHeaderSize="32768"

  acceptCount="200"/>

 

說明:

maxThreads:最大執行緒數 300

minSpareThreads:初始化建立的執行緒數 50

maxThreads:一旦執行緒超過這個值,Tomcat就會關閉不再需要的執行緒

maxIdleTime:為最大空閒時間、單位為毫秒。

 

executor為執行緒池的名字,對應Executor 中的name屬性;Connector 標籤中不再有maxThreads的設定。

 

如果tomcat不使用執行緒池則基本配置如下:

<Connector port="8080"   

  protocol="HTTP/1.1"   

  redirectPort="8443"   

  connectionTimeout="30000"   

  keepAliveTimeout="15000"  

  enableLookups="false"  

  URIEncoding="UTF-8"  

  maxHttpHeaderSize="32768"  

  maxThreads="300"  

  acceptCount="200"  

/>  

 修改Tomcat的/conf目錄下面的server.xml檔案,針對埠為8080的聯結器新增如下引數:哭

    1. connectionTimeout:連線失效時間,單位為毫秒、預設為60s、這裡設定為30s,如果使用者請求在30s內未能進入請求佇列,視為本次連線失敗。

    2. keepAliveTimeout:連線的存活時間,預設和connectionTimeout一致,這裡可以設為15s、這意味著15s之後本次連線關閉. 如果頁面需要載入大量圖片、js等靜態資源,需要將引數適當調大一點、以免多次建立TCP連線。

     3. enableLookups:是否對連線到伺服器的遠端機器查詢其DNS主機名,一般情況下這並不必要,因此設為false即可。

     4. URIEncoding:設定URL引數的編碼格式為UTF-8編碼,預設為ISO-8859-1編碼。

     5. maxHttpHeaderSize:設定HTTP請求、響應的頭部內容大小,預設為8192位元組(8k),此處設定為32768位元組(32k)、和Nginx的設定保持一致。

     6. maxThreads:最大執行緒數、用於處理使用者請求的執行緒數目,預設為200、此處設定為300

     7. acceptCount:使用者請求等候佇列的大小,預設為100、此處設定為200

       Linux系統預設一個程序能夠建立的最大執行緒數為1024、因此對高併發應用需要進行Linux核心調優,至此檔案server.xml修改後的內容如下所示:吻

再次登入檢視狀態,

 http://localhost:8080/manager/status

使用者名稱、密碼就是上邊配置的。根據cpu、記憶體的大小來配置。

 

 

參考:

http://blog.sina.com.cn/s/blog_3f12afd00100zpvf.html

          

tomcat7 正式環境的優化

         http://energykey.iteye.com/blog/2072797

tomcat記憶體配置優化

         http://blog.csdn.net/kefeng824/article/details/31742423

 CentOS 6.5 下的tomcat優化

        http://www.cnblogs.com/littlehb/archive/2013/04/02/2994785.html

JVM(Java虛擬機器)優化大全和案例實戰--(重點推薦)

       http://blog.csdn.net/kthq/article/details/8618052

 

轉自: https://blog.csdn.net/rickyit/article/details/53895060