1. 程式人生 > >java基礎學習總結(十六):程式碼優化

java基礎學習總結(十六):程式碼優化

程式碼優化的目標是:

1、減小程式碼的體積

2、提高程式碼執行的效率

程式碼優化細節

(1)儘量指定類、方法的final修飾符

    帶有final修飾符的類是不可派生的。在Java核心API中,有許多應用final的例子,例如java.lang.String,整個類都是final的。為類指定final修飾符可以讓類不可以被繼承,為方法指定final修飾符可以讓方法不可以被重寫。如果指定了一個類為final,則該類所有的方法都是final的。Java編譯器會尋找機會內聯所有的final方法,內聯對於提升Java執行效率作用重大,具體參見Java執行期優化

。此舉能夠使效能平均提高50%。

(2)儘量重用物件

    特別是String物件的使用,出現字串連線時應該使用StringBuilder/StringBuffer代替。由於Java虛擬機器不僅要花時間生成物件,以後可能還需要花時間對這些物件進行垃圾回收和處理,因此,生成過多的物件將會給程式的效能帶來很大的影響。

(3)儘可能使用區域性變數

     呼叫方法時傳遞的引數以及在呼叫中建立的臨時變數都儲存在棧中,速度較快,其他變數,如靜態變數、例項變數等,都在堆中建立,速度較慢。另外,棧中建立的變數,隨著方法的執行結束,這些內容就沒了,不需要額外的垃圾回收。

(4)及時關閉流

Java程式設計過程中,進行資料庫連線、I/O流操作時務必小心,在使用完畢後,及時關閉以釋放資源。因為對這些大物件的操作會造成系統大的開銷,稍有不慎,將會導致嚴重的後果。

(5)儘量減少對變數的重複計算

明確一個概念,對方法的呼叫,即使方法中只有一句語句,也是有消耗的,包括建立棧幀、呼叫方法時保護現場、呼叫方法完畢時恢復現場等。所以例如下面的操作:

for (int i = 0; i < list.size(); i++)
{...}

建議替換為:

for (int i = 0, length = list.size(); i < length; i++)
{...}

這樣,在list.size()很大的時候,就減少了很多的消耗

(6)儘量採用懶載入的策略,即在需要的時候才建立

例如:

String str = "aaa";
if (i == 1)
{
  list.add(str);
}

建議替換為:

if (i == 1)
{
  String str = "aaa";
  list.add(str);
}

(7)慎用異常

     異常對效能不利。丟擲異常首先要建立一個新的物件,Throwable介面的建構函式呼叫名為fillInStackTrace()的本地同步方法,fillInStackTrace()方法檢查堆疊,收集呼叫跟蹤資訊。只要有異常被丟擲,Java虛擬機器就必須調整呼叫堆疊,因為在處理過程中建立了一個新的物件。異常只能用於錯誤處理,不應該用來控制程式流程。

(8)不要在迴圈中使用try...catch...,應該把其放在最外層

(9)如果能估計到待新增的內容長度,為底層以陣列方式實現的集合、工具類指定初始長度

比如ArrayList、LinkedLlist、StringBuilder、StringBuffer、HashMap、HashSet等等,以StringBuilder為例:

  • StringBuilder()      // 預設分配16個字元的空間
  • StringBuilder(int size)  // 預設分配size個字元的空間
  • StringBuilder(String str) // 預設分配16個字元+str.length()個字元空間

可以通過類(這裡指的不僅僅是上面的StringBuilder)的建構函式來設定它的初始化容量,這樣可以明顯地提升效能。比如StringBuilder吧,length表示當前的StringBuilder能保持的字元數量。因為當StringBuilder達到最大容量的時候,它會將自身容量增加到當前的2倍再加2,無論何時只要StringBuilder達到它的最大容量,它就不得不建立一個新的字元陣列然後將舊的字元陣列內容拷貝到新字元陣列中----這是十分耗費效能的一個操作。試想,如果能預估到字元陣列中大概要存放5000個字元而不指定長度,最接近5000的2次冪是4096,每次擴容加的2不管,那麼:

  • 在4096 的基礎上,再申請8194個大小的字元陣列,加起來相當於一次申請了12290個大小的字元陣列,如果一開始能指定5000個大小的字元陣列,就節省了一倍以上的空間
  • 把原來的4096個字元拷貝到新的的字元陣列中去

這樣,既浪費記憶體空間又降低程式碼執行效率。所以,給底層以陣列實現的集合、工具類設定一個合理的初始化容量是錯不了的,這會帶來立竿見影的效果。但是,注意,像HashMap這種是以陣列+連結串列實現的集合,別把初始大小和你估計的大小設定得一樣,因為一個table上只連線一個物件的可能性幾乎為0。初始大小建議設定為2的N次冪,如果能估計到有2000個元素,設定成new HashMap(128)、new HashMap(256)都可以。

(10)當複製大量資料時,使用System.arraycopy()命令

(11)乘法和除法使用移位操作

例如:

for (val = 0; val < 100000; val += 5)
{
  a = val * 8;
  b = val / 2;
}

用移位操作可以極大地提高效能,因為在計算機底層,對位的操作是最方便、最快的,因此建議修改為: 

for (val = 0; val < 100000; val += 5)
{
  a = val << 3;
  b = val >> 1;
}

移位操作雖然快,但是可能會使程式碼不太好理解,因此最好加上相應的註釋。

(12)迴圈內不要不斷建立物件引用

例如:

for (int i = 1; i <= count; i++)
{
    Object obj = new Object();    
}

這種做法會導致記憶體中有count份Object物件引用存在,count很大的話,就耗費記憶體了,建議為改為:

Object obj = null;
for (int i = 0; i <= count; i++)
{
    obj = new Object();
}

       這樣的話,記憶體中只有一份Object物件引用,每次new Object()的時候,Object物件引用指向不同的Object罷了,但是記憶體中只有一份,這樣就大大節省了記憶體空間了。

(13)基於效率和型別檢查的考慮,應該儘可能使用array,無法確定陣列大小時才使用ArrayList

(14)儘量使用HashMap、ArrayList、StringBuilder,除非執行緒安全需要,否則不推薦使用Hashtable、Vector、StringBuffer,後三者由於使用同步機制而導致了效能開銷

(15)不要將陣列宣告為public static final

    因為這毫無意義,這樣只是定義了引用為static final,陣列的內容還是可以隨意改變的,將陣列宣告為public更是一個安全漏洞,這意味著這個陣列可以被外部類所改變

(16)儘量在合適的場合使用單例

     使用單例可以減輕載入的負擔、縮短載入的時間、提高載入的效率,但並不是所有地方都適用於單例,簡單來說,單例主要適用於以下三個方面:

  • 控制資源的使用,通過執行緒同步來控制資源的併發訪問
  • 控制例項的產生,以達到節約資源的目的
  • 控制資料的共享,在不建立直接關聯的條件下,讓多個不相關的程序或執行緒之間實現通訊

(17)儘量避免隨意使用靜態變數

要知道,當某個物件被定義為static的變數所引用,那麼gc通常是不會回收這個物件所佔有的堆記憶體的,如:

public class A
{
    private static B b = new B();  
}

此時靜態變數b的生命週期與A類相同,如果A類不被解除安裝,那麼引用B指向的B物件會常駐記憶體,直到程式終止

(18)及時清除不再需要的會話

為了清除不再活動的會話,許多應用伺服器都有預設的會話超時時間,一般為30分鐘。當應用伺服器需要儲存更多的會話時,如果記憶體不足,那麼作業系統會把部分資料轉移到磁碟,應用伺服器也可能根據MRU(最近最頻繁使用)演算法把部分不活躍的會話轉儲到磁碟,甚至可能丟擲記憶體不足的異常。如果會話要被轉儲到磁碟,那麼必須要先被序列化,在大規模叢集中,對物件進行序列化的代價是很昂貴的。因此,當會話不再需要時,應當及時呼叫HttpSession的invalidate()方法清除會話。

(19)實現RandomAccess介面的集合比如ArrayList,應當使用最普通的for迴圈而不是foreach迴圈來遍歷

    這是JDK推薦給使用者的。JDK API對於RandomAccess介面的解釋是:實現RandomAccess介面用來表明其支援快速隨機訪問,此介面的主要目的是允許一般的演算法更改其行為,從而將其應用到隨機或連續訪問列表時能提供良好的效能。實際經驗表明,實現RandomAccess介面的類例項,假如是隨機訪問的,使用普通for迴圈效率將高於使用foreach迴圈;反過來,如果是順序訪問的,則使用Iterator會效率更高。可以使用類似如下的程式碼作判斷:

if (list instanceof RandomAccess)
{
    for (int i = 0; i < list.size(); i++){}
}
else
{
    Iterator<?> iterator = list.iterable();
    while (iterator.hasNext()){iterator.next()}
}

foreach迴圈的底層實現原理就是迭代器Iterator,所以後半句"反過來,如果是順序訪問的,則使用Iterator會效率更高"的意思就是順序訪問的那些類例項,使用foreach迴圈去遍歷。

(20)使用同步程式碼塊替代同步方法

       除非能確定一整個方法都是需要進行同步的,否則儘量使用同步程式碼塊,避免對那些不需要進行同步的程式碼也進行了同步,影響了程式碼執行效率。

(21)將常量宣告為static final,並以大寫命名

這樣在編譯期間就可以把這些內容放入常量池中,避免執行期間計算生成常量的值。另外,將常量的名字以大寫命名也可以方便區分出常量與變數

(22)不要建立一些不使用的物件,不要匯入一些不使用的類

     這毫無意義,如果程式碼中出現"The value of the local variable i is not used"、"The import java.util is never used",那麼請刪除這些無用的內容

(23)程式執行過程中避免使用反射

       反射是Java提供給使用者一個很強大的功能,功能強大往往意味著效率不高。不建議在程式執行過程中使用尤其是頻繁使用反射機制,特別是Method的invoke方法,如果確實有必要,一種建議性的做法是將那些需要通過反射載入的類在專案啟動的時候通過反射例項化出一個物件並放入記憶體----使用者只關心和對端互動的時候獲取最快的響應速度,並不關心對端的專案啟動花多久時間。

(24)使用資料庫連線池和執行緒池

  這兩個池都是用於重用物件的,前者可以避免頻繁地開啟和關閉連線,後者可以避免頻繁地建立和銷燬執行緒

(25)使用帶緩衝的輸入輸出流進行IO操作

    帶緩衝的輸入輸出流,即BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream,這可以極大地提升IO效率

(26)順序插入和隨機訪問比較多的場景使用ArrayList,元素刪除和中間插入比較多的場景使用LinkedList

(27)不要讓public方法中有太多的形參

public方法即對外提供的方法,如果給這些方法太多形參的話主要有兩點壞處:

  • 違反了面向物件的程式設計思想,Java講求一切都是物件,太多的形參,和麵向物件的程式設計思想並不契合
  • 引數太多勢必導致方法呼叫的出錯概率增加

至於這個"太多"指的是多少個,3、4個吧。比如我們用JDBC寫一個insertStudentInfo方法,有10個學生資訊欄位要插如Student表中,可以把這10個引數封裝在一個實體類中,作為insert方法的形參

(28)字串變數和字串常量equals的時候將字串常量寫在前面

這是一個比較常見的小技巧了,如果有以下程式碼:

String str = "123";
if (str.equals("123"))
{
    ...
}

建議修改為:

String str = "123";
if ("123".equals(str))
{
    ...
}

這麼做主要是可以避免空指標異常

(29)不要對陣列使用toString()方法

看一下對陣列使用toString()打印出來的是什麼:

public static void main(String[] args)
{
    int[] is = new int[]{1, 2, 3};
    System.out.println(is.toString());
}

結果是:

[[email protected]

      本意是想打印出陣列內容,卻有可能因為陣列引用is為空而導致空指標異常。不過雖然對陣列toString()沒有意義,但是對集合toString()是可以打印出集合裡面的內容的,因為集合的父類AbstractCollections<E>重寫了Object的toString()方法。

(30)不要對超出範圍的基本資料型別做向下強制轉型

這絕不會得到想要的結果:

public static void main(String[] args)
{
    long l = 12345678901234L;
    int i = (int)l;
    System.out.println(i);
}

我們可能期望得到其中的某幾位,但是結果卻是:

1942892530

解釋一下。Java中long是8個位元組64位的,所以12345678901234在計算機中的表示應該是:

0000 0000 0000 0000 0000 1011 0011 1010 0111 0011 1100 1110 0010 1111 1111 0010

一個int型資料是4個位元組32位的,從低位取出上面這串二進位制資料的前32位是:

0111 0011 1100 1110 0010 1111 1111 0010

這串二進位制表示為十進位制1942892530,所以就是我們上面的控制檯上輸出的內容。從這個例子上還能順便得到兩個結論:

1、整型預設的資料型別是int,long l = 12345678901234L,這個數字已經超出了int的範圍了,所以最後有一個L,表示這是一個long型數。順便,浮點型的預設型別是double,所以定義float的時候要寫成""float f = 3.5f"

2、接下來再寫一句"int ii = l + i;"會報錯,因為long + int是一個long,不能賦值給int

(31)公用的集合類中不使用的資料一定要及時remove掉

      如果一個集合類是公用的(也就是說不是方法裡面的屬性),那麼這個集合裡面的元素是不會自動釋放的,因為始終有引用指向它們。所以,如果公用集合裡面的某些資料不使用而不去remove掉它們,那麼將會造成這個公用集合不斷增大,使得系統有記憶體洩露的隱患。

(32)把一個基本資料型別轉為字串,基本資料型別.toString()是最快的方式、String.valueOf(資料)次之、資料+""最慢

所以以後遇到把一個基本資料型別轉為String的時候,優先考慮使用toString()方法。至於為什麼,很簡單:

  • String.valueOf()方法底層呼叫了Integer.toString()方法,但是會在呼叫前做空判斷
  • Integer.toString()方法就不說了,直接呼叫了
  • i + ""底層使用了StringBuilder實現,先用append方法拼接,再用toString()方法獲取字串

三者對比下來,明顯是2最快、1次之、3最慢

(33)使用最有效率的方式去遍歷Map

遍歷Map的方式有很多,通常場景下我們需要的是遍歷Map中的Key和Value,那麼推薦使用的、效率最高的方式是:

public static void main(String[] args)
{
    HashMap<String, String> hm = new HashMap<String, String>();
    hm.put("111", "222");
        
    Set<Map.Entry<String, String>> entrySet = hm.entrySet();
    Iterator<Map.Entry<String, String>> iter = entrySet.iterator();
    while (iter.hasNext())
    {
        Map.Entry<String, String> entry = iter.next();
        System.out.println(entry.getKey() + "\t" + entry.getValue());
    }
}

如果你只是想遍歷一下這個Map的key值,那用"Set<String> keySet = hm.keySet();"會比較合適一些

(34)對資源的close()建議分開操作

意思是,比如我有這麼一段程式碼:

try
{
    XXX.close();
    YYY.close();
}
catch (Exception e)
{
    ...
}

建議修改為:

try
{
    XXX.close();
}
catch (Exception e)
{
    ...
}
try
{
    YYY.close();
}
catch (Exception e)
{
    ...
}

     雖然有些麻煩,卻能避免資源洩露。我們想,如果沒有修改過的程式碼,萬一XXX.close()拋異常了,那麼就進入了catch塊中了,YYY.close()不會執行,YYY這塊資源就不會回收了,一直佔用著,這樣的程式碼一多,是可能引起資源控制代碼洩露的。而改為下面的寫法之後,就保證了無論如何XXX和YYY都會被close掉

(35)對於ThreadLocal使用前或者使用後一定要先remove

當前基本所有的專案都使用了執行緒池技術,這非常好,可以動態配置執行緒數、可以重用執行緒。

然而,如果你在專案中使用到了ThreadLocal,一定要記得使用前或者使用後remove一下。這是因為上面提到了執行緒池技術做的是一個執行緒重用,這意味著程式碼執行過程中,一條執行緒使用完畢,並不會被銷燬而是等待下一次的使用。我們看一下Thread類中,持有ThreadLocal.ThreadLocalMap的引用:

/* ThreadLocal values pertaining to this thread. This map is maintained
 * by the ThreadLocal class. */
ThreadLocal.ThreadLocalMap threadLocals = null;

執行緒不銷燬意味著上條執行緒set的ThreadLocal.ThreadLocalMap中的資料依然存在,那麼在下一條執行緒重用這個Thread的時候,很可能get到的是上條執行緒set的資料而不是自己想要的內容。

這個問題非常隱晦,一旦出現這個原因導致的錯誤,沒有相關經驗或者沒有紮實的基礎非常難發現這個問題,因此在寫程式碼的時候就要注意這一點,這將給你後續減少很多的工作量。

(36)切記以常量定義的方式替代魔鬼數字,魔鬼數字的存在將極大地降低程式碼可讀性,字串常量是否使用常量定義可以視情況而定

(37)long或者Long初始賦值時,使用大寫的L而不是小寫的l,因為字母l極易與數字1混淆,這個點非常細節,值得注意

(38)所有重寫的方法必須保留@Override註解

這麼做有三個原因:

(1)清楚地可以知道這個方法由父類繼承而來

(2)getObject()和get0bject()方法,前者第四個字母是"O",後者第四個子母是"0",加了@Override註解可以馬上判斷是否重寫成功

(3)在抽象類中對方法簽名進行修改,實現類會馬上報出編譯錯誤

(39)推薦使用JDK7中新引入的Objects工具類來進行物件的equals比較,直接a.equals(b),有空指標異常的風險

(40)迴圈體內不要使用"+"進行字串拼接,而直接使用StringBuilder不斷append

(41)不捕獲Java類庫中定義的繼承自RuntimeException的執行時異常類

異常處理效率低,RuntimeException的執行時異常類,其中絕大多數完全可以由程式設計師來規避,比如:

  • ArithmeticException可以通過判斷除數是否為空來規避
  • NullPointerException可以通過判斷物件是否為空來規避
  • IndexOutOfBoundsException可以通過判斷陣列/字串長度來規避
  • ClassCastException可以通過instanceof關鍵字來規避
  • ConcurrentModificationException可以使用迭代器來規避

(42)避免Random例項被多執行緒使用,雖然共享該例項是執行緒安全的,但會因競爭同一seed 導致的效能下降,JDK7之後,可以使用ThreadLocalRandom來獲取隨機數

(43)靜態類、單例類、工廠類將它們的建構函式置為private

    這是因為靜態類、單例類、工廠類這種類本來我們就不需要外部將它們new出來,將建構函式置為private之後,保證了這些類不會產生例項物件。