1. 程式人生 > >ArrayList和LinkedList的幾種迴圈遍歷方式及效能對比分

ArrayList和LinkedList的幾種迴圈遍歷方式及效能對比分

轉自:http://www.trinea.cn/android/arraylist-linkedlist-loop-performance/
主要介紹ArrayList和LinkedList這兩種list的五種迴圈遍歷方式,各種方式的效能測試對比,根據ArrayList和LinkedList的原始碼實現分析效能結果,總結結論。
通過本文你可以瞭解
(1)List的五種遍歷方式及各自效能
(2)foreach及Iterator的實現
(3)加深對ArrayList和LinkedList實現的瞭解。
閱讀本文前希望你已經瞭解ArrayList順序儲存和LinkedList鏈式的結構,本文不對此進行介紹。
相關:HashMap迴圈遍歷方式及其效能對比

1. List的五種遍歷方式

下面只是簡單介紹各種遍歷示例(以ArrayList為例),各自優劣會在本文後面進行分析給出結論。
(1) for each迴圈

List<Integer> list = new ArrayList<Integer>();
for (Integer j : list) {
    // use j
}

(2) 顯示呼叫集合迭代器

List<Integer> list = new ArrayList<Integer>();
for (Iterator<Integer> iterator = list
.iterator(); iterator.hasNext();) { iterator.next(); }

List<Integer> list = new ArrayList<Integer>();
Iterator<Integer> iterator = list.iterator();
while (iterator.hasNext()) {
    iterator.next();
}

(3) 下標遞增迴圈,終止條件為每次呼叫size()函式比較判斷

List<Integer> list = new ArrayList<
Integer>(); for (int j = 0; j < list.size(); j++) { list.get(j); }

(4) 下標遞增迴圈,終止條件為和等於size()的臨時變數比較判斷

List<Integer> list = new ArrayList<Integer>();
int size = list.size();
for (int j = 0; j < size; j++) {
    list.get(j);
}

(5) 下標遞減迴圈

List<Integer> list = new ArrayList<Integer>();
for (int j = list.size() - 1; j >= 0; j--) {
    list.get(j);
}

在測試前大家可以根據對ArrayList和LinkedList資料結構及Iterator的瞭解,想想上面五種遍歷方式哪個效能更優。

2、List五種遍歷方式的效能測試及對比

以下是效能測試程式碼,會輸出不同數量級大小的ArrayList和LinkedList各種遍歷方式所花費的時間。

package cn.trinea.java.test;

import java.text.DecimalFormat;
import java.util.ArrayList;
import java.util.Calendar;
import java.util.Iterator;
import java.util.LinkedList;
import java.util.List;

/**
 * JavaLoopTest
 * 
 * @author www.trinea.cn 2013-10-28
 */
public class JavaLoopTest {

    public static void main(String[] args) {

        System.out.print("compare loop performance of ArrayList");
        loopListCompare(getArrayLists(10000, 100000, 1000000, 9000000));

        System.out.print("\r\n\r\ncompare loop performance of LinkedList");
        loopListCompare(getLinkedLists(100, 1000, 10000, 100000));
    }

    public static List<Integer>[] getArrayLists(int... sizeArray) {
        List<Integer>[] listArray = new ArrayList[sizeArray.length];
        for (int i = 0; i < listArray.length; i++) {
            int size = sizeArray[i];
            List<Integer> list = new ArrayList<Integer>();
            for (int j = 0; j < size; j++) {
                list.add(j);
            }
            listArray[i] = list;
        }
        return listArray;
    }

    public static List<Integer>[] getLinkedLists(int... sizeArray) {
        List<Integer>[] listArray = new LinkedList[sizeArray.length];
        for (int i = 0; i < listArray.length; i++) {
            int size = sizeArray[i];
            List<Integer> list = new LinkedList<Integer>();
            for (int j = 0; j < size; j++) {
                list.add(j);
            }
            listArray[i] = list;
        }
        return listArray;
    }

    public static void loopListCompare(List<Integer>... listArray) {
        printHeader(listArray);
        long startTime, endTime;

        // Type 1
        for (int i = 0; i < listArray.length; i++) {
            List<Integer> list = listArray[i];
            startTime = Calendar.getInstance().getTimeInMillis();
            for (Integer j : list) {
                // use j
            }
            endTime = Calendar.getInstance().getTimeInMillis();
            printCostTime(i, listArray.length, "for each", endTime - startTime);
        }

        // Type 2
        for (int i = 0; i < listArray.length; i++) {
            List<Integer> list = listArray[i];
            startTime = Calendar.getInstance().getTimeInMillis();
            // Iterator<Integer> iterator = list.iterator();
            // while(iterator.hasNext()) {
            // iterator.next();
            // }
            for (Iterator<Integer> iterator = list.iterator(); iterator.hasNext();) {
                iterator.next();
            }
            endTime = Calendar.getInstance().getTimeInMillis();
            printCostTime(i, listArray.length, "for iterator", endTime - startTime);
        }

        // Type 3
        for (int i = 0; i < listArray.length; i++) {
            List<Integer> list = listArray[i];
            startTime = Calendar.getInstance().getTimeInMillis();
            for (int j = 0; j < list.size(); j++) {
                list.get(j);
            }
            endTime = Calendar.getInstance().getTimeInMillis();
            printCostTime(i, listArray.length, "for list.size()", endTime - startTime);
        }

        // Type 4
        for (int i = 0; i < listArray.length; i++) {
            List<Integer> list = listArray[i];
            startTime = Calendar.getInstance().getTimeInMillis();
            int size = list.size();
            for (int j = 0; j < size; j++) {
                list.get(j);
            }
            endTime = Calendar.getInstance().getTimeInMillis();
            printCostTime(i, listArray.length, "for size = list.size()", endTime - startTime);
        }

        // Type 5
        for (int i = 0; i < listArray.length; i++) {
            List<Integer> list = listArray[i];
            startTime = Calendar.getInstance().getTimeInMillis();
            for (int j = list.size() - 1; j >= 0; j--) {
                list.get(j);
            }
            endTime = Calendar.getInstance().getTimeInMillis();
            printCostTime(i, listArray.length, "for j--", endTime - startTime);
        }
    }

    static int                 FIRST_COLUMN_LENGTH = 23, OTHER_COLUMN_LENGTH = 12, TOTAL_COLUMN_LENGTH = 71;
    static final DecimalFormat COMMA_FORMAT        = new DecimalFormat("#,###");

    public static void printHeader(List<Integer>... listArray) {
        printRowDivider();
        for (int i = 0; i < listArray.length; i++) {
            if (i == 0) {
                StringBuilder sb = new StringBuilder().append("list size");
                while (sb.length() < FIRST_COLUMN_LENGTH) {
                    sb.append(" ");
                }
                System.out.print(sb);
            }

            StringBuilder sb = new StringBuilder().append("| ").append(COMMA_FORMAT.format(listArray[i].size()));
            while (sb.length() < OTHER_COLUMN_LENGTH) {
                sb.append(" ");
            }
            System.out.print(sb);
        }
        TOTAL_COLUMN_LENGTH = FIRST_COLUMN_LENGTH + OTHER_COLUMN_LENGTH * listArray.length;
        printRowDivider();
    }

    public static void printRowDivider() {
        System.out.println();
        StringBuilder sb = new StringBuilder();
        while (sb.length() < TOTAL_COLUMN_LENGTH) {
            sb.append("-");
        }
        System.out.println(sb);
    }

    public static void printCostTime(int i, int size, String caseName, long costTime) {
        if (i == 0) {
            StringBuilder sb = new StringBuilder().append(caseName);
            while (sb.length() < FIRST_COLUMN_LENGTH) {
                sb.append(" ");
            }
            System.out.print(sb);
        }

        StringBuilder sb = new StringBuilder().append("| ").append(costTime).append(" ms");
        while (sb.length() < OTHER_COLUMN_LENGTH) {
            sb.append(" ");
        }
        System.out.print(sb);

        if (i == size - 1) {
            printRowDivider();
        }
    }
}

PS:如果執行報異常in thread “main” java.lang.OutOfMemoryError: Java heap space,請將main函式裡面list size的大小減小。
其中getArrayLists函式會返回不同size的ArrayList,getLinkedLists函式會返回不同size的LinkedList。
loopListCompare函式會分別用上面的遍歷方式1-5去遍歷每一個list陣列(包含不同大小list)中的list。
print開頭函式為輸出輔助函式。

測試環境為Windows7 32位系統 3.2G雙核CPU 4G記憶體,Java 7,Eclipse -Xms512m -Xmx512m
最終測試結果如下:
這裡寫圖片描述
第一張表為ArrayList對比結果,第二張表為LinkedList對比結果。
表橫向為同一遍歷方式不同大小list遍歷的時間消耗,縱向為同一list不同遍歷方式遍歷的時間消耗。
PS:由於首次遍歷List會稍微多耗時一點,for each的結果稍微有點偏差,將測試程式碼中的幾個Type順序調換會發現,for each耗時和for iterator接近。

3、遍歷方式效能測試結果分析

foreach是Java SE5.0引入的功能很強的迴圈結構,for (Integer j : list)應讀作for each int in list。
for (Integer j : list)實現幾乎等價於

Iterator<Integer> iterator = list.iterator();
while(iterator.hasNext()) {
    Integer j = iterator.next();
}

下面的分析會將foreach和顯示呼叫集合迭代器兩種遍歷方式歸類為Iterator方式,其他三種稱為get方式遍歷。
這時我們已經發現foreach的一大好處,簡單一行實現了四行的功能,使得程式碼簡潔美觀,另一大好處是相對於下標迴圈而言的,foreach不必關心下標初始值和終止值及越界等,所以不易出錯。Effective-Java中推薦使用此種寫法遍歷,本文會驗證這個說法。

使用foreach結構的類物件必須實現了Iterable介面,Java的Collection繼承自此介面,List實現了Collection,這個介面僅包含一個函式,原始碼如下:

package java.lang;

import java.util.Iterator;

/**
 * Implementing this interface allows an object to be the target of
 * the "foreach" statement.
 *
 * @param <T> the type of elements returned by the iterator
 *
 * @since 1.5
 */
public interface Iterable<T> {

    /**
     * Returns an iterator over a set of elements of type T.
     *
     * @return an Iterator.
     */
    Iterator<T> iterator();
}

iterator()用於返回一個Iterator,從foreach的等價實現中我們可以看到,會呼叫這個函式得到Iterator,再通過Iterator的next()得到下一個元素,hasNext()判斷是否還有更多元素。Iterator原始碼如下:

public interface Iterator<E> {
    boolean hasNext();

    E next();

    void remove();
}

(2) ArrayList遍歷方式結果分析
這裡寫圖片描述
PS:由於首次遍歷List會稍微多耗時一點,for each的結果稍微有點偏差,將測試程式碼中的幾個Type順序調換會發現,for each耗時和for iterator接近。
從上面我們可以看出:
a. 在ArrayList大小為十萬之前,五種遍歷方式時間消耗幾乎一樣
b. 在十萬以後,第四、五種遍歷方式快於前三種,get方式優於Iterator方式,並且

int size = list.size();
for (int j = 0; j < size; j++) {
    list.get(j);
}

用臨時變數size取代list.size()效能更優。我們看看ArrayList中迭代器Iterator和get方法的實現

private class Itr implements Iterator<E> {
    int cursor;       // index of next element to return
    int lastRet = -1; // index of last element returned; -1 if no such
    int expectedModCount = modCount;

    public boolean hasNext() {
        return cursor != size;
    }

    @SuppressWarnings("unchecked")
    public E next() {
        checkForComodification();
        int i = cursor;
        if (i >= size)
            throw new NoSuchElementException();
        Object[] elementData = ArrayList.this.elementData;
        if (i >= elementData.length)
            throw new ConcurrentModificationException();
        cursor = i + 1;
        return (E) elementData[lastRet = i];
    }
    ……
}

public E get(int index) {
    rangeCheck(index);

    return elementData(index);
}

從中可以看出get和Iterator的next函式同樣通過直接定位資料獲取元素,只是多了幾個判斷而已。
c . 從上可以看出即便在千萬大小的ArrayList中,幾種遍歷方式相差也不過50ms左右,且在常用的十萬左右時間幾乎相等,考慮foreach的優點,我們大可選用foreach這種簡便方式進行遍歷。
(3) LinkedList遍歷方式結果分析
這裡寫圖片描述
PS:由於首次遍歷List會稍微多耗時一點,for each的結果稍微有點偏差,將測試程式碼中的幾個Type順序調換會發現,for each耗時和for iterator接近。
從上面我們可以看出:
a 在LinkedList大小接近一萬時,get方式和Iterator方式就已經差了差不多兩個數量級,十萬時Iterator方式效能已經遠勝於get方式。
我們看看LinkedList中迭代器和get方法的實現

private class ListItr implements ListIterator<E> {
    private Node<E> lastReturned = null;
    private Node<E> next;
    private int nextIndex;
    private int expectedModCount = modCount;

    ListItr(int index) {
        // assert isPositionIndex(index);
        next = (index == size) ? null : node(index);
        nextIndex = index;
    }

    public boolean hasNext() {
        return nextIndex < size;
    }

    public E next() {
        checkForComodification();
        if (!hasNext())
            throw new NoSuchElementException();

        lastReturned = next;
        next = next.next;
        nextIndex++;
        return lastReturned.item;
    }
    ……
}

public E get(int index) {
    checkElementIndex(index);
    return node(index).item;
}

/**
 * Returns the (non-null) Node at the specified element index.
 */
Node<E> node(int index) {
    // assert isElementIndex(index);

    if (index < (size >> 1)) {
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else {
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

從上面程式碼中可以看出LinkedList迭代器的next函式只是通過next指標快速得到下一個元素並返回。而get方法會從頭遍歷直到index下標,查詢一個元素時間複雜度為哦O(n),遍歷的時間複雜度就達到了O(n2)。
所以對於LinkedList的遍歷推薦使用foreach,避免使用get方式遍歷。
(4) ArrayList和LinkedList遍歷方式結果對比分析
從上面的數量級來看,同樣是foreach迴圈遍歷,ArrayList和LinkedList時間差不多,可將本例稍作修改加大list size會發現兩者基本在一個數量級上。
但ArrayList get函式直接定位獲取的方式時間複雜度為O(1),而LinkedList的get函式時間複雜度為O(n)。
再結合考慮空間消耗的話,建議首選ArrayList。對於個別插入刪除非常多的可以使用LinkedList。

4、結論總結

通過上面的分析我們基本可以總結下:
(1) 無論ArrayList還是LinkedList,遍歷建議使用foreach,尤其是資料量較大時LinkedList避免使用get遍歷。
(2) List使用首選ArrayList。對於個別插入刪除非常多的可以使用LinkedList。
(3) 可能在遍歷List迴圈內部需要使用到下標,這時綜合考慮下是使用foreach和自增count還是get方式。