1. 程式人生 > >List去重(資料為物件的情況)及String中的equals()方法和hashCode()方法原始碼分析

List去重(資料為物件的情況)及String中的equals()方法和hashCode()方法原始碼分析

面試中經常被問到的list如何去重,用來考察你對list資料結構,以及相關方法的掌握,體現你的java基礎學的是否牢固。

我們大家都知道,set集合的特點就是沒有重複的元素如果集合中的資料型別是基本資料型別,可以直接將list集合轉換成set,就會自動去除重複的元素,這個就相對比較簡單。上一篇文章就是基本型別的資料結構去重。

如下示例:

public class Test {
    public static void main(String[] args) {
        List list = new ArrayList();
        list.add(11);
        list.add(12);
        list.add(13);
        list.add(14);
        list.add(15);
        list.add(11);
        System.out.println(list);

        Set set = new HashSet();
        List newList = new ArrayList();
        set.addAll(list);
        newList.addAll(set);
        System.out.println(newList);
    }
}

輸出結果為:

我們可以看到去重成功了。

在面試中被問到list去重問題,大部分回答都會是list和set互轉,利用set自動去除重複屬性的方法去重,但是這樣的回答並不會得分。

當list集合中儲存的型別是物件型別的時候,我們就不能簡單的只把list集合轉換成set集合。


我們定義一個物件類:

public class People {

    private String name;
    private String phoneNumber;

    public People(String name, String phoneNumber) {
        super();
        this.name = name;
        this.phoneNumber = phoneNumber;
    }

    //setter、getter......

    @Override
    public String toString() {
        return "People{" +
                "name='" + name + ''' +
                ", phoneNumber='" + phoneNumber + ''' +
                '}';
    }
}

我們使用上面的set去重的方法去重:

public static void main(String[] args) {
    List<People> listPeople = new ArrayList<People>();
    listPeople.add(new People("張三", "11111"));
    listPeople.add(new People("張三",  "22222"));
    listPeople.add(new People("李四",  "33333"));
    listPeople.add(new People("張三",  "22222"));

    Set<People> setData = new HashSet<People>();
    setData.addAll(listPeople);
    System.out.println("list:" + listPeople.toString());
    System.out.println("set:" + setData.toString());
}

執行後輸出的結果為:面試中常問的List去重問題,你都答對了嗎?

我們可以看到第二個張三和最後一個張三,資訊都一樣,卻沒有被去重。

list集合中儲存的是物件時,我們需要在物件的實體類中去重寫equals()方法和hashCode()方法,如下:

public class People {

    private String name;
    private String phoneNumber;

    public People(String name, String phoneNumber) {
        super();
        this.name = name;
        this.phoneNumber = phoneNumber;
    }

    //setter、getter......

    @Override
    public String toString() {
        return "People{" +
                "name='" + name + ''' +
                ", phoneNumber='" + phoneNumber + ''' +
                '}';
    }

    @Override
    public boolean equals(Object arg0) {
        // TODO Auto-generated method stub
        People p = (People) arg0;
        return name.equals(p.name) && phoneNumber.equals(p.phoneNumber);
    }

    @Override
    public int hashCode() {
        // TODO Auto-generated method stub
        String str = name + phoneNumber;
        return str.hashCode();
    }
}

此時執行上面的test方法,去重就成功了。

 

最後,我們拿出String中的equals()方法和hashCode()方法原始碼來加深認識:

equals()

    public boolean equals(Object anObject) {
        //首先,先去判斷兩個物件是否具有相同的地址(是否同一個物件的引用)
        if (this == anObject) {
            return true;
        }
        //如果地址不一樣,則證明不是引用同一個物件,接下來就是挨個去比較兩個字串物件的內容是否一致
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = count;
            if (n == anotherString.count) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = offset;
                int j = anotherString.offset;
                while (n-- != 0) {
                    if (v1[i++] != v2[j++])
                        return false;
                }
                return true;
            }
        }
        return false;
    }

比較兩個物件時,首先先去判斷兩個物件是否具有相同的地址,如果是同一個物件的引用,則直接放回true;如果地址不一樣,則證明不是引用同一個物件,接下來就是挨個去比較兩個字串物件的內容是否一致,完全相等返回true,否則false。


hashCode()

    public int hashCode() {
        int h = hash;
        if (h == 0 && count > 0) {
            int off = offset;
            char val[] = value;
            int len = count;
            for (int i = 0; i < len; i++) {
                h = 31*h + val[off++];
            }
            hash = h;
        }
        return h;
    }

hashCode()官方定義:

hashcode方法返回該物件的雜湊碼值。支援該方法是為雜湊表提供一些優點,例如,java.util.Hashtable 提供的雜湊表。

 

hashCode 的常規協定是:

在 Java 應用程式執行期間,在同一物件上多次呼叫 hashCode 方法時,必須一致地返回相同的整數,前提是物件上 equals 比較中所用的資訊沒有被修改。從某一應用程式的一次執行到同一應用程式的另一次執行,該整數無需保持一致。

如果根據 equals(Object) 方法,兩個物件是相等的,那麼在兩個物件中的每個物件上呼叫 hashCode 方法都必須生成相同的整數結果。

以下情況不是必需的:如果根據 equals(java.lang.Object) 方法,兩個物件不相等,那麼在兩個物件中的任一物件上呼叫 hashCode 方法必定會生成不同的整數結果。但是,程式設計師應該知道,為不相等的物件生成不同整數結果可以提高雜湊表的效能。

實際上,由 Object 類定義的 hashCode 方法確實會針對不同的物件返回不同的整數。(這一般是通過將該物件的內部地址轉換成一個整數來實現的,但是 JavaTM 程式語言不需要這種實現技巧。)

當equals方法被重寫時,通常有必要重寫 hashCode 方法,以維護 hashCode 方法的常規協定,該協定宣告相等物件必須具有相等的雜湊碼。

 

當然,List去重的方法很多,可以用 for迴圈 或者使用 java8新特性stream 等等。

 


來源於:

java知音公眾號 —— 面試中常問的List去重問題,你都答對了嗎?2018年10月30日