1. 程式人生 > >Java Set集合的詳解

Java Set集合的詳解

一,Set
Set:注重獨一無二的性質,該體系集合可以知道某物是否已近存在於集合中,不會儲存重複的元素
用於儲存無序(存入和取出的順序不一定相同)元素,值不能重複。

物件的相等性

   引用到堆上同一個物件的兩個引用是相等的。如果對兩個引用呼叫hashCode方法,會得到相同的結果,如果物件所屬的類沒有覆蓋Object的hashCode方法的話,hashCode會返回每個物件特有的序號(java是依據物件的記憶體地址計算出的此序號),所以兩個不同的物件的hashCode值是不可能相等的。

如果想要讓兩個不同的Person物件視為相等的,就必須覆蓋Object繼下來的hashCode方法和equals方法,因為Object  hashCode方法返回的是該物件的記憶體地址,所以必須重寫hashCode方法,才能保證兩個不同的物件具有相同的hashCode,同時也需要兩個不同物件比較equals方法會返回true

該集合中沒有特有的方法,直接繼承自Collection。


---| Itreable      介面 實現該介面可以使用增強for迴圈
                ---| Collection        描述所有集合共性的介面
                    ---| List介面        可以有重複元素的集合
                            ---| ArrayList   
                            ---|  LinkedList
                    ---| Set介面        不可以有重複元素的集合

案例:set集合新增元素並使用迭代器迭代元素。

public class Demo4 {
    public static void main(String[] args) {
        //Set 集合存和取的順序不一致。
        Set hs = new HashSet();
        hs.add("世界軍事");
        hs.add("兵器知識");
        hs.add("艦船知識");
        hs.add("漢和防務");
        System.out.println(hs);
        // [艦船知識, 世界軍事, 兵器知識, 漢和防務]
        Iterator it = hs.iterator();
        while (it.hasNext()) {
            System.out.println(it.next());
        }
    }
}
二,HashSet

---| Itreable      介面 實現該介面可以使用增強for迴圈
                ---| Collection        描述所有集合共性的介面
                    ---| List介面        可以有重複元素的集合
                            ---| ArrayList   
                            ---|  LinkedList
                    ---| Set介面        不可以有重複元素的集合
                            ---| HashSet  執行緒不安全,存取速度快。底層是以雜湊表實現的。
HashSet

雜湊表邊存放的是雜湊值。HashSet儲存元素的順序並不是按照存入時的順序(和List顯然不同) 是按照雜湊值來存的所以取資料也是按照雜湊值取得。

HashSet不存入重複元素的規則.使用hashcode和equals

由於Set集合是不能存入重複元素的集合。那麼HashSet也是具備這一特性的。HashSet如何檢查重複?HashSet會通過元素的hashcode()和equals方法進行判斷元素師否重複。

當你試圖把物件加入HashSet時,HashSet會使用物件的hashCode來判斷物件加入的位置。同時也會與其他已經加入的物件的hashCode進行比較,如果沒有相等的hashCode,HashSet就會假設物件沒有重複出現。

簡單一句話,如果物件的hashCode值是不同的,那麼HashSet會認為物件是不可能相等的。

因此我們自定義類的時候需要重寫hashCode,來確保物件具有相同的hashCode值。

如果元素(物件)的hashCode值相同,是不是就無法存入HashSet中了? 當然不是,會繼續使用equals 進行比較.如果 equals為true 那麼HashSet認為新加入的物件重複了,所以加入失敗。如果equals 為false那麼HashSet 認為新加入的物件沒有重複.新元素可以存入.

總結:

元素的雜湊值是通過元素的hashcode方法 來獲取的, HashSet首先判斷兩個元素的雜湊值,如果雜湊值一樣,接著會比較equals方法 如果 equls結果為true ,HashSet就視為同一個元素。如果equals 為false就不是同一個元素。

雜湊值相同equals為false的元素是怎麼儲存呢,就是在同樣的雜湊值下順延(可以認為雜湊值相同的元素放在一個雜湊桶中)。也就是雜湊一樣的存一列。

hashtable

圖1:hashCode值不相同的情況

圖2:hashCode值相同,但equals不相同的情況。

HashSet:通過hashCode值來確定元素在記憶體中的位置。一個hashCode位置上可以存放多個元素。

當hashcode() 值相同equals() 返回為true 時,hashset 集合認為這兩個元素是相同的元素.只儲存一個(重複元素無法放入)。呼叫原理:先判斷hashcode 方法的值,如果相同才會去判斷equals 如果不相同,是不會呼叫equals方法的。


HashSet到底是如何判斷兩個元素重複。

通過hashCode方法和equals方法來保證元素的唯一性,add()返回的是boolean型別

判斷兩個元素是否相同,先要判斷元素的hashCode值是否一致,只有在該值一致的情況下,才會判斷equals方法,如果儲存在HashSet中的兩個物件hashCode方法的值相同equals方法返回的結果是true,那麼HashSet認為這兩個元素是相同元素,只儲存一個(重複元素無法存入)。

注意:HashSet集合在判斷元素是否相同先判斷hashCode方法,如果相同才會判斷equals。如果不相同,是不會呼叫equals方法的。

 

HashSet 和ArrayList集合都有判斷元素是否相同的方法,

boolean contains(Object o)

HashSet使用hashCode和equals方法,ArrayList使用了equals方法


案例:

使用HashSet儲存字串,並嘗試新增重複字串

回顧String類的equals()、hashCode()兩個方法。


public class Demo4 {
    public static void main(String[] args) {
        // Set 集合存和取的順序不一致。
        Set hs = new HashSet();
        hs.add("世界軍事");
        hs.add("兵器知識");
        hs.add("艦船知識");
        hs.add("漢和防務");
 
        // 返回此 set 中的元素的數量
        System.out.println(hs.size()); // 4
 
        // 如果此 set 尚未包含指定元素,則返回 true
        boolean add = hs.add("世界軍事"); // false
        System.out.println(add);
 
        // 返回此 set 中的元素的數量
        System.out.println(hs.size());// 4
        Iterator it = hs.iterator();
        while (it.hasNext()) {
            System.out.println(it.next());
        }
    }
}

使用HashSet儲存自定義物件,並嘗試新增重複物件(物件的重複的判定)

public class Demo4 {
    public static void main(String[] args) {
        HashSet hs = new HashSet();
        hs.add(new Person("jack", 20));
        hs.add(new Person("rose", 20));
        hs.add(new Person("hmm", 20));
        hs.add(new Person("lilei", 20));
        hs.add(new Person("jack", 20));
 
        Iterator it = hs.iterator();
        while (it.hasNext()) {
            Object next = it.next();
            System.out.println(next);
        }
    }
}
 
class Person {
    private String name;
    private int age;
 
    Person() {
 
    }
 
    public Person(String name, int age) {
 
        this.name = name;
        this.age = age;
    }
 
    public String getName() {
        return name;
    }
 
    public void setName(String name) {
        this.name = name;
    }
 
    public int getAge() {
        return age;
    }
 
    public void setAge(int age) {
        this.age = age;
    }
 
    @Override
    public int hashCode() {
        System.out.println("hashCode:" + this.name);
        return this.name.hashCode() + age * 37;
    }
 
    @Override
    public boolean equals(Object obj) {
        System.out.println(this + "---equals---" + obj);
        if (obj instanceof Person) {
            Person p = (Person) obj;
            return this.name.equals(p.name) && this.age == p.age;
        } else {
            return false;
        }
    }
 
    @Override
    public String toString() {
 
        return "[email protected]:" + this.name + " age:" + this.age;
    }
 
}

問題:現在有一批資料,要求不能重複儲存元素,而且要排序。ArrayList 、 LinkedList不能去除重複資料。HashSet可以去除重複,但是是無序。

所以這時候就要使用TreeSet了

三,TreeSet


案例:使用TreeSet集合儲存字串元素,並遍歷

public class Demo5 {
    public static void main(String[] args) {
        TreeSet ts = new TreeSet();
        ts.add("ccc");
        ts.add("aaa");
        ts.add("ddd");
        ts.add("bbb");
 
        System.out.println(ts); // [aaa, bbb, ccc, ddd]
 
    }
}
---| Itreable      介面 實現該介面可以使用增強for迴圈
                ---| Collection        描述所有集合共性的介面
                    ---| List介面        有序,可以重複,有角標的集合
                            ---| ArrayList   
                            ---|  LinkedList
                    ---| Set介面        無序,不可以重複的集合
                            ---| HashSet  執行緒不安全,存取速度快。底層是以hash表實現的。
                            ---| TreeSet  紅-黑樹的資料結構,預設對元素進行自然排序(String)。如果在比較的時候兩個物件返回值為0,那麼元素重複。
紅-黑樹

紅黑樹是一種特定型別的二叉樹

紅黑樹演算法的規則: 左小右大。

既然TreeSet可以自然排序,那麼TreeSet必定是有排序規則的。

1:讓存入的元素自定義比較規則。

2:給TreeSet指定排序規則。

方式一:元素自身具備比較性

元素自身具備比較性,需要元素實現Comparable介面,重寫compareTo方法,也就是讓元素自身具備比較性,這種方式叫做元素的自然排序也叫做預設排序。

方式二:容器具備比較性

當元素自身不具備比較性,或者自身具備的比較性不是所需要的。那麼此時可以讓容器自身具備。需要定義一個類實現介面Comparator,重寫compare方法,並將該介面的子類例項物件作為引數傳遞給TreeMap集合的構造方法。

注意:當Comparable比較方式和Comparator比較方式同時存在時,以Comparator的比較方式為主;

注意:在重寫compareTo或者compare方法時,必須要明確比較的主要條件相等時要比較次要條件。(假設姓名和年齡一直的人為相同的人,如果想要對人按照年齡的大小來排序,如果年齡相同的人,需要如何處理?不能直接return 0,因為可能姓名不同(年齡相同姓名不同的人是不同的人)。此時就需要進行次要條件判斷(需要判斷姓名),只有姓名和年齡同時相等的才可以返回0.)

通過return 0來判斷唯一性。

 

問題:為什麼使用TreeSet存入字串,字串預設輸出是按升序排列的?因為字串實現了一個介面,叫做Comparable 介面.字串重寫了該介面的compareTo 方法,所以String物件具備了比較性.那麼同樣道理,我的自定義元素(例如Person類,Book類)想要存入TreeSet集合,就需要實現該介面,也就是要讓自定義物件具備比較性.

存入TreeSet集合中的元素要具備比較性.

比較性要實現Comparable介面,重寫該介面的compareTo方法

TreeSet屬於Set集合,該集合的元素是不能重複的,TreeSet如何保證元素的唯一性

通過compareTo或者compare方法中的來保證元素的唯一性。

新增的元素必須要實現Comparable介面。當compareTo()函式返回值為0時,說明兩個物件相等,此時該物件不會新增進來。

比較器介面

----| Comparable
               compareTo(Object o)     元素自身具備比較性
----| Comparator
               compare( Object o1, Object o2 )    給容器傳入比較器

TreeSet集合排序的兩種方式:

一,讓元素自身具備比較性。

也就是元素需要實現Comparable介面,覆蓋compareTo 方法。

這種方式也作為元素的自然排序,也可稱為預設排序。

年齡按照搜要條件,年齡相同再比姓名。

public class Demo4 {
    public static void main(String[] args) {
        TreeSet ts = new TreeSet();
        ts.add(new Person("aa", 20, "男"));
        ts.add(new Person("bb", 18, "女"));
        ts.add(new Person("cc", 17, "男"));
        ts.add(new Person("dd", 17, "女"));
        ts.add(new Person("dd", 15, "女"));
        ts.add(new Person("dd", 15, "女"));
 
 
        System.out.println(ts);
        System.out.println(ts.size()); // 5
 
    }
}
 
class Person implements Comparable {
    private String name;
    private int age;
    private String gender;
 
    public Person() {
 
    }
 
    public Person(String name, int age, String gender) {
 
        this.name = name;
        this.age = age;
        this.gender = gender;
    }
 
    public String getName() {
        return name;
    }
 
    public void setName(String name) {
        this.name = name;
    }
 
    public int getAge() {
        return age;
    }
 
    public void setAge(int age) {
        this.age = age;
    }
 
    public String getGender() {
        return gender;
    }
 
    public void setGender(String gender) {
        this.gender = gender;
    }
 
    @Override
    public int hashCode() {
        return name.hashCode() + age * 37;
    }
 
    public boolean equals(Object obj) {
        System.err.println(this + "equals :" + obj);
        if (!(obj instanceof Person)) {
            return false;
        }
        Person p = (Person) obj;
        return this.name.equals(p.name) && this.age == p.age;
 
    }
 
    public String toString() {
        return "Person [name=" + name + ", age=" + age + ", gender=" + gender
                + "]";
    }
 
    @Override
    public int compareTo(Object obj) {
        
        Person p = (Person) obj;
        System.out.println(this+" compareTo:"+p);
        if (this.age > p.age) {
            return 1;
        }
        if (this.age < p.age) {
            return -1;
        }
        return this.name.compareTo(p.name);
    }
 
}
二,讓容器自身具備比較性,自定義比較器。

需求:當元素自身不具備比較性,或者元素自身具備的比較性不是所需的。

那麼這時只能讓容器自身具備。

定義一個類實現Comparator 介面,覆蓋compare方法。

並將該介面的子類物件作為引數傳遞給TreeSet集合的建構函式。

當Comparable比較方式,及Comparator比較方式同時存在,以Comparator

比較方式為主。

public class Demo5 {
    public static void main(String[] args) {
        TreeSet ts = new TreeSet(new MyComparator());
        ts.add(new Book("think in java", 100));
        ts.add(new Book("java 核心技術", 75));
        ts.add(new Book("現代作業系統", 50));
        ts.add(new Book("java就業教程", 35));
        ts.add(new Book("think in java", 100));
        ts.add(new Book("ccc in java", 100));
 
        System.out.println(ts); 
    }
}
 
class MyComparator implements Comparator {
 
    public int compare(Object o1, Object o2) {
        Book b1 = (Book) o1;
        Book b2 = (Book) o2;
        System.out.println(b1+" comparator "+b2);
        if (b1.getPrice() > b2.getPrice()) {
            return 1;
        }
        if (b1.getPrice() < b2.getPrice()) {
            return -1;
        }
        return b1.getName().compareTo(b2.getName());
    }
 
}
 
class Book {
    private String name;
    private double price;
 
    public Book() {
 
    }
 
    public String getName() {
        return name;
    }
 
    public void setName(String name) {
        this.name = name;
    }
 
    public double getPrice() {
        return price;
    }
 
    public void setPrice(double price) {
        this.price = price;
    }
 
    public Book(String name, double price) {
 
        this.name = name;
        this.price = price;
    }
 
    @Override
    public String toString() {
        return "Book [name=" + name + ", price=" + price + "]";
    }
 
}


四,LinkedHashSet
會儲存插入的順序。

看到array,就要想到角標。

看到link,就要想到first,last。

看到hash,就要想到hashCode,equals.

看到tree,就要想到兩個介面。Comparable,Comparator。