您好,登錄后才能下訂單哦!
第1 部分 hashCode的作用
Java集合中有兩類,一類是List,一類是Set他們之間的區別就在于List集合中的元素師有序的,且可以重復,而Set集合中元素是無序不可重復的。對于List好處理,但是對于Set而言我們要如何來保證元素不重復呢?通過迭代來equals()是否相等。數據量小還可以接受,當我們的數據量大的時候效率可想而知(當然我們可以利用算法進行優化)。比如我們向HashSet插入1000數據,難道我們真的要迭代1000次,調用1000次equals()方法嗎?hashCode提供了解決方案。怎么實現?我們先看hashCode的源碼(Object)。
public native int hashCode();
它是一個本地方法,它的實現與本地機器有關,這里我們暫且認為他返回的是對象存儲的物理位置(實際上不是,這里寫是便于理解)。當我們向一個集合中添加某個元素,集合會首先調用hashCode方法,這樣就可以直接定位它所存儲的位置,若該處沒有其他元素,則直接保存。若該處已經有元素存在,就調用equals方法來匹配這兩個元素是否相同,相同則不存,不同則散列到其他位置。這樣處理,當我們存入大量元素時就可以大大減少調用equals()方法的次數,極大地提高了效率。
所以hashCode在上面扮演的角色為尋域(尋找某個對象在集合中區域位置)。hashCode可以將集合分成若干個區域,每個對象都可以計算出他們的hash碼,可以將hash碼分組,每個分組對應著某個存儲區域,根據一個對象的hash碼就可以確定該對象所存儲區域,這樣就大大減少查詢匹配元素的數量,提高了查詢效率。
如何理解hashCode的作用:
以java.lang.Object來理解,JVM每new一個Object,它都會將這個Object丟到一個Hash哈希表中去,這樣的話,下次做Object的比較或者取這個對象的時候,它會根據對象的hashcode再從Hash表中取這個對象。這樣做的目的是提高取對象的效率。具體過程是這樣:
1.new Object(),JVM根據這個對象的Hashcode值,放入到對應的Hash表對應的Key上,如果不同的對象確產生了相同的hash值,也就是發生了Hash key相同導致沖突的情況,那么就在這個Hash key的地方產生一個鏈表,將所有產生相同hashcode的對象放到這個單鏈表上去,串在一起。
2.比較兩個對象的時候,首先根據他們的hashcode去hash表中找他的對象,當兩個對象的hashcode相同,那么就是說他們這兩個對象放在Hash表中的同一個key上,那么他們一定在這個key上的鏈表上。那么此時就只能根據Object的equal方法來比較這個對象是否equal。當兩個對象的hashcode不同的話,肯定他們不能equal.
java.lang.Object中對hashCode的約定:
1. 在一個應用程序執行期間,如果一個對象的equals方法做比較所用到的信息沒有被修改的話,則對該對象調用hashCode方法多次,它必須始終如一地返回同一個整數。
2. 如果兩個對象根據equals(Object o)方法是相等的,則調用這兩個對象中任一對象的hashCode方法必須產生相同的整數結果。
3. 如果兩個對象根據equals(Object o)方法是不相等的,則調用這兩個對象中任一個對象的hashCode方法,不要求產生不同的整數結果。但如果能不同,則可能提高散列表的性能。
有一個概念要牢記,兩個相等對象的equals方法一定為true, 但兩個hashcode相等的對象不一定是相等的對象。
所以hashcode相等只能保證兩個對象在一個HASH表里的同一條HASH鏈上,繼而通過equals方法才能確定是不是同一對象,如果結果為true, 則認為是同一對象在插入,否則認為是不同對象繼續插入。
第2部分 hashCode對于一個對象的重要性
一個對象的HashCode就是一個簡單的Hash算法的實現,雖然它和那些真正的復雜的Hash算法相比還不能叫真正的算法,它如何實現它,不僅僅是程序員的編程水平問題, 而是關系到你的對象在存取是性能的非常重要的關系.有可能,不同的HashCode可能會使你的對象存取產生,成百上千倍的性能差別。先來看一下,在JAVA中兩個重要的數據結構:HashMap和Hashtable,雖然它們有很大的區別,如繼承關系不同,對value的約束條件(是否允許null)不同,以及線程安全性等有著特定的區別,但從實現原理上來說,它們是一致的。所以,只以Hashtable來說明:
在java中,存取數據的性能,一般來說當然是首推數組,但是在數據量稍大的容器選擇中,Hashtable將有比數據性能更高的查詢速度。具體原因看下面的內容,Hashtable在存儲數據時,一般先將該對象的HashCode和0x7FFFFFFF做與操作,因為一個對象的HashCode可以為負數,這樣操作后可以保證它為一個正整數。然后以Hashtable的長度取模,得到該對象在Hashtable中的索引。
int index = (hash & 0x7FFFFFFF) % tab.length;
這個對象就會直接放在Hashtable的每index位置,對于寫入,這和數據一樣,把一個對象放在其中的第index位置,但如果是查詢,經過同樣的算法,Hashtable可以直接從第index取得這個對象,而數組卻要做循環比較.所以對于數據量稍大時,Hashtable的查詢比數據具有更高的性能。
既然一個對象可以根據HashCode直接定位它在Hashtable中的位置,那么為什么Hashtable還要用key來做映射呢?這就是關系Hashtable性能問題的最重要的問題:Hash沖突。
常見的Hash沖突是不同對象最終產生了相同的索引,而一種非常甚至絕對少見的Hash沖突是,如果一組對象的個數大過了int 范圍,而HashCode的長度只能在int范圍中,所以肯定要有同一組的元素有相同的HashCode,這樣無論如何他們都會有相同的 索引。當然這種極端的情況是極少見的,可以暫不考慮,但是對于同的HashCode經過取模,則會產生相同的索引,或者不同 的對象卻具有相同的HashCode,當然具有相同的索引。所以對于索引相同的對象,在該index位置存放了多個值,這些值要想能正確區分,就要依靠key來識別。事實上一個設計各好的HashTable,一般來說會比較平均地分布每個元素,因為Hashtable的長度總是比實際元素的個數按一 定比例進行自增(裝填因子一般為0.75)左右,這樣大多數的索引位置只有一個對象,而很少的位置會有幾個元素,所以 Hashtable中的每個位置存放的是一個鏈表,對于只有一個對象是位置,鏈表只有一個首節點(Entry),Entry的next為null。然后有hashCode,key,value屬性保存了該位置的對象的HashCode,key和value(對象本身),如果有相同索引的對象進來則 會進入鏈表的下一個節點。如果同一個索引中有多個對象,根據HashCode和key可以在該鏈表中找到一個和查詢的key相匹配的對象。
從上面我看可以看到,對于HashMap和Hashtable的存取性能有重大影響的首先是應該使該數據結構中的元素盡量大可能具有不同的HashCode,雖然這并不能保證不同的HashCode產生不同的index,但相同的HashCode一定產生相同的index,從而影響 產生Hash沖突。
對于一個象,如果具有很多屬性,把所有屬性都參與散列,顯然是一種笨拙的設計。因為對象的HashCode()方法幾乎無所不在 地被自動調用,如equals比較,如果太多的對象參與了散列。那么需要的操作常數時間將會增加很大。所以,挑選哪些屬性參與散列絕對是一個編程水平的問題。
我們知道,每次調用HashCode方法方法,都要重新 對方法內的參與散列的對象重新計算一次它們的HashCode的運算,如果一個對象的屬性沒有改變,仍然要每次都進行計算, 所以如果設置一個標記來緩存當前的散列碼,只要當參與散列的對象改變時才重新計算,否則調用緩存的hashCode,這可以 從很大程度上提高性能。默認的實現是將對象內部地址轉化為整數作為HashCode,這當然能保證每個對象具有不同的HasCode,因為不同的對象內部地 址肯定不同,但java語言并不能讓程序員獲取對象內部地址,所以,讓每個對象產生不同的HashCode有著很多可研究 的技術。如果從多個屬性中采樣出能具有平均分布的hashCode的屬性,這是一個性能和多樣性相矛盾的地方,如果所有屬性都參與散 列,當然hashCode的多樣性將大大提高,但犧牲了性能,而如果只能少量的屬性采樣散列,極端情況會產生大量的散列沖突 ,如對"人"的屬性中,如果用性別而不是姓名或出生日期,那將只有兩個或幾個可選的hashcode值,將產生一半以上的散列 沖突.所以如果可能的條件下,專門產生一個序列用來生成HashCode將是一個好的選擇(當然產生序列的性能要比所有屬性參 與散列的性能高的情況下才行,否則還不如直接用所有屬性散列). 如何對HashCode的性能和多樣性求得一個平衡,可以參考相關算法設計的書,其實并不一定要求非常的優秀,只要能盡最大 可能減少散列值的聚集。重要的是我們應該記得HashCode對于我們的程序性能有著重要的影響,在程序設計時應該時時加以注 意.
請記住:如果你想有效的使用HashMap,你就必須重寫在其的HashCode()。
還有兩條重寫HashCode()的原則:
1.不必對每個不同的對象都產生一個唯一的hashcode,只要你的HashCode方法使get()能夠得到put()放進去的內容就可以了。即“不為一原則”。
2.生成hashcode的算法盡量使hashcode的值分散一些, 不要很多hashcode都集中在一個范圍內,這樣有利 于提高HashMap的性能。即“分散原則”。
至于第二條原則的具體原因,有興趣者可以參考Bruce Eckel的《Thinking in Java》,在那里有對HashMap內部實現原理的介紹,這里就不贅述了。
第3部分 hashCode與equals
在Java中hashCode的實現總是伴隨著equals,他們是緊密配合的,你要是自己設計了其中一個,就要設計另外一個。當然在多數情況下,這兩個方法是不用我們考慮的,直接使用默認方法就可以幫助我們解決很多問題。但是在有些情況,我們必須要自己動手來實現它,才能確保程序更好的運作。
對于equals,我們必須遵循如下規則:
對稱性:如果x.equals(y)返回是“true”,那么y.equals(x)也應該返回是“true”。
反射性:x.equals(x)必須返回是“true”。
類推性:如果x.equals(y)返回是“true”,而且y.equals(z)返回是“true”,那么z.equals(x)也應該返回是“true”。
一致性:如果x.equals(y)返回是“true”,只要x和y內容一直不變,不管你重復x.equals(y)多少次,返回都是“true”。
任何情況下,x.equals(null),永遠返回是“false”;x.equals(和x不同類型的對象)永遠返回是“false”。
對于hashCode,我們應該遵循如下規則:
1. 在一個應用程序執行期間,如果一個對象的equals方法做比較所用到的信息沒有被修改的話,則對該對象調用hashCode方法多次,它必須始終如一地返回同一個整數。
2. 如果兩個對象根據equals(Object o)方法是相等的,則調用這兩個對象中任一對象的hashCode方法必須產生相同的整數結果。
3. 如果兩個對象根據equals(Object o)方法是不相等的,則調用這兩個對象中任一個對象的hashCode方法,不要求產生不同的整數結果。但如果能不同,則可能提高散列表的性能。
至于兩者之間的關聯關系,我們只需要記住如下即可:
如果x.equals(y)返回“true”,那么x和y的hashCode()必須相等。
如果x.equals(y)返回“false”,那么x和y的hashCode()有可能相等,也有可能不等。
理清了上面的關系我們就知道他們兩者是如何配合起來工作的。先看下圖:
整個處理流程是:
1、判斷兩個對象的hashcode是否相等,若不等,則認為兩個對象不等,完畢,若相等,則比較equals。
2、若兩個對象的equals不等,則可以認為兩個對象不等,否則認為他們相等。
實例:
package com.weakHashMap; /** * 重新實現了hashCode方法和equals方法 * @ClassName: Person * * */ public class Person { private int age; private int sex; // 0:男,1:女 private String name; private final int PRIME = 37; Person(int age ,int sex ,String name){ this.age = age; this.sex = sex; this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } public int getSex() { return sex; } public void setSex(int sex) { this.sex = sex; } public String getName() { return name; } public void setName(String name) { this.name = name; } @Override public int hashCode() { System.out.println("調用hashCode方法..........."); int hashResult = 1; hashResult = (hashResult + Integer.valueOf(age).hashCode() + Integer.valueOf(sex).hashCode()) * PRIME; hashResult = PRIME * hashResult + ((name == null) ? 0 : name.hashCode()); System.out.println("name:"+name +" hashCode:" + hashResult); return hashResult; } /** * 重寫hashCode() */ public boolean equals(Object obj) { System.out.println("調用equals方法..........."); if(obj == null){ return false; } if(obj.getClass() != this.getClass()){ return false; } if(this == obj){ return true; } Person person = (Person) obj; if(getAge() != person.getAge() || getSex()!= person.getSex()){ return false; } if(getName() != null){ if(!getName().equals(person.getName())){ return false; } } else if(person != null){ return false; } return true; } } package com.weakHashMap; import java.util.HashSet; import java.util.Set; /** * * @ClassName: test1 * TODO * * */ public class test extends Person{ /** * @param age * @param sex * @param name */ test(int age, int sex, String name) { super(age, sex, name); // TODO Auto-generated constructor stub } public static void main(String[] args){ Set<Person> set = new HashSet<Person>(); Person p1 = new Person(11, 1, "張三"); Person p2 = new Person(12, 1, "李四"); Person p3 = new Person(11, 1, "張三"); Person p4 = new Person(11, 1, "李四"); //只驗證p1、p3 System.out.println("p1 == p3? :" + (p1 == p3)); System.out.println("p1.equals(p3)?:"+p1.equals(p3)); System.out.println("-----------------------分割線--------------------------"); set.add(p1); set.add(p2); set.add(p3); set.add(p4); System.out.println("set.size()="+set.size()); } }
結果:
p1 == p3? :false 調用equals方法........... p1.equals(p3)?:true -----------------------分割線-------------------------- 調用hashCode方法........... name:張三 hashCode:792686 調用hashCode方法........... name:李四 hashCode:861227 調用hashCode方法........... name:張三 hashCode:792686 調用equals方法........... 調用hashCode方法........... name:李四 hashCode:859858 set.size()=3
可以看到張三的兩次hashCode相同,調用equals進行匹配,最后hashCode 和 equals 都返回true,則不添加。
以上所述是小編給大家介紹的Java 中HashCode作用_動力節點Java學院整理,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對億速云網站的支持!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。