您好,登錄后才能下訂單哦!
hashCode()和equals()方法可以說是Java完全面向對象的一大特色.它為我們的編程提供便利的同時也帶來了很多危險.這篇文章我們就討論一下如何正解理解和使用這2個方法.
如果你決定要重寫equals()方法,那么你一定要明確這么做所帶來的風險,并確保自己能寫出一個健壯的equals()方法.一定要注意的一點是,在重寫equals()后,一定要重寫hashCode()方法.具體原因稍候再進行說明.
我們先看看 JavaSE 7 Specification中對equals()方法的說明:
·It is reflexive: for any non-null reference value x, x.equals(x)
should return true
.
·It is symmetric: for any non-null reference values x
and y, x.equals(y)
should return true
if and only if y.equals(x)
returns true
.
·It is transitive: for any non-null reference values x, y,
and z, if x.equals(y)
returns true and y.equals(z)
returns true
, then x.equals(z)
should return true.
·It is consistent: for any non-null reference values x
and y
, multiple invocations of x.equals(y)
consistently return true
or consistently return false
, provided no information used in equals comparisons on the objects is modified.
·For any non-null reference value x, x.equals(null)
should return false
.
這段話用了很多離散數學中的術數.簡單說明一下:
1. 自反性:A.equals(A)要返回true.
2. 對稱性:如果A.equals(B)返回true, 則B.equals(A)也要返回true.
3. 傳遞性:如果A.equals(B)為true, B.equals(C)為true, 則A.equals(C)也要為true. 說白了就是 A = B , B = C , 那么A = C.
4. 一致性:只要A,B對象的狀態沒有改變,A.equals(B)必須始終返回true.
5. A.equals(null) 要返回false.
相信只要不是專業研究數學的人,都對上面的東西不來電.在實際應用中我們只需要按照一定的步驟重寫equals()方法就可以了.為了說明方便,我們先定義一個程序員類(Coder):
class Coder { private String name; private int age; // getters and setters }
我們想要的是,如果2個程序員對象的name和age都是相同的,那么我們就認為這兩個程序員是一個人.這時候我們就要重寫其equals()方法.因為默認的equals()實際是判斷兩個引用是否指向內在中的同一個對象,相當于 == . 重寫時要遵循以下三步:
1. 判斷是否等于自身.
if(other == this) return true;
2. 使用instanceof運算符判斷 other 是否為Coder類型的對象.
if(!(other instanceof Coder)) return false;
3. 比較Coder類中你自定義的數據域,name和age,一個都不能少.
Coder o = (Coder)other; return o.name.equals(name) && o.age == age;
看到這有人可能會問,第3步中有一個強制轉換,如果有人將一個Integer類的對象傳到了這個equals中,那么會不會扔ClassCastException呢?這個擔心其實是多余的.因為我們在第二步中已經進行了instanceof 的判斷,如果other是非Coder對象,甚至other是個null, 那么在這一步中都會直接返回false, 從而后面的代碼得不到執行的機會.
上面的三步也是<Effective Java>中推薦的步驟,基本可保證萬無一失.
在JavaSE 7 Specification中指出,
"Note that it is generally necessary to override the hashCode method whenever this method(equals) is overridden, so as to maintain the general contract for the hashCode method, which states that equal objects must have equal hash codes."
如果你重寫了equals()方法,那么一定要記得重寫hashCode()方法.我們在大學計算機數據結構課程中都已經學過哈希表(hash table)了,hashCode()方法就是為哈希表服務的.
當我們在使用形如HashMap, HashSet這樣前面以Hash開頭的集合類時,hashCode()就會被隱式調用以來創建哈希映射關系.稍后我們再對此進行說明.這里我們先重點關注一下hashCode()方法的寫法.
<Effective Java>中給出了一個能最大程度上避免哈希沖突的寫法,但我個人認為對于一般的應用來說沒有必要搞的這么麻煩.如果你的應用中HashSet中需要存放上萬上百萬個對象時,那你應該嚴格遵循書中給定的方法.如果是寫一個中小型的應用,那么下面的原則就已經足夠使用了:
要保證Coder對象中所有的成員都能在hashCode中得到體現.
對于本例,我們可以這么寫:
@Override public int hashCode() { int result = 17; result = result * 31 + name.hashCode(); result = result * 31 + age; return result; }
其中int result = 17你也可以改成20, 50等等都可以.看到這里我突然有些好奇,想看一下String類中的hashCode()方法是如何實現的.查文檔知:
"Returns a hash code for this string. The hash code for a String object is computed as
s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
using int arithmetic, where s[i] is the ith character of the string, n is the length of the string, and ^ indicates exponentiation. (The hash value of the empty string is zero.)"
對每個字符的ASCII碼計算n - 1次方然后再進行加和,可見Sun對hashCode的實現是很嚴謹的. 這樣能最大程度避免2個不同的String會出現相同的hashCode的情況.
在Oracle的Hash Table實現中引用了bucket的概念.如下圖所示:
從上圖中可以看出,帶bucket的hash table大致相當于哈希表與鏈表的結合體.即在每個bucket上會掛一個鏈表,鏈表的每個結點都用來存放對象.Java通過hashCode()方法來確定某個對象應該位于哪個bucket中,然后在相應的鏈表中進行查找.在理想情況下,如果你的hashCode()方法寫的足夠健壯,那么每個bucket將會只有一個結點,這樣就實現了查找操作的常量級的時間復雜度.即無論你的對象放在哪片內存中,我都可以通過hashCode()立刻定位到該區域,而不需要從頭到尾進行遍歷查找.這也是哈希表的最主要的應用.
如:
當我們調用HashSet的put(Object o)方法時,首先會根據o.hashCode()的返回值定位到相應的bucket中,如果該bucket中沒有結點,則將 o 放到這里,如果已經有結點了, 則把 o 掛到鏈表末端.同理,當調用contains(Object o)時,Java會通過hashCode()的返回值定位到相應的bucket中,然后再在對應的鏈表中的結點依次調用equals()方法來判斷結點中的對象是否是你想要的對象.
下面我們通過一個例子來體會一下這個過程:
我們先創建2個新的Coder對象:
Coder c1 = new Coder("bruce", 10); Coder c2 = new Coder("bruce", 10);
假定我們已經重寫了Coder的equals()方法而沒有重寫hashCode()方法:
@Override public boolean equals(Object other) { System.out.println("equals method invoked!"); if(other == this) return true; if(!(other instanceof Coder)) return false; Coder o = (Coder)other; return o.name.equals(name) && o.age == age; }
然后我們構造一個HashSet,將c1對象放入到set中:
Set<Coder> set = new HashSet<Coder>(); set.add(c1);
再執行:
System.out.println(set.contains(c2));
我們期望contains(c2)方法返回true, 但實際上它返回了false.
c1和c2的name和age都是相同的,為什么我把c1放到HashSet中后,再調用contains(c2)卻返回false呢?這就是hashCode()在作怪了.因為你沒有重寫hashCode()方法,所以HashSet在查找c2時,會在不同的bucket中查找.比如c1放到05這個bucket中了,在查找c2時卻在06這個bucket中找,這樣當然找不到了.因此,我們重寫hashCode()的目的在于,在A.equals(B)返回true的情況下,A, B 的hashCode()要返回相同的值.
我讓hashCode()每次都返回一個固定的數行嗎
有人可能會這樣重寫:
@Override public int hashCode() { return 10; }
如果這樣的話,HashMap, HashSet等集合類就失去了其 "哈希的意義".用<Effective Java>中的話來說就是,哈希表退化成了鏈表.如果hashCode()每次都返回相同的數,那么所有的對象都會被放到同一個bucket中,每次執行查找操作都會遍歷鏈表,這樣就完全失去了哈希的作用.所以我們最好還是提供一個健壯的hashCode()為妙.
以上就是本文關于重寫hashCode()和equals()方法詳細介紹的全部內容,希望對大家有所幫助。感興趣的朋友可以繼續參閱本站其他相關專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。