您好,登錄后才能下訂單哦!
這篇文章主要介紹了Java集合框架是什么,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
Java集合框架提供了一套性能優良,使用方便的接口和類,他們位于java.util
包中。容器主要包括 Collection 和 Map 兩種,Collection 存儲著對象的集合,而 Map 存儲著鍵值對(兩個對象)的映射表
TreeSet
基于紅黑樹實現,支持有序性操作,例如根據一個范圍查找元素的操作。但是查找效率不如 HashSet,HashSet 查找的時間復雜度為 O(1),TreeSet 則為 O(logN)
HashSet
基于哈希表實現,支持快速查找,但不支持有序性操作。并且失去了元素的插入順序信息,也就是說使用 Iterator 遍歷 HashSet 得到的結果是不確定的。
LinkedHashSet
具有 HashSet 的查找效率,且內部使用雙向鏈表維護元素的插入順序。
ArrayList
基于動態數組實現,支持隨機訪問。
Vector
和 ArrayList 類似,但它是線程安全的。
LinkedList
基于雙向鏈表實現,只能順序訪問,但是可以快速地在鏈表中間插入和刪除元素。不僅如此,LinkedList 還可以用作棧、隊列和雙向隊列。
LinkedList
可以實現雙向隊列。
PriorityQueue
基于堆結構實現,可以用它來實現優先隊列。
TreeMap
基于紅黑樹實現。
HashMap
基于哈希表實現。
HashTable
和 HashMap 類似,但它是線程安全的,這意味著同一時刻多個線程可以同時寫入 HashTable 并且不會導致數據不一致。它是遺留類,不應該去使用它。現在可以使用 ConcurrentHashMap
來支持線程安全,并且 ConcurrentHashMap
的效率會更高,因為 ConcurrentHashMap
引入了分段鎖。
LinkedHashMap
使用雙向鏈表來維護元素的順序,順序為插入順序或者最近最少使用(LRU)順序
Collection 接口存儲一組不唯一,無序的對象
List 接口存儲一組不唯一,有序的對象。
Set 接口存儲一組唯一,無序的對象
Map 接口存儲一組鍵值對象,提供key到value的映射
ArrayList實現了長度可變的數組,在內存中分配連續的空間。遍歷元素和隨機訪問元素的效率比較高
LinkedList采用鏈表存儲方式。插入、刪除元素時效率比較高
HashSet采用哈希算法實現的Set
HashSet的底層是用HashMap實現的,因此查詢效率較高,由于采用hashCode算法直接確定 元素的內存地址,增刪效率高
方法 | 說明 |
---|---|
boolean add(Object o) | 在列表的末尾順序添加元素,起始索引位置從0開始 |
void add(int index, Object o) | 在指定的索引位置添加元素,索引位置必須介于0和列表中元素個數之間 |
int size() | 返回列表中的元素個數 |
Object get(int index) | 返回指定索引位置處的元素。取出的元素是Object類型,使用前品要進行益制類型轉換 |
boolean contains(Object o) | 判斷列表中是否存在指定元素 |
boolean remove(Object o) | 從列表中刪除元素 |
Object remove(int index) | 從列表中刪除指定位置元素,起始索引位量從0開始 |
ArrayList是可以動態增長和縮減的索引序列,它是基于數組實現的List類
該類封裝了一個動態再分配的Object[]數組,每一個類對象都有一個capacity[容量]屬性,表示它們所封裝的Object[]數組的長度,當向ArrayList中添加元素時,該屬性值會自動增加。如果想ArrayList中添加大量元素,可使用ensureCapacity方法一次性增加capacity,可以減少增加重分配的次數提高性能
ArrayList的用法和Vector向類似,但是Vector是一個較老的集合,具有很多缺點,不建議使用
另外,ArrayList和Vector的區別是:ArrayList是線程不安全的,當多條線程訪問同一個ArrayList集合時,程序需要手動保證該集合的同步性,而Vector則是線程安全的。
public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable
這里簡單解釋一下幾個接口
RandomAccess接口
這個是一個標記性接口,通過查看api文檔,它的作用就是用來快速隨機存取,有關效率的問題,在實現了該接口的話,那么使用普通的for循環來遍歷,性能更高,例如ArrayList。而沒有實現該接口的話,使用Iterator來迭代,這樣性能更高,例如linkedList。所以這個標記性只是為了 讓我們知道我們用什么樣的方式去獲取數據性能更好。
Cloneable接口
實現了該接口,就可以使用Object.Clone()方法了。
Serializable接口
實現該序列化接口,表明該類可以被序列化。什么是序列化?簡單的說,就是能夠從類變成字節流傳輸,然后還能從字節流變成原來的類。
這里的繼承結構可通過IDEA中Navigate>Type Hierarchy查看
//版本號 private static final long serialVersionUID = 8683452581122892189L; //缺省容量 private static final int DEFAULT_CAPACITY = 10; //空對象數組 private static final Object[] EMPTY_ELEMENTDATA = {}; //缺省空對象數組 private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}; //存儲的數組元素 transient Object[] elementData; // non-private to simplify nested class access //實際元素大小,默認為0 private int size; //最大數組容量 private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
/** * 構造具有指定初始容量的空列表 * 如果指定的初始容量為負,則為IllegalArgumentException */public ArrayList(int initialCapacity) { if (initialCapacity > 0) { this.elementData = new Object[initialCapacity]; } else if (initialCapacity == 0) { this.elementData = EMPTY_ELEMENTDATA; } else { throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); }}/** * 默認空數組的大小為10 * ArrayList中儲存數據的其實就是一個數組,這個數組就是elementData */public ArrayList() { this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;}/** * 按照集合迭代器返回元素的順序構造包含指定集合的元素的列表 */public ArrayList(Collection<? extends E> c) { elementData = c.toArray(); if ((size = elementData.length) != 0) { // 轉換為數組 //每個集合的toarray()的實現方法不一樣,所以需要判斷一下,如果不是Object[].class類型,那么久需要使用ArrayList中的方法去改造一下。 if (elementData.getClass() != Object[].class) elementData = Arrays.copyOf(elementData, size, Object[].class); } else { // 否則就用空數組代替 this.elementData = EMPTY_ELEMENTDATA; }}
每當向數組中添加元素時,都要去檢查添加后元素的個數是否會超出當前數組的長度,如果超出,數組將會進行擴容,以滿足添加數據的需求。數組擴容通過一個公開的方法ensureCapacity(int minCapacity)
來實現。在實際添加大量元素前,我也可以使用ensureCapacity
來手動增加ArrayList實例的容量,以減少遞增式再分配的數量。
數組進行擴容時,會將**老數組中的元素重新拷貝一份到新的數組中,每次數組容量的增長大約是其原容量的1.5倍。**這種操作的代價是很高的,因此在實際使用時,我們應該盡量避免數組容量的擴張。當我們可預知要保存的元素的多少時,要在構造ArrayList實例時,就指定其容量,以避免數組擴容的發生。或者根據實際需求,通過調用ensureCapacity方法來手動增加ArrayList實例的容量。
private void ensureCapacityInternal(int minCapacity) { ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));}private static int calculateCapacity(Object[] elementData, int minCapacity) { //判斷初始化的elementData是不是空的數組,也就是沒有長度 if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { //因為如果是空的話,minCapacity=size+1;其實就是等于1,空的數組沒有長度就存放不了 //所以就將minCapacity變成10,也就是默認大小,但是在這里,還沒有真正的初始化這個elementData的大小 return Math.max(DEFAULT_CAPACITY, minCapacity); } //確認實際的容量,上面只是將minCapacity=10,這個方法就是真正的判斷elementData是否夠用 return minCapacity;}private void ensureExplicitCapacity(int minCapacity) { modCount++; //minCapacity如果大于了實際elementData的長度,那么就說明elementData數組的長度不夠用 /*第一種情況:由于elementData初始化時是空的數組,那么第一次add的時候, minCapacity=size+1;也就minCapacity=1,在上一個方法(確定內部容量ensureCapacityInternal) 就會判斷出是空的數組,就會給將minCapacity=10,到這一步為止,還沒有改變elementData的大小。 第二種情況:elementData不是空的數組了,那么在add的時候,minCapacity=size+1;也就是 minCapacity代表著elementData中增加之后的實際數據個數,拿著它判斷elementData的length 是否夠用,如果length不夠用,那么肯定要擴大容量,不然增加的這個元素就會溢出。*/ if (minCapacity - elementData.length > 0) grow(minCapacity);}//ArrayList核心的方法,能擴展數組大小的真正秘密。private void grow(int minCapacity) { //將擴充前的elementData大小給oldCapacity int oldCapacity = elementData.length; //newCapacity就是1.5倍的oldCapacity int newCapacity = oldCapacity + (oldCapacity >> 1); /*這句話就是適應于elementData就空數組的時候,length=0,那么oldCapacity=0,newCapacity=0, 所以這個判斷成立,在這里就是真正的初始化elementData的大小了,就是為10.前面的工作都是準備工作。 */ if (newCapacity - minCapacity < 0) newCapacity = minCapacity; //如果newCapacity超過了最大的容量限制,就調用hugeCapacity,也就是將能給的最大值給newCapacity if (newCapacity - MAX_ARRAY_SIZE > 0) newCapacity = hugeCapacity(minCapacity); //新的容量大小已經確定好就copy數組,改變容量大小。 elementData = Arrays.copyOf(elementData, newCapacity);}//用來賦最大值private static int hugeCapacity(int minCapacity) { if (minCapacity < 0) // overflow throw new OutOfMemoryError(); //如果minCapacity都大于MAX_ARRAY_SIZE,那么就Integer.MAX_VALUE返回,反之將MAX_ARRAY_SIZE返回。 //相當于給ArrayList上了兩層防護 return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE;}
/** * 添加一個特定的元素到list的末尾。 * 先size+1判斷數組容量是否夠用,最后加入元素 */public boolean add(E e) { ensureCapacityInternal(size + 1); // Increments modCount!! elementData[size++] = e; return true;}/** * Inserts the specified element at the specified position in this * list. Shifts the element currently at that position (if any) and * any subsequent elements to the right (adds one to their indices). * * @param index index at which the specified element is to be inserted * @param element element to be inserted * @throws IndexOutOfBoundsException {@inheritDoc} */public void add(int index, E element) { //檢查index也就是插入的位置是否合理。 rangeCheckForAdd(index); //檢查容量是否夠用,不夠就自動擴容 ensureCapacityInternal(size + 1); // Increments modCount!! //這個方法就是用來在插入元素之后,要將index之后的元素都往后移一位 System.arraycopy(elementData, index, elementData, index + 1, size - index); elementData[index] = element; size++;}
當調用add()方法時,實際函數調用:
add→ensureCapacityInternal→ensureExplicitCapacity(→grow→hugeCapacity)
例如剛開始初始化一個空數組后add一個值,會首先進行自動擴容
將底層數組的容量調整為當前列表保存的實際元素的大小的功能
public void trimToSize() { modCount++; if (size < elementData.length) { elementData = (size == 0) ? EMPTY_ELEMENTDATA : Arrays.copyOf(elementData, size); }}
remove()
方法也有兩個版本,一個是remove(int index)
刪除指定位置的元素,另一個是remove(Object o)
刪除第一個滿足o.equals(elementData[index])
的元素。刪除操作是add()
操作的逆過程,需要將刪除點之后的元素向前移動一個位置。需要注意的是為了讓GC起作用,必須顯式的為最后一個位置賦null
值。
public E remove(int index) { rangeCheck(index); modCount++; E oldValue = elementData(index); int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); elementData[--size] = null; //清除該位置的引用,讓GC起作用 return oldValue; }
這里簡單介紹了核心方法,其他方法查看源碼可以很快了解
ArrayList采用了快速失敗的機制,通過記錄modCount
參數來實現。在面對并發的修改時,迭代器很快就會完全失敗,并拋出ConcurrentModificationException
異常,而不是冒著在將來某個不確定時間發生任意不確定行為的風險
ArrayList可以存放null
ArrayList本質上就是一個elementData數組
ArrayList區別于數組的地方在于能夠自動擴展大小,其中關鍵的方法就是gorw()方法
ArrayList中removeAll(collection c)和clear()的區別就是removeAll可以刪除批量指定的元素,而clear是全是刪除集合中的元素
ArrayList由于本質是數組,所以它在數據的查詢方面會很快,而在插入刪除這些方面,性能下降很多,有移動很多數據才能達到應有的效果
ArrayList實現了RandomAccess,所以在遍歷它的時候推薦使用for循環
方法名 | 說明 |
---|---|
void addFirst(Object o) | 在列表的首部添加元素 |
void addLast(Object o) | 在列表的未尾添加元素 |
Object getFirst() | 返回列表中的第一個元素 |
Object getLast() | 返回列表中的最后一個元素 |
Object removeFirst() | 刪除并返回列表中的第一個元素 |
Object removeLast() | 刪除并返回列表中的最后一個元素 |
LinkedList
同時實現了List接口和Deque接口,也就是說它既可以看作一個順序容器,又可以看作一個隊列(Queue),同時又可以看作一個棧(Stack)。這樣看來,LinkedList簡直就是個全能冠軍。當你需要使用棧或者隊列時,可以考慮使用LinkedList
,一方面是因為Java官方已經聲明不建議使用Stack類,更遺憾的是,Java里根本沒有一個叫做Queue_的類(它是個接口名字)。關于棧或隊列,現在的首選是ArrayDeque
,它有著比LinkedList
(當作棧或隊列使用時)有著更好的性能。
LinkedList的實現方式決定了所有跟下標相關的操作都是線性時間,而在首段或者末尾刪除元素只需要常數時間。為追求效率LinkedList沒有實現同步(synchronized),如果需要多個線程并發訪問,可以先采用Collections.synchronizedList()
方法對其進行包裝
public class LinkedList<E> extends AbstractSequentialList<E> implements List<E>, Deque<E>, Cloneable, java.io.Serializable
這里可以發現LinkedList多了一層AbstractSequentialList
的抽象類,這是為了減少實現順序存取(例如LinkedList)這種類的工作。如果自己想實現順序存取這種特性的類(就是鏈表形式),那么就繼承 這個AbstractSequentialList抽象類,如果想像數組那樣的隨機存取的類,那么就去實現AbstracList抽象類。
List接口
列表add、set等一些對列表進行操作的方法
Deque接口
有隊列的各種特性
Cloneable接口
能夠復制,使用那個copy方法
Serializable接口
能夠序列化。
沒有RandomAccess
推薦使用iterator,在其中就有一個foreach,增強的for循環,其中原理也就是iterator,我們在使用的時候,使用foreach或者iterator
transient關鍵字修飾,這也意味著在序列化時該域是不會序列化的
//實際元素個數transient int size = 0; //頭結點transient Node<E> first; //尾結點transient Node<E> last;
public LinkedList() {}public LinkedList(Collection<? extends E> c) { this(); //將集合c中的各個元素構建成LinkedList鏈表 addAll(c);}
//根據前面介紹雙向鏈表就知道這個代表什么了,linkedList的奧秘就在這里private static class Node<E> { // 數據域(當前節點的值) E item; //后繼 Node<E> next; //前驅 Node<E> prev; // 構造函數,賦值前驅后繼 Node(Node<E> prev, E element, Node<E> next) { this.item = element; this.next = next; this.prev = prev; }}
public boolean add(E e) { linkLast(e); return true;}void linkLast(E e) { //臨時節點l(L的小寫)保存last,也就是l指向了最后一個節點 final Node<E> l = last; //將e封裝為節點,并且e.prev指向了最后一個節點 final Node<E> newNode = new Node<>(l, e, null); //newNode成為了最后一個節點,所以last指向了它 last = newNode; if (l == null) //判斷是不是一開始鏈表中就什么都沒有,如果沒有,則new Node就成為了第一個結點,first和last都指向它 first = newNode; else //正常的在最后一個節點后追加,那么原先的最后一個節點的next就要指向現在真正的 最后一個節點,原先的最后一個節點就變成了倒數第二個節點 l.next = newNode; //添加一個節點,size自增 size++; modCount++;}
addAll()
有兩個重載函數,addAll(Collection<? extends E>)
型和addAll(int,Collection<? extends E>)
型,我們平時習慣調用的addAll(Collection<?extends E>)
型會轉化為addAll(int,Collection<? extends<E>)
型
public boolean addAll(Collection<? extends E> c) { return addAll(size, c);}public boolean addAll(int index, Collection<? extends E> c) { //檢查index這個是否為合理 checkPositionIndex(index); //將集合c轉換為Object數組 Object[] a = c.toArray(); //數組a的長度numNew,也就是由多少個元素 int numNew = a.length; if (numNew == 0) //如果空的就什么也不做 return false; Node<E> pred, succ; //構造方法中傳過來的就是index==size //情況一:構造方法創建的一個空的鏈表,那么size=0,last、和first都為null。linkedList中是空的。 //什么節點都沒有。succ=null、pred=last=null //情況二:鏈表中有節點,size就不是為0,first和last都分別指向第一個節點,和最后一個節點, //在最后一個節點之后追加元素,就得記錄一下最后一個節點是什么,所以把last保存到pred臨時節點中。 //情況三index!=size,說明不是前面兩種情況,而是在鏈表中間插入元素,那么就得知道index上的節點是誰, //保存到succ臨時節點中,然后將succ的前一個節點保存到pred中,這樣保存了這兩個節點,就能夠準確的插入節點了 if (index == size) { succ = null; pred = last; } else { succ = node(index); pred = succ.prev; } for (Object o : a) { @SuppressWarnings("unchecked") E e = (E) o; Node<E> newNode = new Node<>(pred, e, null); if (pred == null) first = newNode; else pred.next = newNode; pred = newNode; } if (succ == null) { /*如果succ==null,說明是情況一或者情況二, 情況一、構造方法,也就是剛創建的一個空鏈表,pred已經是newNode了, last=newNode,所以linkedList的first、last都指向第一個節點。 情況二、在最后節后之后追加節點,那么原先的last就應該指向現在的最后一個節點了, 就是newNode。*/ last = pred; } else { pred.next = succ; succ.prev = pred; } size += numNew; modCount++; return true;}//根據引下標找到該結點并返回Node<E> node(int index) { //判斷插入的位置在鏈表前半段或者是后半段 if (index < (size >> 1)) { Node<E> x = first; //從頭結點開始正向遍歷 for (int i = 0; i < index; i++) x = x.next; return x; } else { Node<E> x = last; //從尾結點開始反向遍歷 for (int i = size - 1; i > index; i--) x = x.prev; return x; }}
/*如果我們要移除的值在鏈表中存在多個一樣的值,那么我們 會移除index最小的那個,也就是最先找到的那個值,如果不存在這個值,那么什么也不做 */public boolean remove(Object o) { if (o == null) { for (Node<E> x = first; x != null; x = x.next) { if (x.item == null) { unlink(x); return true; } } } else { for (Node<E> x = first; x != null; x = x.next) { if (o.equals(x.item)) { unlink(x); return true; } } } return false;}不能傳一個null值E unlink(Node<E> x) { // assert x != null; final E element = x.item; final Node<E> next = x.next; final Node<E> prev = x.prev; if (prev == null) { first = next; } else { prev.next = next; x.prev = null; } if (next == null) { last = prev; } else { next.prev = prev; x.next = null; } //x的前后指向都為null了,也把item為null,讓gc回收它 x.item = null; size--; modCount++; return element;}
**get(index)、indexOf(Object o)**等查看源碼即可
在LinkedList中除了有一個Node的內部類外,應該還能看到另外兩個內部類,那就是ListItr
,還有一個是DescendingIterator
內部類
/*這個類,還是調用的ListItr,作用是封裝一下Itr中幾個方法,讓使用者以正常的思維去寫代碼, 例如,在從后往前遍歷的時候,也是跟從前往后遍歷一樣,使用next等操作,而不用使用特殊的previous。 */private class DescendingIterator implements Iterator<E> { private final ListItr itr = new ListItr(size()); public boolean hasNext() { return itr.hasPrevious(); } public E next() { return itr.previous(); } public void remove() { itr.remove(); }}
linkedList本質上是一個雙向鏈表,通過一個Node內部類實現的這種鏈表結構。linkedList能存儲null值
跟ArrayList相比較,就真正的知道了,LinkedList在刪除和增加等操作上性能好,而ArrayList在查詢的性能上好,從源碼中看,它不存在容量不足的情況
linkedList不光能夠向前迭代,還能像后迭代,并且在迭代的過程中,可以修改值、添加值、還能移除值
linkedList不光能當鏈表,還能當隊列使用,這個就是因為實現了Deque接口
ArrayList底層是用數組實現的順序表,是隨機存取類型,可自動擴增,并且在初始化時,數組的長度是0,只有在增加元素時,長度才會增加。默認是10,不能無限擴增,有上限,在查詢操作的時候性能更好
LinkedList底層是用鏈表來實現的,是一個雙向鏈表,注意這里不是雙向循環鏈表,順序存取類型。在源碼中,似乎沒有元素個數的限制。應該能無限增加下去,直到內存滿了在進行刪除,增加操作時性能更好。
兩個都是線程不安全的,在iterator時,會發生fail-fast:快速失效。
ArrayList線程不安全,在用iterator,會發生fail-fast
Vector線程安全,因為在方法前加了Synchronized關鍵字,也會發生fail-fast
在java.util下的集合都是發生fail-fast,而在java.util.concurrent下的發生的都是fail-safe
fail-fast
快速失敗,例如在arrayList中使用迭代器遍歷時,有另外的線程對arrayList的存儲數組進行了改變,比 如add、delete等使之發生了結構上的改變,所以Iterator就會快速報一個java.util.ConcurrentModi?cationException
異常(并發修改異常),這就是快速失敗
fail-safe
安全失敗,在java.util.concurrent
下的類,都是線程安全的類,他們在迭代的過程中,如果有線程進行結構的改變,不會報異常,而是正常遍歷,這就是安全失敗
為什么在java.util.concurrent包下對集合有結構的改變卻不會報異常?
在concurrent下的集合類增加元素的時候使用Arrays.copyOf()
來拷貝副本,在副本上增加元素,如果有其他線程在此改變了集合的結構,那也是在副本上的改變,而不是影響到原集合,迭代器還是照常遍歷,遍歷完之后,改變原引用指向副本,所以總的一句話就是如果在此包下的類進行增加刪除,就會出現一個副本。所以能防止fail-fast,這種機制并不會出錯,所以我們叫這種現象為fail-safe
vector也是線程安全的,為什么是fail-fast呢?
出現fail-safe是因為他們在實現增刪的底層機制不一樣,就像上面說的,會有一個副本,而像arrayList、linekdList、verctor等他們底層就是對著真正的引用進行操作,所以才會發生異常
vector實現線程安全的方法是在每個操作方法上加鎖,這些鎖并不是必須要的,在實際開發中,一般都是通過鎖一系列的操作來實現線程安全,也就是說將需要同步的資源放一起加鎖來保證線程安全
如果多個Thread并發執行一個已經加鎖的方法,但是在該方法中,又有Vector的存在,Vector
本身實現中已經加鎖了,那么相當于鎖上又加鎖,會造成額外的開銷
Vector還有fail-fast的問題,也就是說它也無法保證遍歷安全,在 遍歷時又得額外加鎖,又是額外的開銷,還不如直接用arrayList,然后再加鎖
總結:Vector在你不需要進行線程安全的時候,也會給你加鎖,也就導致了額外開銷,所以在jdk1.5之后就被棄用了,現在如果要用到線程安全的集合,都是從java.util.concurrent
包下去拿相應的類。
通過key、value封裝成一個entry對象,然后通過key的值來計算該entry的hash值,通過entry的hash 值和數組的長度length來計算出entry放在數組中的哪個位置上面,每次存放都是將entry放在第一個位置。
HashMap實現了Map接口,即允許放入key
為null
的元素,也允許插入value
為null
的元素;除該類未實現同步外,其余跟Hashtable
大致相同;跟TreeMap不同,該容器不保證元素順序,根據需要該容器可能會對元素重新哈希,元素的順序也會被重新打散,因此不同時間迭代同一個HashMap的順序可能會不同。 根據對沖突的處理方式不同,哈希表有兩種實現方式,一種開放地址方式(Open addressing),另一種是沖突鏈表方式(Separate chaining with linked lists)。Java7 HashMap采用的是沖突鏈表方式。
Java8 對 HashMap 進行了一些修改,最大的不同就是利用了紅黑樹,所以其由 數組+鏈表+紅黑樹 組成。根據 Java7 HashMap 的介紹,我們知道,查找的時候,根據 hash 值我們能夠快速定位到數組的具體下標,但是之后的話,需要順著鏈表一個個比較下去才能找到我們需要的,時間復雜度取決于鏈表的長度為 O(n)。為了降低這部分的開銷,在 Java8 中,當鏈表中的元素達到了 8 個時,會將鏈表轉換為紅黑樹,在這些位置進行查找的時候可以降低時間復雜度為 O(logN)。
Java7 中使用 Entry 來代表每個 HashMap 中的數據節點,Java8 中使用 Node,基本沒有區別,都是 key,value,hash 和 next 這四個屬性,不過,Node 只能用于鏈表的情況,紅黑樹的情況需要使用 TreeNode
public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable
//序列號private static final long serialVersionUID = 362498820763181265L; //默認的初始容量static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16 //最大容量static final int MAXIMUM_CAPACITY = 1 << 30; //默認加載因子static final float DEFAULT_LOAD_FACTOR = 0.75f; //當桶(bucket)上的結點數大于這個值時會轉成紅黑樹static final int TREEIFY_THRESHOLD = 8; //當桶(bucket)上的結點數小于這個值時樹轉鏈表static final int UNTREEIFY_THRESHOLD = 6; //桶中結構轉化為紅黑樹對應的table的最小大小static final int MIN_TREEIFY_CAPACITY = 64; //存儲元素的數組,總是2的冪次倍transient Node<K,V>[] table; //存放具體元素的集transient Set<Map.Entry<K,V>> entrySet; //存放元素的個數,注意這個不等于數組的長度transient int size; //每次擴容和更改map結構的計數器transient int modCount; //臨界值,當實際大小(容量*填充因子)超過臨界值時,會進行擴容int threshold; //填充因子,計算HashMap的實時裝載因子的方法為:size/capacityfinal float loadFactor;
public HashMap(int initialCapacity, float loadFactor) { // 初始容量不能小于0,否則報錯 if (initialCapacity < 0) throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity); // 初始容量不能大于最大值,否則為最大值 if (initialCapacity > MAXIMUM_CAPACITY) initialCapacity = MAXIMUM_CAPACITY; //填充因子不能小于或等于0,不能為非數字 if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal load factor: " + loadFactor); //初始化填充因子 this.loadFactor = loadFactor; //初始化threshold大小 this.threshold = tableSizeFor(initialCapacity);}//這個方法將傳進來的參數轉變為2的n次方的數值static final int tableSizeFor(int cap) { int n = cap - 1; n |= n >>> 1; n |= n >>> 2; n |= n >>> 4; n |= n >>> 8; n |= n >>> 16; return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;}/** * 自定義初始容量,加載因子為默認 */public HashMap(int initialCapacity) { this(initialCapacity, DEFAULT_LOAD_FACTOR);}/** * 使用默認的加載因子等字段 */public HashMap() { this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted}public HashMap(Map<? extends K, ? extends V> m) { //初始化填充因子 this.loadFactor = DEFAULT_LOAD_FACTOR; //將m中的所有元素添加至HashMap中 putMapEntries(m, false);}//將m的所有元素存入該實例final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) { int s = m.size(); if (s > 0) { //判斷table是否已經初始化 if (table == null) { // pre-size //未初始化,s為m的實際元素個數 float ft = ((float)s / loadFactor) + 1.0F; int t = ((ft < (float)MAXIMUM_CAPACITY) ? (int)ft : MAXIMUM_CAPACITY); //計算得到的t大于閾值,則初始化閾值 if (t > threshold) threshold = tableSizeFor(t); } else if (s > threshold) resize(); //將m中的所有元素添加至HashMap中 for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) { K key = e.getKey(); V value = e.getValue(); putVal(hash(key), key, value, false, evict); } }}
put()方法
先計算key的hash值,然后根據hash值搜索在table數組中的索引位置,如果table數組在該位置處有元素,則查找是否存在相同的key,若存在則覆蓋原來key的value,否則將該元素保存在鏈表尾部,注意JDK1.7中采用的是頭插法,即每次都將沖突的鍵值對放置在鏈表頭,這樣最初的那個鍵值對最終就會成為鏈尾,而JDK1.8中使用的是尾插法。此外,若table在該處沒有元素,則直接保存。
public V put(K key, V value) { return putVal(hash(key), key, value, false, true);}final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; //第一次put元素時,table數組為空,先調用resize生成一個指定容量的數組 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; //hash值和n-1的與運算結果為桶的位置,如果該位置空就直接放置一個Node if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); //如果計算出的bucket不空,即發生哈希沖突,就要進一步判斷 else { Node<K,V> e; K k; //判斷當前Node的key與要put的key是否相等 if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; //判斷當前Node是否是紅黑樹的節點 else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); //以上都不是,說明要new一個Node,加入到鏈表中 else { for (int binCount = 0; ; ++binCount) { //在鏈表尾部插入新節點,注意jdk1.8是在鏈表尾部插入新節點 if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); // 如果當前鏈表中的元素大于樹化的閾值,進行鏈表轉樹的操作 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } //在鏈表中繼續判斷是否已經存在完全相同的key if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } //走到這里,說明本次put是更新一個已存在的鍵值對的value if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; //在hashMap中,afterNodeAccess方法體為空,交給子類去實現 afterNodeAccess(e); return oldValue; } } ++modCount; //如果當前size超過臨界值,就擴容。注意是先插入節點再擴容 if (++size > threshold) resize(); //在hashMap中,afterNodeInsertion方法體為空,交給子類去實現 afterNodeInsertion(evict); return null;}
resize() 數組擴容
用于初始化數組或數組擴容,每次擴容后,容量為原來的 2 倍,并進行數據遷移
final Node<K,V>[] resize() { Node<K,V>[] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; int oldThr = threshold; int newCap, newThr = 0; if (oldCap > 0) { // 對應數組擴容 if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } // 將數組大小擴大一倍 else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) // 將閾值擴大一倍 newThr = oldThr << 1; // double threshold } else if (oldThr > 0) // 對應使用 new HashMap(int initialCapacity) 初始化后,第一次 put 的時候 newCap = oldThr; else {// 對應使用 new HashMap() 初始化后,第一次 put 的時候 newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } if (newThr == 0) { float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; // 用新的數組大小初始化新的數組 Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; // 如果是初始化數組,到這里就結束了,返回 newTab 即可 if (oldTab != null) { // 開始遍歷原數組,進行數據遷移。 for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { oldTab[j] = null; // 如果該數組位置上只有單個元素,那就簡單了,簡單遷移這個元素就可以了 if (e.next == null) newTab[e.hash & (newCap - 1)] = e; // 如果是紅黑樹,具體我們就不展開了 else if (e instanceof TreeNode) ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { // 這塊是處理鏈表的情況, // 需要將此鏈表拆成兩個鏈表,放到新的數組中,并且保留原來的先后順序 // loHead、loTail 對應一條鏈表,hiHead、hiTail 對應另一條鏈表,代碼還是比較簡單的 Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; do { next = e.next; if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); if (loTail != null) { loTail.next = null; // 第一條鏈表 newTab[j] = loHead; } if (hiTail != null) { hiTail.next = null; // 第二條鏈表的新的位置是 j + oldCap,這個很好理解 newTab[j + oldCap] = hiHead; } } } } } return newTab;}
get()過程
public V get(Object key) { Node<K,V> e; return (e = getNode(hash(key), key)) == null ? null : e.value;}final Node<K,V> getNode(int hash, Object key) { Node<K,V>[] tab; Node<K,V> first, e; int n; K k; if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) { // 判斷第一個節點是不是就是需要的 if (first.hash == hash && // always check first node ((k = first.key) == key || (key != null && key.equals(k)))) return first; if ((e = first.next) != null) { // 判斷是否是紅黑樹 if (first instanceof TreeNode) return ((TreeNode<K,V>)first).getTreeNode(hash, key); // 鏈表遍歷 do { if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; } while ((e = e.next) != null); } } return null;}
HashSet是對HashMap的簡單包裝,其他還有迭代器等
關于數組擴容,從putVal源代碼中我們可以知道,當插入一個元素的時候size就加1,若size大于threshold的時候,就會進行擴容。假設我們的capacity大小為32,loadFator為0.75,則threshold為24 = 32 * 0.75,此時,插入了25個元素,并且插入的這25個元素都在同一個桶中,桶中的數據結構為紅黑樹,則還有31個桶是空的,也會進行擴容處理,其實此時,還有31個桶是空的,好像似乎不需要進行擴容處理,但是是需要擴容處理的,因為此時我們的capacity大小可能不適當。我們前面知道,擴容處理會遍歷所有的元素,時間復雜度很高;前面我們還知道,經過一次擴容處理后,元素會更加均勻的分布在各個桶中,會提升訪問效率。所以說盡量避免進行擴容處理,也就意味著,遍歷元素所帶來的壞處大于元素在桶中均勻分布所帶來的好處。
HashMap在JDK1.8以前是一個鏈表散列這樣一個數據結構,而在JDK1.8以后是一個數組加鏈表加紅黑樹的數據結構
通過源碼的學習,HashMap是一個能快速通過key獲取到value值得一個集合,原因是內部使用的是hash查找值得方法
另外LinkedHashMap是HashMap的直接子類,二者唯一的區別是LinkedHashMap在HashMap的基礎上,采用雙向鏈表(doubly-linked list)的形式將所有**entry**
連接起來,這樣是為保證元素的迭代順序跟插入順序相同
此類完全由在 collection 上進行操作或返回 collection 的靜態方法組成。它包含在 collection 上操作的多態算法,即“包裝器”,包裝器返回由指定 collection 支持的新 collection,以及少數其他內容。如果為此類的方法所提供的 collection 或類對象為 null,則這些方法都將拋出NullPointerException
//反轉列表中元素的順序 static void reverse(List<?> list) //對List集合元素進行隨機排序 static void shuffle(List<?> list) //根據元素的自然順序 對指定列表按升序進行排序 static void sort(List<T> list) //根據指定比較器產生的順序對指定列表進行排序 static <T> void sort(List<T> list, Comparator<? super T> c) //在指定List的指定位置i,j處交換元素 static void swap(List<?> list, int i, int j) //當distance為正數時,將List集合的后distance個元素“整體”移到前面;當distance為負數時,將list集合的前distance個元素“整體”移到后邊。該方法不會改變集合的長度 static void rotate(List<?> list, int distance)
//使用二分搜索法搜索指定列表,以獲得指定對象在List集合中的索引 //注意:此前必須保證List集合中的元素已經處于有序狀態 static <T> int binarySearch(List<? extends Comparable<? super T>>list, T key) //根據元素的自然順序,返回給定collection 的最大元素 static Object max(Collection coll) //根據指定比較器產生的順序,返回給定 collection 的最大元素 static Object max(Collection coll,Comparator comp): //根據元素的自然順序,返回給定collection 的最小元素 static Object min(Collection coll): //根據指定比較器產生的順序,返回給定 collection 的最小元素 static Object min(Collection coll,Comparator comp): //使用指定元素替換指定列表中的所有元素 static <T> void fill(List<? super T> list,T obj) //返回指定co1lection中等于指定對象的出現次數 static int frequency(collection<?>c,object o) //返回指定源列表中第一次出現指定目標列表的起始位置;如果沒有出現這樣的列表,則返回-1 static int indexofsubList(List<?>source, List<?>target) //返回指定源列表中最后一次出現指定目標列表的起始位置;如果沒有出現這樣的列表,則返回-1 static int lastIndexofsubList(List<?>source,List<?>target) //使用一個新值替換List對象的所有舊值o1dval static <T> boolean replaceA1l(list<T> list,T oldval,T newval)
Collectons提供了多個synchronizedXxx()方法,該方法可以將指定集合包裝成線程同步的集合,從而解決多線程并發訪問集合時的線程安全問題。正如前面介紹的HashSet,TreeSet,arrayList,LinkedList,HashMap,TreeMap都是線程不安全的。Collections提供了多個靜態方法可以把他們包裝成線程同步的集合。
//返回指定 Collection 支持的同步(線程安全的)collection static <T> Collection<T> synchronizedCollection(Collection<T> c) //返回指定列表支持的同步(線程安全的)列表 static <T> List<T> synchronizedList(List<T> list) //返回由指定映射支持的同步(線程安全的)映射 static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) //返回指定 set 支持的同步(線程安全的)set static <T> Set<T> synchronizedSet(Set<T> s)
//返回一個空的、不可變的集合對象,此處的集合既可以是List,也可以是Set,還可以是Map。 emptyXxx() //返回一個只包含指定對象(只有一個或一個元素)的不可變的集合對象,此處的集合可以是:List,Set,Map。 singletonXxx(): //返回指定集合對象的不可變視圖,此處的集合可以是:List,Set,Map unmodifiableXxx()
感謝你能夠認真閱讀完這篇文章,希望小編分享的“Java集合框架是什么”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。