您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關B+Tree如何理解,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
B+Tree的定義
B+Tree是B樹的變種,有著比B樹更高的查詢性能,來看下m階B+Tree特征:
有m個子樹的節點包含有m個元素(B-Tree中是m-1)
根節點和分支節點中不保存數據,只用于索引,所有數據都保存在葉子節點中。
所有分支節點和根節點都同時存在于子節點中,在子節點元素中是最大或者最小的元素。
葉子節點會包含所有的關鍵字,以及指向數據記錄的指針,并且葉子節點本身是根據關鍵字的大小從小到大順序鏈接。
更直觀的圖
1、紅點表示是指向衛星數據的指針,指針指向的是存放實際數據的磁盤頁,衛星數據就是數據庫中一條數據記錄。
2、葉子節點中還有一個指向下一個葉子節點的next指針,所以葉子節點形成了一個有序的鏈表,方便遍歷B+樹。
B+樹的優勢1、更加高效的單元素查找
B+樹的查找元素3的過程:
第一次磁盤IO
第二次磁盤IO
第三次磁盤IO
這個過程看下來,貌似與B樹的查詢過程沒有什么區別。但實際上有兩點不一樣:
a、首先B+樹的中間節點不存儲衛星數據,所以同樣大小的磁盤頁可以容納更多的節點元素,如此一來,相同數量的數據下,B+樹就相對來說要更加矮胖些,磁盤IO的次數更少。
b、由于只有葉子節點才保存衛星數據,B+樹每次查詢都要到葉子節點;而B樹每次查詢則不一樣,最好的情況是根節點,最壞的情況是葉子節點,沒有B+樹穩定。
2、葉子節點形成有順鏈表,范圍查找性能更優
B樹范圍查找3-8的過程
a、先查找3
b、再查找4、5、6、7、8,中間過程省略,直接到8的查找
這里查找的范圍跨度越大,則磁盤IO的次數越多,性能越差。
B+樹范圍查找3-11的過程
先從上到下找到下限元素3,然后通過鏈表指針,依次遍歷得到元素5/6/8/9/11;如此一來,就不用像B樹那樣一個個元素進行查找。
總結
單節點可以存儲更多的元素,使得查詢磁盤IO次數更少。
所有查詢都要查找到葉子節點,查詢性能穩定。
所有葉子節點形成有序鏈表,便于范圍查詢。
PS:在數據庫的聚集索引(Clustered Index)中,葉子節點直接包含衛星數據。在非聚集索引(NonClustered Index)中,葉子節點帶有指向衛星數據的指針。
看完上述內容,你們對B+Tree如何理解有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。