您好,登錄后才能下訂單哦!
這篇文章主要介紹“MySQL索引底層數據結構怎么理解”,在日常操作中,相信很多人在MySQL索引底層數據結構怎么理解問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”MySQL索引底層數據結構怎么理解”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
為什么是B+樹而不是B樹?
首先看看B樹和B+樹在結構上的區別
B樹結構:
B+樹:
可以看到:
B樹在每個節點上都有衛星數據(數據表中的一行數據),而B+樹只在葉子節點上有衛星數據。這意味著相同大小的磁盤扇區,B+樹可以存儲的葉子節點更多,磁盤IO次數更少;同樣也意味著B+樹的查找效率更穩定,而B樹數據查詢的最快時間復雜度是O(1)。
B樹的每個節點只出現一次,B+樹的所有節點都會出現在葉子節點中。B+樹的所有葉子節點形成一個升序鏈表,適合區間范圍查找,而B樹則不適合。
首先需要了解聚簇索引和非聚簇索引。
聚簇索引:
在聚簇索引中,葉子頁包含了行的全部數據,節點頁值包含索引列。InnoDB通過主鍵聚集數據,如果沒有定義主鍵則選擇一個唯一的非空索引列代替;如果沒有這樣的索引,InnoDB會隱式定義一個主鍵來作為聚簇索引。
聚簇索引的數據分布:
在聚簇索引中,除了主鍵索引,還有二級索引。二級索引中的葉子節點存儲的不是“行指針”,而是主鍵值,并以此作為指向行的“指針”。這意味著通過二級索引查找行,存儲引擎需要找到二級索引的葉子節點獲得對應的主鍵值,然后根據這個值去聚簇索引中查找對應的行,也稱為“回表”。當然,可以通過覆蓋索引避免回表或者InnoDB
的自適應索引能夠減少這樣的重復工作。
注意:聚簇索引中每一個葉子節點不止包含完整的數據行,還包括事務ID、用于事務和MVCC的回滾指針。
非聚簇索引的主鍵索引和二級索引在結構上沒有什么不同,都在葉子節點上存儲指向數據的物理地址的“行指針”。
聚簇索引的主鍵索引和二級索引:
非聚簇索引的主鍵索引和二級索引:
優點:
把相關數據保存在一起(比如用用戶ID把用戶的全部郵件聚集在一起),否則每次數據讀取就可能導致一次磁盤IO
數據訪問更快,把索引和數據保存在同一個B+樹中,通常在聚簇索引中獲取數據比在非聚簇索引中查找更快
使用覆蓋查詢可以直接利用頁節點中的主鍵值
缺點:
如果所有數據都可以放在內存中,順序訪問不再那么必要,聚簇索引沒有優勢
插入速度依賴于插入順序,隨機插入會導致頁分裂,造成空洞,使用OPTIMIZE TABLE重建表
每次插入、更新、刪除都需要維護索引的變化,代價很高
二級索引可能比想象中大,因為在節點中包含了引用行的主鍵列
哈希索引基于哈希表實現,只有精確匹配索引所有列的查詢才有效,這意味著,哈希索引適用于等值查詢。
具體實現:對于每一行數據,存儲引擎都會對所有的索引列計算一個哈希碼,哈希索引將所有的哈希碼存儲在索引中,同時在哈希表中保存指向每個數據行的指針。
在MySQL中,只有Memory
引擎顯式支持哈希索引,當然Memory
引擎也支持B樹索引。
注意:Memory引擎支持非唯一哈希索引,解決沖突的方式是以鏈表的形式存放多個哈希值相同的記錄指針。
InnoDB
注意到某些索引值被使用得非常頻繁時,會在內存中基于B+樹索引之上再創建一個哈希索引,這樣就讓B+樹索引也具有哈希索引的一些優點,比如快速的哈希查找。
到此,關于“MySQL索引底層數據結構怎么理解”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。