您好,登錄后才能下訂單哦!
這篇文章主要介紹“位圖索引BitMap舉例分析”,在日常操作中,相信很多人在位圖索引BitMap舉例分析問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”位圖索引BitMap舉例分析”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
有張表名為table的表,由三列組成,分別是姓名、性別和婚姻狀況,其中性別只有男和女兩項,婚姻狀況由已婚、未婚、離婚這三項,該表共有100w個記錄。現在有這樣的查詢: select * from table where Gender=‘男’ and Marital=“未婚”;
姓名(Name) | 性別(Gender) | 婚姻狀況(Marital) |
張三 | 男 | 已婚 |
李四 | 女 | 已婚 |
王五 | 男 | 未婚 |
趙六 | 女 | 離婚 |
孫七 | 女 | 未婚 |
... | ... | ... |
1. 不使用索引:不使用索引時,數據庫只能一行行掃描所有記錄,然后判斷該記錄是否滿足查詢條件。
2. B樹索引
對于性別,可取值的范圍只有'男','女',并且男和女可能各站該表的50%的數據,這時添加B樹索引還是需要取出一半的數據, 因此完全沒有必要。相反,如果某個字段的取值范圍很廣,幾乎沒有重復,比如身份證號,此時使用B樹索引較為合適。事實上,當取出的行數據占用表中大部分的數據時,即使添加了B樹索引,數據庫如oracle、mysql也不會使用B樹索引,很有可能還是一行行全部掃描。
如果用戶查詢的列的基數非常的小, 即只有的幾個固定值,如性別、婚姻狀況、行政區等等。要為這些基數值比較小的列建索引,就需要建立位圖索引。
對于性別這個列,位圖索引形成兩個向量,男向量為10100...,向量的每一位表示該行是否是男,如果是則位1,否為0,同理,女向量位01011。
RowId | 1 | 2 | 3 | 4 | 5 | ... |
男 | 1 | 0 | 1 | 0 | 0 |
|
女 | 0 | 1 | 0 | 1 | 1 |
|
對于婚姻狀況這一列,位圖索引生成三個向量,已婚為11000...,未婚為00100...,離婚為00010...。
RowId | 1 | 2 | 3 | 4 | 5 | ... |
已婚 | 1 | 1 | 0 | 0 | 0 |
|
未婚 | 0 | 0 | 1 | 0 | 1 |
|
離婚 | 0 | 0 | 0 | 1 | 0 |
|
當我們使用查詢語句“select * from table where Gender=‘男’ and Marital=“未婚”;”的時候 首先取出男向量10100...,然后取出未婚向量00100...,將兩個向量做與操作,這時生成新向量00100...,可以發現第三位為1,表示該表的第三行數據就是我們需要查詢的結果。
RowId | 1 | 2 | 3 | 4 | 5 |
男 | 1 | 0 | 1 | 0 | 0 |
& |
|
|
|
|
|
未婚 | 0 | 0 | 1 | 0 | 1 |
結果 | 0 | 0 | 1 | 0 | 0 |
上面講了,位圖索引適合只有幾個固定值的列,如性別、婚姻狀況、行政區等等,而身份證號這種類型不適合用位圖索引。
此外,位圖索引適合靜態數據,而不適合索引頻繁更新的列。舉個例子,有這樣一個字段busy,記錄各個機器的繁忙與否,當機器忙碌時,busy為1,當機器不忙碌時,busy為0。
這個時候有人會說使用位圖索引,因為busy只有兩個值。好,我們使用位圖索引索引busy字段!假設用戶A使用update更新某個機器的busy值,比如update table set table.busy=1 where rowid=100;,但還沒有commit,而用戶B也使用update更新另一個機器的busy值,update table set table.busy=1 where rowid=12; 這個時候用戶B怎么也更新不了,需要等待用戶A commit。
原因:用戶A更新了某個機器的busy值為1,會導致所有busy為1的機器的位圖向量發生改變,因此數據庫會將busy=1的所有行鎖定,只有commit之后才解鎖。
到此,關于“位圖索引BitMap舉例分析”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。