您好,登錄后才能下訂單哦!
本篇內容主要講解“數據庫索引實際上是怎么工作的”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“數據庫索引實際上是怎么工作的”吧!
數據庫具有組織化的數據存儲功能。存儲具有用于放置數據的特定結構。每種數據庫類型都有其自己的用于存儲數據的格式。針對特定用例對它們進行了調整和優化。在下面的示例中,我們有一個包含汽車信息的數據庫:
> Example of a database table with cars
看起來很好,很容易瀏覽它。但是你有沒有問過自己的數據是如何存儲的?
內部存儲器
每個數據庫都內部存儲在文件中,并應用了特定的編碼和格式。為簡單起見,讓我們假設一個數據庫由CSV文件支持。它是這樣的:
ID,Brand,Model,Color,Price
1,Ford,Focus,Grey,42000
2,Toyota,Prius,White,40500
3,BMW,M5,Red,60000
4,Audi,A3,Black,38000
5,Toyota,Camry,White,51500
6,VW,Golf,Grey,32000
這一切都很簡單。用只有六個條目進行查找不是問題。你能想象你有100,000個條目嗎?經過文件會變得非常慢。查詢時間與文件的大小成比例地增加。當我們知道數據庫會隨著時間的推移而增長時,我們需要找到一個解決方案。
在這里索引到救援。
數據庫索引
數據庫索引是一種數據結構,用于加快檢索數據的操作。它是什么樣子的?
如果我們需要通過ID 6從我們的表中檢索一輛汽車,則直接跳到相應的行時會更快地跳轉,而不會通過其余循環。這是索引的主要思想。我們還需要保存指向各個條目的偏移量。
最簡單的方法是保留哈希中每個條目的偏移量。關鍵是我們要索引的列的值(在此示例中,它是ID列)。哈希值是數據庫文件中的偏移量。對于ID = 1,偏移量為0。對于ID = 2,偏移量為24。它看起來像這樣:
Hash Index {1:0, 2:24, 3:51, 4:70, 5:92, 6:118}
1 => {0} ---------> 1,Ford,Focus,Grey,42000
2 => {24} ---------> 2,Toyota,Prius,White,40500
3 => {51} ---------> 3,BMW,M5,Red,60000
4 => {70} ---------> 4,Audi,A3,Black,38000
5 => {92} ---------> 5,Toyota,Camry,White,51500
6 => {118} ---------> 6,VW,Golf,Grey,32000
添加索引后,通過ID查詢汽車將返回結果更快。檢索請求進入散列索引,并占用相應ID的偏移量。然后它開始在必要的條目中完全從偏移量讀取數據庫文件。
索引是實現唯一性約束的正確方法。當您想要保證某個列中的值是唯一的,則需要列上的索引。否則,每個插入操作都會卡住檢查新數據是否已存在。
也可以具有多個索引。如果我們需要通過任何其他列快速查詢,我們也會添加一個索引。例如,我們可以通過顏色添加顏色和查詢快車的索引。但每個新索引都會為數據庫帶來額外的成本。
索引開銷
首先,每個索引哈希都需要額外的內存。我們添加的索引越多,將使用更多的內存。重要的是要記住僅在經常查詢的列上添加索引。否則,對每一列建立索引將消耗大量內存。
其次,對于快速讀取操作,寫入操作會略微慢。每次向表添加條目時,我們也必須在哈希索引中創建一個項目。類似的情況適用于更新或刪除數據。這是我們必須處理的權衡。
總結
數據庫索引是增強讀取查詢的好方法。
唯一性約束需要索引列。
通過每個新索引,將消耗更多內存。
添加索引對寫作和更新的操作產生了影響。
這就是簡單的哈希索引的工作方式。還有許多其他使用數據庫索引的方法,例如排序字符串表或B樹。他們使用更復雜的邏輯和優化的結構來獲得更好的性能結果。
但是,保存偏移量的想法保持不變。通過正確使用索引,在使用數據庫時,您將可以達到一個新的水平。
到此,相信大家對“數據庫索引實際上是怎么工作的”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。