您好,登錄后才能下訂單哦!
這篇文章給大家介紹MySQL中緩沖池的作用是什么,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
圖注:思維導圖
上邊我們提到過了,執行 SQL 對某一行進行操作時,總不能每次都直接進行磁盤操作吧。好歹有個緩沖地帶,不然每次都深入老巢這誰受得了。
這不緩沖池就應運而生了,簡單來說就是一塊內存區域。它存在的原因之一是為了避免每次都去訪問磁盤,把最常訪問的數據放在緩存里,提高數據的訪問速度。
了解了它的作用,接下來讓我們先來看下緩沖池在整個 Mysql 架構里處于什么樣的地方,有一個宏觀的認識。
我們再來看看它的內部組成部分。在緩沖池中,除數據頁和索引頁外還有多種類型:
緩沖池你也了解了,可能此時你最關注的是它在 SQL 執行時起了一個什么樣的作用。上篇文章中我們簡單的提到過一條 SQL 語句的執行過程,但并未涉及到緩沖池相關的問題。這期我們仍是以一條 SQL 來作為切入點。
當一條 SQL 執行的時候,如果是讀操作,要查找的數據所在的數據頁在內存中時,則將結果返回。否則會把對應的數據頁加載到內存中,然后再返回結果。
同樣對于寫操作來說。如果要修改的行所在的數據頁在內存中,則修改后返回對應的結果(當然還有后續操作)。如果不在的話,則會從磁盤里將該行所對應的數據頁讀到內存中再進行修改。
好了,現在讓我們回到開始時候的問題。為什么操作磁盤慢,但是 SQL 執行卻不慢呢。到這里相信你也差不多知道了吧。
緩沖池的存在,很大程度減少了磁盤 I/O 帶來的開銷。要操作的數據行所在的數據頁如果存在于緩存中的話,就不需要從磁盤中進行讀取。這樣在執行后就可以很快拿到結果。
我們可以看出來,只要不存在或減少磁盤 I/O,執行速度自然就會變快。那么對于加載數據頁這種無法避免的磁盤 I/O 來說是否有更好的方式呢?既然避免不了,那減少磁盤 I/O 的次數總可以吧?
這就是我們要講的 Mysql 中「預讀」的新特性,它是 Innodb 通過在緩沖池中提前讀取多個數據頁來優化 I/O 的一種方式。因為磁盤讀寫的時候,是按照頁的方式來讀取的(你可以理解為固定大小的數據,例如一頁數據為 16K),每次至少讀入一頁的數據,如果下次讀取的數據就在頁中,就不用再去磁盤上讀取了,從而減少了磁盤 I/O。
可以在命令行通過如下命令查看對應的頁大小:
你可能會有疑問,緩沖池這么洋氣的東西,為什么不把所有的數據都放到緩沖池里呢?這樣速度豈不是美滋滋,放到磁盤里慢的跟老牛拉車一樣。
哎,哥,醒醒,拋開內存的易失性不談,緩沖池也是有大小限制的。那你可能又有疑惑了,既然緩沖池有大小限制,那我每次都讀入的數據頁怎么來管理呢。別的數據頁都占了地兒了,哪有我的位置?
這里我們來聊聊緩沖池的空間管理,其實對緩沖池進行管理的關鍵部分是如何安排進池的數據并且按照一定的策略淘汰池中的數據,保證池中的數據不“溢出”,同時還能保證常用數據留在池子中。
緩沖池是基于傳統的 LRU 方法來進行緩存頁管理的,我們先來看下如果使用 LRU 是如何管理的。
LRU,全稱是 Least Recently Used,中文名字叫作「最近最少使用」。從名字上就很容易理解了。
這里分兩種情況:
這種情況下會將對應的緩存頁放到 LRU 鏈表的頭部,無需從磁盤再進行讀取,也無需淘汰其它緩存頁。
如下圖所示,如果要訪問的數據在 6 號頁中,則將 6 號頁放到鏈表頭部即可,這種情況下沒有緩存頁被淘汰。
緩存頁不在緩沖中,這時候就需要從磁盤中讀入對應的數據頁,將其放置在鏈表頭部,同時淘汰掉末尾的緩存頁
如下圖所示,如果要訪問的數據在 60 號頁中,60 號頁不在緩沖池中,此時加載進來放到鏈表的頭部,同時淘汰掉末尾的 17 號緩存頁。
是不是看上去很簡單,同時也能滿足緩沖池淘汰緩存頁的方法?但是我們來思考幾個問題:
預讀失效
上面我們提到了緩沖池的預讀機制可能會預先加載相鄰的數據頁。假如加載了 20、21 相鄰的兩個數據頁,如果只有頁號為 20 的緩存頁被訪問了,而另一個緩存頁卻沒有被訪問。此時兩個緩存頁都在鏈表的頭部,但是為了加載這兩個緩存頁卻淘汰了末尾的緩存頁,而被淘汰的緩存頁卻是經常被訪問的。這種情況就是預讀失效,被預先加載進緩沖池的頁,并沒有被訪問到,這種情況是不是很不合理。
緩沖池污染
還有一種情況是當執行一條 SQL 語句時,如果掃描了大量數據或是進行了全表掃描,此時緩沖池中就會加載大量的數據頁,從而將緩沖池中已存在的所有頁替換出去,這種情況同樣是不合理的。這就是緩沖池污染,并且還會導致 MySQL 性能急劇下降。
這樣看來,傳統的 LRU 方法并不能滿足緩沖池的空間管理。因此,Msyql 基于 LRU 設計了冷熱數據分離的處理方案。
也就是將 LRU 鏈表分為兩部分,一部分為熱數據區域,一部分為冷數據區域。
當數據頁第一次被加載到緩沖池中的時候,先將其放到冷數據區域的鏈表頭部,1s(由 innodb_old_blocks_time 參數控制) 后該緩存頁被訪問了再將其移至熱數據區域的鏈表頭部。
可能你會有疑惑了,為什么要等 1s 后才將其移至熱數據區域呢?你想想,如果數據頁剛被加載到冷數據區就被訪問了,之后再也不訪問它了呢?這不就造成熱數據區的浪費了嗎?要是 1s 后不訪問了,說明之后可能也不會去頻繁訪問它,也就沒有移至熱緩沖區的必要了。當緩存頁不夠的時候,從冷數據區淘汰它們就行了。
另一種情況,當我的數據頁已經在熱緩沖區了,是不是緩存頁只要被訪問了就將其插到鏈表頭部呢?不用我說你肯定也覺得不合理。熱數據區域里的緩存頁是會被經常訪問的,如果每訪問一個緩存頁就插入一次鏈表頭,那整個熱緩沖區里就異常騷動了,你想想那個畫面。
那咋整呢?Mysql 中優化為熱數據區的后 3/4 部分被訪問后才將其移動到鏈表頭部去,對于前 1/4 部分的緩存頁被訪問了不會進行移動。
好了,到這里關于 buffer pool 的知識就講完了。這期里我們講了 buffer pool 能使 SQL 執行變快的原因,同時還講了有關 buffer pool 空間的管理方式。歡迎在留言區里進行討論。
緩沖池很大程度減少了磁盤 I/O 帶來的開銷,通過將操作的數據行所在的數據頁加載到緩沖池可以提高 SQL 的執行速度。
為了減少磁盤 I/O,Innodb 通過在緩沖池中提前讀取多個數據頁來進行優化,這種方式叫作預讀。
傳統的LRU方法對于緩沖池來說,會導致預讀失效和緩沖池污染兩種情況,因此這種傳統的方式并不適用緩沖池的空間管理。
基于對 LRU 方法的優化,Msyql 設計了冷熱數據分離的處理方案,將LRU鏈表分為熱數據區和冷數據區兩部分,這樣就可以解決預讀失效和緩沖池污染的情況。
關于MySQL中緩沖池的作用是什么就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。