您好,登錄后才能下訂單哦!
一、緩存命中率的介紹
命中:可以直接通過緩存獲取到需要的數據。
不命中:無法直接通過緩存獲取到想要的數據,需要再次查詢數據庫或者執行其它的操作。原因可能是由于緩存中根本不存在,或者緩存已經過期。
通常來講,緩存的命中率越高則表示使用緩存的收益越高,應用的性能越好(響應時間越短、吞吐量越高),抗并發的能力越強。
由此可見,在高并發的互聯網系統中,緩存的命中率是至關重要的指標。
二、如何監控緩存的命中率
在memcached中,運行state命令可以查看memcached服務的狀態信息,其中cmd_get表示總的get次數,get_hits表示get的總命中次數,命中率 = get_hits/cmd_get。
當然,我們也可以通過一些開源的第三方工具對整個memcached集群進行監控,顯示會更直觀。比較典型的包括:zabbix、MemAdmin等。
如圖:MemAdmin對memcached服務的命中率情況的監控統計
同理,在redis中可以運行info命令查看redis服務的狀態信息,其中keyspace_hits為總的命中中次數,keyspace_misses為總的miss次數,命中率=keyspace_hits/(keyspace_hits+keyspace_misses)。
開源工具Redis-star能以圖表方式直觀redis服務相關信息,同時,zabbix也提供了相關的插件對redis服務進行監控。
三、影響緩存命中率的幾個因素
1、業務場景和業務需求
緩存適合“讀多寫少”的業務場景,反之,使用緩存的意義其實并不大,命中率會很低。
業務需求決定了對時效性的要求,直接影響到緩存的過期時間和更新策略。時效性要求越低,就越適合緩存。在相同key和相同請求數的情況下,緩存時間越長,命中率會越高。
互聯網應用的大多數業務場景下都是很適合使用緩存的。
2、緩存的設計(粒度和策略)
通常情況下,緩存的粒度越小,命中率會越高。舉個實際的例子說明:
當緩存單個對象的時候(例如:單個用戶信息),只有當該對象對應的數據發生變化時,我們才需要更新緩存或者讓移除緩存。而當緩存一個集合的時候(例如:所有用戶數據),其中任何一個對象對應的數據發生變化時,都需要更新或移除緩存。
還有另一種情況,假設其他地方也需要獲取該對象對應的數據時(比如其他地方也需要獲取單個用戶信息),如果緩存的是單個對象,則可以直接命中緩存,反之,則無法直接命中。這樣更加靈活,緩存命中率會更高。
此外,緩存的更新/過期策略也直接影響到緩存的命中率。當數據發生變化時,直接更新緩存的值會比移除緩存(或者讓緩存過期)的命中率更高,當然,系統復雜度也會更高。
3、緩存容量和基礎設施
緩存的容量有限,則容易引起緩存失效和被淘汰(目前多數的緩存框架或中間件都采用了LRU算法)。同時,緩存的技術選型也是至關重要的,比如采用應用內置的本地緩存就比較容易出現單機瓶頸,而采用分布式緩存則畢竟容易擴展。所以需要做好系統容量規劃,并考慮是否可擴展。此外,不同的緩存框架或中間件,其效率和穩定性也是存在差異的。
4、其他因素
當緩存節點發生故障時,需要避免緩存失效并最大程度降低影響,這種特殊情況也是架構師需要考慮的。業內比較典型的做法就是通過一致性Hash算法,或者通過節點冗余的方式。
有些朋友可能會有這樣的理解誤區:既然業務需求對數據時效性要求很高,而緩存時間又會影響到緩存命中率,那么系統就別使用緩存了。其實這忽略了一個重要因素--并發。通常來講,在相同緩存時間和key的情況下,并發越高,緩存的收益會越高,即便緩存時間很短。
四、提高緩存命中率的方法
從架構師的角度,需要應用盡可能的通過緩存直接獲取數據,并避免緩存失效。這也是比較考驗架構師能力的,需要在業務需求,緩存粒度,緩存策略,技術選型等各個方面去通盤考慮并做權衡。盡可能的聚焦在高頻訪問且時效性要求不高的熱點業務上,通過緩存預加載(預熱)、增加存儲容量、調整緩存粒度、更新緩存等手段來提高命中率。
對于時效性很高(或緩存空間有限),內容跨度很大(或訪問很隨機),并且訪問量不高的應用來說緩存命中率可能長期很低,可能預熱后的緩存還沒來得被訪問就已經過期了。
最后
歡迎大家一起交流,喜歡文章記得點個贊喲,感謝支持!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。