您好,登錄后才能下訂單哦!
MySQL中怎么實現慢查詢,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
1 什么是慢SQL?
這里指的是MySQL慢查詢,具體指運行時間超過long_query_time值的SQL。
我們常聽常見的MySQL中有二進制日志binlog、中繼日志relaylog、重做回滾日志redolog、undolog等。針對慢查詢,還有一種慢查詢日志slowlog,用來記錄在MySQL中響應時間超過閥值的語句。
大家不要被慢查詢這個名字誤導,以為慢查詢日志只會記錄select語句,其實也會記錄執行時間超過了long_query_time設定的閾值的insert、update等DML語句。
# 查看慢SQL是否開啟 show variables like "slow_query_log%"; # 查看慢查詢設定的閾值 單位:秒 show variables like "long_query_time";
對于我們使用的AliSQL-X-Cluster即XDB來說,默認慢查詢是開啟的,long_query_time設置為1秒。
2 慢查詢為何會導致故障?
真實的慢SQL往往會伴隨著大量的行掃描、臨時文件排序或者頻繁的磁盤flush,直接影響就是磁盤IO升高,正常SQL也變為了慢SQL,大面積執行超時。
去年雙11后,針對技術側暴露的問題,菜鳥CTO線推出多個專項治理,CTO-D各領一項作為sponsor,我所在的大團隊負責慢SQL治理這個專項。
1 怎么來衡量一個應用的慢SQL嚴重程度?
微平均
sum(aone應用慢SQL執行次數) ----------------------- sum(aone應用SQL執行次數)
我們認為,該值越大,影響越大;該值越小,影響可能小。
極端情況就是應用里每次執行的SQL全是慢SQL,該值為1;應用里每次執行的SQL全不是慢SQL,該值為0。
但是這個指標帶來的問題是區分度不佳,尤其是對SQL QPS很高且大多數情況下SQL都不是慢查詢的情況,偶發的慢SQL會被淹沒。
另外一個問題,偶發的慢SQL是真的慢SQL嗎?我們遇到很多被慢查詢日志記錄的SQL,實際上可能受到其他慢SQL影響、MySQL磁盤抖動、優化器選擇等原因使得常規查詢下表現顯然不是慢SQL的變成了慢SQL。
宏平均
sum(慢SQL 1執行次數) sum(慢SQL n執行次數) ----------------- + ------------------ sum(SQL 1執行次數) sum(SQL n執行次數) --------------------------------------- n
這個算法建立在被抓到的慢SQL有一定執行次數的基礎上,可以減少假性慢SQL的影響。
當某些應用QPS很低,即一天執行SQL的次數很少,如果碰到假性SQL就會引起統計誤差。
執行次數
sum(aone應用慢SQL執行次數) ----------------------- 7
統計最近一周平均每天的慢SQL執行次數,可以消除掉宏平均帶來的假性SQL問題。
慢SQL模板數量
以上維度均有個時間限定范圍,為了追溯慢SQL歷史處理情況,我們還引入了全局慢SQL模板數量維度。
count(distinct(aone應用慢SQL模板) )
2 目標
核心應用:解決掉所有的慢SQL
普通應用:微平均指標下降50%
3 CTO報表
以CTO-D為單位根據以上多維度指標統計匯總應用的加權平均,由低到高得出排名,突出頭尾top3,每周播報。
猜測可能與我的背景有關,有C/C++背景,曾在上家公司負責過公司層面異地多活架構的設計和落地,對于MySQL比較了解一些。
另外可能是利益無關,我所在小團隊業務剛起步,不存在慢SQL,這樣可以插入到各個業務線去。
1 集團MySQL規約
索引規約摘錄部分:
【強制】超過三個表禁止join。需要join的字段,數據類型保持絕對一致;多表關聯查詢時,保證被關聯的字段需要有索引。
說明:即使雙表join也要注意表索引、SQL性能。
【強制】在varchar字段上建立索引時,必須指定索引長度,沒必要對全字段建立索引,根據實際文本區分度決定索引長度。
說明:索引的長度與區分度是一對矛盾體,一般對字符串類型數據,長度為20的索引,區分度會高達90%以上,可以使用count(distinct left(列名, 索引長度))/count(*)的區分度來確定。
【強制】頁面搜索嚴禁左模糊或者全模糊,如果需要請走搜索引擎來解決。
說明:索引文件具有B-Tree的最左前綴匹配特性,如果左邊的值未確定,那么無法使用此索引。
【推薦】防止因字段類型不同造成的隱式轉換,導致索引失效。
【參考】創建索引時避免有如下極端誤解:
1) 索引寧濫勿缺
認為一個查詢就需要建一個索引。
2) 吝嗇索引的創建
認為索引會消耗空間、嚴重拖慢更新和新增速度。
3) 抵制唯一索引
認為唯一索引一律需要在應用層通過“先查后插”方式解決。
2 DB變更標準
DDL需要控制變更速度,注意灰度和并發控制,變更發布需要在規定的變更發布窗口內。
1 數據分布不均勻
1)分庫分表不合理
該業務數據分了8個庫,每個庫分了16張表,通過查看表空間可以看到數據幾乎都分布在各個庫的某2張表中。分庫分表的策略有問題,另外過高預估了業務增量,這個持保留意見。
2)索引不合理
單表創建了idx_logistics_corp_id_special_id的聯合索引,但即便這樣區分度依然太低,根據實驗及業務反饋(logistics_corp_id,transport_type_id)字段組合區分度非常高,且業務存在transport_type_id的單查場景。
2 索引問題
SELECT COUNT(0) AS `tmp_count` FROM( SELECT `table_holder`.`user_id`, `table_holder`.`sc_item_id`, SUM( CASE `table_holder`.`inventory_type` WHEN 1 THEN `table_holder`.`quantity` ELSE 0 END ) AS `saleable_quantity`, SUM( CASE `table_holder`.`inventory_type` WHEN 1 THEN `table_holder`.`lock_quantity` ELSE 0 END ) AS `saleable_lock_quantity`, SUM( CASE `table_holder`.`inventory_type` WHEN 401 THEN `table_holder`.`quantity` ELSE 0 END ) AS `transfer_on_way_quantity`, `table_holder`.`store_code`, MAX(`table_holder`.`gmt_modified`) AS `gmt_modified` FROM `table_holder` WHERE(`table_holder`.`is_deleted` = 0) AND(`table_holder`.`quantity` > 0) AND `table_holder`.`user_id` IN(3405569954) AND `table_holder`.`store_code` IN('ZJJHBHYTJJ0001', '...1000多個') GROUP BY `table_holder`.`user_id`, `table_holder`.`sc_item_id` ORDER BY `table_holder`.`user_id` ASC, `table_holder`.`sc_item_id` ASC ) `a`;
這個case對應的表有store_code索引,因此認為沒問題,沒辦法優化了。實則通過執行計劃,我們發現MySQL選擇了全表掃描。針對該case實踐發現,當范圍查詢的個數超過200個時,索引優化器將不再使用該字段索引。
最終經過拉取最近一段時間的相關查詢SQL,結合業務的數據分布,我們發現采用(is_deleted,quantity)即可解決。
判斷執行計劃采用的索引長度:key_len的長度計算公式(>=5.6.4)
char(10)允許NULL = 10 * ( character set:utf8mb4=4,utf8=3,gbk=2,latin1=1) + 1(NULL) char(10)不允許NULL = 10 * ( character set:utf8mb4=4,utf8=3,gbk=2,latin1=1) varchr(10)允許NULL = 10 * ( character set:utf8mb4=4,utf8=3,gbk=2,latin1=1) + 1(NULL) + 2(變長字段) varchr(10)不允許NULL = 10 * ( character set:utf8mb4=4,utf8=3,gbk=2,latin1=1) + 2(變長字段) int允許NULL = 4 + 1(NULL) int不允許NULL = 4 timestamp允許NULL = 4 + 1(NULL) timestamp不允許NULL = 4 datatime允許NULL = 5 + 1(NULL) datatime不允許NULL = 5
3 被人影響
用到了索引卻依然被爆出掃描2千萬行:
索引字段區分度很高:
同時期常規SQL變為了慢查詢:
DB數據盤訪問情況:
排查共用物理機其他實例的情況,發現有個庫在問題時間附近有很多慢sql需要排序,寫臨時文件剛好寫入了2GB:
多個MySQL實例leader節點混合部署在同一臺物理機,雖然通過docker隔離了CPU、MEM等資源,但目前還沒有做到buffer io的隔離。
4 無法解決
通過匯總分析高頻的查詢并結合業務得出合適的索引往往能夠解決日常遇到的慢查詢,但這并不是萬能的。
比如有可能索引越加越多,乃至成了這樣:
有些場景,比如支持多個字段組合查詢,又沒有必填項,如果都要通過索引來支持顯然是不合理的。
查詢場景下,將區分度較高的字段設定為必填項是個好習慣;查詢組合很多的情況下考慮走搜索支持性更好的存儲或者搜索引擎。
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。