您好,登錄后才能下訂單哦!
這篇文章主要介紹MySQL性能優化的案例分析,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
上一篇 《實踐(1)--MySQL性能優化》我們講了數據庫表設計的一些原則,Explain工具的介紹、SQL語句優化索引的最佳實踐,本篇繼續來聊聊 MySQL 如何選擇合適的索引。
MySQL 最終是否選擇走索引或者一張表涉及多個索引,最終是如何選擇索引,可以使用 trace 工具來一查究竟,開啟 trace工具會影響 MySQL 性能,所以只能臨時分析 SQL 使用,用完之后立即關閉。
講 trace 工具之前我們先來看一個案例:
# 示例表CREATE TABLE`employees`(`id` int(11) NOT NULL AUTO_INCREMENT,`name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名',`age` int(11) NOT NULL DEFAULT '0' COMMENT '年齡',`position` varchar(20) NOT NULL DEFAULT '' COMMENT '職位',`hire_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入職時間', PRIMARY KEY (`id`), KEY `idx_name_age_position` (`name`,`age`,`position`) USING BTREE )ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='員工記錄表'; INSERT INTO employees(name,age,position,hire_time)VALUES('ZhangSan',23,'Manager',NOW());INSERT INTO employees(name,age,position,hire_time)VALUES('HanMeimei', 23,'dev',NOW());INSERT INTO employees(name,age,position,hire_time) VALUES('Lucy',23,'dev',NOW());復制代碼
MySQL 如何選擇合適的索引
EXPLAIN select * from employees where name > 'a';復制代碼
如果用name索引需要遍歷name字段聯合索引樹,然后還需要根據遍歷出來的主鍵值去主鍵索引樹里再去查出最終數據,成本比全表掃描還高,可以用覆蓋索引優化,這樣只需要遍歷name字段的聯合索引樹就能拿到所有結果,如下:
EXPLAIN select name,age,position from employees where name > 'a' ;復制代碼
EXPLAIN select * from employees where name > 'zzz' ;復制代碼
對于上面這兩種 name>'a'
和 name>'zzz'
的執行結果,mysql最終是否選擇走索引或者一張表涉及多個索引,mysql最終如何選擇索引,我們可以用trace工具來一查究竟,開啟trace工具會影響mysql性能,所以只能臨時分析sql使用,用完之后立即關閉。
#開啟traceset session optimizer_trace="enabled=on",end_markers_in_json=on; #關閉traceset session optimizer_trace="enabled=off";復制代碼
執行這兩句sql
select * from employees where name >'a' order by position;sELECT * FROM information_schema.OPTIMIZER_TRACE; 復制代碼
提出來trace值,詳見注釋
{ "steps": [ { "join_preparation": { --第一階段:SQL準備階段 "select#": 1, "steps": [ { "expanded_query": "/* select#1 */ select `employees`.`id` AS `id`,`employees`.`name` AS `name`,`employees`.`age` AS `age`,`employees`.`position` AS `position`,`employees`.`hire_time` AS `hire_time` from `employees` where (`employees`.`name` > 'a') order by `employees`.`position`" } ] /* steps */ } /* join_preparation */ }, { "join_optimization": { --第二階段:SQL優化階段 "select#": 1, "steps": [ { "condition_processing": { --條件處理 "condition": "WHERE", "original_condition": "(`employees`.`name` > 'a')", "steps": [ { "transformation": "equality_propagation", "resulting_condition": "(`employees`.`name` > 'a')" }, { "transformation": "constant_propagation", "resulting_condition": "(`employees`.`name` > 'a')" }, { "transformation": "trivial_condition_removal", "resulting_condition": "(`employees`.`name` > 'a')" } ] /* steps */ } /* condition_processing */ }, { "substitute_generated_columns": { } /* substitute_generated_columns */ }, { "table_dependencies": [ --表依賴詳情 { "table": "`employees`", "row_may_be_null": false, "map_bit": 0, "depends_on_map_bits": [ ] /* depends_on_map_bits */ } ] /* table_dependencies */ }, { "ref_optimizer_key_uses": [ ] /* ref_optimizer_key_uses */ }, { "rows_estimation": [ --預估表的訪問成本 { "table": "`employees`", "range_analysis": { "table_scan": { --全表掃描 "rows": 3, --掃描行數 "cost": 3.7 --查詢成本 } /* table_scan */, "potential_range_indexes": [ --查詢可能使用的索引 { "index": "PRIMARY", --主鍵索引 "usable": false, "cause": "not_applicable" }, { "index": "idx_name_age_position", --輔助索引 "usable": true, "key_parts": [ "name", "age", "position", "id" ] /* key_parts */ }, { "index": "idx_age", "usable": false, "cause": "not_applicable" } ] /* potential_range_indexes */, "setup_range_conditions": [ ] /* setup_range_conditions */, "group_index_range": { "chosen": false, "cause": "not_group_by_or_distinct" } /* group_index_range */, "analyzing_range_alternatives": { --分析各個索引使用成本 "range_scan_alternatives": [ { "index": "idx_name_age_position", "ranges": [ "a < name" --索引使用范圍 ] /* ranges */, "index_pes_for_eq_ranges": true, "rowid_ordered": false, --使用該索引獲取的記錄是否按照主鍵排序 "using_mrr": false, "index_only": false, --是否使用覆蓋索引 "rows": 3, --索引掃描行數 "cost": 4.61, --索引使用成本 "chosen": false, --是否選擇該索引 "cause": "cost" } ] /* range_scan_alternatives */, "analyzing_roworder_intersect": { "usable": false, "cause": "too_few_roworder_scans" } /* analyzing_roworder_intersect */ } /* analyzing_range_alternatives */ } /* range_analysis */ } ] /* rows_estimation */ }, { "considered_execution_plans": [ { "plan_prefix": [ ] /* plan_prefix */, "table": "`employees`", "best_access_path": { --最優訪問路徑 "considered_access_paths": [ --最終選擇的訪問路徑 { "rows_to_scan": 3, "access_type": "scan", --訪問類型:為sacn,全表掃描 "resulting_rows": 3, "cost": 1.6, "chosen": true, --確定選擇 "use_tmp_table": true } ] /* considered_access_paths */ } /* best_access_path */, "condition_filtering_pct": 100, "rows_for_plan": 3, "cost_for_plan": 1.6, "sort_cost": 3, "new_cost_for_plan": 4.6, "chosen": true } ] /* considered_execution_plans */ }, { "attaching_conditions_to_tables": { "original_condition": "(`employees`.`name` > 'a')", "attached_conditions_computation": [ ] /* attached_conditions_computation */, "attached_conditions_summary": [ { "table": "`employees`", "attached": "(`employees`.`name` > 'a')" } ] /* attached_conditions_summary */ } /* attaching_conditions_to_tables */ }, { "clause_processing": { "clause": "ORDER BY", "original_clause": "`employees`.`position`", "items": [ { "item": "`employees`.`position`" } ] /* items */, "resulting_clause_is_simple": true, "resulting_clause": "`employees`.`position`" } /* clause_processing */ }, { "reconsidering_access_paths_for_index_ordering": { "clause": "ORDER BY", "index_order_summary": { "table": "`employees`", "index_provides_order": false, "order_direction": "undefined", "index": "unknown", "plan_changed": false } /* index_order_summary */ } /* reconsidering_access_paths_for_index_ordering */ }, { "refine_plan": [ { "table": "`employees`" } ] /* refine_plan */ } ] /* steps */ } /* join_optimization */ }, { "join_execution": { --第三階段:SQL執行階段 "select#": 1, "steps": [ { "filesort_information": [ { "direction": "asc", "table": "`employees`", "field": "position" } ] /* filesort_information */, "filesort_priority_queue_optimization": { "usable": false, "cause": "not applicable (no LIMIT)" } /* filesort_priority_queue_optimization */, "filesort_execution": [ ] /* filesort_execution */, "filesort_summary": { "rows": 3, "examined_rows": 3, "number_of_tmp_files": 0, "sort_buffer_size": 200704, "sort_mode": "<sort_key, packed_additional_fields>" } /* filesort_summary */ } ] /* steps */ } /* join_execution */ } ] /* steps */ }復制代碼
結論:全表掃描的成本低于索引掃描,所以MySQL最終選擇全表掃描。
select * from employees where name > 'zzz' order by position;SELECT * FROM information_schema.OPTIMIZER_TRACE; 復制代碼
結論:查看trace字段可知索引掃描的成本低于全表掃描,所以MySQL最終選擇索引掃描。
Order by
與 Group by
優化EXPLAIN select * from employees where name = 'ZhangSan' and position = 'dev' order by age復制代碼
分析:
利用最左前綴法則:中間字段不能斷,因此查詢用到了 name索引
,從 key_len = 74 也能看出,age 索引列用在排序過程過程中,因為 Extra 字段里沒有 using filesort
。
EXPLAIN select * from employees where name = 'ZhangSan' order by position復制代碼
分析:
從 explain 的執行結果來看:key_len = 74,查詢使用了 name 索引,由于用了 position 進行排序,跳過了 age,出現了 Using filesort
。
EXPLAIN select * from employees where name = 'ZhangSan' order by age,position復制代碼
分析:
查詢只用到索引name
,age 和 position 用于排序,無Using filesort
。
EXPLAIN select * from employees where name = 'ZhangSan' order by position,age復制代碼
分析:
和案例3中explain的執行結果一樣,但是出現了Using filesort
,因為索引的創建順序為 name,age,position
, 但是排序的時候 age 和 position 顛倒位置了。
EXPLAIN select * from employees where name = 'ZhangSan' and age = 18 order by position,age復制代碼
分析:
與案例4對比,在Extra中并未出現** Using filesort
**,因為 age 為常量,在排序中被優化,所以索引未顛倒,不會出現 Using filesort
。
EXPLAIN select * from employees where name = 'ZhangSan' order by age asc, position desc;復制代碼
分析:
雖然排序的字段列與索引順序一樣,且 order by
默認升序,這里 position desc
變成列降序,導致與索引的排序方式不同,從而產生 Using filesort
。MySQL8 以上版本有降序索引可以支持該種查詢方式。
EXPLAIN select * from employees where name in ('ZhangSan', 'hjh') order by age, position;復制代碼
分析:
對于排序來說,多個相等條件也是范圍查詢。
EXPLAIN select * from employees where name > 'a' order by name;復制代碼
可以用覆蓋索引優化
EXPLAIN select name,age,position from employees where name > 'a' order by name;復制代碼
filesort
和 index
。Using index 是指MySQL 掃描索引本身完成排序。index 效率高,filesort 效率低。order by null
禁止排序。注意:where 高于 having,能寫在 where 中的限定條件就不要去 having 限定了。sort buffer
中進行排序;用 trace 工具可以看到 sort_mode 信息里顯示 < sort_key, additional_fields > 或者 < sort_key, packed_additional_fields >。MySQL 通過比較系統變量 max_length_for_sort_data
(默認1024字節) 的大小和需要查詢的字段總大小來判斷使用那種排序模式。
max_length_for_sort_data
比查詢的字段的總長度大,那么使用單路排序模式;max_length_for_sort_data
比查詢字段的總長度小,那么使用雙路排序模式。EXPLAIN select * from employees where name = 'ZhangSan' order by position;復制代碼
查看下這條sql對應trace結果如下(只展示排序部分):
set session optimizer_trace="enabled=on",end_markers_in_json=on; #開啟traceselect * from employees where name = 'ZhangSan' order by position;select * from information_schema.OPTIMIZER_TRACE;復制代碼
"join_execution": { --SQL執行階段 "select#": 1, "steps": [ { "filesort_information": [ { "direction": "asc", "table": "`employees`", "field": "position" } ] /* filesort_information */, "filesort_priority_queue_optimization": { "usable": false, "cause": "not applicable (no LIMIT)" } /* filesort_priority_queue_optimization */, "filesort_execution": [ ] /* filesort_execution */, "filesort_summary": { --文件排序信息 "rows": 1, --預計掃描行數 "examined_rows": 1, --參數排序的行 "number_of_tmp_files": 0, --使用臨時文件的個數,這個只如果為0代表全部使用的sort_buffer內存排序,否則使用的磁盤文件排序 "sort_buffer_size": 200704, --排序緩存的大小 "sort_mode": "<sort_key, packed_additional_fields>" --排序方式,這里用的單路排序 } /* filesort_summary */ } ] /* steps */ } /* join_execution */復制代碼
修改系統變量 max_length_for_sort_data
(默認1024字節) ,employees 表所有字段長度總和肯定大于10字節
set max_length_for_sort_data = 10; select * from employees where name = 'ZhangSan' order by position;select * from information_schema.OPTIMIZER_TRACE;復制代碼
trace排序部分結果:
"join_execution": { "select#": 1, "steps": [ { "filesort_information": [ { "direction": "asc", "table": "`employees`", "field": "position" } ] /* filesort_information */, "filesort_priority_queue_optimization": { "usable": false, "cause": "not applicable (no LIMIT)" } /* filesort_priority_queue_optimization */, "filesort_execution": [ ] /* filesort_execution */, "filesort_summary": { "rows": 1, "examined_rows": 1, "number_of_tmp_files": 0, "sort_buffer_size": 53248, "sort_mode": "<sort_key, rowid>" --排序方式,這里用餓的雙路排序 } /* filesort_summary */ } ] /* steps */ } /* join_execution */ 復制代碼
單路排序的詳細過程:
雙路排序的詳細過程:
對比兩個排序模式,單路排序會把所有需要查詢的字段都放到 sort_buffer 中,而雙路排序只會把主鍵和需要排序的字段放到 sort_buffer 中進行排序,然后再通過主鍵回到原表查詢需要的字段。
如果MySQL排序內存配置的比較小并且沒有條件繼續增加了,可以適當把 max_length_for_sort_data
配置小點,讓優化器選擇使用雙路排序算法,可以在 sort_buffer 中一次排序更多的行,只是需要再根據主鍵回到原表取數據。
如果MySQL排序內存有條件可以配置比較大,可以適當增大 max_length_for_sort_data
的值,讓優化器優先選擇全字段排序(單路排序),把需要的字段放到 sort_buffer 中,這樣排序后就會直接從內存里返回查詢結果了。
所以,MySQL 通過 max_length_for_sort_data
這個參數來控制排序,在不同場景使用不同的排序模式,從而提升排序效率。
注意:如果全部使用sort_buffer 內存排序一般情況下效率會高于磁盤文件排序,但不能因為這個就隨便增大 sort_buffer(默認1M),MySQL很多參數設置都做過優化的,不要輕易調整。
在這我們先往 employess
插入一些測試數據
drop procedure if exists insert_emp; delimiter ;; create procedure insert_emp()begin declare i int; set i=1; while(i<=100000) do insert into employees(name,age,position) values(CONCAT('hjh',i),i,'dev'); set i=i+1; end while;end;; delimiter ; call insert_emp();復制代碼
很多時候我們業務系統實現分頁功能可能會用如下SQL實現
select * from employees limit 10000,10;復制代碼
表示從表 employees 中取出從 10001 行開始的 10 行記錄。看似只查詢了 10 條記錄,實際這條 SQL 是先讀取 10010 條記錄,然后拋棄前 10000 條記錄,然后讀到后面 10 條想要的數據。因此要查詢一張大表比較靠后的數據,執行效率是非常低的。
首先來看一個根據自增且連續主鍵排序的分頁查詢的例子:
select * from employees limit 9000,5;復制代碼
該 SQL 表示查詢從第 9001開始的五行數據,沒添加單獨 order by,表示通過主鍵排序。我們再看表 employees ,因為主鍵是自增并且連續的,所以可以改寫成按照主鍵去查詢從第 9001開始的五行數據,如下:
select * from employees where id > 9000 limit 5;復制代碼
查詢結果是一致的,我們再對比一下執行計劃:
EXPLAIN select * from employees limit 9000,5;復制代碼
EXPLAIN select * from employees where id > 9000 limit 5;復制代碼
顯然改寫后的 SQL 走了索引,而且掃描的行數大大減少,執行效率更高。 但是,這條改寫的 SQL 在很多場景并不實用,因為表中可能某些記錄被刪后,主鍵空缺,導致結果不一致,如下圖試驗所示(先刪除一條前面的記錄,然后再測試原 SQL 和優化后的 SQL):
兩條 SQL 的結果并不一樣,因此,如果主鍵不連續,不能使用上面描述的優化方法。
另外如果原SQL是order by 非主鍵的字段,按照上面說餓的方法改寫會導致兩條SQL的結果不一致。所以這種改寫得滿足以下兩個條件:
再看一個根據非主鍵字段排序的分頁查詢,SQL 如下:
select * from employees ORDER BY name limit 9000,5;復制代碼
EXPLAIN select * from employees ORDER BY name limit 90000,5;復制代碼
發現并沒有使用 name 字段的索引(key 字段對應的值為 null),具體原因上前面講過 : 掃描整個索引并查找到沒索引的行(可能要遍歷多個索引樹)的成本比掃描全表的成本更高,所以優化器放棄使用索引。 知道不走索引的原因,那么怎么優化呢? 其實關鍵是讓排序時返回的字段盡可能少,所以可以讓排序和分頁操作先查出主鍵,然后根據主鍵查到對應的記錄,SQL 改寫如下:
select * from employees e inner join (select id from employees order by name limit 90000,5) ed on e.id = ed.id;復制代碼
需要的結果與原 SQL 一致,執行時間減少了一半以上,我們再對比優化前后sql的執行計劃:
EXPLAIN select * from employees e inner join (select id from employees order by name limit 90000,5) ed on e.id = ed.id;復制代碼
原 SQL 使用的是 filesort 排序,而優化后的 SQL 使用的是索引排序。
#示例表CREATE TABLE `t1` ( `id` INT (11) NOT NULL AUTO_INCREMENT, `a` INT (11) DEFAULT NULL, `b` INT (11) DEFAULT NULL, PRIMARY KEY (`id`), KEY `idx_a` (`a`) ) ENGINE = INNODB AUTO_INCREMENT = 10001 DEFAULT CHARSET = utf8;CREATE TABLE t2 LIKE t1;復制代碼
往t1表插入1萬行記錄,往t2表插入100行記錄
#t1 1萬條記錄drop procedure if exists insert_emp_t1; delimiter ;; create procedure insert_emp_t1()begin declare i int; set i=1; while(i<=10000) do insert into t1(a,b) values(i,i); set i=i+1; end while;end;; delimiter ; call insert_emp_t1(); #t2 100條記錄drop procedure if exists insert_emp_t2; delimiter ;; create procedure insert_emp_t2()begin declare i int; set i=1; while(i<=100) do insert into t2(a,b) values(i,i); set i=i+1; end while;end;; delimiter ; call insert_emp_t2();復制代碼
一次一行循環地從第一張表(稱為驅動表)中讀取行,在這行數據中取到關聯字段,根據關聯字段在另一張表(被驅動表)里取出滿足條件的行,然后取出兩張表的結果合集。
EXPLAIN select * from t1 inner join t2 on t1.a= t2.a;復制代碼
從執行計劃中可以看到這些信息:
上面SQL的大致流程如下:
整個過程會讀取 t2 表的所有數據(掃描100行),然后遍歷這每行數據中字段 a 的值,根據 t2 表中的 a 的值索引掃描 t1 表中對應的行(掃描 100次 t1 表的索引,1次掃描可以認為最終只掃描 t1 表一行完整數據,也就是總共 t1 表也掃描了100行)。因此整個過程掃描了 200 行。
如果被驅動表的關聯字段沒有索引,使用NLJ算法性能會比較低(下面有詳細解釋),MySQL 會選擇 Block Nested-Loop Join 算法。
把驅動表的數據讀入到 join_buffer 中,然后掃描被驅動表,把被驅動表每一行取出來跟 join_buffer 中的數據做對比。
EXPLAIN select * from t1 inner join t2 on t1.b= t2.b;復制代碼
Extra 中 的Using join buffer (Block Nested Loop)說明該關聯查詢使用的是 BNL 算法。
上面sql的大致流程如下:
整個過程對表 t1 和 t2 都做了一次全表掃描,因此掃描的總行數為10000(表 t1 的數據總量) + 100(表 t2 的數據總量) = 10100。并且 join_buffer 里的數據是無序的,因此對表 t1 中的每一行,都要做 100 次判斷,所以內存中的判斷次數是 100 * 10000= 100 萬次。
被驅動表的關聯字段沒索引為什么要選擇使用 BNL 算法而不使用 Nested-Loop Join 呢?
如果上面第二條sql使用 Nested-Loop Join,那么掃描行數為 100 * 10000 = 100萬次,這個是磁盤掃描。
很顯然,用BNL磁盤掃描次數少很多,相比于磁盤掃描,BNJ 的內存計算會快得多。
因此MySQL對于被驅動表的關聯字段沒索引的關聯查詢,一般都會使用 BNL 算法。如果有索引一般選擇 NLJ 算法,有索引的情況下 NLJ 算法比 BNL算法性能更高。
straight_join
寫法固定連接驅動方式,省去mysql優化器自己判斷的時間straight_join解釋
straight_join功能同join類似,但能讓左邊的表來驅動右邊的表,能改變優化器對于聯表查詢的執行順序。
比如 : select * from t2 straight_join t1 on t2.a = t1.a;
代表制定mysql選擇 t2 表作為驅動表。
原則:小表驅動大表,即小的數據集驅動大的數據集。
in:當B表的數據集小于A表的數據集時,in優于exists
select * from A where id in(select id from B) #等價于:for(select id from B){ select * from A where A.id = B.id }復制代碼
exists:當A表的數據集小于B表的數據集時,exists優于in
將主查詢A的數據,放到子查詢B中做條件驗證,根據驗證結果(true或false)來決定主查詢的數據是否保留
select * from A where exists (select 1 from B whereB.id=A.id) #等價于:for(select * from A){ select * from B where B.id = A.id } #A表與B表的ID字段應建立索引復制代碼
Count(*)
查詢優化臨時關閉mysql查詢緩存,為了查看sql多次執行的真實時間。
set global query_cache_size=0;set global query_cache_type=0;復制代碼
EXPLAIN select count(1) from employees; EXPLAIN select count(id) from employees;EXPLAIN select count(name) from employees; EXPLAIN select count(*) from employees;復制代碼
四個sql的執行計劃一樣,說明這四個sql執行效率應該差不多,區別在于根據某個字段count不會統計字段為null值的數據行。
為什么mysql最終選擇輔助索引而不是主鍵聚集索引?
因為二級索引相對主鍵索引存儲數據更少,檢索性能應該更高
對于myisam存儲引擎的表做不帶where條件的count查詢性能是很高的,因為myisam存儲引擎的表的總行數會被 mysql存儲在磁盤上,查詢不需要計算。
對于innodb存儲引擎的表mysql不會存儲表的總記錄行數,查詢count需要實時計算。
如果只需要知道表總行數的估計值可以用如下sql查詢,性能很高
插入或刪除表數據行的時候同時維護redis里的表總行數key的計數值(用incr或decr命令),但是這種方式可能不準,很難保證表操作和redis操作的事務一致性。
插入或刪除表數據行的時候同時維護計數表,讓他們在同一個事務里操作。
以上是MySQL性能優化的案例分析的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。