您好,登錄后才能下訂單哦!
小編給大家分享一下mysql關聯查詢如何優化,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
mysql中任何關聯查詢都是nest loop(嵌套循環)操作,nest loop是在驅動表中取出一條數據,然后從被驅動表中逐行比較,把符合規則的放入結果集中,然后再取下一行,依次循環,驅動表每返回一行,被驅動表就要掃描一次。
針對nest loop關聯機制需要從下面幾個方面著手優化:
1、減少nest loop循環次數,使用小結果集做驅動表,驅動大結果集。
2、被驅動表每次循環都要被掃描,所以要求關聯鍵上一定要有索引,而且選擇性要好。
3、如果第二條無法滿足,可以通過調join_buffer_size來設置join buffer的大小,不過還是建議添加索引而不是純粹的加大join_buffer_size
接下來通過下面的實驗來了解mysql的nest loop
實驗環境:Percona server5.6.27 大表bill、小表user,表上均有索引
mysql> select count(*) from bill;
+----------+
| count(*) |
+----------+
| 1966789 |
+----------+
mysql> select count(*) from user_tmp;
+----------+
| count(*) |
+----------+
| 36317 |
+----------+
一、執行計劃:
mysql> explain select a.user_id,b.loan_info_id from bill b left JOIN user_tmp a on a.user_id=b.user_id;
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
| 1 | SIMPLE | b | ALL | NULL | NULL | NULL | NULL | 1912096 | NULL |
| 1 | SIMPLE | a | eq_ref | PRIMARY | PRIMARY | 194 | CDM.b.user_id | 1 | Using index |
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
左連接左表不管有多大總是驅動表,右表總是被驅動表
mysql> explain select a.user_id,b.loan_info_id from bill b INNER JOIN user_tmp a on a.user_id=b.user_id;
+----+-------------+-------+-------+------------------------------+------------------------------+---------+---------------+-------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+------------------------------+------------------------------+---------+---------------+-------+-------------+
| 1 | SIMPLE | a | index | PRIMARY | PRIMARY | 194 | NULL | 35970 | Using index |
| 1 | SIMPLE | b | ref | in_bill_user_id | in_bill_user_id | 194 | CDM.a.user_id | 3 | NULL |
+----+-------------+-------+-------+------------------------------+------------------------------+---------+---------------+-------+-------------+
2 rows in set (0.00 sec)
內連接,mysql的優化器會根據統計信息自動選擇小表user_tmp做驅動表,大家可以看到rows列值和我們剛開始統計的行數不一致,是因為統計信息和實際是有差異,所以有時候統計信息的不準確會導致執行計劃不是最優的。內連接可以用STRAIGHT_JOIN按照順序執行,即指定左表為驅動表
mysql> explain select STRAIGHT_JOIN a.user_id,b.loan_info_id from bill b inner JOIN user_tmp a on a.user_id=b.user_id;
+----+-------------+-------+--------+------------------------------+---------+---------+---------------+---------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+--------+------------------------------+---------+---------+---------------+---------+-------------+
| 1 | SIMPLE | b | ALL | in_bill_user_id | NULL | NULL | NULL | 1912096 | NULL |
| 1 | SIMPLE | a | eq_ref | PRIMARY | PRIMARY | 194 | CDM.b.user_id | 1 | Using index |
+----+-------------+-------+--------+------------------------------+---------+---------+---------------+---------+-------------+
這個時候mysql就不會根據統計信息把右邊的小表當做驅動表
刪除被驅動表bill索引
mysql> explain select a.user_id,b.loan_info_id from bill b INNER JOIN user_tmp a on a.user_id=b.user_id;
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
| 1 | SIMPLE | b | ALL | NULL | NULL | NULL | NULL | 1905575 | NULL |
| 1 | SIMPLE | a | eq_ref | PRIMARY | PRIMARY | 194 | CDM.b.user_id | 1 | Using index |
+----+-------------+-------+--------+---------------+---------+---------+---------------+---------+-------------+
mysql優化器是基于成本的,bill沒有了索引,那么就要掃描35970次bill全表 ,成本高于掃描1905575次user_tmp索引,所以又改變了執行計劃,變成了把大表做驅動表,進而降低了查詢效率
二、執行效率(關聯鍵都有索引):
當小表是驅動表的時候
mysql> select a.user_id,b.loan_info_id from bill b INNER JOIN user_tmp a on a.user_id=b.user_id;
這里結果集有幾萬條,省略
耗時:0.202s
使用STRAIGHT_JOIN強制大表是驅動表的時候
mysql>select STRAIGHT_JOIN a.user_id,b.loan_info_id from bill b INNER JOIN user_tmp a on a.user_id=b.user_id
耗時:5.260s
由于兩張表的相差幾十倍,兩種執行計劃的效率也是顯而易見的
注:如果大表的關聯鍵索引選擇性比較差(如重復數據多等),每次循環掃太多了,不如讓大表做驅動表,上述實驗是在大表的索引選擇性好的情況下得出的結果
以上是“mysql關聯查詢如何優化”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。