您好,登錄后才能下訂單哦!
建立索引如何優化SQL?相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。
1、建立普通索引:對經常出現在 where 關鍵字后面的表字段建立對應的索引。。
2、建立復合索引:如果 where 關鍵字后面常出現的有幾個字段,可以建立對應的 復合索引。要注意可以優化的一點是,將單獨出現最多的字段放在前面。例如現在我們有兩個字段 a 和 b 經常會同時出現在 where 關鍵字后面:
select * from t where a = 1 and b = 2; \* Q1 *\
也有很多 SQL 會單獨使用字段 a 作為查詢條件:
select * from t where a = 2; \* Q2 *\
此時,我們可以建立復合索引 index(a,b)。因為不但 Q1 可以利用復合索引,Q2 也可以利用復合索引。
3、最左前綴匹配原則
如果我們使用的是復合索引,應該盡量遵循 最左前綴匹配原則。MySQL 會一直向右匹配直到遇到范圍查詢(>、<、between、like)就停止匹配。假如此時我們有一條SQL:
select * from t where a = 1 and b = 2 and c > 3 and d = 4;
那么我們應該建立的復合索引是:index(a,b,d,c) 而不是 index(a,b,c,d)。因為字段 c 是范圍查詢,當 MySQL 遇到范圍查詢就停止索引的匹配了。大家也注意到了,其實 a,b,d 在 SQL 的位置是可以任意調整的,優化器會找到對應的復合索引。還要注意一點的是,最左前綴匹配原則不但是復合索引的最左 N 個字段;也可以是單列(字符串類型)索引的最左 M 個字符。例如我們常說的 like 關鍵字,盡量不要使用全模糊查詢,因為這樣用不到索引;所以建議是使用右模糊查詢:select * from t where name like '李%'(查詢所有姓李的同學的信息)。
4、索引下推:很多時候,我們還可以復合索引的 索引下推 來優化 SQL 。例如此時我們有一個復合索引:index(name,age) ,然后有一條 SQL 如下:
select * from user where name like '張%' and age = 10 and sex = 'm';
根據復合索引的最左前綴匹配原則,MySQL 匹配到復合索引 index(name,age) 的 name 時,就停止匹配了;然后接下來的流程就是根據主鍵回表,判斷 age 和 sex 的條件是否同時滿足,滿足則返回給客戶端。
但是由于有索引下推的優化,匹配到 name 時,不會立刻回表;而是先判斷復合索引 index(name,age) 中的 age 是否符合條件;符合條件才進行回表接著判斷 sex 是否滿足,否則會被過濾掉。那么借著 MySQL 5.6 引入的索引下推優化 ,可以做到減少回表的次數。
5、覆蓋索引:很多時候,我們還可以覆蓋索引來優化SQL。
情況一:SQL 只查詢主鍵作為返回值。主鍵索引(聚簇索引)的葉子節點是整行數據,而普通索引(二級索引)的葉子節點是主鍵的值。所以當我們的 SQL 只查詢主鍵值,可以直接獲取對應葉子節點的內容,而避免回表。
情況二:SQL 的查詢字段就在索引里。復合索引:假如此時我們有一個復合索引 index(name,age) ,有一條 SQL 如下:
select name,age from t where name like '張%';
由于是字段 name 是右模糊查詢所以可以走復合索引,然后匹配到 name 時,不需要回表,因為 SQL 只是查詢字段 name 和 age,所以直接返回索引值就 ok 了。
6、普通索引
盡量 使用普通索引 而不是唯一索引。首先,普通索引和唯一索引的查詢性能其實不會相差很多;當然了,前提是要查詢的記錄都在同一個數據頁中,否則普通索引的性能會慢很多。但是,普通索引的更新操作性能比唯一索引更好;其實很簡單,因為普通索引能利用 change buffer 來做更新操作;而唯一索引因為要判斷更新的值是否是唯一的,所以每次都需要將磁盤中的數據讀取到 buffer pool 中。
7、前綴索引
我們要學會巧妙的使用 前綴索引,避免索引值過大。例如有一個字段是 addr varchar(255),但是如果一整個建立索引 [ index(addr) ],會很浪費磁盤空間,所以會選擇建立前綴索引 [ index(addr(64)) ]。建立前綴索引,一定要關注字段的區分度。例如像身份證號碼這種字段的區分度很低,只要出生地一樣,前面好多個字符都是一樣的;這樣的話,最不理想時,可能會掃描全表。前綴索引避免不了回表,即無法使用覆蓋索引這個優化點,因為索引值只是字段的前 n 個字符,需要回表才能判斷查詢值是否和字段值是一致的。
怎么解決?倒序存儲:像身份證這種,后面的幾位區分度就非常的高了;我們可以這么查詢:
select field_list from t where id_card = reverse('input_id_card_string'
增加 hash 字段并為 hash 字段添加索引。
8、干凈的索引列:索引列不能參與計算,要保持索引列“干凈”。假設我們給表 student 的字段 birthday 建立了普通索引。下面的 SQL 語句不能利用到索引來提升執行效率:
select * from student where DATE_FORMAT(birthday,'%Y-%m-%d') = '2020-02-02';
我們應該改成下面這樣:
select * from student where birthday = STR_TO_DATE('2020-02-02', '%Y-%m-%d');
9、擴展索引
我們應該盡量擴展索引,而不是新增索引,一個表最好不要超過5個索引;一個表的索引越多,會導致更新操作更加耗費性能。
看完上述內容,你們掌握建立索引如何優化SQL的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。