您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關一條SQL語句在MySQL中是如何執行的,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
前言
最近開始在學習mysql相關知識,自己根據學到的知識點,根據自己的理解整理分享出來,小編會分析下一個sql語句在mysql中的執行流程,包括sql的查詢在mysql內部會怎么流轉,sql語句的更新是怎么完成的。在分析之前我會先帶著你看看 MySQL 的基礎架構,知道了 MySQL 由那些組件組成已經這些組件的作用是什么,可以幫助我們理解和解決這些問題。
一、mysql架構分析
下面是mysql的一個簡要架構圖:
mysql主要分為Server層和存儲引擎層
Server層:主要包括連接器、查詢緩存、分析器、優化器、執行器等,所有跨存儲引擎的功能都在這一層實現,比如存儲過程、觸發器、視圖,函數等,還有一個通用的日志模塊 binglog日志模塊。
存儲引擎: 主要負責數據的存儲和讀取,采用可以替換的插件式架構,支持InnoDB、MyISAM、Memory等多個存儲引擎,其中InnoDB引擎有自有的日志模塊redolog 模塊。
InnoDB 5.5.5版本作為默認引擎。
連接器
主要負責用戶登錄數據庫,進行用戶的身份認證,包括校驗賬戶密碼,權限等操作,如果用戶賬戶密碼已通過,連接器會到權限表中查詢該用戶的所有權限,之后在這個連接里的權限邏輯判斷都是會依賴此時讀取到的權限數據,也就是說,后續只要這個連接不斷開,即時管理員修改了該用戶的權限,該用戶也是不受影響的。
查詢緩存
連接建立后,執行查詢語句的時候,會先查詢緩存,Mysql會先校驗這個sql是否執行過,以Key-Value的形式緩存在內存中,Key是查詢預計,Value是結果集。如果緩存key被***,就會直接返回給客戶端,如果沒有***,就會執行后續的操作,完成后也會把結果緩存起來,方便下一次調用。當然在真正執行緩存查詢的時候還是會校驗用戶的權限,是否有該表的查詢條件。
Mysql 查詢不建議使用緩存,因為對于經常更新的數據來說,緩存的有效時間太短了,往往帶來的效果并不好,對于不經常更新的數據來說,使用緩存還是可以的,Mysql 8.0 版本后刪除了緩存的功能,官方也是認為該功能在實際的應用場景比較少,所以干脆直接刪掉了。
分析器
mysql 沒有***緩存,那么就會進入分析器,分析器主要是用來分析SQL語句是來干嘛的,分析器也會分為幾步:
***步,詞法分析,一條SQL語句有多個字符串組成,首先要提取關鍵字,比如select,提出查詢的表,提出字段名,提出查詢條件等等。做完這些操作后,就會進入第二步。
第二步,語法分析,主要就是判斷你輸入的sql是否正確,是否符合mysql的語法。
完成這2步之后,mysql就準備開始執行了,但是如何執行,怎么執行是***的結果呢?這個時候就需要優化器上場了。
優化器
優化器的作用就是它認為的***的執行方案去執行(雖然有時候也不是***),比如多個索引的時候該如何選擇索引,多表查詢的時候如何選擇關聯順序等。
執行器
當選擇了執行方案后,mysql就準備開始執行了,首先執行前會校驗該用戶有沒有權限,如果沒有權限,就會返回錯誤信息,如果有權限,就會去調用引擎的接口,返回接口執行的結果。
二、語句分析
2.1 查詢語句
說了以上這么多,那么究竟一條sql語句是如何執行的呢?其實我們的sql可以分為兩種,一種是查詢,一種是更新(增加,更新,刪除)。我們先分析下查詢語句,語句如下:
select * from tb_student A where A.age='18' and A.name='張三';
結合上面的說明,我們分析下這個語句的執行流程:
先檢查該語句是否有權限,如果沒有權限,直接返回錯誤信息,如果有權限,在mysql8.0版本以前,會先查詢緩存,以這條sql語句為key在內存中查詢是否有結果,如果有直接緩存,如果沒有,執行下一步。
通過分析器進行詞法分析,提取sql語句的關鍵元素,比如提取上面這個語句是查詢select,提取需要查詢的表名為tb_student,需要查詢所有的列,查詢條件是這個表的id='1'。然后判斷這個sql語句是否有語法錯誤,比如關鍵詞是否正確等等,如果檢查沒問題就執行下一步。
接下來就是優化器進行確定執行方案,上面的sql語句,可以有兩種執行方案:
a.先查詢學生表中姓名為“張三”的學生,然后判斷是否年齡是18。
b.先找出學生中年齡18歲的學生,然后再查詢姓名為“張三”的學生。
那么優化器根據自己的優化算法進行選擇執行效率***的一個方案(優化器認為,有時候不一定***)。那么確認了執行計劃后就準備開始執行了。
進行權限校驗,如果沒有權限就會返回錯誤信息,如果有權限就會調用數據庫引擎接口,返回引擎的執行結果。
2.2 更新語句
以上就是一條查詢sql的執行流程,那么接下來我們看看一條更新語句如何執行的呢?sql語句如下:
update tb_student A set A.age='19' where A.name='張三';
我們來給張三修改下年齡,在實際數據庫肯定不會設置年齡這個字段的,不然要被技術負責人打的。其實條語句也基本上會沿著上一個查詢的流程走,只不過執行更新的時候肯定要記錄日志啦,這就會引入日志模塊了,mysql 自帶的日志模塊式binlog(歸檔日志),所有的存儲引擎都可以使用,我們常用的InnoDB引擎還自帶了一個日志模塊redo log,我們就以InnoDB模式下來探討這個語句的執行流程。流程如下:
先查詢到張三這一條數據,如果有緩存,也是會用到緩存。
然后拿到查詢的語句,把 age 改為19,然后調用引擎API接口,寫入這一行數據,InnoDB引擎把數據保存在內存中,同時記錄redo log,此時redo log進入prepare狀態,然后告訴執行器,執行完成了,隨時可以提交。
執行器收到通知后記錄binlog,然后調用引擎接口,提交redo log 為提交狀態。
更新完成。
這里肯定有同學會問,為什么要用兩個日志模塊,用一個日志模塊不行嗎?這就是之前mysql的模式了,MyISAM引擎是沒有redo log的,那么我們知道它是不支持事務的,所以并不是說只用一個日志模塊不可以,只是InnoDB引擎就是通過redo log來支持事務的。那么,又會有同學問,我用兩個日志模塊,但是不要這么復雜行不行,為什么redo log 要引入prepare預提交狀態?這里我們用反證法來說明下為什么要這么做?
先寫redo log 直接提交,然后寫 binlog,假設寫完redo log 后,機器掛了,binlog日志沒有被寫入,那么機器重啟后,這臺機器會通過redo log恢復數據,但是這個時候bingog并沒有記錄該數據,后續進行機器備份的時候,就會丟失這一條數據,同時主從同步也會丟失這一條數據。
先寫binlog,然后寫redo log,假設寫完了binlog,機器異常重啟了,由于沒有redo log,本機是無法恢復這一條記錄的,但是binlog又有記錄,那么和上面同樣的道理,就會產生數據不一致的情況。
如果采用redo log 兩階段提交的方式就不一樣了,寫完binglog后,然后再提交redo log就會防止出現上述的問題,從而保證了數據的一致性。那么問題來了,有沒有一個極端的情況呢?假設redo log 處于預提交狀態,binglog也已經寫完了,這個時候發生了異常重啟會怎么樣呢?這個就要依賴于mysql的處理機制了,mysql的處理過程如下:
判斷redo log 是否完整,如果判斷是完整的,就立即提交。
如果redo log 只是預提交但不是commit狀態,這個時候就會去判斷binlog是否完整,如果完整就提交 redo log, 不完整就回滾事務。
這樣就解決了數據一致性的問題。
三、總結
Mysql 主要分為Server曾和引擎層,Server層主要包括連接器、查詢緩存、分析器、優化器、執行器,同時還有一個日志模塊(binlog),這個日志模塊所有執行引擎都可以共用。
引擎層是插件式的,目前主要包括,MyISAM,InnoDB,Memory等。
查詢語句的執行流程如下:權限校驗(如果***緩存)---》查詢緩存---》分析器---》優化器---》權限校驗---》執行器---》引擎
更新語句執行流程如下:分析器----》權限校驗----》執行器---》引擎---redo log(prepare 狀態---》binlog---》redo log(commit狀態)
看完上述內容,你們對一條SQL語句在MySQL中是如何執行的有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。