91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

GaussDB for DWS是如何識別壞味道的SQL

發布時間:2021-12-21 13:44:23 來源:億速云 閱讀:147 作者:柒染 欄目:大數據

本篇文章為大家展示了GaussDB for DWS是如何識別壞味道的SQL,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

SQL語言是關系型數據庫(RDB)的標準語言,其作用是將使用者的意圖翻譯成數據庫能夠理解的語言來執行。人類之間進行交流時,同樣的意思用不同的措辭會產生不同的效果。

類似地,人類與數據庫交流信息時,同樣的操作用不同的SQL語句來表達,也會導致不同的效率。而有時同樣的SQL語句,數據庫采用不同的方式來執行,效率也會不同。那些會導致執行效率低下的SQL語句及其執行方式,我們稱之為SQL中的“壞味道”。

下面這個簡單的例子,可以說明什么是SQL中的壞味道。

GaussDB for DWS是如何識別壞味道的SQL

圖1-a 用union合并集合

在上面的查詢語句中,由于使用了union來合并兩個結果集,在合并后需要排序和去重,增加了開銷。實際上符合dept_id = 1和dept_id > 2的結果間不會有重疊,所以完全可以用union all來合并,如下圖所示。

GaussDB for DWS是如何識別壞味道的SQL

圖1-b 用union all合并集合

而更高效的做法是用or條件,在掃描的時候直接過濾出所需的結果,不但節省了運算,也節省了保存中間結果所需的內存開銷,如下圖所示。

GaussDB for DWS是如何識別壞味道的SQL

圖1-c 用or條件來過濾結果

可見完成同樣的操作,用不同的SQL語句,效率卻大相徑庭。前兩條SQL語句都不同程度地存在著“壞味道”。

對于這種簡單的例子,用戶可以很容易發現問題并選出最佳方案。但對于一些復雜的SQL語句,其性能缺陷可能很隱蔽,需要深入分析才有可能挖掘出來。這對數據庫的使用者提出了很高的要求。即便是資深的數據庫專家,有時也很難找出性能劣化的原因。

GaussDB在執行SQL語句時,會對其性能表現進行分析和記錄,通過視圖和函數等手段呈現給用戶。本文將簡要介紹如何利用GaussDB提供的這些“第一手”數據,分析和定位SQL語句中存在的性能問題,識別和消除SQL中的“壞味道”。

◆ 識別SQL壞味道之自診斷視圖

GaussDB在執行SQL時,會對執行計劃以及執行過程中的資源消耗進行記錄和分析,如果發現異常情況還會記錄告警信息,用于對原因進行“自診斷”。用戶可以通過下面的視圖查詢這些信息:

? gs_wlm_session_info

? pgxc_wlm_session_info

? gs_wlm_session_history

? pgxc_wlm_session_history

其中gs_wlm_session_info是基本表,其余3個都是視圖。gs_開頭的用于查看當前CN節點上收集的信息,pgxc_開頭的則包含集群中所有CN收集的信息。各表格和視圖的定義基本相同,如下表所示。

GaussDB for DWS是如何識別壞味道的SQL

表1-1 自診斷表格&函數字段定義

GaussDB for DWS是如何識別壞味道的SQL

表1-2 自診斷表格&函數字段定義

其中的query字段就是執行的SQL語句。通過分析每個query對應的各字段,例如執行時間,內存,IO,下盤量和傾斜率等等,可以發現疑似有問題的SQL語句,然后結合query_plan(執行計劃)字段,進一步地加以分析。特別地,對于一些在執行過程中發現的異常情況,warning字段還會以human-readable的形式給出告警信息。目前能夠提供的自診斷信息如下:

◇多列/單列統計信息未收集

優化器依賴于表的統計信息來生成合理的執行計劃。如果沒有及時對表中各列收集統計信息,可能會影響優化器的判斷,從而生成較差的執行計劃。如果生成計劃時發現某個表的單列或多列統計信息未收集,warning字段會給出如下告警信息:

Statistic Not Collect:
schemaname.tablename(column name list)

此外,如果表格的統計信息已收集過(執行過analyze),但是距離上次analyze時間較遠,表格內容發生了很大變化,可能使優化器依賴的統計信息不準,無法生成最優的查詢計劃。針對這種情況,可以用pg_total_autovac_tuples系統函數查詢表格中自從上次分析以來發生變化的元組的數量。如果數量較大,最好執行一下analyze以使優化器獲得最新的統計信息。

◇SQL未下推

執行計劃中的算子,如果能下推到DN節點執行,則只能在CN上執行。因為CN的數量遠小于DN,大量操作堆積在CN上執行,會影響整體性能。如果遇到不能下推的函數或語法,warning字段會給出如下告警信息:

SQL is not plan-shipping, reason : %s

◇Hash連接大表做內表

如果發現在進行Hash連接時使用了大表作為內表,會給出如下告警信息:

PlanNode[%d] Large Table is INNER in HashJoin \"%s\"

目前“大表”的標準是平均每個DN上的行數大于100,000,并且內表行數是外表行數的10倍以上。

◇大表等值連接使用NestLoop

如果發現對大表做等值連接時使用了NestLoop方式,會給出如下告警信息:

PlanNode[%d] Large Table with Equal-Condition use Nestloop\"%s\"

目前大表等值連接的判斷標準是內表和外表中行數最大者大于DN的數量乘以100,000。

◇數據傾斜

數據在DN之間分布不均勻,可導致數據較多的節點成為性能瓶頸。如果發現數據傾斜嚴重,會給出如下告警信息:

PlanNode[%d] DataSkew:\"%s\", min_dn_tuples:%.0f, max_dn_tuples:%.0f

目前數據傾斜的判斷標準是DN中行數最多者是最少者的10倍以上,且最多者大于100,000。

◇代價估算不準確

GaussDB在執行SQL語句過程中會統計實際付出的代價,并與之前估計的代價比較。如果優化器對代價的估算與實際的偏差很大,則很可能生成一個非最優化的計劃。如果發現代價估計不準確,會給出如下告警信息:

"PlanNode[%d] Inaccurate Estimation-Rows: \"%s\" A-Rows:%.0f, E-Rows:%.0f

目前的代價由計劃節點返回行數來衡量,如果平均每個DN上實際/估計返回行數大于100,000,并且二者相差10倍以上,則認定為代價估算不準。

◇Broadcast量過大

Broadcast主要適合小表。對于大表來說,通常采用Hash+重分布(Redistribute)的方式效率更高。如果發現計劃中有大表被廣播的環節,會給出如下告警信息:

PlanNode[%d] Large Table in Broadcast \"%s\"

目前對大表廣播的認定標準為平均廣播到每個DN上的數據行數大于100,000。

◇索引設置不合理

如果對索引的使用不合理,比如應該采用索引掃描的地方卻采用了順序掃描,或者應該采用順序掃描的地方卻采用了索引掃描,可能會導致性能低下。

索引掃描的價值在于減少數據讀取量,因此認為索引掃描過濾掉的行數越多越好。如果采用索引掃描,但輸出行數/掃描總行數>1/1000,并且輸出行數>10000(對于行存表)或>100(對于列存表),則會給出如下告警信息:

PlanNode[%d] Indexscan is not properly used:\"%s\", output:%.0f, filtered:%.0f, rate:%.5f

順序掃描適用于過濾的行數占總行數比例不大的情形。如果采用順序掃描,但輸出行數/掃描總行數<=1/1000,并且輸出行數<=10000(對于行存表)或<=100(對于列存表),則會給出如下告警信息:

PlanNode[%d] Indexscan is ought to be used:\"%s\", output:%.0f, filtered:%.0f, rate:%.5f

◇下盤量過大或過早下盤

SQL語句執行過程中,因為內存不足等原因,可能需要將中間結果的全部或一部分轉儲的磁盤上。下盤可能導致性能低下,應該盡量避免。如果監測到下盤量過大或過早下盤等情況,會給出如下告警信息:

? Spill file size large than 256MB

? Broadcast size large than 100MB

? Early spill

? Spill times is greater than 3

? Spill on memory adaptive

? Hash table conflict

下盤可能是因為緩沖區設置得過小,也可能是因為表的連接順序或連接方式不合理等原因,要結合具體的SQL進行分析。可以通過改寫SQL語句,或者HINT指定連接方式等手段來解決。

使用自診斷視圖功能,需要將以下變量設成合適的值:

▲ use_workload_manager(設成on,默認為on)

▲ enable_resource_check(設成on,默認為on)

▲ resource_track_level(如果設成query,則收集query級別的信息,如果設成operator,則收集所有信息,如果設成none,則以用戶默認的log級別為準)

▲ resource_track_cost(設成合適的正整數。為了不影響性能,只有執行代價大于resource_track_cost語句才會被收集。該值越大,收集的語句越少,對性能影響越小;反之越小,收集的語句越多,對性能的影響越大。)

執行完一條代價大于resource_track_cost后,診斷信息會存放在內存hash表中,可通過pgxc_wlm_session_history或gs_wlm_session_history視圖查看。

視圖中記錄的有效期是3分鐘,過期的記錄會被系統清理。如果設置enable_resource_record=on,視圖中的記錄每隔3分鐘會被轉儲到gs_wlm_session_info表中,因此3分鐘之前的歷史記錄可以通過gs_wlm_session_info表或pgxc_wlm_session_info視圖查看。

◆ 發現正在運行的SQL的壞味道

上一節提到的自診斷視圖可以顯示已完成SQL的信息。如果要查看正在運行的SQL的情況,可以使用下面的視圖:

? gs_wlm_session_statistics

? pgxc_wlm_session_statistics

類似地,gs_開頭的用于查看當前CN節點上收集的信息,pgxc_開頭的則包含集群中所有CN收集的信息。兩個視圖的定義與上一節的自診斷視圖基本相同,使用方法也基本一致。通過觀察其中的字段,可以發現正在運行的SQL中存在的性能問題。

例如,通過“select queryid, duration from gs_wlm_session_statistics order by duration desc limit 10;”可以查詢當前運行的SQL中,已經執行時間最長的10個SQL。如果時間過長,可能有必要分析一下原因。

GaussDB for DWS是如何識別壞味道的SQL

圖2-a 通過gs_wlm_session_statistics視圖發現可能hang住SQL

查到queryid后,可以通過query_plan字段查看該SQL的執行計劃,分析其中可能存在的性能瓶頸和異常點。

GaussDB for DWS是如何識別壞味道的SQL

圖2-b 通過gs_wlm_session_statistics視圖查看當前SQL的執行計劃

再下一步,可以結合等待視圖等其他手段定位性能劣化的原因。

GaussDB for DWS是如何識別壞味道的SQL

圖2-c 通過gs_wlm_session_statistics視圖結合等待視圖定位性能問題

另外,活動視圖pg_stat_activity也能提供一些當前執行SQL的信息。

◆ Top SQL——利用統計信息發現SQL壞味道

除了針對逐條SQL進行分析,還可以利用統計信息發現SQL中的壞味道。另一篇文章“Unique SQL特性原理與應用”中提到的Unique SQL特性,能夠針對執行計劃相同的一類SQL進行了性能統計。與自診斷視圖不同的是,如果同一個SQL被多次執行,或者多個SQL語句的結構相同,只有條件中的常量值不同。這些SQL在Unique SQL視圖中會合并為一條記錄。因此使用Unique SQL視圖能更容易看出那些類型的SQL語句存在性能問題。

利用這一特性,可以找出某一指標或者某一資源占用量最高/最差的那些SQL類型。這樣的SQL被稱為“Top SQL”。例如,查找占用CPU時間最長的SQL語句,可以用如下SQL:

select unique_sql_id,query,cpu_time from pgxc_instr_unique_sql order by cpu_time desc limit 10。

發現SQL中的壞味道是性能調優的前提。GaussDB對數據庫的運行狀況進行了SQL級別的監控和記錄。這些打點記錄的數據可以幫助用戶發現可能存在的異常情況,“嗅”出潛在的壞味道。從這些數據和提示信息出發,結合其他視圖和工具,可以定位出壞味道的來源,進而有針對性地進行優化。

上述內容就是GaussDB for DWS是如何識別壞味道的SQL,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

sql
AI

阿拉善左旗| 大足县| 呼玛县| 万山特区| 宜兴市| 聊城市| 盐边县| 西贡区| 昌宁县| 巴青县| 岑溪市| 东源县| 延津县| 航空| 晋宁县| 连州市| 辛集市| 公主岭市| 泰顺县| 鄂托克前旗| 康保县| 湘潭市| 武乡县| 丹凤县| 海门市| 滨海县| 衡阳县| 宜良县| 灵台县| 屯留县| 寻甸| 宁蒗| 高清| 延吉市| 探索| 犍为县| 静乐县| 南宫市| 盘锦市| 通州区| 庄浪县|