91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

hive job sql 優化 之CPU占有過高

發布時間:2020-08-06 07:58:00 來源:網絡 閱讀:2013 作者:r7raul 欄目:大數據

最近有個SQL運行時長超過兩個小時,所以準備優化下

首先查看hive sql 產生job的counter數據發現

總的CPU time spent 過高估計100.4319973小時

hive job sql  優化 之CPU占有過高

 

每個mapCPU time spent

hive job sql  優化 之CPU占有過高

 

排第一的耗了2.0540889小時


建議設置如下參數:

1mapreduce.input.fileinputformat.split.maxsize現在是256000000   往下調增加map數(此招立竿見影,我設為32000000產生了500+的map,最后任務由原先的2小時提速到47分鐘就完成

2、優化UDF  getPageID  getSiteId getPageValue (這幾個方法用了很多正則表達式的文本匹配)

     2.1 正則表達式處理優化可以參考

    http://www.fasterj.com/articles/regex1.shtml

    http://www.fasterj.com/articles/regex2.shtml


     2.2  UDF優化見

1 Also you should use class level privatete members to save on object
 incantation and garbage collection.

2 You also get benefits by matching the args with what you would normally
 expect from upstream. Hive converts text to string when needed, but if the
 data normally coming into the method is text you could try and match the
 argument and see if it is any faster.
 Exapmle:
 優化前:
 >>>> import org.apache.hadoop.hive.ql.exec.UDF;
>>>> import java.net.URLDecoder;
>>>>
>>>> public final class urldecode extends UDF {
>>>>
>>>>    public String evaluate(final String s) {
>>>>        if (s == null) { return null; }
>>>>        return getString(s);
>>>>    }
>>>>
>>>>    public static String getString(String s) {
>>>>        String a;
>>>>        try {
>>>>            a = URLDecoder.decode(s);
>>>>        } catch ( Exception e) {
>>>>            a = "";
>>>>        }
>>>>        return a;
>>>>    }
>>>>
>>>>    public static void main(String args[]) {
>>>>        String t = "%E5%A4%AA%E5%8E%9F-%E4%B8%89%E4%BA%9A";
>>>>        System.out.println( getString(t) );
>>>>    }
>>>> }

優化后:

import java.net.URLDecoder;

public final class urldecode extends UDF {

    private Text t = new Text();

    public Text evaluate(Text s) {
        if (s == null) { return null; }
        try {
            t.set( URLDecoder.decode( s.toString(), "UTF-8" ));
            return t;
        } catch ( Exception e) {
            return null;
        }
    }

    //public static void main(String args[]) {
        //String t = "%E5%A4%AA%E5%8E%9F-%E4%B8%89%E4%BA%9A";
        //System.out.println( getString(t) );
    //}
}
3  繼承實現GenericUDF

3、如果是Hive 0.14 +  可以開啟hive.cache.expr.evaluation  UDF Cache功能


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

安泽县| 班玛县| 家居| 荔波县| 左贡县| 冕宁县| 广安市| 句容市| 普陀区| 资中县| 阿巴嘎旗| 航空| 马尔康县| 南川市| 台中市| 磐安县| 柘城县| 桂平市| 扎兰屯市| 西城区| 高台县| 兰西县| 泰顺县| 永顺县| 漯河市| 扶沟县| 绍兴市| 屏边| 神木县| 德化县| 都昌县| 大足县| 新泰市| 德清县| 西丰县| 康定县| 专栏| 金华市| 涟源市| 兴和县| 长兴县|