91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

hive sql 優化 數據傾斜

發布時間:2020-06-27 15:56:36 來源:網絡 閱讀:1248 作者:r7raul 欄目:大數據


 

此腳本運行速度慢,主要是reduce端數據傾斜導致的,了解到dw.fct_traffic_navpage_path_detl表是用來收集用戶點擊數據的,那么最終

購物車和下單的點擊肯定極少,所以此表ordr_code字段為空和cart_prod_id字段為NULL的數據量極大,如下所示:

select ordr_code,count(*) as a from dw.fct_traffic_navpage_path_detl  where ds = '2015-05-10'  group by ordr_code having a>10000 ;

        151722135

select cart_prod_id,count(*) as a fromdw.fct_traffic_navpage_path_detl   where ds = '2015-05-10'  groupby cart_prod_id having a>10000 ;

NULL    127233335

 

對于create table tmp_lifan_trfc_tpa as 這句SQLBI加上如下配置,

 

set hive.mapjoin.smalltable.filesize = 120000000; //因為 dw.univ_parnt_tranx_comb_detl表最大不超過120MB,如果是hive on tez要用hive.auto.convert.join.noconditionaltask.size ,這樣tez會生成BROADCAST

sethive.auto.convert.join=true;

同時修改SQL如下語句:

from dw.fct_traffic_navpage_path_detl t

  left outer join dw.univ_parnt_tranx_comb_detl o //用mapjoin解決數據傾斜

    on t.ordr_code = o.parnt_ordr_code

   and t.cart_prod_id = o.comb_prod_id

   and o.ds = '2015-05-10'

  left outer join bic.cust_first_ordr_tranx f

    on case when o.end_user_id is null then cast(rand(9)*100as bigint)  else o.end_user_id end = f.end_user_id  //join后數傾斜用隨機數避免傾斜 ,紅色為修改部分

   and f.first_ordr_date_id = '2015-05-10'

where t.ds = '2015-05-10';

運行后SQL可以在可控時間內完成。


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

沂水县| 新昌县| 顺平县| 雷州市| 历史| 水富县| 夏津县| 奉贤区| 固原市| 商河县| 赣榆县| 洱源县| 会昌县| 米泉市| 佳木斯市| 台北县| 石城县| 永胜县| 黄大仙区| 浙江省| 米易县| 泾川县| 岫岩| 基隆市| 孟村| 师宗县| 蓬溪县| 自贡市| 扶沟县| 友谊县| 玛沁县| 加查县| 石棉县| 光泽县| 宽甸| 汉中市| 民县| 兴海县| 保靖县| 黔西| 吴江市|