91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Hive中如何實現分桶表

發布時間:2022-03-11 13:51:38 來源:億速云 閱讀:229 作者:小新 欄目:編程語言

這篇文章將為大家詳細講解有關Hive中如何實現分桶表,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

分桶表

通常,當很難在列上創建分區時,我們會使用分桶,比如某個經常被篩選的字段,如果將其作為分區字段,會造成大量的分區。在Hive中,會對分桶字段進行哈希,從而提供了中額外的數據結構,進行提升查詢效率。

與分區表類似,分桶表的組織方式是將HDFS上的文件分割成多個文件。分桶可以加快數據采樣,也可以提升join的性能(join的字段是分桶字段),因為分桶可以確保某個key對應的數據在一個特定的桶內(文件),所以巧妙地選擇分桶字段可以大幅度提升join的性能。通常情況下,分桶字段可以選擇經常用在過濾操作或者join操作的字段。

我們可以使用set.hive.enforce.bucketing = true啟用分桶設置。

當使用分桶表時,最好將bucketmapjoin標志設置為true,具體配置參數為:

SET hive.optimize.bucketmapjoin = true

CREATE TABLE table_name 
PARTITIONED BY (partition1 data_type, partition2 data_type,….) CLUSTERED BY (column_name1, column_name2, …) 
SORTED BY (column_name [ASC|DESC], …)] 
INTO num_buckets BUCKETS;

關于“Hive中如何實現分桶表”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

永昌县| 临沂市| 苗栗市| 小金县| 盐城市| 溆浦县| 利川市| 炉霍县| 万年县| 永泰县| 故城县| 阜新| 三穗县| 株洲市| 东至县| 伊春市| 日喀则市| 丹寨县| 奉化市| 崇左市| 乌拉特中旗| 卓尼县| 肇州县| 东平县| 德格县| 隆尧县| 普陀区| 南城县| 监利县| 荆门市| 齐河县| 通许县| 遵义市| 孝昌县| 正阳县| 汝州市| 全南县| 宁津县| 深州市| 阿合奇县| 家居|