91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

hive中order by與distribute by的區別和聯系是什么

發布時間:2021-12-21 17:36:58 來源:億速云 閱讀:222 作者:iii 欄目:開發技術

本篇內容主要講解“hive中order by與distribute by的區別和聯系是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“hive中order by與distribute by的區別和聯系是什么”吧!

order by

order by 會對數據進行全局排序,和oracle和mysql等數據庫中的order by 效果一樣,它只在一個reduce中進行所以數據量特別大的時候效率非常低。

而且當設置 :set hive.mapred.mode=strict的時候不指定limit,執行select會報錯,如下:

LIMIT must also be specified。

sort by

sort by 是單獨在各自的reduce中進行排序,所以并不能保證全局有序,一般和distribute by 一起執行,而且distribute by 要寫在sort by前面。

如果mapred.reduce.tasks=1和order by效果一樣,如果大于1會分成幾個文件輸出每個文件會按照指定的字段排序,而不保證全局有序。

sort by 不受 hive.mapred.mode 是否為strict ,nostrict 的影響。

distribute by

DISTRIBUTE BY 控制map 中的輸出在 reducer 中是如何進行劃分的。使用DISTRIBUTE BY 可以保證相同KEY的記錄被劃分到一個Reduce 中。

cluster by

distribute by 和 sort by 合用就相當于cluster by,但是cluster by 不能指定排序為asc或 desc 的規則,只能是升序排列。

到此,相信大家對“hive中order by與distribute by的區別和聯系是什么”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

沙雅县| 遂川县| 白朗县| 鞍山市| 柘城县| 仪陇县| 永吉县| 桦甸市| 翁牛特旗| 左权县| 武强县| 德钦县| 防城港市| 塔河县| 塔城市| 东安县| 海城市| 灵川县| 苏尼特左旗| 马鞍山市| 赫章县| 三门峡市| 咸阳市| 苍南县| 寿光市| 垣曲县| 慈溪市| 遂川县| 凌云县| 邵阳市| 新安县| 郸城县| 台州市| 涟水县| 阿城市| 阿鲁科尔沁旗| 龙里县| 天峨县| 霍邱县| 沧州市| 达日县|