91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

為什么使用Hive和Impala

發布時間:2020-07-18 16:27:09 來源:網絡 閱讀:1976 作者:caosheng03 欄目:大數據


Impala Hive都是構建在Hadoop之上的數據查詢工具,但是各有不同側重,那么我們為什么要同時使用這兩個工具呢?單獨使用Hive或者Impala不可以嗎?

一、介紹ImpalaHive

1ImpalaHive都是提供對HDFS/Hbase數據進行SQL查詢的工具,Hive會轉換成MapReduce,借助于YARN進行調度從而實現對HDFS的數據的訪問,而Impala直接對HDFS進行數據查詢。但是他們都是提供如下的標準SQL語句,在機身里運行。

為什么使用Hive和Impala

2Apache HiveMapReduce的高級抽象,使用HiveQL,Hive可以生成運行在Hadoop集群的MapReduceSpark作業。Hive最初由Facebook大約在2007年開發,現在是Apache的開源項目。

Apache Impala是高性能的專用SQL引擎,使用Impala SQL,因為Impala無需借助任何的框架,直接實現對數據塊的查詢,所以查詢延遲毫秒級。Impala受到GoogleDremel項目啟發2012年由Cloudera開發,現在是Apache開源項目。

二、ImpalaHive有什么不同?

1Hive有很多的特性:

1、對復雜數據類型(比如arraysmaps)和窗口分析更廣泛的支持

2、高擴展性

3、通常用于批處理

2Impala更快

1、專業的SQL引擎,提供了5x50x更好的性能

2、理想的交互式查詢和數據分析工具

3、更多的特性正在添加進來

三、高級概述:

為什么使用Hive和Impala

四、為什么要使用HiveImpala?

1、為數據分析人員帶來了海量數據分析能力,不需要軟件開發經驗,運用已掌握的SQL知識進行數據的分析。

2、比直接寫MapReduceSpark具有更好的生產力,5HiveQL/Impala SQL等同于200行或更多的Java代碼。

3、提供了與其他系統良好的互操作性,比如通過Java和外部腳本擴展,而且很多商業智能工具支持HiveImpala

五、HiveImpala使用案例

(1)日志文件分析

日志是普遍的數據類型,是當下大數據時代重要的數據源,結構不固定,可以通過Flumekafka將日志采集放到HDFS,然后分析日志的結構,根據日志的分隔符去建立一個表,接下來運用HiveImpala 進行數據的分析。例如:

為什么使用Hive和Impala

(2)情感分析

很多組織使用HiveImpala來分析社交媒體覆蓋情況。例如:

為什么使用Hive和Impala

(3)商業智能

很多領先的BI工具支持HiveImpala

為什么使用Hive和Impala

看了HiveImpala的作用及功效闡述,對于掌握Hadoop數據處理有著重要作用。大家在平常要多去積累和總結經驗,不斷提升技能水平。我自己平時除了總結自己的經驗教訓,還喜歡看別人分享的知識,取長補短,對于完善自己的知識架構有著重要作用。像“CSDN”論壇,“大數據cn”,“大數據時代學習中心”微信服務號都挺不錯,總之,努力汲取多方面知識,我們就會取得更大進步!


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

曲周县| 巴中市| 资中县| 南昌县| 临桂县| 英山县| 达拉特旗| 化隆| 礼泉县| 昭觉县| 柘城县| 安泽县| 陇川县| 望江县| 军事| 桐城市| 大理市| 万荣县| 富顺县| 锡林浩特市| 尼玛县| 申扎县| 游戏| 乌什县| 汉沽区| 松桃| 阿合奇县| 唐海县| 平果县| 昭觉县| 荆州市| 明光市| 侯马市| 临沧市| 秭归县| 新巴尔虎左旗| 永和县| 大埔区| 长乐市| 库尔勒市| 平昌县|