91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Hadoop生態圈以及各組成部分是什么

發布時間:2021-11-23 14:21:50 來源:億速云 閱讀:453 作者:柒染 欄目:大數據

本篇文章給大家分享的是有關Hadoop生態圈以及各組成部分是什么,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

1.Hadoop是什么?

適合大數據的分布式存儲與計算平臺

HDFS: Hadoop Distributed File System分布式文件系統

MapReduce:并行計算框架

2.Hadoop生態圈

Hadoop生態圈以及各組成部分是什么

①HBase

Google Bigtable的開源實現

列式數據庫

可集群化

可以使用shell、web、api等多種方式訪問

適合高讀寫(insert)的場景

HQL查詢語言

NoSQL的典型代表產品

Hadoop生態圈以及各組成部分是什么

②Hive

數據倉庫工具。可以把Hadoop下的原始結構化數據變成Hive中的表

支持一種與SQL幾乎完全相同的語言HiveQL。除了不支持更新、索引和事務,幾乎SQL的其它特征都能支持

可以看成是從SQL到Map-Reduce的映射器

提供shell、JDBC/ODBC、Thrift、Web等接口

Hadoop生態圈以及各組成部分是什么

③Zookeeper

Google Chubby的開源實現

用于協調分布式系統上的各種服務。例如確認消息是否準確到達,防止單點失效,處理負載均衡

應用場景:Hbase,實現Namenode自動切換

工作原理:***,跟隨者以及選舉過程

Hadoop生態圈以及各組成部分是什么

④Sqoop

用于在Hadoop和關系型數據庫之間交換數據

通過JDBC接口連入關系型數據庫

Hadoop生態圈以及各組成部分是什么

⑤Chukwa

架構在Hadoop之上的數據采集與分析框架

主要進行日志采集和分析

通過安裝在收集節點的“代理”采集最原始的日志數據

代理將數據發給收集器

收集器定時將數據寫入Hadoop集群

指定定時啟動的Map-Reduce作業隊數據進行加工處理和分析

Hadoop生態圈以及各組成部分是什么

⑥Pig

Hadoop客戶端

使用類似于SQL的面向數據流的語言Pig Latin

Pig Latin可以完成排序,過濾,求和,聚組,關聯等操作,可以支持自定義函數

Pig自動把Pig Latin映射為Map-Reduce作業上傳到集群運行,減少用戶編寫Java程序的苦惱

Hadoop生態圈以及各組成部分是什么

⑦Avro

數據序列化工具,由Hadoop的創始人Doug Cutting主持開發

用于支持大批量數據交換的應用。支持二進制序列化方式,可以便捷,快速地處理大量數據

動態語言友好,Avro提供的機制使動態語言可以方便地處理 Avro數據。

Thrift接口

⑧Cassandra

NoSQL,分布式的Key-Value型數據庫,由Facebook貢獻

與Hbase類似,也是借鑒Google Bigtable的思想體系

只有順序寫,沒有隨機寫的設計,滿足高負荷情形的性能需求

3.Hadoop生態圈流程圖

Hadoop生態圈以及各組成部分是什么

以上就是Hadoop生態圈以及各組成部分是什么,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

隆化县| 江门市| 盐津县| 诸城市| 商都县| 睢宁县| 正宁县| 子长县| 镇安县| 澄城县| 漯河市| 太康县| 唐河县| 宁河县| 松潘县| 乳山市| 曲周县| 岳池县| 宁晋县| 东阿县| 尚义县| 武义县| 衡东县| 铜川市| 卓资县| 北票市| 镇平县| 应城市| 亚东县| 灵寿县| 隆德县| 邯郸市| 乌恰县| 武宣县| 宜宾市| 小金县| 东台市| 霍州市| 平昌县| 黑龙江省| 邢台市|