91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

大數據開發生態圈之Apache Hadoop簡介

發布時間:2020-07-07 23:16:54 來源:網絡 閱讀:333 作者:Emmanuel趙 欄目:大數據

大數據開發生態圈之Apache Hadoop簡介

Hadoop概述

Hadoop是一個由Apache基金會所開發的分布式系統基礎架構。
用戶可以在不了解分布式底層細節的情況下,開發分布式程序,充分利用集群的威力進行高速運算和存儲。
Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。HDFS有高容錯性的特點,并且設計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應用程序的數據,適合那些有著超大數據集(large data set)的應用程序。
Hadoop的框架最核心的設計就是:HDFS和MapReduce。HDFS為海量的數據提供了存儲,則MapReduce為海量的數據提供了計算。

分布式存儲

    在分布式存儲系統中,分散在不同節點中的數據可能屬于同一個文件,為了組織眾多的文件,把文件可以放到不同的文件夾中,
文件夾可以一級一級的包含。我們把這種組織形式稱為命名空間(namespace)。命名空間管理著整個服務器集群中的所有文件。

分布式計算

    把一個需要非常巨大的計算能力才能解決的問題分成許多小的部分,然后把這些部分分配給許多計算機進行處理,最后把這些計
算結果綜合起來得到最終的結果。

Hadoop關聯項目

大數據開發生態圈之Apache Hadoop簡介

AmbariTM:基于web能夠提供資源、監控、管理Hadoop集群的操作工具。
AvroTM:數據序列化系統。
HBaseTM:能支持結構化數據大表存儲的可擴展的、分布式的數據庫。
HiveTM:能夠支持數據的匯總和臨時查詢的數據倉庫基礎框架。
MahoutTM:一個可擴展的機器學習和數據挖掘庫。
PigTM:高級數據流語言和并行計算執行框架
SparkTM:一個快速和通用的計算Hadoop數據引擎。
TezTM:一個通用的數據流編程框架。
ZooKeeperTM:一個分布式應用的高性能協調的服務。

Hadoop版本

大數據開發生態圈之Apache Hadoop簡介

大數據開發生態圈之Apache Hadoop簡介

Hadoop的版本大致分為以下:
Apache
官方版本
Cloudera(CDH)
使用下載最多的版本,穩定,有商業支持,在Apache的基礎上打上了一些補丁。推薦使用。
HortonWorks(HDP)
基于Apache的版本進行了集成。
MapR

Hadoop模塊構成

Hadoop2包括4個模塊

Hadoop Common
The common utilities that support the other Hadoop modules.
Hadoop Distributed File System(HDFSTM)
A distributed file system that provides high-throughput access to application data.
Hadoop Yarn
A framework for job scheduling and cluster resource management.
Hadoop MapReduce
A YARN-based system for parallel processing of large data sets.

Hadoop1和Hadoop2簡介

Hadoop1
HDFS:Hadoop Distributed File System 分布式文件系統
MapReduce:分布式計算模型
Hadoop2
HDFS2: Hadoop Distributed File System 分布式文件系統
Yarn:資源管理平臺,在上面運行分布式計算,典型的計算模型有
MapReduce、Storm、Spark等。

大數據開發生態圈之Apache Hadoop簡介

詳細可參考http://hadoop.apache.org

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

万载县| 嘉定区| 长丰县| 阜平县| 高淳县| 北辰区| 宣威市| 营山县| 河津市| 噶尔县| 平湖市| 千阳县| 高密市| 顺平县| 大新县| 马边| 邹城市| 游戏| 盐山县| 桓台县| 南澳县| 盈江县| 和静县| 铁岭市| 佛学| 阳泉市| 苏州市| 卓资县| 松原市| 阿拉善盟| 遵化市| 同仁县| 麻栗坡县| 彭泽县| 七台河市| 定边县| 鱼台县| 海宁市| 白沙| 肇州县| 平远县|