您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關如何掌握Hive架構,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
Hive是建立在Hadoop上的數據倉庫基礎構架,它提供了一系列的工具,可以用來進行數據提取轉化加載,這是一種可以存儲、查詢和分析存儲在Hadoop中的大規模數據的機制。Hive定義了簡單的類 SQL 查詢語言,它允許熟悉SQL的用戶查詢數據。因此掌握Hive是學習大數據的必修課,那么掌握Hive架構需要學什么呢?本文將為大家講述Hive的具體學習內容,下面是Hive視頻教程的學習大綱:
第一章 數據管理與數據倉庫
1. 數據分析系統不同數據來源
2. 數據管理--文件管理服務&跨部門文件管理規范
3. 數據管理--文件管理規范示例
4. 數據管理--數據質量檢測
5. 數據倉庫--基本概念&和數據庫區別
6. 數據倉庫--數據倉庫主要特征
7. 數據倉庫--數據倉庫分層架構
8. 數據倉庫--數據倉庫元數據管理
第二章 Apache Hive介紹及安裝部署
1. 介紹&Hive實現思路模擬
2. 架構&組件
3. 與RDBMS區別
4. 安裝部署--內置derby版以及缺陷
5. 安裝部署-mysql版安裝
6. 安裝部署-幾種交互方式
7. 初體驗-理解什么是映射
第三章 Apache Hive—DDL
1. DDL--創建表--數據類型&分隔符
2. DDL--創建表--默認分隔符
3. DDL--創建表--分區表創建
4. DDL--創建表--雙分區表&小結
5. DDL--創建表--分桶表創建&分桶數據導入
6. DDL--創建表--分桶表總結&分桶表好處
7. DDL--創建表--內外部表&like復制
8. DDL--修改表&顯示命令
第四章 Apache Hive—DML
1. DML--load裝載數據
2. DML--insert&多重插入&動態分區
3. DML--導出數據
4. DML--select查詢
第五章 Apache Hive—函數及其他操作
1. join操作
2. 命令行&參數配置方式
3. 內置運算符函數&dual測試方式
4. 自定義函數UDF開發
5. 了解transform
6. 特殊分隔符處理
看完上述內容,你們對如何掌握Hive架構有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。