91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

混合數據湖的好處是什么

發布時間:2022-01-15 17:35:06 來源:億速云 閱讀:158 作者:柒染 欄目:大數據

這篇文章主要為大家分析了混合數據湖的好處是什么的相關知識點,內容詳細易懂,操作細節合理,具有一定參考價值。如果感興趣的話,不妨跟著跟隨小編一起來看看,下面跟著小編一起深入學習“混合數據湖的好處是什么”的知識吧。

在存儲大數據時,數據湖和數據倉庫都是既定術語,但是這兩個術語不是同義詞。數據湖是尚未確定用途的大量原始數據。另一方面,數據倉庫是用于特定目的的結構化過濾數據的存儲庫。

共同點

數據倉庫和數據湖代表了一個中央數據庫系統,可以在公司中用于分析目的。該系統從各種異構數據源中提取,收集和保存相關數據,并提供給下游系統。

數據倉庫可以分為四個子過程:

  • 數據獲取:從各種數據存儲庫中獲取和提取數據。

  • 數據存儲:包括長期歸檔在內的數據倉庫中的數據存儲。

  • 數據提供:向下游系統提供所需的數據,提供數據集市。

  • 數據評估:對數據庫存的分析和評估。

差異性

數據倉庫將經典的ETL流程與關系數據庫中的結構化數據結合使用,而數據湖則使用諸如ELT的范式和讀取模式以及經常使用的非結構化數據[2]。

混合數據湖的好處是什么

> Differences Data Warehouse vs. Lake

在上方,您可以看到主要區別。您使用的技術也完全不同。對于數據倉庫,您將使用SQL和關系數據庫,而對于數據湖,您可能將使用NoSQL或兩者的混合。

將兩者結合在混合數據湖中

那么如何將這兩個概念結合起來?在下圖中,您可以從高角度查看架構。

該過程是將非結構化和未轉換的數據加載到數據湖中。從這里,一方面可以將數據用于ML和Data  Science任務。另一方面,數據也可以轉換為結構化形式并加載到數據倉庫中。從這里,可以實現通過數據集市和(自助服務)BI工具進行的經典數據倉庫分發。

混合數據湖的好處是什么

> Hybrid Data Lake Concept — Image from Author

可以用于此體系結構的主要技術例如:

  • 通過talend,Google Dataflow,AWS Data Pipeline進行ELT / ETL流程

  • 通過Data Lake-HDFS,AWS Athena和S3,Google Cloud Storage

  • 數據倉庫通過-Google BigQuery,AWS Redshift,Snowflake

注意:諸如Google的BiqQuery或AWS  Redshift之類的技術通常被視為數據倉庫技術與數據湖技術之間的混合體,因為它們通常已經具有NoSQL的某些特征。

關于“混合數據湖的好處是什么”就介紹到這了,更多相關內容可以搜索億速云以前的文章,希望能夠幫助大家答疑解惑,請多多支持億速云網站!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

富阳市| 杭锦后旗| 侯马市| 武穴市| 洛浦县| 海城市| 太仆寺旗| 泗阳县| 垣曲县| 绍兴市| 大城县| 彩票| 吴桥县| 合江县| 泉州市| 杂多县| 綦江县| 承德市| 合山市| 商洛市| 龙山县| 称多县| 卓资县| 德清县| 茌平县| 资源县| 镇安县| 奉贤区| 古田县| 宁海县| 芦溪县| 太谷县| 阿拉善右旗| 荆门市| 三门县| 虎林市| 晋城| 贡嘎县| 九龙县| 抚州市| 黔西|