91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Hadoop生態系統的存儲格式CarbonData性能分析

發布時間:2021-12-10 13:44:03 來源:億速云 閱讀:172 作者:iii 欄目:大數據

本篇內容主要講解“Hadoop生態系統的存儲格式CarbonData性能分析”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Hadoop生態系統的存儲格式CarbonData性能分析”吧!

 一、評測環境

1)網絡拓撲圖

Hadoop生態系統的存儲格式CarbonData性能分析

2)配置參數

服務器配置

Hadoop生態系統的存儲格式CarbonData性能分析

二、性能對比
目前主流hadoop的文件存儲格式有行存儲的CSV格式,列式存儲的ORC和Parquet等。本章給出的是Parquet+Spark和CarbonData+Spark在過濾查詢場景和聚合計算場景的性能測試結果。

1)測試數據

創建沈陽社保的數據倉庫,導入、集成1年的測試數據,如下表:

Hadoop生態系統的存儲格式CarbonData性能分析

生成CarbonData格式文件,如下表:

Hadoop生態系統的存儲格式CarbonData性能分析

2)過濾查詢場景測試
Hadoop生態系統的存儲格式CarbonData性能分析

Hadoop生態系統的存儲格式CarbonData性能分析

Parquet和CarbonData在過濾查詢場景下的性能對比

3)聚合計算場景測試

Parquet和CarbonData在聚合計算場景下的性能對比

4)總結分析

在過濾查詢中,CarbonData的查詢效率比parquet效率好,主要體現在列數據的索引查詢,極大地提高了精確查詢的性能。在聚合查詢中,CarbonData通過使用全局字典編碼來加快計算速度,這使得處理、查詢引擎可以直接在編碼好的數據上進行處理而不需要轉換數據,數據只有在返回結果給用戶的時候才轉換成用戶可讀的形式,通過索引有效過濾文件數據塊減少磁盤的IO,提高查詢性能。

Hadoop生態系統的存儲格式CarbonData性能分析

到此,相信大家對“Hadoop生態系統的存儲格式CarbonData性能分析”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

大竹县| 龙陵县| 株洲县| 万全县| 临沂市| 涪陵区| 河池市| 永城市| 蒙阴县| 乌拉特后旗| 彩票| 察雅县| 高要市| 牙克石市| 大同市| 新宁县| 太谷县| 公安县| 庆阳市| 安丘市| 新民市| 新津县| 石景山区| 巫山县| 龙里县| 延边| 宜兰县| 白城市| 利川市| 石屏县| 金阳县| 贵州省| 余干县| 玉环县| 大安市| 宁晋县| 巩留县| 洛川县| 玉林市| 五河县| 芒康县|