91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Uber如何使用Apache Hudi近實時分析全球網絡

發布時間：2021-11-09 18:35:11 來源：億速云閱讀：165 作者：柒染欄目：大數據

這篇文章將為大家詳細講解有關Uber如何使用Apache Hudi近實時分析全球網絡，文章內容質量較高，因此小編分享給大家做個參考，希望大家閱讀完這篇文章后對相關知識有一定的了解。

Uber如何使用Apache Hudi近實時分析全球網絡

Uber業務規模快速增長，覆蓋了60個國家的600個城市，累計10B的訂單。 Uber如何使用Apache Hudi近實時分析全球網絡

并且幾乎都是通過手機App來使用Uber，而100%都依賴于手機網絡，需要近實時的監控網絡的可靠性。

Uber如何使用Apache Hudi近實時分析全球網絡

而無線網絡在各個地方的信號強弱均不一樣。

Uber如何使用Apache Hudi近實時分析全球網絡

并且隨著時間的變化，信號強弱也發生變化；蜂窩網絡質量、網絡格式的變化等等。

Uber如何使用Apache Hudi近實時分析全球網絡

對于網絡性能的挑戰很多，如維度太多，數據量太大等。

Uber如何使用Apache Hudi近實時分析全球網絡

一種不太高效的解決方案是使用批處理重新計算所有數據，但開銷太高（重復讀取數據）、對相同數據的重復計算、計算結果更新太慢。

Uber如何使用Apache Hudi近實時分析全球網絡

使用增量處理，即只處理數據源的更新，增量更新結果，便可更快地計算出結果。

Uber如何使用Apache Hudi近實時分析全球網絡

可使用Apache Hudi進行增量拉取

Uber如何使用Apache Hudi近實時分析全球網絡

對大數據引入了流式處理，只對變化的數據進行增量處理，減少延遲，擴展性更好。

Uber如何使用Apache Hudi近實時分析全球網絡

基于Hudi的實現架構，Hudi會基于統計信息來管理文件，提供不同的視圖供不同的上層應用使用，并且更通用。DB的變化會導入kafka，然后每隔數分鐘使用Hudi（DeltaStreamer）進行消費，然后寫入Hudi數據集，在數據集上提供三種視圖（讀優化視圖、實時視圖、增量視圖）供上層應用使用。

Uber如何使用Apache Hudi近實時分析全球網絡

Hudi在Uber中已經構建了超10PB的數據湖、1000個pipeline/表、每天處理100TB數據。

Uber如何使用Apache Hudi近實時分析全球網絡

Hudi的增量模型使用微批任務（數分鐘），支持upsert（插入更新）結果集，支持增量拉取數據源變化的數據。

Uber如何使用Apache Hudi近實時分析全球網絡

基于Hudi構建的增量pipeline和展示面板

Uber如何使用Apache Hudi近實時分析全球網絡

可使用Spark DataSource API 或者DeltaStreamer來讀取數據源/寫入Hudi數據集。

Uber如何使用Apache Hudi近實時分析全球網絡

構建增量pipeline，用來增量更新網絡指標

Uber如何使用Apache Hudi近實時分析全球網絡

Hudi增量拉取處理后，會合并之前處理的結果

Uber如何使用Apache Hudi近實時分析全球網絡

增量更新指標

Uber如何使用Apache Hudi近實時分析全球網絡

Uber如何使用Apache Hudi近實時分析全球網絡

Uber如何使用Apache Hudi近實時分析全球網絡

Uber如何使用Apache Hudi近實時分析全球網絡

總體的pipeline使用兩階段增量更新，第一階段結果在Sketch表（臨時表），第二階段合并為Summary表（最終結果總表），兩階段都涉及結果的合并。

Uber如何使用Apache Hudi近實時分析全球網絡

Delta sketch和Delta summary均使用Hudi提供的DeltaStreamer實現。

Uber如何使用Apache Hudi近實時分析全球網絡

Hudi在Uber的實踐經驗總結，包括測試、運維、監控

Uber如何使用Apache Hudi近實時分析全球網絡

生產環境的增量pipeline設置

Uber如何使用Apache Hudi近實時分析全球網絡

Uber如何使用Apache Hudi近實時分析全球網絡

pipeline的運行時介紹，每天100GB，批量更新pipeline使用1200core、增量pipeline使用150core。

Uber如何使用Apache Hudi近實時分析全球網絡

關于Uber如何使用Apache Hudi近實時分析全球網絡就分享到這里了，希望以上內容可以對大家有一定的幫助，可以學到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到。

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
如何通過使用 gcc編譯選項快速定位頭文件路徑解決編譯中的問題
下一篇新聞：
Django中的unittest應用是什么

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

乌什县| 汶上县| 六枝特区| 大英县| 鄂托克前旗| 旅游| 平山县| 门头沟区| 通城县| 黔西| 平江县| 广西| 高阳县| 仪征市| 巴楚县| 平阳县| 平陆县| 河津市| 高雄市| 琼中| 齐齐哈尔市| 隆林| 乡城县| 广德县| 公主岭市| 伊春市| 兰溪市| 禹城市| 阿克陶县| 雷波县| 东乡| 阿巴嘎旗| 婺源县| 天等县| 平邑县| 徐州市| 汝南县| 普兰店市| 喀喇| 庐江县| 望奎县|