您好,登錄后才能下訂單哦!
這篇文章主要介紹大數據Lambda架構概念及應用的示例分析,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
大數據Lambda架構概念及應用
大數據平臺中包括批量計算的Batch Layer和實時計算的Speed Layer,通過在一套平臺中將批計算和流計算整合在一起。
例如使用HadoopMapReduce、Spark進行批量數據的處理,使用ApacheStorm、Spark Streaming 進行實時數據的處理。
這種架構在一定程度上解決了不同計算類型的問題,但是帶來的問題是框架太多,會導致平臺復雜度過高、運維成功高等。
Lambda架構的主要思想就是將大數據系統構建為多個層次,如下圖所示:
我們來梳理一下他們是如何分工協助的:
首先new data作為整個數據系統的數據源頭,Batch Layer作為數據的批處理層次對原始數據進行加工與處理,并且將處理的數據結果的Batch View輸入到Serving Layer。(這里對應的是全量數據)
Speed Layer對于實時增加的數據進行處理,生成對增量數據計算結果的Real-time View。(這里對應的是增量數據)
最終用戶查詢是通過Batch View與Real-time View相結合的形式將最終結果呈現出來。
基于Lambda架構,一旦數據通過Batch layer進入到Serving layer,在Real-time view中的相應結果就不再需要了。
以上是“大數據Lambda架構概念及應用的示例分析”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。