91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

大數據流處理中Flume、Kafka和NiFi的對比是怎樣的

發布時間:2021-12-15 16:08:58 來源:億速云 閱讀:385 作者:柒染 欄目:大數據

今天就跟大家聊聊有關大數據流處理中Flume、Kafka和NiFi的對比是怎樣的,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

我們將簡要介紹三種Apache處理工具:Flume、Kafka和Nifi。這三款產品性能優異,可橫向伸縮,并提供插件機制,可通過定制組件進行擴展。

Apache Flume

Flume部署由一個或多個使用拓撲配置的代理組成。Flume代理是一個JVM進程,它承載Flume拓撲的基本構建塊,即源、通道和接收器。Flume客戶機將事件發送到源,然后將它們成批地放在名為channel的臨時緩沖區中,數據從該緩沖區流向連接到數據最終目的地的接收器。接收器也可以是其他Flume代理程序的后續數據源。代理可以鏈接,并且每個代理都有多個源、通道和接收器。

Flume是一個分布式系統,可用于收集、聚合流事件并將其傳輸到Hadoop中。它有許多內置的源、通道和接收器,例如Kafka通道和Avro接收器。Flume是基于配置的,它有攔截器來對通道中的數據執行簡單的轉換。

如果不小心,使用Flume很容易丟失數據。例如,為高吞吐量選擇內存通道有一個缺點,即當代理節點關閉時,數據將丟失。文件通道將以增加延遲為代價提供持久性。即使如此,由于數據沒有復制到其他節點,因此文件通道僅與底層磁盤一樣的可靠性。Flume通過多跳/扇入扇出流提供了可伸縮性。對于高可用性(HA),可以水平擴展代理。

Apache Kafka

Kafka是一種分布式高吞吐量消息總線,可將數據生成者與消費者分開。消息按主題組織,主題分為多個分區,分區在群集中的節點之間復制(稱為代理)。與Flume相比,Kafka具有更好的可擴展性和消息持久性。 Kafka現在有兩種樣式:一種是“經典”生產者/消費者模型,另一種是新的Kafka-Connect,它為外部數據存儲提供可配置的連接器(源/接收器)。

kafka可以用于大型軟件系統組件之間的事件處理和集成,此外,kafka附帶kafka流,它可以用于簡單的流處理,而不需要單獨的集群,如apache spark或apacheFlink。

由于消息被持久化在磁盤上,并且在集群中被復制,因此數據丟失情況不像Flume那樣常見。也就是說,無論是使用Kafka客戶端還是通過Connect API,生產者/來源和消費者/接收器通常都需要自定義編碼。與Flume一樣,消息大小也有限制。最后,為了能夠進行通信,Kafka的生產者和消費者必須就協議、格式和架構達成一致,這在某些情況下可能會有問題。

Apache NiFi

與Flume和Kafka不同,NIFI可以處理任何大小的消息。在基于Web的拖放用戶界面后面,NIFI在集群中運行,并提供實時控制,以便您可以輕松地管理任何源和任何目標之間的數據移動。它支持不同格式、模式、協議、速度和大小的分散和分布式源。

NiFi可以用于具有嚴格安全性和合規性要求的關鍵任務數據流中,在那里我們可以可視化整個過程并實時進行更改。在撰寫本文時,它有近200個隨時可用的處理器(包括Flume和Kafka處理器),可以進行拖放、配置和立即投入使用。NiFi的一些關鍵特性是優先級排隊、數據跟蹤和每個連接的背壓閾值配置。

雖然NiFi用于創建容錯生產管道,但它不會復制像Kafka這樣的數據。如果節點發生故障,則可以將流定向到另一個節點,但排隊等待故障節點的數據必須等待節點恢復。 NiFi不是一個成熟的ETL工具,不適合復雜的計算和事件處理(CEP)。要做到這一點,它應該連接到流式框架,如Apache Flink,Spark Streaming或Storm。

組合

沒有工具符合您的所有要求。組合以更好的方式執行不同操作的工具可以增強功能并增加處理更多場景的靈活性。根據您的需求,NiFi和Flume可以充當Kafka生產商或消費者。

Flume-Kafka集成非常受歡迎,它有自己的名字:Flafka(我不是這樣做的)。Flafka包括Kafka源,Kafka通道和Kafka池。結合Flume和Kafka,Kafka可以避免自定義編碼并利用Flume經過實戰考驗的資源和接收器,通過Kafka通道的Flume事件將在Kafka代理中進行存儲和復制,以實現彈性。

組合工具可能看起來很浪費,因為它似乎在功能上重疊。例如,NiFi和Kafka都提供代理商來連接生產者和消費者。但是,它們的表現不同:在NiFi中,大多數數據流邏輯不在生產者/消費者中,而是在代理中,允許集中控制。 NiFi是為了做一件重要的事情而構建的:數據流管理。通過兩種工具的結合,NiFi可以充分利用Kafka可靠的流數據存儲,同時解決Kafka無法解決的數據流挑戰。

看完上述內容,你們對大數據流處理中Flume、Kafka和NiFi的對比是怎樣的有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

阜阳市| 嵊州市| 紫阳县| 万山特区| 喀喇沁旗| 伊宁市| 环江| 富蕴县| 阿坝| 保山市| 三门峡市| 曲沃县| 广河县| 郓城县| 乐陵市| 达日县| 阿荣旗| 曲水县| 长海县| 昌邑市| 虎林市| 枣阳市| 武功县| 石景山区| 广水市| 怀安县| 逊克县| 南漳县| 改则县| 水城县| 荥经县| 当雄县| 罗平县| 信宜市| 佳木斯市| 时尚| 永平县| 东至县| 丰原市| 龙山县| 彰武县|