91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Kafka集群消息積壓問題及怎么樣處理

發布時間:2021-12-15 10:56:47 來源:億速云 閱讀:739 作者:柒染 欄目:大數據

今天就跟大家聊聊有關Kafka集群消息積壓問題及怎么樣處理,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

通常情況下,企業中會采取輪詢或者隨機的方式,通過Kafka的producer向Kafka集群生產數據,來盡可能保證Kafk分區之間的數據是均勻分布的。

在分區數據均勻分布的前提下,如果我們針對要處理的topic數據量等因素,設計出合理的Kafka分區數量。對于一些實時任務,比如Spark Streaming/Structured-Streaming、Flink和Kafka集成的應用,消費端不存在長時間"掛掉"的情況即數據一直在持續被消費,那么一般不會產生Kafka數據積壓的情況。

但是這些都是有前提的,當一些意外或者不合理的分區數設置情況的發生,積壓問題就不可避免。

Kafka消息積壓的典型場景:

1.實時/消費任務掛掉  

比如,我們寫的實時應用因為某種原因掛掉了,并且這個任務沒有被監控程序監控發現通知相關負責人,負責人又沒有寫自動拉起任務的腳本進行重啟。

那么在我們重新啟動這個實時應用進行消費之前,這段時間的消息就會被滯后處理,如果數據量很大,可就不是簡單重啟應用直接消費就能解決的。
2.Kafka分區數設置的不合理(太少)和消費者"消費能力"不足  

Kafka單分區生產消息的速度qps通常很高,如果消費者因為某些原因(比如受業務邏輯復雜度影響,消費時間會有所不同),就會出現消費滯后的情況。

此外,Kafka分區數是Kafka并行度調優的最小單元,如果Kafka分區數設置的太少,會影響Kafka consumer消費的吞吐量。
3.Kafka消息的key不均勻,導致分區間數據不均衡  
在使用Kafka producer消息時,可以為消息指定key,但是要求key要均勻,否則會出現Kafka分區間數據不均衡。

那么,針對上述的情況,有什么好的辦法處理數據積壓呢?

一般情況下,針對性的解決辦法有以下幾種:

1.實時/消費任務掛掉導致的消費滯后  

a.任務重新啟動后直接消費最新的消息,對于"滯后"的歷史數據采用離線程序進行"補漏"。

此外,建議將任務納入監控體系,當任務出現問題時,及時通知相關負責人處理。當然任務重啟腳本也是要有的,還要求實時框架異常處理能力要強,避免數據不規范導致的不能重新拉起任務。

b.任務啟動從上次提交offset處開始消費處理

如果積壓的數據量很大,需要增加任務的處理能力,比如增加資源,讓任務能盡可能的快速消費處理,并趕上消費最新的消息
2.Kafka分區少了
如果數據量很大,合理的增加Kafka分區數是關鍵。如果利用的是Spark流和Kafka direct approach方式,也可以對KafkaRDD進行repartition重分區,增加并行度處理。
3.由于Kafka消息key設置的不合理,導致分區數據不均衡  
可以在Kafka producer處,給key加隨機后綴,使其均衡。

看完上述內容,你們對Kafka集群消息積壓問題及怎么樣處理有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

建阳市| 茶陵县| 开平市| 满城县| 荃湾区| 米林县| 邯郸县| 文安县| 祥云县| 资源县| 高淳县| 西畴县| 平远县| 景东| 梅州市| 穆棱市| 东乡| 江西省| 台东县| 宾阳县| 九江县| 兰州市| 汉川市| 施秉县| 瓮安县| 丰台区| 平山县| 晋城| 河北省| 五寨县| 科技| 阿拉尔市| 隆德县| 会理县| 广德县| 镇江市| 青铜峡市| 金塔县| 平南县| 滁州市| 库尔勒市|