91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

kafka的多分區watermark機制是怎么樣的

發布時間:2021-12-15 09:31:06 來源:億速云 閱讀:261 作者:柒染 欄目:大數據

今天就跟大家聊聊有關kafka的多分區watermark機制是怎么樣的,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

watermark依賴的背景,可以是:

  1. 事件時間,必須要在事件時間這個概念之上理解watermark。

  2. watermark更形象的理解可以理解為時間序列心跳吧,驅動流進行,而不是延遲時間,比如6s,這個不是watermark。

watermark就像心跳一樣,驅動著流程序基于事件時間進行處理,watermark之所以說類似于序列心跳,是因為它攜帶了時間戳 t。Watermark(t)意味著算子當前的事件時間已經到達了時間 t,任何時間戳小于t的事件都不會再發過來,也即是時間戳小于t的事件就應該丟棄了。

kafka的多分區watermark機制是怎么樣的

上面的可以說是針對單并行度的流,只有一個流水線,怎么著也玩不出彩來。watermark會在每個并行度的source處或者其他算子內部添加,然后繼續向前流動,假如流程序不存在shuffle那就沒啥好說的了,每個單獨的實例單獨進行,這個要想理解要結合前面的一篇文章:

結合Spark講一下Flink的runtime

存在shuffle的話,就是一個算子會存在多個輸入的話,當前事件時間就采用最小的事件時間。

kafka的多分區watermark機制是怎么樣的

kafkasource

kafka作為數據源的時候,假如消費的是多個topic或者多分區,那么由于分區消費是并行進行的,會打破數據在每個分區的數據性,這個是客戶端性質決定的,除非你是一個消費者對應于一個分區。這種情況下,可以使用

Kafka-partition-aware watermark生成器,該生成器會在每個kafka消費者內部,為每個分區生成watermark,最后每個分區的watermark會想Stream shuffle watermark的合并機制一樣合并。

kafka的多分區watermark機制是怎么樣的

代碼示例

FlinkKafkaConsumer09<MyType> kafkaSource = new FlinkKafkaConsumer09<>("myTopic", schema, props);
kafkaSource.assignTimestampsAndWatermarks(new AscendingTimestampExtractor<MyType>() {

   @Override
   public long extractAscendingTimestamp(MyType element) {
       return element.eventTimestamp();
   }
});

DataStream<MyType> stream = env.addSource(kafkaSource);

看完上述內容,你們對kafka的多分區watermark機制是怎么樣的有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

绥宁县| 云和县| 庆云县| 新绛县| 新竹市| 根河市| 阿拉善盟| 盘锦市| 射阳县| 瓦房店市| 高平市| 东港市| 英吉沙县| 谢通门县| 玉山县| 奉新县| 富蕴县| 永德县| 和林格尔县| 雷波县| 游戏| 乳山市| 武定县| 建平县| 蓬莱市| 黄平县| 二手房| 肃宁县| 高青县| 高安市| 嵊泗县| 莱州市| 根河市| 海安县| 和龙市| 民权县| 南平市| 大冶市| 和林格尔县| 汾阳市| 黄浦区|