在Apache Storm中,數據流劃分有以下幾種策略:
隨機分組(Random Grouping):隨機將數據流中的元組發送到下游的任務中,沒有特定的規律。
字段分組(Fields Grouping):根據元組中指定的字段進行分組,相同字段值的元組將被發送到同一個任務中。
散列分組(Shuffle Grouping):根據元組的散列值將元組發送到下游任務中,保證相同的元組會被發送到同一個任務中。
全部分組(All Grouping):將所有的元組都發送到所有的下游任務中。
全局分組(Global Grouping):將所有的元組發送到一個下游任務中,保證所有的元組都發送到同一個任務中。
本地分組(Local or Partial Key Grouping):根據元組中的某個字段進行分組,但是只在本地的工作進程中進行分組,不跨越工作進程。
分區分組(Partition Grouping):根據元組中的某個字段進行分組,但是只發送到指定的分區中。
自定義分組(Custom Grouping):根據自定義的分組策略將元組發送到下游任務中。