您好,登錄后才能下訂單哦!
角色
Client
client的主要作用是提交topology到集群
Worker
Worker是運行在Supervisor節點上的一個獨立的JVM進程,主要作用是運行topology,一個topology可以包含多個worker,但一個worker只能屬于一個topology
Exceutor
在Worker中運行的線程,一個Executor可以對應一個或多個Task,每個Task(Spout或Bolt)必須對應一個Executor。
Task
一個獨立的處理邏輯的實例,每個Spout或Bolt都可以對應多個Task在集群中運行,每個線程對應到一個Executor線程上。
streaminggroup定義了如何從一堆Task發送數據到另外一堆Task上。
Storm集群的啟動、任務提交與執行流程
啟動
客戶運行storm nimbus或storm supervisor時,在storm腳本內部實際對應了兩個python函數,這兩個函數最終會生成一條java命令,用于啟動一個storm的java進程:
java -server xxxx.xxxx.nimbus/supervisor args
1
任務提交
運行storm java xxxx.MainClass name,此時會執行Driver驅動類的main函數
在驅動類中,會調用topologyBuilder.createTopology()方法,該方法會生成spout和bolt的序列化對象
客戶端把topology對應的jar上傳的到nimbus的storm-local/nimbus/inbox目錄下
首先,nimbus會將storm.jar復制到/home/hadoop/storm-local/nimbus/stormdist/wordcount01-2-1525621662目錄下,根據第二步生成的序列化對象生成task的序列化文件和相關配置的序列化文件(wordcount01-2-1525621662為storm生成的一個唯一的topology名稱),此時,nimbus就可以進行任務分配了
-rw-rw-r--. 1 hadoop hadoop 3615 5月 6 23:47 stormcode.ser
-rw-rw-r--. 1 hadoop hadoop 733 5月 6 23:47 stormconf.ser
-rw-rw-r--. 1 hadoop hadoop 3248667 5月 6 23:47 stormjar.jar
1
2
3
接下來進行任務分配,分配完成后會產生一個assegiment對象,該對象會被序列化后保存到zookeeper的/storm/assignments/wordcount01-2-1525621662目錄下
supervisor通過zookeeper的watch機制感知/storm/assignments目錄變化,拉取數據自己的topology(nimbus進行分配時,會指定task所屬的supervisor)
supversior根據拉取到的信息在指定端口上啟動worker,實際上就是執行一條java腳本
java -server xxxxx.xxxx.worker
1
worker啟動后,根據分配的task信息開始執行。
大數據學習交流群 766988146 不管你是小白還是大牛,筆者我都挺歡迎,今天的源碼已經上傳到群文件,不定期分享干貨,
包括我自己整理的一份最新的適合2018年學習的大數據開發和零基礎入門教程,歡迎初學和進階中的小伙伴
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。