91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何解析Spark集群和任務執行過程

發布時間:2021-12-17 09:23:02 來源:億速云 閱讀:127 作者:柒染 欄目:大數據

本篇文章給大家分享的是有關如何解析Spark集群和任務執行過程,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

Spark集群組件

如何解析Spark集群和任務執行過程  
Spark是典型的Master/Slave架構,集群主要包括以下4個組件:
Driver:Spark框架中的驅動器,運行用戶編寫Application 的main()函數。類比于MapReduce的MRAppmaster
Master:主節點,控制整個集群,監控worker。在Yarn模式中為全局資源管理器
Worker:從節點,負責控制計算節點,啟動Executor。類比Yarn中的節點資源管理器
Executor:運算任務執行器,運行在worker節點上的一個進程。類似于MapReduce中的MapTask和ReduceTask

Spark基本執行流程

以StandAlone運行模式為例:

如何解析Spark集群和任務執行過程


 1.客戶端啟動應用程序及Driver相關工作,向Master提交任務申請資源
2.Master給Worker分配資源,通知worker啟動executor

3.Worker啟動Executor,Worker創建ExecutorRunner線程,ExecutorRunner會啟動ExecutorBackend進程,Executor和Driver進行通信(任務分發監聽等)

4.ExecutorBackend啟動后向Driver的SchedulerBackend注冊,SchedulerBackend將任務提交到Executor上運行
5.所有Stage都完成后作業結束

筆者強調:

  1. Driver端進行的操作

    1. SparkContext構建DAG圖

    2. DAGScheduler將任務劃分為stage、為需要處理的分區生成TaskSet

    3. TaskScheduler進行task下發

    4. SchedulerBackend將任務提交到Executor上運行
  2. 資源劃分的一般規則

    1. 獲取所有worker上的資源

    2. 按照資源大小進行排序

    3. 按照排序后的順序拿取資源

      1. 輪詢

      2. 優先拿資源多的
  3. Spark不同運行模式任務調度器是不同的,如Yarn模式:yarn-cluster模式為YarnClusterScheduler,yarn-client模式為YarnClientClusterScheduler

以上就是如何解析Spark集群和任務執行過程,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

永寿县| 晴隆县| 轮台县| 瑞昌市| 兰州市| 临沂市| 和龙市| 敦化市| 沁水县| 崇文区| 陕西省| 宿松县| 临漳县| 昂仁县| 乌兰浩特市| 拜城县| 绍兴市| 景洪市| 尚义县| 平舆县| 桃园市| 宿迁市| 田东县| 淳化县| 沙坪坝区| 共和县| 高尔夫| 闽清县| 牡丹江市| 金坛市| 舟山市| 南康市| 阿尔山市| 汽车| 河源市| 阳新县| 东城区| 湛江市| 杭锦旗| 资源县| 平定县|