在Spark中,DAG(Directed Acyclic Graph)是一個有向無環圖,用來表示Spark作業的執行計劃。DAG中的節點表示數據的轉換操作,而邊表示數據的依賴關系。每個節點代表一個RDD(Resilient Distributed Dataset)操作,例如map、filter、reduce等。DAG是按照操作的依賴關系構建的,以確保每個操作在其所有依賴操作完成后才能執行。Spark引擎會根據DAG來優化和執行作業,以提高作業的性能和效率。
億速云公眾號
手機網站二維碼
Copyright ? Yisu Cloud Ltd. All Rights Reserved. 2018 版權所有
廣州億速云計算有限公司粵ICP備17096448號-1 粵公網安備 44010402001142號增值電信業務經營許可證編號:B1-20181529