簡介 ??spark一個最重要的特性就是對數據集在各個節點的分區進行控制。控制數據分布可以減少網絡開銷,極大地提升整體性能。 ??只有Pair RDD才有分區,非Pair RDD分區的值是None。如
億速云公眾號
手機網站二維碼
Copyright ? Yisu Cloud Ltd. All Rights Reserved. 2018 版權所有
廣州億速云計算有限公司粵ICP備17096448號 粵公網安備 44010402001142號增值電信業務經營許可證編號:B1-20181529