91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python搭建Spark分布式集群環境

發布時間:2020-09-07 19:17:14 來源:腳本之家 閱讀:185 作者:E-iceblue 欄目:開發技術

前言

Apache Spark 是一個新興的大數據處理通用引擎,提供了分布式的內存抽象。Spark 最大的特點就是快,可比 Hadoop MapReduce 的處理速度快 100 倍。本文沒有使用一臺電腦上構建多個虛擬機的方法來模擬集群,而是使用三臺電腦來搭建一個小型分布式集群環境安裝。

本教程采用Spark2.0以上版本(比如Spark2.0.2、Spark2.1.0等)搭建集群,同樣適用于搭建Spark1.6.2集群。

安裝Hadoop并搭建好Hadoop集群環境

Spark分布式集群的安裝環境,需要事先配置好Hadoop的分布式集群環境。

安裝Spark

這里采用3臺機器(節點)作為實例來演示如何搭建Spark集群,其中1臺機器(節點)作為Master節點,另外兩臺機器(節點)作為Slave節點(即作為Worker節點),主機名分別為Slave01和Slave02。

在Master節點機器上,訪問Spark官方下載地址,按照如下圖下載。

Python搭建Spark分布式集群環境

下載完成后,執行如下命令:

sudo tar -zxf ~/下載/spark-2.0.2-bin-without-hadoop.tgz -C /usr/local/
cd /usr/local
sudo mv ./spark-2.0.2-bin-without-hadoop/ ./spark
sudo chown -R hadoop ./spark

配置環境變量

在Mster節點主機的終端中執行如下命令:

vim ~/.bashrc

在.bashrc添加如下配置:

export SPARK_HOME=/usr/local/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

執行如下命令使得配置立即生效:

source ~/.bashrc

Spark配置

在Master節點主機上進行如下操作:

配置slaves文件

將 slaves.template 拷貝到 slaves

cd /usr/local/spark/
cp ./conf/slaves.template ./conf/slaves

slaves文件設置Worker節點。編輯slaves內容,把默認內容localhost替換成如下內容:

slave01
slave02

配置spark-env.sh文件

將 spark-env.sh.template 拷貝到 spark-env.sh

cp ./conf/spark-env.sh.template ./conf/spark-env.sh

編輯spark-env.sh,添加如下內容:

export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)
export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop
export SPARK_MASTER_IP=192.168.1.104

SPARK_MASTER_IP 指定 Spark 集群 Master 節點的 IP 地址;

配置好后,將Master主機上的/usr/local/spark文件夾復制到各個節點上。在Master主機上執行如下命令:

cd /usr/local/
tar -zcf ~/spark.master.tar.gz ./spark
cd ~
scp ./spark.master.tar.gz slave01:/home/hadoop
scp ./spark.master.tar.gz slave02:/home/hadoop

在slave01,slave02節點上分別執行下面同樣的操作:

sudo rm -rf /usr/local/spark/
sudo tar -zxf ~/spark.master.tar.gz -C /usr/local
sudo chown -R hadoop /usr/local/spark

啟動Spark集群

啟動Hadoop集群

啟動Spark集群前,要先啟動Hadoop集群。在Master節點主機上運行如下命令:

cd /usr/local/hadoop/
sbin/start-all.sh

啟動Spark集群

1.啟動Master節點

在Master節點主機上運行如下命令:

cd /usr/local/spark/
sbin/start-master.sh

在Master節點上運行jps命令,可以看到多了個Master進程:

15093 Jps
14343 SecondaryNameNode
14121 NameNode
14891 Master
14509 ResourceManager

2.啟動所有Slave節點

在Master節點主機上運行如下命令:

sbin/start-slaves.sh

分別在slave01、slave02節點上運行jps命令,可以看到多了個Worker進程

37553 DataNode
37684 NodeManager
37876 Worker
37924 Jps

3.在瀏覽器上查看Spark獨立集群管理器的集群信息

在master主機上打開瀏覽器,訪問http://master:8080,如下圖:

Python搭建Spark分布式集群環境

關閉Spark集群

1.關閉Master節點

sbin/stop-master.sh

2.關閉Worker節點

sbin/stop-slaves.sh

3.關閉Hadoop集群

cd /usr/local/hadoop/
sbin/stop-all.sh

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

喀什市| 宣武区| 沅陵县| 永安市| 厦门市| 新安县| 东丰县| 青浦区| 云林县| 枞阳县| 邢台市| 连平县| 肇庆市| 都匀市| 清流县| 高台县| 青冈县| 垦利县| 天峨县| 环江| 黄骅市| 隆回县| 夏河县| 穆棱市| 台山市| 攀枝花市| 张北县| 霍州市| 黎川县| 平顶山市| 宜宾县| 江达县| 仁寿县| 贵港市| 海阳市| 肥东县| 滦南县| 丹巴县| 庄河市| 渝北区| 苏尼特左旗|