您好,登錄后才能下訂單哦!
小編給大家分享一下centos6.4 32/64位機中如何安裝hadoop2.2.0集群,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
1、準備環境
安裝VMware10 ,三臺centos6.4 版本,安裝在VMware虛擬機下。
1)安裝中文輸入法:
1、需要root權限,所以要用root登錄 ,或su root
2、yum install "@Chinese Support"
2)安裝ssh或者vsftp
使用chkconfig --list來查看是否裝有vsftpd服務;
使用yum命令直接安裝: yum install vsftpd
查看與管理ftp服務:
啟動ftp服務:service vsftpd start
查看ftp服務狀態:service vsftpd status
重啟ftp服務:service vsftpd restart
關閉ftp服務:service vsftpd stop
3)jdk安裝
參考http://my.oschina.net/kt431128/blog/269262
2、修改主機名
本人安裝一個虛擬機,然后通過虛擬機-》管理-》克隆 完成其他兩臺機器的安裝,現在存在的一個問題就是主機名是一樣的,這個明顯不是自己想要的,所以需要修改其余兩臺的主機名。
[root@slaver2 sysconfig]# vi /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=slaver
3、配置/ect/hosts,三臺服務器的配置一樣
vi /etc/hosts
192.168.21.128 master
192.168.21.131 slaver
192.168.21.130 slaver2
4、創建用戶(使用root用戶創建后來發現Browse the filesystem 報錯,后來查文檔,建議使用新建的用戶)
useradd hadoop
passwd hadoop
輸入密碼,確認
5、ssh無密碼登錄
參考:http://my.oschina.net/kt431128/blog/269266
6、HADOOP的下載和環境的配置
http://mirror.esocc.com/apache/hadoop/common/hadoop-2.2.0/
[ ] hadoop-2.2.0.tar.gz 07-Oct-2013 14:46 104M
hadoop環境變量的配置:
vi/etc/profile
在文件的最下面添加
export HADOOP_HOME=/usr/zkt/hadoop2.2.0/hadoop-2.2.0
export PAHT=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_LOG_DIR=/usr/zkt/hadoop2.2.0/hadoop-2.2.0/logs
export YARN_LOG_DIR=$HADOOP_LOG_DIR
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"
注:在64位操作系統上需要加入一下紅色部分的配置信息
網上看到的另一種解決辦法:
在使用./sbin/start-dfs.sh或./sbin/start-all.sh啟動時會報出這樣如下警告:
Java HotSpot(TM) 64-Bit Server VM warning: You have loaded library /usr/local/hadoop-2.2.0/lib/native/libhadoop.so.1.0.0 which might have disabled stack guard. The VM will try to fix the stack guard now.
....
Java: ssh: Could not resolve hostname Java: Name or service not known
HotSpot(TM): ssh: Could not resolve hostname HotSpot(TM): Name or service not known
64-Bit: ssh: Could not resolve hostname 64-Bit: Name or service not known
....
這個問題的錯誤原因會發生在64位的操作系統上,原因是從官方下載的hadoop使用的本地庫文件(例如lib/native/libhadoop.so.1.0.0)都是基于32位編譯的,運行在64位系統上就會出現上述錯誤。
解決方法之一是在64位系統上重新編譯hadoop,另一種方法是在hadoop-env.sh和yarn-env.sh中添加如下兩行:
export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_HOME}/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"
注:/usr/zkt/hadoop2.2.0/hadoop-2.2.0為自定義的下載hadoop文件的解壓路徑
7、修改hadoop的配置文件hadoop2.2.0/etc/hadoop
1、修改hadoop-env.sh 、yarn-env.sh 確保hadoop運行所需要的java環境
# The java implementation to use.
export JAVA_HOME=/usr/java/jdk1.7.0_55
2、修改core-site.xml文件 定義文件系統的配置
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000/</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/zkt/hadoop2.2.0/tmp</value>
</property>
</configuration>
3、修改hadfs-site.xml 定義名稱節點和數據節點
<configuration>
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/zkt/hadoop2.2.0/hdf/data</value>
<final>true</final>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/zkt/hadoop2.2.0/hdf/name</value>
<final>true</final>
</property>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>
4、修改mapred-site.xml Configurations for MapReduce Applications
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>master:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>master:19888</value>
</property>
5、修改yarn-site.xml文件
該文件主要用于:
1、Configurations for ResourceManager and NodeManager:
2、Configurations for ResourceManager:
3、Configurations for NodeManager:
4、Configurations for History Server (Needs to be moved elsewhere):
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>master:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master:8030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>master:8033</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master:8088</value>
</property>
8、創建第7步配置文件中多出的文件夾
data tmp name log mkdir -r /usr/zkt/hadoop2.2.0/hdf/data 等
9、為這些文件夾賦權限 比較關鍵 不然文件生成的時候無文件創建、寫權限
su - root
chown -R hadoop:hadoop /usr/zkt/hadoop2.2.0 (不明白的可以查看chown命令)
或者切換到hadoop用戶下 通過chmod -R 777 data 賦權限
10、將配置好的hadoop分別拷貝到 slaver 和slaver2主機上
scp -r /usr/zkt/hadoop2.2.0/hadoop-2.2.0 hadoop@slaver:/usr/zkt/hadoop2.2.0/
scp -r /usr/zkt/hadoop2.2.0/hadoop-2.2.0 hadoop@slaver2:/usr/zkt/hadoop2.2.0/
11、hadoop namenode的初始化
如果 hadoop環境變量配置沒問題直接使用
hdfs namenode -format
hadoop command not found 解決辦法:
echo $PATH
發現hadoop的環境變量是:/home/hadoop/bin 而不是我們配置的環境變量,我們需要把hadoop-2.2.0包下的bin、sbin文件夾拷貝到/home/hadoop/下,再次echo $PATH,發現可以了。
12、關閉防火墻 三臺服務器的防火墻都需要關閉
查看iptables狀態:
service iptables status
iptables開機自動啟動:
開啟: chkconfig iptables on
關閉: chkconfig iptables off
iptables關閉服務:
開啟: service iptables start
關閉: service iptables stop
13、啟動hadoop
start-all.sh
關閉hadoop
stop-all.sh
14、查看啟動的節點進程
jps
15、查看啟動后的服務信息
master中應該有ResourceManager服務,slave中應該有nodemanager服務
查看集群狀態:./bin/hdfs dfsadmin –report
查看文件塊組成: ./bin/hdfsfsck / -files -blocks
查看各節點狀態: http://master:50070
看完了這篇文章,相信你對“centos6.4 32/64位機中如何安裝hadoop2.2.0集群”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。