集群时间同步
如果集群节点时间不同步,可能会出现节点宕机或引发其它异常问题,所以在生产环境中一般通过配置NTP服务器实现集群时间同步。本集群在master节点设置ntp服务器
集群其它节点通过执行crontab定时任务,每天在指定时间向ntp服务器进行时间同步
Zookeeper集群安装
Zookeeper是一个开源分布式协调服务,zookeeper服务可用于:统一命名服务、配置管理、锁服务、选举。大数据应用中主要使用Zookeeper的集群管理功能
首先下载zookeeper,我这里下载的是zookeeper-3.4.10,
Hadoop HA配置
配置core-site.xml文件
|
|
配置hdfs-site.xml文件
|
|
配置mapred-site.xml文件
|
|
配置yarn-site.xml文件
|
|
$ zkServer.shstart
$ hdfs zkfc -formatZK
$ hadoop-daemon.shstart journalnode
$ hdfs namenode -format
$scp-r /root/hadoop-2.8.1/namenode/* slave1:/root/hadoop-2.8.1/namenode/
$ hadoop-daemon.sh stop journalnode
Hadoop集群的启动
启动zookeeper集群(分别在master、slave和slave2执行)
启动HDFS(在master执行)
启动YARN(在slave1执行)
启动YARN的另一个ResourceManager(在master执行,用于容灾)
$ mr-jobhistory-daemon.sh starthistoryserver
```