博客
关于我
Hadoop是小象——Hadoop集群安装配置
阅读量:171 次
发布时间:2019-02-26

本文共 2510 字,大约阅读时间需要 8 分钟。

Hadoop集群安装配置指南

环境准备

在开始Hadoop安装之前,首先需要确保环境配置正确。以下是我们需要完成的主要步骤:

1. 安装所需软件

Java安装

  • 必须安装JavaTM 1.5.x。建议使用Sun公司发行的Java版本。

SSH配置

  • 已安装OpenSSH(CentOS默认安装),确保sshd服务正常运行。

2. 集群网络配置

集群网络环境配置如下:

  • Master节点内网IP:192.168.235.131
  • Slave1内网IP:192.168.235.132
  • Slave2内网IP:192.168.235.133

网络问题解决

  • 克隆虚拟机时,需手动修改MAC地址并重新分配IP地址,避免网络冲突。

3. SSH免密登录设置

Host文件配置

  • /etc/hosts文件尾部添加以下内容:
    192.168.235.131 master192.168.235.132 slave1192.168.235.133 slave2
  • 确保所有节点均正确解析。

Hostname修改

  • 修改每个节点的hostname,例如(以Master节点为例):
    sudo hostnamectl set-hostname master
  • 重启终端后,执行$hostname验证配置。

SSH免密登录

  • 在Master节点生成RSA密钥,并将其添加到Slave节点的~/.ssh/authorized_keys文件中。
    ssh-keygen -t rsa
  • 传输密钥文件:
    scp ~/.ssh/id_rsa.pub root@slave1:~scp ~/.ssh/id_rsa.pub root@slave2:~
  • 在Slave节点添加密钥并设置权限:
    chmod 600 ~/.ssh/authorized_keys

4. Hadoop安装

Hadoop源码下载

  • 使用wget下载Hadoop二进制源码:
    wget http://mirror.apache.org/hadoop/core/hadoop-2.8.5.tar.gz
  • 解压文件并进入目录:
    tar -zxvf hadoop-2.8.5.tar.gz

Hadoop配置

Master节点配置文件
  • 修改core-site.xml
    vim ~/hadoop/etc/hadoop/core-site.xml

    配置内容如下:

    fs.default.name
    hdfs://master:9000
    hadoop.tmp.dir
    file:/home/leesanghyuk/hadoop-2.8.5/hadoop/tmp
  • 类似地修改hdfs-site.xmlmapred-site.xmlyarn-site.xml等配置文件。
Slave节点配置
  • 将Hadoop文件传输到Slave节点并解压:
    scp -r ~/hadoop root@slave1:~scp -r ~/hadoop root@slave2:~

环境变量配置

  • 修改/etc/profile文件:
    vi /etc/profile

    添加以下内容:

    # Hadoop环境变量配置export HADOOP_HOME=/home/leesanghyuk/hadoop-2.8.5export HADOOP_INSTALL=$HADOOP_HOMEexport HADOOP_MAPRED_HOME=$HADOOP_HOMEexport HADOOP_COMMON_HOME=$HADOOP_HOMEexport HADOOP_HDFS_HOME=$HADOOP_HOMEexport YARN_HOME=$HADOOP_HOMEexport HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/nativeexport PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
  • 使配置生效:
    source /etc/profile

5. Hadoop启动

格式化NameNode

  • 格式化namenode:
    hadoop namenode -format
  • 启动Hadoop集群:
    start-all.sh

验证集群状态

  • 查看进程:
    jps
  • 确认Hadoop服务运行状态。

6. Hadoop集群测试

创建测试文件

  • 生成测试文件:
    echo "My name is LeesangHyuk. This is a example program called WordCount, run by LeesangHyuk " > testWordCount
  • 创建输入目录并上传文件:
    hadoop fs -mkdir /wordCountInputhadoop fs -put testWordCount /wordCountInput

执行WordCount程序

  • 运行MapReduce程序:
    hadoop jar ~/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.5.jar wordcount /wordCountInput /wordCountOutput
  • 查看输出结果:
    hadoop fs -ls /wordCountOutputhadoop fs -cat /wordCountOutput/part-r-00000

注意事项

  • 确保所有节点的防火墙和SELinux设置已关闭。
  • Hadoop的日志聚合和资源管理配置需根据实际负载进行优化。
  • 定期检查节点状态和网络连接,确保集群稳定运行。

通过以上步骤,可以实现一个功能正常的Hadoop集群环境,满足大数据处理和分析需求。

转载地址:http://dqak.baihongyu.com/

你可能感兴趣的文章
NodeJS、NPM安装配置步骤(windows版本)
查看>>
nodejs下的express安装
查看>>
nodejs与javascript中的aes加密
查看>>
nodejs中Express 路由统一设置缓存的小技巧
查看>>
nodejs中express的使用
查看>>
Nodejs中搭建一个静态Web服务器,通过读取文件获取响应类型
查看>>
Nodejs中的fs模块的使用
查看>>
NodeJS使用淘宝npm镜像站的各种姿势
查看>>
NodeJs入门知识
查看>>
nodejs包管理工具对比:npm、Yarn、cnpm、npx
查看>>
NodeJs单元测试之 API性能测试
查看>>
nodejs图片转换字节保存
查看>>
nodejs在Liunx上的部署生产方式-PM2
查看>>
nodejs基于art-template模板引擎生成
查看>>
nodejs字符与字节之间的转换
查看>>
NodeJs学习笔记001--npm换源
查看>>
NodeJs学习笔记002--npm常用命令详解
查看>>
nodejs学习笔记一——nodejs安装
查看>>
vue3+Element-plus icon图标无法显示的问题(已解决)
查看>>
NodeJS实现跨域的方法( 4种 )
查看>>