hadoop2.5.1伪分布式部署

首页 > 代码库 > hadoop2.5.1伪分布式部署

2024-10-23 11:11:03 212人阅读

可参阅官方文档

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.html

文件下载：

http://mirrors.hust.edu.cn/apache/hadoop/common/

注：可直接使用2.5.2或2.6.0版本都解决了2.5.1中不稳定bug

1 伪分布式部署

以测试通过的为例

Linux version 2.6.32-431.el6.x86_64 Red Hat 4.4.7-4

Jdk java version "1.7.0_67"

Hadoop 2.5.1

1.1 环境准备（有些只是参考，环境配置不好就没办法进行部署安装）：

1、java -version

检查cat /etc/profile

export JAVA_HOME=/usr/bin/jdk1.7.0_67

export JRE_HOME=${JAVA_HOME}/jre

export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin:$PATH

没有追加上即可 source /etc/profile执行实时生效

2、如果是普通用户，注意权限

vim /etc/sudoers

grid ALL=(ALL) ALL

如果无法编辑进行如下操作

a、授权 chmod u+w /etc/sudoers

b、编辑 vi /etc/sudoers

c、取消权限 chmod u-w /etc/sudoers

1.2 部署安装

ssh-keygen -t dsa -P ‘‘ -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

在cd /home/grid/.ssh路径下

技术分享

测试：ssh localhost

配置hadoop

进入../hadoop-2.5.1/etc/hadoop目录下，针对以下文件进行操作

httpfs-site.xml

<name>dfs.replication</name>

</property>

</configuration>

core-site.xml

<name>fs.default.name</name>

</property>

</configuration>

里边是没有直接的mapred-site.xml文件，要把mapred-site.xml.template复制成mapred-site.xml再进行修改

mapred-site.xml

<name>mapred.job.tracker</name>

</property>

</configuration>

环境变量配置hadoop-env.sh

export JAVA_HOME=/usr/bin/jdk1.7.0_67

export HADOOP_PREFIX=/home/grid/hadoop-2.5.1

格式化

bin/hdfs namenode –format

技术分享

完成时候启动

sbin/start-dfs.sh(此时可以查看50070和9000端口是否启动，启动可成功)

sbin/start-yarn.sh

测试

首先查看jps

技术分享

有了这些节点再进行下面步骤

1、查看端口是否启动

netstat -ano | grep 50070

netstat -ano | grep 8088

2、页面访问

http://192.168.3.170: 8088

技术分享

http://192.168.3.170: 50070/

技术分享

3、数据测试

a、写入数据

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.1.jar grep input output ‘dfs[a-z.]+‘

b、读取数据

bin/hdfs dfs -get output output

hadoop2.5.1伪分布式部署

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > hadoop2.5.1伪分布式部署

hadoop2.5.1伪分布式部署

看完仍有疑问？有类似问题直接问程序猿