首页 > 代码库 > Hadoop-2.0 目录简介

Hadoop-2.0 目录简介

Hadoop-2.0 目录简介

一、目录结构

将下载的压缩包解压:

技术分享

解压后文件夹如下:

 技术分享

二、各文件夹目录结构

1、bin:Hadoop2.0的最基本管理脚本使用脚本所在目录。这些脚本是sbin目录下管理脚本的基础实现,我们可以直接用这些脚本管理和使用Hadoop。

技术分享

2、etc:这个目录里的文件只要接触过Hadoop的人都很熟悉。Hadoop配置文件目录。首先是从Hadoop1.0继承来的三个文件core-site.xmlhdfs-site.xmlmapred-site.xml,然后还有一个Hadoop2.0新增的一个配置文件yarn-site.xml

技术分享技术分享

3、include:这个是对外提供的编程库头文件,具体动态库和静态库在lib目录里。这些头文件均用C++定义的。学过C++语言的人可以用C++语言访问HDFS或者编写MapReduce程序。

技术分享

(没错这就是咱们熟悉的.h文件。)

4、lib:该目录包含了Hadoop对外提供的编程动态库和静态库,与include目录里的头文件结合使用。

技术分享

技术分享

5、libexec:这个是各个服务对应的Shell配置文件所在目录,可用于配置日志输出目录、启动参数(比如JVM参数)等基本信息。

技术分享

6、sbin:Hadoop管理脚本所在目录,主要包括HDFS和YARN中各类服务的启动和关闭脚本。

技术分享

7、share:Hadoop各个模块编译后的JAR包所在目录。

技术分享

在这个目录:hadoop-2.4.0\share\doc\hadoop\api\index.html可以查看API

技术分享

Hadoop-2.0 目录简介