首页 > 代码库 > 关于ETL的几种运行

关于ETL的几种运行

一:代码部分

1.新建maven项目

 

2.添加需要的java代码

 

3.书写mapper类

 

4.书写runner类

 

二:运行方式

1.本地运行

2.

3.

 

三:本地运行方式

1.解压hadoop到本地

  技术分享

 

2.修改配置文件HADOOP_HOME

  技术分享

 

3.解压common的压缩包

  技术分享

 

 4.将压缩包的内容拷贝到bin下

  技术分享

 

5.前提

  在resource中必须存在core和Hbase的site文件

  技术分享

 

6.上传数据

  新建目录/eventLogs/2015/12/20

  上传到linux

  技术分享

  上传到HDFS

  

7.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 

关于ETL的几种运行