首页 > 代码库 > Hadoop日志分析系统启动脚本
Hadoop日志分析系统启动脚本
Hadoop日志分析系统启动脚本
#!/bin/bash #Flume日志数据的根文件夹 root_path=/flume #Mapreduce处理后的数据文件夹 process_path=/process #hive分区时间 partition=`date "+%Y-%m-%d"` #获取前一小时的时间:/YYYY-MM-DD/HH file_path=`date -d "1 hour ago" +"%Y-%m-%d/%H"` #运行Mapreduce程序 # hadoop jar /root/develop/runjar/accesslog.jar hdfs://mycluster $root_path/$file_path $process_path/$file_path hadoop jar /root/develop/runjar/accesslog.jar hdfs://mycluster /flume/2014-10-15/16 /process/2014-10-15/16 #把数据装载到Hive中 #hive -e load data inpath $process_path/$file_path/* into table access_log partition(dt=$partition) hive -e "load data inpath ‘/process/2014-10-15/16/*‘ overwrite into table access_log partition(dt=‘2014-10-15‘)" #运行Hive脚本,统计数据 hive -e "insert into table access_page_times select cs_uri_stem,count(*) from access_log where dt=‘2014-10-15‘ group by cs_uri_stem" #通过sqoop把数据从hive导出到mysql sqoop export --connect jdbc:mysql://ip:3306/fkdb --username root --password 123456 --table access_page_times --export-dir /user/hive/warehouse/access_page_times --input-fields-terminated-by ‘\001‘
Hadoop日志分析系统启动脚本
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。