Hive表数据导出

首页 > 代码库 > Hive表数据导出

2024-08-03 04:34:03 220人阅读

方式一: hadoop命令导出

hadoop fs -get hdfs://hadoop000:8020/data/page_views2   pv2

方式二:通过insert...directory导出 【spark暂不支持】

导出到本地：

INSERT OVERWRITE LOCAL directory ‘/home/spark/hivetmp/‘ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t‘ LINES TERMINATED BY ‘\n‘select * from page_views;

导出到HDFS：

INSERT OVERWRITE directory ‘/hivetmp/‘ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t‘ LINES TERMINATED BY ‘\n‘select * from page_views;

报错：cannot recognize input near ‘ROW‘ ‘FORMAT‘ ‘DELIMITED‘ in select clause

INSERT OVERWRITE directory ‘/hivetmp/‘select * from page_views;

注意： 导出到本地可以通过ROW FORMAT来设置分隔符,导出到HDFS是不能设置分隔符的；

方式三: shell命令 + 管道(hive -f/-e | sed/grep/awk > file)

hive -e "select * from page_views limit 5"hive -S -e "select * from page_views limit 5" | grep B58W48U4WKZCJ5D1T3Z9ZY88RU7QA7B1hive -S -e "select * from page_views limit 5" | grep B58W48U4WKZCJ5D1T3Z9ZY88RU7QA7B1 > file

方式四: sqoop

详见sqoop章节：http://www.cnblogs.com/luogankun/category/601761.html

Hive表数据导出

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Hive表数据导出

Hive表数据导出

看完仍有疑问？有类似问题直接问程序猿