首页 > 代码库 > 关于hive的存储格式

关于hive的存储格式

1.存储格式

  textfile

  rcfile

  orc

  parquet

 

2.存储方式

  按行存储

    -》textfile

  按列存储

    -》parquet

 

3.压缩比

  技术分享

4.存储textfile的原文件

  技术分享

  并加载数据

  

5.大小

  技术分享

 

6.保存为tectfile,经过mapreduce

  技术分享

7.结果的大小

  技术分享

8.保存为orc格式

  技术分享

9.大小

  技术分享

 

 10.存储为parquet

  技术分享

 

11.大小

  技术分享

12.使用命令求大小

   bin/hdfs dfs -du -s -h /user/hive/warehouse/track_log.db/yhd_par

  技术分享

 

关于hive的存储格式