首页 > 代码库 > Hive/Pig 语法简单比较
Hive/Pig 语法简单比较
一句话,Hive 开发比 Pig快多了...
从hdfs读取数据:
Hive: CREATE EXTRENAL TABLE IF NOT EXIST (domain string, num int) ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t‘ location ‘hdfs_file‘;
Pig: LOAD ‘hdfs_file‘ USING PigStorage (‘\t‘) as (domain:chararray, num:int);
存储:
Hive: INSERT OVERWRITE DIRECTORY ‘target_hdfs_file‘ SELECT... ;
Pig: STORE result into ‘target_hdfs_file‘;
同SQL的比较:
Hive没有in和not in,"select a.key where a.key in {select b.key from b}"的实现方式为"select a.key from a left outer join b on a.key=b.key where b.key is not null;"
Pig就更麻烦了...
区别:
Pig存储默认分隔符‘\t‘, Hive为‘Ctrl+A‘
Hive/Pig 语法简单比较
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。