首页 > 代码库 > HIVE入门操作

HIVE入门操作

2024-07-04 20:53:50 222人阅读

1 HIVE入门操作

1.1 连接环境

输入 hive;进入hive环境

输入 quit;退出hive环境

1.2 查看数据库

show databases;

1.3 创建数据库

create database mng;

1.4 链接数据库

use mng;

成功显示如下：

1.5 查看表

show tables;

1.6 创建表注意点

l 数据类型对比

NUMBER(14) -- BIGINT

NUMBER(m,n) – DOUBLE

VARCHAR2 -- STRING

NUMBER(1) -- TINYINT

~~l 表只保留一级分区；使用数据时间做分区~~

l 表分区保留多级分区

l 去掉default和not null声明

l 分区字段的数据不需要写入表文件

l insert数据时，hive默认用\N表示null值，需要改变这个设置，使用‘‘表示null值

alter table tablename set serdeproperties(‘serialization.null.format‘ = ‘‘);

l 表存储设置有两种定义方式，推荐用方式2

表定义1：

create table TEST

(

cell_id string,

user_cnt bigint,

hcsv_cnt bigint,

arpu double,

call_dur_sum double,

sms_cnt_sum bigint,

data_vol_sum double,

erl double

)

partitioned by (data_date bigint)

row format delimited

fields terminated by ‘|‘

collection items terminated by ‘,‘

map keys terminated by ‘-‘

lines terminated by ‘\n‘;

alter table mng_av_in_m set serdeproperties(‘serialization.null.format‘ = ‘‘);

表定义2：

create table TEST

(

cell_id string,

user_cnt bigint,

hcsv_cnt bigint,

arpu double,

call_dur_sum double,

sms_cnt_sum bigint,

data_vol_sum double,

erl double

)

row format serde ‘org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe‘ with serdeproperties

(

‘escape.delim‘=‘//‘,

‘mapkey.delim‘=‘-‘,

‘serialization.format‘=‘|‘,

‘colelction.delim‘=‘,‘,

‘field.delim‘=‘|‘,

‘line.delim‘=‘\n‘,

‘serialization.null.format‘=‘‘

)

stored as textfile;

1.7 测试数据导入表命令

load data local inpath ‘文件路径‘ overwrite into table TABLE_NAME partition (DATA_DATE=‘20130101000000‘);

备注：分区字段的数据不需要写入表文件

1.8 查看表对应的目录和文件

desc formatted tablename;

1.9 查看表对应的数据文件

dfs -ls 文件路径

1.10 查看表文件中的数据

dfs –cat 文件路径

1.11 truncate 分区

truncate table TABLE_NAME partition (sum_start_dttm=20131001000000);

1.12 删除分区

ALTER TABLE TABLE_NAME DROP PARTITION (sum_start_dttm = 20131001000000);

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们