Spark&Hive结合起来

2024-08-31 23:06:31 216人阅读

　　1.spark与Hive结合起来

　　　　前提:当你spark的版本是1.6.1的时候,你的Hive版本要1.2.1,用别的版本会有问题

　　　　我们在做的时候,Hive的版本很简单,我们只需要解压缩,告诉他Hive的源数据在哪里即可

　　　　1.首先我们进入/conf/hive-site.xml文件,进行修改jdbc的配置

　　　　技术分享

　　　　　　则此时这个IP要改为only的vm1下的那个IP,不能改为自己无线网络的IP

　　　　2.进入bin:./bin/hive

　　　　　　执行成功,会自动创建hive这个库

　　　　　　hive中创建person表

　　　　　　切记:在此之前,由于我们的mysql的字符集编码是utf-8,则我们要是用hive，则就要使用latin1

　　　　　　alter databases hive character set latin1

　　　　3.建表

　　　　　　create table person(id int,name string,age int) row format delimited fields terminated by ","

　　　　4.从hdfs导入数据

　　　　　　load data inpath "hdfs://192.168.109.136:9000/person/person.txt" into table person

　　　　　　此时上面的操作报

　　　　　　Please check that values for params "default.name" and "hive.metastore.warehouse.dir" do

　　　　　　not conf 是由于namenode的不一致

　　　　　　此时修改为weekday01正确

　　　　　　load data inpath "hdfs://weekday01:9000/person/person.txt" into table person

　　　　　　select * from person

　　　　　　技术分享

　　　　　　select * from person order by id desc此时这个就会调用集群上的mapReduce

　　　　　　技术分享

　　　　　　不过这个样子有点慢,我们可以使用spark来进行计算

Spark&Hive结合起来

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们