Spark SQL Hive Support Demo

首页 > 代码库 > Spark SQL Hive Support Demo

2024-07-09 16:32:31 223人阅读

前提：

1、spark1.0的包编译时指定支持hive：./make-distribution.sh --hadoop 2.3.0-cdh5.0.0 --with-yarn --with-hive --tgz

2、安装完spark1.0；

3、安装与hadoop对应的CDH版本的hive；

Spark SQL 支持Hive案例：

1、将hive-site.xml配置文件拷贝到$SPARK_HOME/conf下

hive-site.xml文件内容形如：

<?xml version="1.0"?><?xml-stylesheet type="text/xsl" href="http://www.mamicode.com/configuration.xsl"?><configuration>    <property>      <name>javax.jdo.option.ConnectionURL</name>      <value>jdbc:mysql://hadoop000:3306/hive?createDatabaseIfNotExist=true</value>    </property>    <property>      <name>javax.jdo.option.ConnectionDriverName</name>      <value>com.mysql.jdbc.Driver</value>    </property>    <property>      <name>javax.jdo.option.ConnectionUserName</name>      <value>root</value>    </property>    <property>      <name>javax.jdo.option.ConnectionPassword</name>      <value>root</value>    </property></configuration>

2、启动spark： spark-shell

案例来源于spark官方文档：http://spark.apache.org/docs/latest/sql-programming-guide.html

//创建hiveContextval hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)// 隐式转换import hiveContext._//创建hive表hql("CREATE TABLE IF NOT EXISTS hive.kv_src (key INT, value STRING)")//加载数据到hive表hql("LOAD DATA LOCAL INPATH ‘/home/spark/app/spark-1.0.0-bin-2.3.0-cdh5.0.0/examples/src/main/resources/kv1.txt‘ INTO TABLE hive.kv_src")//通过hql查询hql("FROM hive.kv_src SELECT key, value").collect().foreach(println)

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Spark SQL Hive Support Demo

Spark SQL Hive Support Demo

看完仍有疑问？有类似问题直接问程序猿