flume+sparkStreaming实例实时监控文件demo

首页 > 代码库 > flume+sparkStreaming实例实时监控文件demo

flume+sparkStreaming实例实时监控文件demo

2024-08-15 02:11:57 221人阅读

1，flume所在的节点不和spark同一个集群 v50和 10-15节点 flume在v50里面

flume-agent.conf

技术分享

spark是开的work节点，就是单点计算节点，不涉及到master发送管理只是用到了sparkStreming的实时功能

开启的是spark-shell不是spark-submit 提交jar的形式，提交jar的形式还需要后面研究下

如下在结算节点下

和flume的jar包要在各个节点上的spark 都要放入：
bin/spark-shell \
--jars /hadoop/spark/spark-2.0/jars/flume-ng-sdk-1.6.0.jar
,/hadoop/spark/spark-2.0/jars/flume-avro-source-1.5.0.1.jar,
/hadoop/spark/spark-2.0/jars/spark-streaming-flume_2.11-2.0.0.jar \
--master local[2]
12端口

val stream = FlumeUtils.createStream(ssc, "10.0.10.12", 9999)
11端口的spark
import org.apache.spark._
import org.apache.spark.streaming._
import org.apache.spark.streaming.StreamingContext._
import org.apache.spark.streaming.flume._

val ssc = new StreamingContext(sc, Seconds(5))

//9999就是开启的端口像socket一样用端口连接

val stream = FlumeUtils.createStream(ssc, "10.0.10.12", 9999)

val wordCountStream = stream.map(x => new String(x.event.getBody.array())).flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _)

wordCountStream.print()

ssc.start()
ssc.awaitTermination()

flume命令

bin/flume-ng agent --conf conf --conf-file conf/taile2stream.conf --name agent -Dflume.root.logger=INFO,console

flume+sparkStreaming实例实时监控文件demo

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > flume+sparkStreaming实例 实时监控文件demo

flume+sparkStreaming实例 实时监控文件demo

看完仍有疑问？有类似问题直接问程序猿

首页 > 代码库 > flume+sparkStreaming实例实时监控文件demo

flume+sparkStreaming实例实时监控文件demo