首页 > 代码库 > 课程预告:大数据实时处理系统Apache Storm

课程预告:大数据实时处理系统Apache Storm


Storm为分布式实时计算提供了一组通用原语,可被用于“流处理”之中,实时处理消息并更新数据库。这是管理队列及工作者集群的另一种方式。 Storm也可被用于“连续计算”(continuous computation),对数据流做连续查询,在计算时就将结果以流的形式输出给用户。它还可被用于“分布式RPC”,以并行的方式运行昂贵的运算。
Storm可以方便地在一个计算机集群中编写与扩展复杂的实时计算,Storm用于实时处理,就好比 Hadoop 用于批处理。Storm保证每个消息都会得到处理,而且它很快——在一个小集群中,每秒可以处理数以百万计的消息。更棒的是你可以使用任意编程语言来做开发。


=====Apache Storm课程大纲=====

一、课程概述
(*)课程概述
(*)搭建Linux虚拟机环境

(*)ZooKeeper简介和环境的搭建


二、Storm概述
(*)什么是Storm和流式计算
(*)Storm的体系结构和运行机制
(*)安装配置Storm及常用命令
(*)Demo演示:WordCountTopology

三、Storm案例分析
(*)WordCount数据流程分析
(*)实现WordCountTopology
(*)部署运行WordCountTopology

四、Storm的内部原理
(*)Storm集群任务提交的流程
(*)Storm集群的内部通信机制

五、集成Storm和Apache Kafka
(*)Apache Kafka简介和环境的搭建
(*)集成Storm和Apache Kafka

六、集成Storm和Apache HDFS
(*)Apache Hadoop简介和环境的搭建
(*)集成Storm和Apache HDFS

七、集成Storm和Apache HBase
(*)Apache HBase简介和环境的搭建
(*)集成Storm和Apache HBase

八、集成Storm和Apache Hive
(*)Apache Hive简介和环境的搭建
(*)集成Storm和Apache HBase

九、集成Storm和Redis
(*)Redis简介和环境的搭建
(*)集成Storm和Redis

十、集成Storm和JDBC
(*)集成Storm和JDBC


本文出自 “我的博客” 博客,请务必保留此出处http://collen7788.blog.51cto.com/2788082/1903142

课程预告:大数据实时处理系统Apache Storm