首页 > 代码库 > Kafka介绍

Kafka介绍


      Apache Kafka是一个开源、分布式发布订阅消息系统,主要设计了下面这些特性:

      l  持久化消息:从大数据中提取真正的数据值,任何类型的数据丢失都不能够再获取。Apache Kafka提供了持续时间存储大容量消息,其容量按顺心可以达到TB。

      l  高吞吐量:为大数据而生,Kafka就是运行在商业硬件上而设计的,它支持每秒百万消息量。

      l  分布式:Apache Kafka明确地支持在Kafka集群上的消息分区,在Consumer集群上分发,同时,维护每个分区有序的语法机构。

      l  多客户端支持:Apache Kafka系统支持不同平台不同编程语言的客户端集成,编程语言可以是Java,.NET, PHP, Ruby 和Python。

      l  实时性:Producer线程产生消息应该会立刻被Consumer线程察觉到,这样能够保证消息的实时传送。下面的示意图展示了大数据的聚集分析解决方案。




 



Kafka介绍