首页 > 代码库 > hadoop备记

hadoop备记

Hadoop 的优势
Hadoop 是 一 个 能 够 让 用 户 轻 松 架 构 和 使 用 的 分 布 式 计 算 平 台。 用 户 可 以 轻 松 地 在Hadoop 上开发运行处理海量数据的应用程序。它主要有以下几个优点:
1.高可靠性。Hadoop 按位存储和处理数据的能力值得人们信赖。
2.高扩展性。Hadoop 是在可用的计算机集簇间分配数据完成计算任务的, 这些集簇可以方便地扩展到数以千计的节点中。
3.高效性。Hadoop 能够在节点之间动态地移动数据, 以保证各个节点的动态平衡, 因此其处理速度非常快。

4.高容错性。Hadoop 能够自动保存数据的多份副本, 并且能够自动将失败的任务重新分配。


现在的话Hadoop已经包含很多项目。不过核心内容是MapReduce和Hadoop分布式文件系统。这里spark的话实时性性能方面比hadoop高很多。这里我不多说什么。(http://www.zdnet.com/faster-more-capable-what-apache-spark-brings-to-hadoop-7000026149/可以看看spark与hadoop比较)


与Hadoop相关的Common,Avro,Chukwa,Hive,HBase等项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。