首页 > 代码库 > 【Hadoop学习】Apache HBase项目简介
【Hadoop学习】Apache HBase项目简介
原创声明:转载请注明作者和原始链接 http://www.cnblogs.com/zhangningbo/p/4068957.html
英文原版:http://hbase.apache.org/
Apache HBaseTM ,即Hadoop 数据库,是一个分布式的、可缩放的大数据存储方案。
何时使用Apache HBase?
当需要随机、实时读写大数据时,就可以使用Apache HBase了。该项目旨在组织甚大规模的位于商业硬件集群之上的表——数十亿行 × 数百万列。Apache HBase是一个开源的、分布式的、版本化的、非关系型数据库,基于Google BigTable论文(A Distributed Storage System for Structured Data)来建模。就像BigTable借用GFS(Google File System)提供的分布式数据存储能力一样,Apache HBase也在Hadoop和HDFS之上提供了类似BigTable一样的能力。
特性
- 线性的和模块化的可扩展性
- 严格一致的读写
- 自动的和可配置的表分片
- 在RegionServer之间支持自动故障恢复
- 用Apache HBase表支持Hadoop MapReduce 任务的方便的基础类
- 客户端易用的Java API
- 块缓存和Bloom过滤器机制,支持实时查询
- 通过服务器端过滤器查询可以预测下推
- Thrift 网关和REST-full Web服务,支持XML、protobuf和二进制数据编码选项
- 可扩展的jruby-based (JIRB)shell
- 支持通过Hadoop 测量子系统把测量导出至文件或者Ganglia;或者通过JMX
在哪里可以获得更多的信息?
查看架构概述,Apache HBase 参考手册FAQ,及其它文档。
参考阅读
1)HBase官方网站
2)HBase参考指南 (官方文档英文版)
3)HBase参考指南 (官方文档中文版,本人译)
4)HBase参考指南 (官方文档中文版,周海汉,颜开)
【Hadoop学习】Apache HBase项目简介
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。