首页 > 代码库 > HDInsight HBase的概述

HDInsight HBase的概述

HDInsight HBase的概述


什么是HBase的


HBase的建立在Hadoop的Apache的开源的NoSQL数据库,提供大量的非结构化和半结构化数据随机存取和强大的一致性。是仿照谷歌的BigTable一个列面向家庭的数据库数据被存储在一排内的数据的行是由列族分组。 HBase的在这个意义上,无论是也不存储在其中的数据类型需要在使用它们之前所定义的模式的更小的数据库。开放源代码是首次发布由Mike Cafarella于2007年,线性扩展处理PB级数据数千个节点。可以依靠数据冗余,批处理和通过在Hadoop的生态系统的分布式应用程序提供的其他功能。

什么是Azure的HDInsight HBase的


HDInsight HBase的是提供一个管理的集群集成到Azure的环境集群被配置为直接在Azure的Blob存储,这提供了在性能/成本的选择低延迟和增加的弹性存储数据。这使客户能够建立一个大型数据集工作的互动式网站构建存储传感器和遥测数据,从数以百万计的端点服务并分析这些数据与Hadoop作业 HBase的Hadoop的都是很好的出发点,Azure的大数据项目,特别是可以实现实时应用大型数据集工作。

HDInsight实现利用的HBase横向扩展架构,可提供自动分片表,一致性读取和写入自动故障转移性能提高内存高速缓存读取和高吞吐量数据流写入虚拟网络配置也可用于HDInsight HBase的有关详细信息,请参阅提供HDInsight集群在Azure虚拟网络

如何HDInsight HBase的数据管理


数据可以HBase的使用创造GET,PUT和ScanHBase的shell命令来管理。数据使用付诸表决,并阅读使用get命令写入到数据库中Scan命令被用于获得在表中多行的数据。数据也可以使用HBase的C#的API,它提供了一个客户机库HBase的REST API之上管理。一个HBase的数据库也可以使用配置单元查询。的介绍,这些编程模型,请参阅获取使用HBase的用HadoopHDInsight开始协处理器也可以允许数据库所在的节点数据的处理。

场景:什么是用例HBase的


BigTable的推而广之HBase的创建为其典型使用案例就是网络搜索搜索引擎建立一个映射条款,包含它们的网页索引。但也有许多其他的用例HBase的适合哪几个逐项列出在本节

用例1key-value存储


HBase的可作为一个键值存储,适用于管理信息系统。 Facebook的使用HBase的为自己的邮件系统,它是理想的存储和管理互联网通信 WebTable使用HBase的搜索和管理从网页中提取表。

使用案例2:传感器数据


HASE用于捕捉是从各种来源的增量收集的数据是有用的。这包括社交分析时间序列保持交互式仪表盘的最新潮流和计数器以及管理审计日志系统。例子包括Bloomberg 交易终端和开放时间序列数据库(OpenTSDB)的商店,并提供访问收集服务器系统健康指标

用例3:实时查询


Phoenix 是Apache HBase的一个SQL查询引擎它是作为一个JDBC驱动程序,并能使查询和使用SQL管理HBase的表。

用例4HBase的一个平台


应用程序可以在HBase的顶部使用它作为数据存储上运行。例子包括Phoenix OpenTSDBKIJITitan应用程序也可以集成HBase的例子包括HivePigSolrStormFlumeImpalaSparkGangliaDrill

接下来的步骤


获取HDInsight开始使用HBase的用Hadoop

提供HDInsight集群在Azure虚拟网络

HBase的HDInsight分析Twitter的感悟

使用Maven构建使用HBase的HDInsight Java应用程序Hadoop的

C#HBase的SDK

另请参见


Apache的HBase

Bigtable的分布式存储系统结构化数据

 

本文翻译自Windows Azure官网:http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-overview/

 转载请注明出处:http://blog.csdn.net/yangzhenping, 谢谢!

HDInsight HBase的概述