首页 > 代码库 > Openstack & Hadoop结合项目Sahara

Openstack & Hadoop结合项目Sahara

Openstack 项目Sahara,主要是用来搭建Hadoop集群,利用虚拟出来的计算资源,高速搭建Hadoop集群。

Sahara项目与OPenstack其它项目的关系:

技术分享

图片转自:http://docs.openstack.org/developer/sahara/overview.html


Sahara有两种基本使用流程:

1、高速布署,用户能够添加降低Hadoop节点,,,,

2、分析即服务,依据用户设定的模板创建Hadoop集群,跟计算,然后干掉集群,之后把结果放在(比方Swift容器中)


Sahara 架构包括几个组件:

技术分享


  • Cluster Configuration Manager - 集群配置管理器,这里全部的业务逻辑驻留
  • Auth component - 身份验证组件,负责client身份验证和授权
  • DAL - Data Access Layer, 数据訪问层,持续在数据库内部模型
  • VM Provisioning - 负责与Nova、Glance组件沟通
  • Deployment Engine -Hadoop部署引擎,可插入机制,负责部署配置vm,现有管理解决方式
  • REST API - 通过REST提供Sahara功能
  • Python Sahara Client -类似于其它OpenStack组件都有自己的Python Client
  • Sahara pages - Horizon上面的GUI


内容来自:http://docs.openstack.org/developer/sahara/architecture.html

转眼23点,简介,周末继续深入。

Openstack的这个项目,基本能自己主动化布署Hadoop集群,搞Hadoop的小伙伴再也不用那么麻烦去布多结点了。须要就开个集群,用完就干掉,这样的快捷,应该是Openstack的优势,看好这个项目,继续关注。

Openstack & Hadoop结合项目Sahara