首页 > 代码库 > Centos7-Ceph分布式存储快速部署

Centos7-Ceph分布式存储快速部署

随着OpenStack日渐成为开源云计算的标准软件栈,Ceph也已经成为OpenStack的首选后端存储。相关介绍网上有很多,这里就不做过多介绍了,自己尝试在自己的测试机搭建了一下。


Ceph的架构

Ceph是一个开源的分布式文件系统。因为它还支持块存储、对象存储,所以很自然的被用做云计算框架openstackcloudstack整个存储后端。当然也可以单独作为存储,例如部署一套集群作为对象存储、SAN存储、NAS存储等。


支持接口

1、对象存储:即radosgw,兼容S3接口。通过rest api上传、下载文件。

2、文件系统:posix接口。可以将ceph集群看做一个共享文件系统挂载到本地。

3、块存储:即rbd。有kernel rbd和librbd两种使用方式。支持快照、克隆。相当于一块硬盘挂到本地,用法和用途和硬盘一样。


Ceph相比其它分布式存储有哪些优点?

1、统一存储

 虽然ceph底层是一个分布式文件系统,但由于在上层开发了支持对象和块的接口。所以在开源存储软件中,能够一统江湖。至于能不能千秋万代,就不知了。


2、高扩展性

 扩容方便、容量大。能够管理上千台服务器、EB级的容量。


3、可靠性强

 支持多份强一致性副本,EC。副本能够垮主机、机架、机房、数据中心存放。所以安全可靠。存储节点可以自管理、自动修复。无单点故障,容错性强。


4、高性能

  因为是多个副本,因此在读写操作时候能够做到高度并行化。理论上,节点越多,整个集群的IOPS和吞吐量越高。另外一点ceph客户端读写数据直接与存储设备(osd) 交互。在块存储和对象存储中无需元数据服务器。



集群部署


主机准备

IP地址       主机名
172.16.10.167   admin-node  #管理端,后续的ceph-deploy工具都在该主机上进行操作,并且也充当监控和osd.0节点
172.16.10.162   node1     #监控和osd.1节点
172.16.10.142   node2     #监控和osd.2节点
每台主机三块盘,sda系统盘、sdb存储盘(osd)、sdc日志盘(journal),日志盘最好选用ssd


修改admin-node的/etc/hosts文件

 172.16.10.162    node1
 172.16.10.142    node2


配置admin-node与其它节点的ssh无密码root权限访问,为了方便使用的是root用户,为了安全应该创建一个普通用户

# ssh-keygen
# cat /root/.ssh/id_rsa.pub


修改每个节点的hostname

# hostnamectl set-hostname "新的名字"


每个osd节点开放防火墙

-A INPUT -p tcp -m state --state NEW -m tcp --dport 6789:7100 -j ACCEPT


配置ceph的yum源,安装ceph-deploy工具

此处的源太慢,在我安装的时候总是失败

国内的一些Ceph源:Ceph国内源

# yum install --nogpgcheck -y epel-release
# rpm --import /etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-7
# vim /etc/yum.repos.d/ceph.repo
[Ceph]
name=Ceph packages for $basearch
baseurl=http://download.ceph.com/rpm-jewel/el7/$basearch
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=https://download.ceph.com/keys/release.asc
priority=1
 
[Ceph-noarch]
name=Ceph noarch packages
baseurl=http://download.ceph.com/rpm-jewel/el7/noarch
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=https://download.ceph.com/keys/release.asc
priority=1
 
[ceph-source]
name=Ceph source packages
baseurl=http://download.ceph.com/rpm-jewel/el7/SRPMS
enabled=1
gpgcheck=1
type=rpm-md
gpgkey=https://download.ceph.com/keys/release.asc


安装ceph-deploy工具

# yum update -y
# yum install ceph-deploy -y
# yuminstall ntp ntpdate ntp-doc openssh-server yum-plugin-priorities -y


创建管理目录

# mkdir my-cluster
# cd my-cluster


创建监控节点,这里可以同时创建多个节点,为了测试后期增加mon节点,这里就只添加一个

# ceph-deploy new node1


修改配置文件,执行上述命令之后,会在当前目录产生ceph.conf文件,打开文件增加配置

osd pool default size = 3   #创建3个副本
public_network = 172.16.10.0/24   #公用网络
cluster_network = 172.16.10.0/24  #集群网络


使用ceph-deploy为节点安装ceph,这一步在我安装时经常出问题,出现执行ceph --version命令失败,还有一些其它错误,然后各种在网上查资料,最后自己无意中发现,再次执行命令,或者在失败节点把ceph和ceph-release卸载,然后单个节点再次安装,重复操作,就可以安装成功,究其原因,还是因为ceph源在国外。然后找了一下国内的ceph源,在ceph中国社区找到了一篇文档,在开头已有介绍。

# ceph-deploy install admin-node node1 node2


初始化监控节点并收集keyring,如果是双网卡,需要修改配置文件ceph.conf将mon的内网地址改为公网地址,执行时需要在ceph-deploy后加--overwrite-conf

# ceph-deploy mon create-initial


把admin-node节点的配置文件与keyring同步至其它节点

# ceph-deploy admin admin-node node1 node2
# chmod +r /etc/ceph/ceph.client.admin.keyring   #如果是root用户,这步不需要


初始化各节点的osd分区

# ceph-deploy disk zap admin-node:/dev/sdb node1:/dev/sdb node2:/dev/sdb


挂载日志盘

# ceph-deploy osd prepare admin-node:sdb:/dev/sdc node1:sdb:/dev/sdc node2:sdb:/dev/sdc


查看挂载情况

# ceph-deploy disk list node1


现在初步集群搭建完成


查看ceph集群健康状态

# ceph health

如果成功将提示:HEALTH_OK


增加监控节点

打开ceph.conf文件,增加mon配置,新增admin-node和node2节点为mon节点

# cd my-cluster && vim ceph.conf
mon_initial_members = node1,admin-node,node2
mon_host= 172.16.10.162,172.16.10.167,172.16.10.142


将配置文件同步至所有节点

# ceph-deploy --overwrite-conf admin admin-node node1 node2


查看配置是否生效

# ceph --show-config |grep mon_initial_members


创建新的mon

# ceph-deploy mon create admin-node
# ceph-deploymon create node2


查看mon状态

# ceph mon stat


查看整个集群状态,验证是否成功

# ceph -s


不出意外,现在应该是显示集群成功的,也可能会有时间不同步或者pg问题,在网上都有解决方法,个人测试了几遍都可以成功安装。


启动命令

启动或停止一个节点的所有osd或者mon

# systemctl start ceph-osd.target
# systemctl start ceph-mon.target

启动单个osd或者mon

# systemctl start ceph-osd@0
# systemctl start ceph-mon@node1

添加开机启动

# systemctl enable ceph-mon.target
# systemctl enable ceph-osd.target

检测是否加入开机启动

# systemctl is-enabled ceph-osd.target
# systemctlis-enabled ceph-mon.target


验证

使用块存储验证集群存储是否可用

再找一台机器做为:client-node,并且需要执行上面的基础流程

在admin-node上面

# cd my-cluster
# ceph-deploy install  client-node
# ceph-deployadmin client-node


在client-node创建块设备映像

# rbd create test --size 4096 --image-format 2 --image-feature  layering


查看创建的映像

# rbd ls


将ceph提供的块设备映射到client-node

# rbd map test --pool rbd --name client.admin


创建文件系统

# mkfs.xfs  /dev/rbd/rbd/test


挂载文件系统

# mkdir /test
# mount /dev/rbd/rbd/test /test


使用dd测试

# cd /test
# dd if=/dev/zero of=ceshi bs=1M count=10


在随便一台osd节点上,查看是否有数据写入

# ceph -w


监控

在监控方面,calamari在安装起来比较复杂,没有仔细研究,在网上看到可以使用zabbix对ceph进行监控,然后看了一下。

http://www.cnblogs.com/bodhitree/p/6027289.html


监控流程

在ceph的一台monitor上,比如:admin-node

# yum install -y git
# git clone https://github.com/BodihTao/ceph-zabbix.git
# cd ceph-zabbix
# cp ceph-status.sh /usr/local/zabbix/etc/
# ln -s /usr/local/zabbix/bin/* /usr/bin/
# vim ceph_cron.txt  或者直接crontab -e编辑
* * * * * /usr/local/zabbix/etc/ceph-status.sh zabbixIP “zabbix中定义的主机名”
例如:
* * * * * /usr/local/zabbix/etc/ceph-status.sh 172.16.10.102 "Ceph-172.16.10.167"
# crontab ceph_cron.txt
# crontab -l
# vim/usr/local/zabbix/etc/zabbix_agentd.conf
Hostname=Ceph-172.16.10.167
# pkill -9 zabbix_agentd
# /usr/local/zabbix/sbin/zabbix_agentd

然后在zabbix上面导入ceph-zabbix/zabbix_templates中的模板,修改导入的模板--项目中的类型为zabbix trapper(zabbix捉捕器),然后添加主机,使用导入的模板。


注:如果还需要使用其它模板,比如:Template OS Linux,如果项目中提示不支持,则需要修改类型为zabbix trapper(zabbix捉捕器),如果修改,需要做一个克隆,以免影响其它模板使用者。



Centos7-Ceph分布式存储快速部署