首页 > 代码库 > Sersync实现触发式文件同步
Sersync实现触发式文件同步
目录
1:序言 1
2:inotify 1
2.1:inotify简介 1
2.2:inotify可以监视的文件系统事件 1
3:rsync 1
3.1:rsync简介 1
3.2:Rsync特性 2
4:sersync 2
4-1:sersync简介 2
4-2:sersync优点 2
5:两种架构 2
5.1:inotify-tools + rsync 2
5.2:sersync + rsync 2
6:为什么要用rsync+sersync 2
7:具体操作: 3
7.1:实验环境 3
7.2:目标服务器操作 3
(1) 关闭selinux 3
(2) 开启防火器tcp873端口(rsync默认端口) 3
(3) 安装rsync服务软件 4
(4) 将rsync交由超级管理进程管理 4
(5) 创建rsyncd.conf配置文件 4
(6) 创建用户认证文件 5
(7) 设置文件权限 5
(8) 启动rsync 5
(9) 创建同步目录与同步所用的账户 5
7.3:在源服务器上操作 6
(1)关闭selinux 6
(2)开启防火墙 tcp 873端口 6
(3)安装rsync客户端软件 7
(4)将rsync交由xinetd管理 7
(6)创建认证文件,设置文件权限 7
(7) 测试服务器到源服务器之间的数据同步 7
(8) 安装sersync工具,实时触发rsync进行同步 8
(8-1)查看服务器内核是否支持inotify 8
(8-2)查看并修改inotify默认参数(inotify默认内核参数值太小) 8
(8-3)安装sersync 9
(8-4)配置sersync 10
(8-5)设置sersync监控开机自动启动 10
(8-6)添加脚本监控sersync是否正常运行,因为有时候sersync脚本会自动关掉,因此需要写一个脚本自动的去检测该进程是否存在,不存在就启动 11
(8-7)脚本写好后,添加到计划任务里,每5分钟检查一次 11
7.4:测试 11
(1)删除 11
(2)新建 12
(3)修改 12
8 可能遇到的问题 13
(1)测试的时候远程路径输错 13
(2)测试的时候chdir failed 13
(3)同步多个目录 13
(4)不同用户同步不同目录 13
(5)同步多台主机 13
9 小结 14
附:rsync参数 14
触发式文件同步
1:序言
如果我们后端有多台网站服务器或者文件服务器,而且没有好的文件同步机制,那么当我们升级程序或者更新文件的时候,就需要每台服务器或者目录都要更新,这样就很容易出问题,并很容易导致两边的文件不一致,从而出现很多莫名其妙的问题,因此我们需要使用好的文件同步方式来实现几个后端服务器文件的同步,目前广泛采用的方案是使用rsync+inotify的方式来实现文件的触发更新。原理是采用inotify来对文件进行监控,当监控到文件有文件发生改变的时候,就会调用rsync实现触发式实时同步!基于inotify+rsync进行二次开发实现文件同步的小工具sersync,能够很方便的实现文件触发式同步。
2:inotify
2.1:inotify简介
Inotify是基于inode级别的文件系统监控技术,是一种强大的,细粒度的异步机制,它满足各种各样的文件监控需要,不仅限于安全和性能,内核要求2.6.13以上,inotify能监控非常多的文件系统事件,通过监控这些事件来监控文件系统是否发生变更,然后通过rsync来更新发生变更的文件。
2.2:inotify可以监视的文件系统事件
IN_ACCESS // 文件被访问
IN_MODIFY // 文件被write
IN_ATTRIB // 文件属性被修改,如chmod,chown,touch等
IN_CLOSE_WRITE // 可写文件被close
IN_CLOSE_NOWRITE // 不可写文件被close
IN_OPEN // 文件被open
IN_MOVED_FROM // 文件被移走 如mv,cp
IN_MOVED_TO // 文件被移来
IN_CREATE // 创建新文件
IN_DELETE // 文件被删除,如rm
IN_DELETE_SELF, // 自动删除,即一个可执行文件在执行时删除自己
IN_UNMOUNT // 宿主文件系统被umount
IN_CLOSE // 文件被关闭,等同于
IN_CLOSE_WRITE|IN_CLOSE_NOWRITE
IN_MOVE // 文件被移动,等同于IN_MOVED_FROM /TO
备注:上面的文件也包括目录
3:rsync
3.1:rsync简介
Rsync,remote synchronize,它在同步文件的同时,可以保持原来文件的权限,时间,软硬链接等附加信息,rsync是用rsync算法提供了一个客户机和远程文件服务器的文件同步的快速方法,而且可以通过ssh方式来传输文件,这样保密性也非常好,另外它还是免费的软件。
3.2:Rsync特性
(1) 能更新整个目录和树和文件系统
(2) 由选择性的保留符号链接,硬链接,文件属于,权限,设备以及时间等
(3) 对于安装来说,无任何特殊权限要求
(4) 对于多个文件来说,内部流水线减少文件等待的延时
(5) 能用ssh,rsh或直接端口作为传输入端口
(6) 支持匿名rsync同步文件,是理想的镜像工具
4:sersync
4-1:sersync简介
Sersync利用inotify与rsync对服务器进行实时同步,其中inotify用于监控文件系统事件,rsync时目前广泛使用的同步算法,其优点时只对文件不同的部分进行操作,所以其优势大大超过使用挂接文件系统的方式来进行镜像同步。
4-2:sersync优点
(1) Sersync是使用c++编写,由于只同步发生更改的文件,因此比其它同步工具更节约时 间,带宽
(2) 安装方便,配置简单
(3) 使用多线程进行同步,能够保证多个服务器实时同步状态
(4) 自带出错处理机制,通过失败队列出错的文件重新出错,如果仍旧失败,则每10个小 时对同步的文件重新同步
(5) 自带crontab功能,只需在xml配置文件中开启,即可按您的要求,每隔一段时间整体 同步一次
(6) 自带socket与http协议拓展,你可以方便的进行二次开发
5:两种架构
5.1:inotify-tools + rsync
(1):inotify-tools只能记录下被监听的目录发生了变化(包括增删改),并没有把具体时 哪个文件或者哪个目录发生了变化记录下来
(2):Rsync在同步的时候,并不知到具体时哪个文件或者哪个目录发生了变化,每次都是 对整个目录进行同步,当数据量很大时,整个 目录同步都非常耗时(rsync要对整个 目录遍历查找对比文件),因此效率很低
5.2:sersync + rsync
(1):sersync可以记录下被监听目录中发生变化的(包括增删改)具体某一个文件或某一个目录的名字
(2):Rsync在同步的时候,只同步发生变化的这个文件或目录(每次发生变化的数据相对于整个目录来说时很小的,rsync在遍历查找文件时,速度很快),因此,效率很高
6:为什么要用rsync+sersync
(1):sersync是基于inotify开发的,类似于inotify-tools的工具
(2):sersync可以记录下被监听目录中发生变化的(包括增,删,改)具体某一个文件或某一个目录的名字,然后使用rsync同步的时候,只同步发生变化的这个文件或者这个目录
7:具体操作:
7.1:实验环境
操作系统:Red Hat Enterprise Linux Server 6.5 (santiago)
源服务器: 192.168.4.5
目标服务器: 192.168.4.100 192.168.4.205
目的: 把源服务器上/home/www.zhang.com 目录实时同步到目标服务器的 /home/www.zhang.com下
7.2:目标服务器操作
(1) 关闭selinux
setenforce 0 //立即生效,不用重启
(2) 开启防火器tcp873端口(rsync默认端口)
/etc/init.d/iptables restart //重启防火墙使配置生效
(3) 安装rsync服务软件
(4) 将rsync交由超级管理进程管理
/etc/init.d/xinetd start //启动xinetd守护进程
(5) 创建rsyncd.conf配置文件
(6) 创建用户认证文件
(7) 设置文件权限
(8) 启动rsync
(9) 创建同步目录与同步所用的账户
7.3:在源服务器上操作
(1)关闭selinux
Setenforce = 0 //立即生效
(2)开启防火墙 tcp 873端口
/etc/init.d/iptables restart
(3)安装rsync客户端软件
(4)将rsync交由xinetd管理
/etc/init.d/xinetd start
(6)创建认证文件,设置文件权限
(7)测试服务器到源服务器之间的数据同步
如果没变的话就不会传输
(8)安装sersync工具,实时触发rsync进行同步
(8-1)查看服务器内核是否支持inotify
方法一:查看服务器内核是否支持inotigy,如果出现一下内容,说明服务器支持inotify
方法二:linux下支持inotify的内核最小为2.6.13,可以输入命令:uname -r查看内核大小
(8-2)查看并修改inotify默认参数(inotify默认内核参数值太小)
Max_queued_events inotify: 队列最大长度,如果值太小,会出现**Event Queue Overflow**错误,导致监控文件不准确
Max_user_watches: 要同步的文件包含多少目录,可以用:find /home/www.dalu.com -type d |wc -l统计,必须保证max_user_watches值大于统计结果(这里/home/www.dalu.com为同步文件目录)
Max_user_instances:每个用户创建inotify实例最大值
临时修改默认参数
将修改写入配置文件
(8-3)安装sersync
下载地址:https://sersync.googlecode.com/files/sersync2.5.4_64bit_binary_stable_final.tar.gz
(8-4)配置sersync
参数说明:
24:<Localpath watch=”/home/www.dalu.com” //源服务器同步目录
25:<Remote ip = “192.168.4.100” //目标服务器ip,每行一个
25:Name=”home_www.dalu.com”/> //目标服务器rsync同步用户名
31:<auth start=”true” //认证开始
31:users=”home_www.dalu.com_user” //目标服务器rsync同步用户名
31:passwordfile=”/etc/passwd.txt” > //目标服务器rsync同步用户的密码在源 服务器的存放路径
36:<failLog path=”/tmp/rsync_fail_log.sh” //脚本运行失败日志记录
37:<crontab start=”true” //设置为true,每隔600分钟执行一次 全盘同步
(8-5)设置sersync监控开机自动启动
(8-6)添加脚本监控sersync是否正常运行,因为有时候sersync脚本会自动关掉,因此需要写一个脚本自动的去检测该进程是否存在,不存在就启动
(8-7)脚本写好后,添加到计划任务里,每5分钟检查一次
7.4:测试
(1)删除
查看源服务器同步目录
查看目标服务器同步目录
删除源服务器同步目录中以l开头的文件并查看
查看目标服务器的同步目录
(2)新建
在目标服务器创建新文件
查看源服务器同步目录
(3)修改
在源服务器修改new_document.txt内容
查看目标服务器中new_ducument内容
8 可能遇到的问题
(1)测试的时候远程路径输错
将/去掉即可
(2)测试的时候chdir failed
初遇这个问题,有点不知所措,因为这个没有学过,只做过本地同步,而且没那么多选项,没有那么多配置文件项,只能百度,但是度娘说是selinux的问题,但是我早就把selinux给关了,按他的方法做下来,依然没有解决问题。只能翻看自己的配置文件,最后发现,配置文件中的同步目录和创建的同步目录不是一个目录,改了之后可以了。
(3)同步多个目录
Sersync是多线程的,可以同步多个目录,但是不能写在同一个配置文件中,必须重写,并启起一个sersync进程。
(4)不同用户同步不同目录
刚开始将用户和密码都写在了一个文件中,但是老报语法错误,之后我将认证文件写在了不同文件中,并在相应的文件中做了修改,并设置为600权限,就可以了。
(5)同步多台主机
要是同步多台主机,修改.xml文件,多加几个remote ip 就可以了
9 小结
(1)通过以上操作,可使服务器的/home/www.dalu.com/目录能从主服务器实时更新,升级的时候只升级主服务器的文件,从服务器也会自动更新过去,减少工作量以及出错的概率。
(2)当同步的目录数据量不大时,建议使用inotify+rsync;当数据量很大时(几百G甚至1T以上),建议使用sersync+rsync
附:rsync参数
rsync参数
-v, --verbose 详细模式输出
-q, --quiet 精简输出模式
-c, --checksum 打开校验开关,强制对文件传输进行校验
-a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
-r, --recursive 对子目录以递归模式处理
-R, --relative 使用相对路径信息
-b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
--backup-dir 将备份文件(如~filename)存放在在目录下。
-suffix=SUFFIX 定义备份文件前缀
-u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
-l, --links 保留软链结
-L, --copy-links 想对待常规文件一样处理软链结
--copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
--safe-links 忽略指向SRC路径目录树以外的链结
-H, --hard-links 保留硬链结
-p, --perms 保持文件权限
-o, --owner 保持文件属主信息
-g, --group 保持文件属组信息
-D, --devices 保持设备文件信息
-t, --times 保持文件时间信息
-S, --sparse 对稀疏文件进行特殊处理以节省DST的空间
-n, --dry-run现实哪些文件将被传输
-W, --whole-file 拷贝文件,不进行增量检测
-x, --one-file-system 不要跨越文件系统边界
-B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节
-e, --rsh=COMMAND 指定使用rsh、ssh方式进行数据同步
--rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
-C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
--existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
--delete 删除那些DST中SRC没有的文件
--delete-excluded 同样删除接收端那些被该选项指定排除的文件
--delete-after 传输结束以后再删除
--ignore-errors 及时出现IO错误也进行删除
--max-delete=NUM 最多删除NUM个文件
--partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
--force 强制删除目录,即使不为空
--numeric-ids 不将数字的用户和组ID匹配为用户名和组名
--timeout=TIME IP超时时间,单位为秒
-I, --ignore-times 不跳过那些有同样的时间和长度的文件
--size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
--modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
-T --temp-dir=DIR 在DIR中创建临时文件
--compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
-P 等同于 --partial
--progress 显示备份过程
-z, --compress 对备份的文件在传输时进行压缩处理
--exclude=PATTERN 指定排除不需要传输的文件模式
--include=PATTERN 指定不排除而需要传输的文件模式
--exclude-from=FILE 排除FILE中指定模式的文件
--include-from=FILE 不排除FILE指定模式匹配的文件
--version 打印版本信息
--address 绑定到特定的地址
--config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
--port=PORT 指定其他的rsync服务端口
--blocking-io 对远程shell使用阻塞IO
-stats 给出某些文件的传输状态
--progress 在传输时现实传输过程
--log-format=formAT 指定日志文件格式
--password-file=FILE 从FILE中得到密码
--bwlimit=KBPS 限制I/O带宽,KBytes per second
-h, --help 显示帮助信息
IN_ACCESS 被监控项目或者被监控目录中的条目被访问过。例如,一个打开的文件被读取。
IN_MODIFY 被监控项目或者被监控目录中的条目被修改过。例如,一个打开的文件被修改。
IN_ATTRIB 被监控项目或者被监控目录中条目的元数据被修改过。例如,时间戳或者许可被修改。
IN_CLOSE_WRITE 一个打开的,等待写入的文件或目录被关闭。
IN_CLOSE_NOWRITE 一个以只读方式打开的文件或目录被关闭。
IN_CLOSE 一个掩码,可以很便捷地对前面提到的两个关闭事件(IN_CLOSE_WRITE | IN_CLOSE_NOWRITE)进行逻辑操作。
IN_OPEN 文件或目录被打开。
IN_MOVED_FROM 被监控项目或者被监控目录中的条目被移出监控区域。该事件还包含一个 cookie 来实现 IN_MOVED_FROM 与 IN_MOVED_TO 的关联。
IN_MOVED_TO 文件或目录被移入监控区域。该事件包含一个针对 IN_MOVED_FROM 的 cookie。如果文件或目录只是被重命名,将能看到这两个事件,如果它只是被移入或移出非监控区域,将只能看到一个事件。如果移动或重命名一个被监控项目,监控将继续进行。参见下面的 IN_MOVE-SELF。
IN_MOVE 可以很便捷地对前面提到的两个移动事件(IN_MOVED_FROM | IN_MOVED_TO)进行逻辑操作的掩码。
IN_CREATE 在被监控目录中创建了子目录或文件。
IN_DELETE 被监控目录中有子目录或文件被删除。
IN_DELETE_SELF 被监控项目本身被删除。监控终止,并且将收到一个 IN_IGNORED 事件。
IN_MOVE_SELF 监控项目本身被移动。
本文出自 “庭中有奇树” 博客,请务必保留此出处http://zhangdl.blog.51cto.com/11050780/1881878
Sersync实现触发式文件同步