首页 > 代码库 > 灾备演练

灾备演练

12月20日:

灾备演练前告知灾难管理小组及相关业务部门提前做好准备工作。


12月21日:

一、【容灾演习-第一阶段开始】

1、7点钟灾难发生(模拟南汇生产机房火灾,导致服务器、网络设备受损严重、各业务均不可访问)。

2、7时32分完成灾难确认及灾难评估,同步上报灾难管理小组决策是否进行灾备切换。

3、7时50分灾难管理小组组长决策进行灾备切换,按既定流程,确定于8:00准时开始切换核心营运系统到无锡灾备中心,预计10:00恢复核心系统及周边系统。

4、7时50分内部门户发布灾备演练维护通知,计划于 2014-12-21 10:00 切换完成,涉及业务操作详情请各业务部门咨询各事业部解决方案推广小组。

5、8时xx官网发布《xx系统升级告客户书》,并实时记录业务量情况,每半小时展现一次数据。

6、8时灾备切换执行团队进行切换,灾备切换进度实时通过进度工具展现。切换工作按照预期计划正常进行,整体进展顺利。

7、截止9时00分核心营运系统等10个系统已切换至灾备中心,同步进行灾备中心内网功能验证工作。预计10点灾备中心开始对外提供服务。

8、截止9时30分核心营运系统及周边相关系统等10个系统切换至灾备中心后,灾备中心内网功能验证工作已完成,所有系统验证正常,9时30分灾备中心开始正式对外提供服务,其它切换工作按照预期计划正常进行,整体进展顺利。同步进行业务回访,涉及异常由各事业部解决方案推广组进行对接解决。实时查看业务开单量及灾备系统、网络运行状况。

9、9时30分内部门户更新灾备演练维护通知,计划于 2014-12-21 12:00 关闭使用并进行回切操作。


二、【容灾演习-灾难回切评估】

1、回切软硬件条件具备 ;数据反向同步和校验完成;回切方案就绪;

2、回切成本评估:①业务中断时间:12时00分~14时00分为业务操作低峰期,期间业务可采用线下执行,系统恢复后补录; ②数据丢失量:0数据丢失;

3、评估结论:生产机房具备回切条件,回切时间处于业务低峰,建议12:00开始回切操作。灾难管理小组组长决策进行容灾切换回切操作。


三、【容灾演习-第二阶段】

1、12时整内部门户更新灾备演练维护通知,计划于 2014-12-21 14:00 回切完成恢复正常使用。

2、截止12时30分核心营运系统及周边相关系统等10个系统已回切至生产南汇中心,同步进行生产中心内网功能验证工作。预计12时50分生产中心开始对外提供服务。

3、截止12时50分回切至生产中心后,生产中心内网功能验证工作已完成,所有系统验证正常;12时50分上海生产中心开始正式对外提供服务,其它切换工作按照预期计划正常进行,整体进展顺利。


四、【容灾演习-演习结束】

总结过程经验及流程改进。


本文出自 “天骄地傲” 博客,谢绝转载!

灾备演练