首页 > 代码库 > 事故教训:备份与巡检的重要性

事故教训:备份与巡检的重要性

前一段时间,发生了多起较大的数据库故障,几乎每个月发生一次事故
大部分原因是硬件故障引起,由于巡检不及时,导致累积坏掉2块或2块以上磁盘,从而造成重大损失。

技术分享

磁盘阵列的关键部件如磁盘控制器、磁盘都是冗余配置的,正常情况下,允许坏掉一个部件而不影响正常工作,但是如果不及时更换故障部件,当再次发生部件故障时,灾难就发生了。
所以,及时的巡检非常重要,可以避免不必要的故障发生。
每个项目都要做到,确保自己的数据库所在磁盘阵列都是正常的,每周至少1次巡检磁盘阵列,前面板有无故障指示灯闪烁。
当灾难发生时,还有最后一根救命稻草备份】。
备份重于一切,关键时刻,备份是保底的,如果没有备份,一切也就玩完了。
因此,每个项目都必须确保有及时、有效的备份。

事故教训:备份与巡检的重要性