首页 > 代码库 > 如何尽可能挽救RAID故障带来的损失?

如何尽可能挽救RAID故障带来的损失?

案例:

抛出一个做过RAID,开机出现问题的案例。当然这里只是其中一个现象。

从中可以得到三个信息。

1、Adapter RAID BLOS V5.2-0     //可能和RAID有关

2、press<ctrl><A>for ibm serveRAID configuration utility!  //ctal+A进入BLOS配置

3、controller monitor initializing...     //控制器监视初始化…

技术分享

遇到这样的问题,一般人可能会不淡定了,不知道如何有效的,最小损失的解决问题。

在这里,我谈一下个人的经验和看法,希望可以帮助到一些人。出现上述问题,处理步骤可见下:

###############################################################


谈谈本人对于做RAID 后期维护的经验:

1、RAID的选择:

1.1)RAID5

1.2)RAID+热备

1.3)RAID10

1.4)其他

其中上面三种方式用的颇多,用RAID之前,要知道其中的不同,如果你是做RAID5的话,要注意定期机房查看,或者通过监控检测(不过还是觉得定期机房查看为好),不过这里要明白,至少坏多少盘磁盘阵列会出现问题。这也是一些人用RAID5之后,加了个热备盘的原因。至于RAID10,用的也比较多,而且风险要比RAID5小一些。因此,RAID的选择很重要。


2、数据的备份

你始终要明白,做RAID是为了更好的确保数据的安全性,但是你更要明白,数据备份才是王道,即使做了RAID,数据也要定期备份,如果数据十分重要,一点也不可以丢失,那选择一种实时备份尤为重要。


3、RAID数据盘和系统盘区分

我本人还是比较建议RAID和系统区分开的,比如系统盘做RAID1,数据库盘单独做别的RAID,合理化管理。当然如果不喜欢这种方式也可以。


4、RAID卡报错,处理步骤如下:

4.1)首先检查物理服务器磁盘是否出现黄灯或者红灯现象,一般先是黄灯的偏多。


4.2)黄灯情况,坏的盘理论不影响数据

4.2.1)要先想想是否数据进行了备份,如果没有,尽快备份。

(此考虑是在系统并没有关机,只是监控报警发现RAID卡出现问题)

4.2.2)如果系统不慎关机,发现此现象,那先考虑是否有售后,数据备份有没有备份,如果有,先恢复当前业务为主,然后将磁盘拿到售后进行处理。


4.3)如果没有售后且红灯且理论影响数据,尽可能挽救损失。

4.3.1)尝试此服务器换个系统(系统不能在RAID卡),然后启动系统,尝试挂载RAID阵列,备份数据

4.3.2)如果由于一般原因(比如松动,磁盘内部发生报错),可尝试是把服务器的RAID卡抠出来再放进去一般就能解决了,如果此方法不能解决的话则有可能是RAID卡有了问题。

4.3.3)出现问题的磁盘不要直接使用(除非磁盘坏道修复,没有其它)


5、RAID卡出现问题注意事项

5.1)不要随意插拔硬盘

5.2)不能搞乱RAID卡顺序

5.3)如果是一块RAID卡出现问题,可换一块磁盘即可。


总结:数据为大,选好RAID卡阵列,定期数据备份,平时机房监控查看,懂得尽可能挽救RAID阵列里的数据,尽可能避免损失。


本文完全博主就RAID问题个人经验总结,如有问题,欢迎指出。


本文出自 “任志远51CTO博客” 博客,谢绝转载!

如何尽可能挽救RAID故障带来的损失?