raid5阵列常见故障:
1、服务器硬件故障或者RAID阵列卡故障;
2、服务器意外断电导致的磁盘阵列故障;
3、服务器RAID阵列阵列磁盘出现物理故障,如:电路板坏、磁头损坏、盘面划伤、坏扇区、固件坏等;
4、误操作导致磁盘盘序出现错误;
5、raid在同步数据或者重建过程中,同组raid阵列中又有其他硬盘掉线导致同步失败。
RAID5磁盘阵列出现故障后需要注意的问题:
1、发现RAID5磁盘阵列发生故障或者数据丢失,建议不要盲目进行rebuild操作。
Rebuild:通过阵列的校验功能,根据阵列内其他正常硬盘中的数据,计算&生成损坏硬盘中的数据,然后同步到热备盘中。Rebuild操作适用于raid5阵列中有1块硬盘掉线的情况。针对raid5阵列中有2块磁盘掉线的情况:如果第一块硬盘掉线后服务器有写入操作,第一块掉线的硬盘数据在掉线后就不更新了。rebuild只能对先掉线的磁盘做Rebuild,如果对后掉线的磁盘做Rebuild操作,则部分阵列虽然能正常工作,但会出现数据错乱,某些文件无法打开的情况。
2、RAID5阵列中硬盘掉线,建议不要盲目进行强制上线操作。
从北亚企安数据恢复工程师做过的海量RAID5阵列数据恢复案例中来看,有部分raid5阵列数据丢失的原因是阵列中有一块硬盘离线后没有及时更换硬盘,此后服务器出现故障或者服务器重启,原来离线的硬盘重新上线,而原本在线的硬盘反而故障离线,数据不能正常使用。
用户对后离线的硬盘进行强制上线操作,磁盘阵列自动同步,导致数据新旧混乱,服务器数据丢失。市面上多数品牌和型号的阵列卡在原先离线磁盘自动上线时会检查校验信息,一旦发现校验信息不正确就会重新计算校验信息,无法在缺盘的情况下恢复数据。
3、千万不要进行初始化操作。
初始化类似于低级格式化,一旦对阵列进行初始化操作,这个阵列内所有硬盘的底层数据会被全部清零,导致阵列数据无法恢复。
4、重新配置阵列信息时要保持与原阵列配置信息一致。
一旦重新配置磁盘阵列的信息与原始磁盘阵列的信息不一致,阵列内多数文件将无法打开,导致数据丢失。多数服务器都具有重新配置阵列信息后自动初始化的功能,这将导致数据无法恢复。
5、在进行任何数据恢复操作前,务必将服务器内的所有硬盘以只读方式进行扇区级的镜像备份,避免破坏原始数据。
RAID5数据恢复方案:
1、将故障服务器中所有磁盘编号后取出,由硬件工程师对所有磁盘进行硬件故障检测。针对不存在硬件故障的磁盘,以只读方式做镜像;对于存在硬件故障的磁盘,由硬件工程师处理后使用专门的工具做镜像备份。
2、基于镜像文件分析底层数据,根据分析底层数据获取到的RAID5阵列结构相关信息重组raid5阵列,然后导出数据。
3、验证导出的数据,确认数据无误后重新搭建环境,将恢复出来的数据迁移到准备好的服务器环境中。