WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

新闻资讯 > 硬盘 > 正文
磁盘阵列恢复方法以及注意事项
作者: 佚名 2016-05-09 19:12 【中国存储】

想要弄清楚磁盘阵列恢复,首先就得知道什么是磁盘阵列,磁盘阵列多用于存储服务器,数据服务器等企业级大数据存储领域,磁盘阵列是把多块独立的物理硬盘按不同方式组合起来形成一个逻辑硬盘,当磁盘瘫痪或硬件损坏后,为了恢复存储在阵列平台的数据被称之为磁盘阵列数据恢复,而磁盘阵列能够提供比单个硬盘有着更高的性能和提供数据冗余的技术。

对于做数据恢复人员来讲,最怕的是什么,那就是在客户发现数据丢失后,没有停止对其他的操作,而是随意根据自己的理解或者是某些未证实的方法进行随意操作,导致数据恢复难上加难,因此如果你的服务器或存储平台组建了RAID磁盘阵列,无论因哪种原因导致的磁盘阵列瘫痪,请勿进行侥幸心理尝试或执行盲目性无安全操作,这是十分危险的事情!在RAID数据恢复案例统计中发现,不能恢复的RAID数据往往是再次的操作导致的,因此一旦发现磁盘阵列发现问题,请立即停止一切操作,咨询相关技术人员,确定好后再操作。

那么当磁盘阵列不正常或无法启动的时候,该如何有效的保护数据不被破坏呢,先简单介绍下几种可能会对磁盘阵列数据恢复造成数据破坏的操作:

1.强制Online

这个操作是很容易对阵列造成数据破坏的,尤其是当有2块或以上的盘掉线的时候,如果不知道哪个盘先掉,哪个盘后掉的话,一但破坏了,数据将有可能变成旧的,而且无法恢复。

2.Rebuild

比如:RAID5阵列,4块盘,Rebuild操作的实际意义是,用其中3块盘做异或运算,将结果写到另一块盘中。这里要求,用来做异或运算的3块盘的数据一定要是正确的,如果其中有一块或多块不正确哪么异或出来的结果也就是不正确的。

3.更换RAID卡或主机

目前大部分RAID卡都是支持这种操作的,在阵列正常的情况下这个操作是不会破坏数据的。但是,在阵列已经瘫痪或是无法正常工作的时候,这个操作将有可能导致RAID对硬盘做不正常的Rebuild和校验,所以当阵列出现问题的时候,要准确判断是阵列卡有问题,还是硬盘有问题,不要轻易去尝试更换RAID卡或主机。

4.把报错的硬盘全部拔下来再插上去

拔下来没关系,但是如果再全插上去的话阵列将重新去识别插上去的硬盘,这时如果硬盘中的阵列信息或数据有误的话,会导致阵列做出错的Rebuild操作。如果是怀疑硬盘接触不好的话,可以一块一块的拔,再一块一块的插上去。不要一次都拔下来。或者可以的话,关机后,再进行插拔。

5.操作系统的check disk

Windows,Linux,Unix等操作系统都有自己的一个硬盘检测程序,当你硬盘中的分区或文件出现问题无法正常读取的时候,操作系统就会在重启的时候去自动运行Check disk去试图修复,这时,如果是阵列的检验出现问题而导致分区或文件出错的话,运行Check disk将有可能破坏阵列中数据。

6.对RAID中单块硬盘进行写操作

一件事情或一个工作做的多了,你可能什么情况都能遇到,这一项我们是很不愿意列出来,但是就有人这么做了,所以不得不拿出来提醒一个。阵列中的硬盘是一个整体,破坏其它一块硬盘就是破坏整个阵列。

7.磁盘掉线

对于RAID5来说,掉线1块盘阵列还是可以正常运行的,如果超出1块,阵列将无法启动。当阵列掉线超出1块盘的时候,最好不要做强制Online。尤其是在你不知道是哪个盘先掉线哪块盘后掉线的时候,绝对不可以强制Online。RAID0和1算法简单,这里就不详细说明了。RAID5当一块硬盘OFFLINE之后负载会比较重,此时最好做脱机的REBUILD,如一定要在线REBUILD,应尽可能少得对磁盘做高负荷的读写,应保障这个过程的顺利完成。建议条件许可的话,加入HOTSPARE DISK

8.磁盘有坏道

阵列中的磁盘如果有坏道的话,会导致磁盘掉线或阵列不稳定,这时应尽早将有坏道的硬盘换掉,如果出现多坏硬盘有坏道的话,阵列将可能瘫痪。

9.断电或意外关机

阵列是由RAID卡控制硬盘,通过某种算法将多块硬盘整合成一块硬盘提供给用户使用。在阵列运行过程中,会有大量的输入输出信息放在RAID卡的缓冲或主机的缓冲中的,如果发生突然断电和意外关机的情况,将导致碏的信息无法写回到硬盘或RAID卡的ROM中,这样极易导致阵列信息丢失、阵列瘫痪。

10.扩容失败或扩容过程中意外中断

这里强烈建议,虽然目前很多阵列都支持不破坏数据直接扩容,但是这种操作十分危险,在扩容的过程中如果出现意外情况,比如说,突然断电,硬盘有坏道等,那数据是无法恢复的。所以要尽量将数据备份后再进行扩容。

11.文件目录混乱,部分或全部文件无法访问

这种情况是由于阵列中某块硬盘的数据是不正确的,导致校验出错,其实并不是文件本身的问题。这时如果重启系统的话,操作系统会对这个分区做Check disk,注意不要让系统做Check disk。

12.Rebuild失败或Rebuild过程中意外中断

Rebuild过程中阵列是不能断电的,否则阵列将有可能瘫痪。而且磁盘中有坏道的活,在Rebuild过程中也会使Rebuild失败。

甲驭科技数据恢复中心专业从事数据恢复服务及其产品研发。是国内较早专业从事数据恢复服务的公司,拥有资探数据恢复技术团队。可以应付各种类型的raid阵列故障。对各种raid类型,例如raid0,1,5,6,5e,5ee,6e,惠普双循环等情况都可以进行恢复,我们研发了业界知名的raidgenius,磁盘阵列自动分析工具,全自动恢复以及检测各类型的raid阵列上千例


标签:磁盘 RAID 硬盘 

LecVideo
论坛与活动