基本信息
|
客户姓名 | 某银行 | ||
送修日期 | 2015 | |||
恢复用时 | 3天小时 | |||
故障描述 | IBM 3650服务器,底层使用5块 SAS 500GB磁盘做的RAID5,其中一块为热备磁盘。服务器操作系统为 windows 2003 x64,整个存储分成三个分区,第一个40GB为windows系统区,第二个约700GB,为DB2生产库所在的分区,第三个也是约700GB,为备份文件所在的分区。客户使用 IBM DB2v8.2数据库,整体数据量不大,db2move 备份文件约 16GB。但数据库中多张表存储外部文件指针,指向约100多万张扫描件。 | |||
检查恢复 | 1.工程师开始对所有磁盘进行镜像,发现有两块磁盘有严重物理坏道,通过专用设备最大化镜像出数据,然后着手RAID分析、重组过程。2.分析发现热备磁盘早已顶上RAID磁盘,再分析出最先离线的两块磁盘,此时就确定了恢复数据所需的三块磁盘,但有一块磁盘前部存在大量坏道,位置处于 windows系统区域。3.按分析好的原始RAID参数,重组RAID,并修复 windows系统。使用正常的 windows系统文件对损坏的RAID中的windows系统文件进行替换,然后再次镜像回客户用新的磁盘做新的RAID中,启动服务器,进入系统,一却正常。4.验证DB2数据库: 数据库无法启动,发现windows服务存在问题,修复好,数据库仍无法启动,再次修复 db2数据库的编目,数据库实例能正常启动,激活实例下的两个数据库,正常。5.客户验证数据库中表的数据,最新数据存在,操作也一却正常。 |