0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心
发布

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器数据恢复—磁盘不稳定被踢导致raid5阵列崩溃的数据恢复案例

Frombyte 来源:Frombyte 作者:Frombyte 2024-06-12 11:30 次阅读

服务器存储数据恢复环境:
品牌MSA2000服务器存储中有一组由8块SAS硬盘组建的raid5磁盘阵列,其中包含一块热备盘。分配了6个LUN,均分配给HP-Unix小机使用。磁盘分区由LVM进行管理,存放的数据主要为Oracle数据库及OA服务端。

服务器存储故障:
服务器存储raid5阵列中有两块硬盘先后离线,服务器瘫痪,无法正常访问lun。

服务器存储数据恢复过程:
1、将所有磁盘编号标记后取出故障服务器存储,硬件工程师分别对服务器中所有磁盘进行物理故障检测和坏道检测,均无异常。
将所有磁盘以只读方式镜像成文件,镜像完成后将所有磁盘按照编号还原到故障存储中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
备份完成的部分数据:

wKgZomZpFfuAdGRFAAGCY5ulPiE439.png北亚企安数据恢复——raid5数据恢复



2、MSA2000存储中一旦某些磁盘读写性能不稳定,该存储中的raid控制器会将这些磁盘识别为坏盘并踢出RAID。一旦RAID中掉线的盘数到达到采用的RAID级别所允许掉盘的极限,RAID不可用,服务器瘫痪。
3、存储中的LUN都是基于RAID的,要想恢复数据就需要先将原始RAID重组出来。分析Oracle数据库页在每个磁盘中分布的情况,并根据数据分布的情况获取RAID条带大小,盘序、数据走向等重组RAID所需要的信息
4、根据分析出来的RAID信息重组原始RAID。重组完成后分析LUN在RAID中的分配情况,以及LUN分配的数据块MAP。由于有6个LUN,因此只需要将每一个LUN的数据块分布MAP提取出来。北亚企安数据恢复工程师根据这些信息编写相应的程序,解析所有LUN的数据MAP,然后根据数据MAP导出所有LUN的数据。
导出的部分数据:

wKgaomZpFheALyIlAAHsvQsM8Wg858.png北亚企安数据恢复——raid5数据恢复



5、分析所有LUN,发现所有LUN中均包含LVM逻辑卷信息。尝试解析每个LUN中的LVM信息,发现其中一共有三套LVM:第一个LVM中划分了一个LV,存放OA服务器端的数据;第二个LVM中划分了一个LV,存放临时备份数据;剩下的4个LUN组成一个LVM,划分了一个LV,存放Oracle数据库文件。北亚企安数据恢复工程师编写LVM解释程序,尝试解释每套LVM中的LV卷,但是在解释过程中出错。
6、开发工程师debug程序出错的位置,分析程序报错原因,由文件系统工程师对恢复出来的LUN做检测,检测LVM信息是否会因为存储瘫痪而导致LMV逻辑卷的信息损坏。经过检测发现LVM信息确实被破坏。北亚企安数据恢复工程师尝试人工修复损坏的区域,并同步修改程序重新解析LVM逻辑卷。
7、搭建HP-Unix环境,将解释出来的LV卷映射到HP-Unix。尝试Mount文件系统,结果Mount文件系统出错。尝试使用“fsck –F vxfs” 命令修复vxfs文件系统,修复完成还是不能挂载。怀疑vxfs文件系统元数据被破坏。
8、仔细分析解析出来的LV,根据VXFS文件系统的底层结构校验此文件系统的完整性。分析发现VXFS文件系统确实存在问题,存储瘫痪的同时此文件系统正在执行IO操作,因此部分文件系统元文件损坏。人工修复这些损坏的元文件,直到能够正常解析VXFS文件系统。再次将修复好的LV卷挂载到HP-Unix小机上,尝试Mount文件系统,这回文件系统没有报错,成功挂载。
9、在HP-Unix机器上mount文件系统后,将所有用户数据备份至指定空间。
部分文件目录:

wKgaomZpFh6AG940AAEx_hriVWE593.png北亚企安数据恢复——raid5数据恢复



10、使用Oracle数据库文件检测工具“dbv”检测每个数据库文件是否完整,没有发现错误。使用北亚企安自主研发的Oracle数据库检测工具进行检测,发现有部分数据库文件和日志文件校验不一致。由数据库工程师修复此类文件并校验,直到所有文件均通过校验。
11、将恢复出来的Oracle数据库附加到原始生产环境的HP-Unix服务器中,尝试启动Oracle数据库,Oracle数据库启动成功。

wKgZomZpFiWAIjC9AANXE12Fup0339.png北亚企安数据恢复——raid5数据恢复



12、启动Oracle数据库和OA服务端,通过OA客户端对最新的数据记录以及历史数据记录进行验证,并且安排不同部门人员进行远程验证。经过仔细验证,确认数据完整有效。本次数据恢复工作完成。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    8593

    浏览量

    84161
  • 数据恢复
    +关注

    关注

    10

    文章

    493

    浏览量

    17073
  • RAID5
    +关注

    关注

    0

    文章

    100

    浏览量

    12673
收藏 人收藏

    评论

    相关推荐

    服务器数据恢复raid5阵列热备盘未全部成功启用的数据恢复案例

    服务器存储 数据 恢复环境: 一台EMC某型号存储中有一组 RAID5 磁盘阵列。该 raid5
    的头像 发表于08-14 11:27 209次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b>热备盘未全部成功启用的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复raid5阵列热备盘未完全激活导致阵列崩溃数据恢复案例

    服务器存储 数据 恢复环境: 北京某企业一台EMC FCAX-4存储上搭建一组由12块成员盘的 raid5 磁盘阵列,其中包括2块热备盘。
    的头像 发表于07-12 10:58 99次阅读

    服务器数据恢复—EMC存储中raid5阵列多块硬盘离线的数据恢复案例

    服务器存储 数据 恢复环境: 一台EMC存储中有一组 raid5 磁盘阵列,划分1个lun供小型机使用,上层采用ZFS文件系统。
    的头像 发表于07-09 11:58 97次阅读

    服务器数据恢复raid5阵列硬盘坏道导致raid崩溃数据恢复案例

    服务器存储 数据 恢复环境: 某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块硬盘组建2组 RAID5 磁盘阵列(一组
    的头像 发表于07-05 12:00 180次阅读

    服务器数据恢复磁盘离线但热备盘未完全启用导致raid5阵列崩溃数据恢复案例

    一台EMC某型号存储由于存储中 raid5 阵列出现故障 导致 服务器 崩溃,由于 数据涉密,需要工程师到现
    的头像 发表于06-11 13:51 137次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>磁盘</b>离线但热备盘未完全启用<b class='flag-5'>导致</b><b class='flag-5'>raid5</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—同友存储raid5阵列崩溃数据恢复案例

    服务器 数据 恢复环境: 某市教育局同友存储,存储中有一组由数块 磁盘组建的 raid5 阵列,存储空间
    的头像 发表于06-11 11:45 311次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—同友存储<b class='flag-5'>raid5</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—X3650服务器raid5磁盘阵列数据恢复案例

    一台某品牌X3650M3 服务器服务器中有一组 raid5 磁盘阵列,上层采用zfs文件系统。 服务器未知原因
    的头像 发表于06-04 11:08 263次阅读

    服务器数据恢复RAID5多块磁盘掉线导致崩溃数据恢复案例

    某公司的一台 服务器中的 raid5 磁盘阵列有两块 磁盘先后掉线, 服务器 崩溃。故障
    的头像 发表于05-21 11:43 412次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>RAID5</b>多块<b class='flag-5'>磁盘</b>掉线<b class='flag-5'>导致</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—分享几个服务器数据恢复的案例

    服务器 数据 恢复案例之 服务器 raid6中3个 磁盘离线 导致
    的头像 发表于03-04 13:21 696次阅读

    服务器数据恢复raid5崩溃导致同友存储无法启动的数据恢复案例

    服务器 数据 恢复环境: 一台同友存储,存储上有一组 raid5 磁盘阵列,存储上层有若干台虚拟机,其中有3台linux操作系统虚拟机上存放重要
    的头像 发表于01-02 13:28 228次阅读
    【<b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>】<b class='flag-5'>raid5</b><b class='flag-5'>崩溃</b><b class='flag-5'>导致</b>同友存储无法启动的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复-raid5故障导致上层卷无法挂载的数据恢复案例

    服务器 数据 恢复环境: 一台 服务器中有一组由24块FC硬盘组建的 raid5 磁盘阵列,linux操
    的头像 发表于12-14 11:32 371次阅读

    服务器数据恢复raid5热备盘未激活导致阵列崩溃数据恢复案例

    (oracle已经不再为该OA系统提供后续 服务支持)。 服务器故障: raid5中一块 磁盘离线,热备盘未自动激活rebuild(原因不明)。
    的头像 发表于12-12 13:58 376次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>—<b class='flag-5'>raid5</b>热备盘未激活<b class='flag-5'>导致</b><b class='flag-5'>阵列</b><b class='flag-5'>崩溃</b>的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例

    服务器数据恢复—EMC存储raid5故障的数据恢复案例

    服务器存储 数据 恢复环境: EMC某型号存储,8块组建一组 raid5 磁盘阵列。上层操作系统采用zfs文件系统。
    的头像 发表于11-30 11:59 439次阅读

    服务器数据恢复-RAID5磁盘导致raid崩溃数据恢复案例

    一台3U的某品牌机架式 服务器,Windows server操作系统,100块SAS硬盘组建 RAID5 阵列
    的头像 发表于10-19 15:07 413次阅读

    服务器数据恢复-raid5崩溃导致上层LVM结构破坏的数据恢复案例

    服务器 数据 恢复环境: 一台 服务器中有两组分别由4块SAS硬盘组建的 raid5 阵列,两组
    的头像 发表于09-06 15:08 531次阅读
    <b class='flag-5'>服务器</b><b class='flag-5'>数据</b><b class='flag-5'>恢复</b>-<b class='flag-5'>raid5</b><b class='flag-5'>崩溃</b><b class='flag-5'>导致</b>上层LVM结构破坏的<b class='flag-5'>数据</b><b class='flag-5'>恢复</b>案例