日本电子维修技术 NAS记一次黑群故障及RAID和数据恢复过程




看了回复,无非大家觉得黑群不能放业务数据,RAID不安全,不过我想说的是重要数据备份,这个跟黑白没关系,跟RAID没关系,各种数据有其重要性,用户自然是知道的,只是重要性有个高低,是否值得的花成本的问题。白群崩溃的也不是少数,关键看运气和操作,此次问题也证明RAID对某些问题导致盘脱机有一定的数据保护能力。
这儿的数据有部分有备份,未备份的还是能重新获取到,只是麻烦一点(分散存放,需求重新做整理,或者不在本地),否则我也不会放心大胆的恢复,而不是直接就让送专业数据恢复那儿了。



以下仅有文字描述,未配任何图片。觉得不想看文字的可以绕道。
仅记录处理全过程,暂时未复盘处理过程中有何不妥的步骤,如果各位有建议,请指出讨论。
设备非我自用,是朋友的。
先说结果,虽然过程稍微有点曲折,但结果基本OK。

1.设备配置:
   某黑群晖,采购自TB,六盘位,卖家安装的DSM5-5967,后加装了4块8T酷狼,R5,存有业务数据10多T。经检查是GA-MN525RI主板,4G内存,8GU盘,益衡250W电源

2.故障描述:
   不定时掉盘,后RAID损坏,有一块盘显示未初始化,另外3块盘只有一块显示系统可以访问,其他红字显示无法系统访问。盘未显示有任何坏道之类故障。也拿脱机的那块接PC看了下,扫描了前一部分,也没问题。

3.故障处理过程:
   因数据还比较重要,且虽然掉盘,但还可以访问数据,故先尝试了修复系统,修复完成显示3个盘都是绿色可以访问正常,然后开始拷贝数据,但拷贝当中大量数据无法正确读取,不时跳出文件无法访问的提示,点了跳过后有可以拷贝一部分,故挂那儿继续拷贝,但没过多久发现系统死机。
    再次重启系统,接显示器,黑群启动到命令登陆界面后,群晖助手完全找不到此NAS,也无法登陆WEB界面,故可以判断前面的系统修复完全没有成功,且最后一个系统也有问题,处理遇到瓶颈。
    咨询了一下别人,也查了下网上资料,准备尝试下再做一个系统然后挂载RAID,拔了4个盘,然后重新找了一个硬盘,按新机器重新装了系统,能正常启动,然后关机,插入3个盘(RAID未坏的3个盘),重新开机,进系统提示RAID损坏,但还是能拷贝数据,故继续拷贝数据,但还是大量的读取错误。想想能救一点是一点,就跳过了无法读取部分。拷贝了一会儿,系统再次死机,重启后发现新系统无法进,反而进了老系统(黑群启动完后命令提示前有显示名称,前后两个名称特意起的不一样就此判读),但老系统还是跟原来一样无法进WEB,也无法访问。
    再次拔了RAID盘,单系统盘进系统根本无法找到系统,WEB显示无硬盘,以为硬盘坏了(毕竟是很老的旧盘),又换了块盘再重做,又能进系统,再重启了一遍(没插RAID盘),结果又进不了系统了,提示无硬盘,想想不会手这么背吧,连坏两个盘,把前面一块盘拿下来接PC,一切正常,想想是不是主板口有问题,换到2口也不行,换最后一个口,能进系统,故终于判断主板SATA口有故障。然后用6口接系统盘,1口随便接了个其他的盘,进系统还是不认1口的盘证实前面的判断。
     故障就是坏了5个SATA,且是间隙性故障。

4.数据处理过程:
      前面判断是主板问题,换主板好办,重要的数据恢复。
       先要找个合适的平台,要至少5个SATA口还真不好找,最后拆了自己的WINSERVER做的NAS机器,搭建了下。
     同样是1口接新的系统盘,后面4个口接了3个RAID盘(因为试过那块离线的盘接上会系统启动有问题),进系统,RAID损毁,但能读取数据,开始拷贝数据,一共比较重要的有4个T左右,时间比较长,中间也偶尔跳数据损坏,但少多了,拷贝数据花了几个小时,期间共有5个大小不一的文件报数据损坏,做了记录。
     拷贝完又再次尝试了下拷贝那几个文件,居然惊喜的发现很顺利的都拷贝出来了,包括有一个几个G的单个文件,所以坏的也可以再试下,说不定就有能读出来。
    拷贝完数据,下面基本就放心搞了,想想还有些不很重要或者有备份的,能恢复最好,但不想再拷贝出来了,一是没那么多空间,二是时间太长了,所以想尝试修复下RAID,但离线的盘不能冷插,故尝试热插了下,过了一会儿,系统里面显示多一个盘,按流程加入RAID组,开始修复RAID,然后就是漫长等待,大概花了16个小时,修复成功,RAID恢复正常。期间因为机箱是开着的,严重影响了风道,且硬盘一直在读写,温度一度达到60度,故使用电风扇对其进行强制散热,最后保持在了45-50度之间。

5.恢复到另外一个新的群晖:
   老机器的主板一时来不了,故新搞了一个,插入4个修复好的盘,启动提示可以重新恢复,按照向导保留数据重装了6.2的系统,然后一切正常,重启了一下也正常,不需要再次修复RAID,这次过程基本结束。





评论
看来还是有必要上白裙

评论

安全性的关键还是不用raid,多备份

评论
这主板不靠谱,这raid不靠谱。

评论
Raid不是备份 Raid不是备份 Raid不是备份 业务数据一开始就要备份 否则追悔莫及

评论
业务数据上黑裙,公司经费有那么困难么?

评论
下电影玩,可以用黑群

业务数据,要么白群;或者存储服务器;或者FreeNAS

实际使用中,我这边业务数据是主存FreeNAS,备份到Windows存储服务器。
单台机器存放,数据可靠性太差,和阵列没有关系。
要考虑这台机器本体彻底挂彩的情况发生,而不是单纯坏一两个盘。

评论
有业务数据的也敢有黑群晖,心也蛮大的,这个就是第一步失误, 全盘皆错了~~~

黑群用来玩玩下载电影, 放点电影音乐还是不错的

评论
我也再某宝看了黑裙成品,j3455组成的八盘位,但还没有入手,我就也就是怕用raid了系统或者其它出问题了数据全没了,现在安安稳稳的用硬盘盒用着,数据无价,重要的数据没了就是没了,曾经的360网盘至今记忆尤新

评论

硬盘盒的话要不备几份,真的是说没就没了,这个真有遇到过。我觉得重要数据在黑群里面用R1做个备份,然后不定时再冷备份一份,对一般人真的也足够了。


评论
你这SATA大面积挂掉也少见了

我用过南桥raid,软的,南桥挂了,数据丢了的情况

哎。,。 辛苦了

评论
业务的话我们用IBM存储,根本不会碰群辉这种家用级别的东西

然后黑裙白裙都一样的

评论
看这故障并不是很严重的 我遇到的是存储空间损坏 完全没救~~

评论

专业存储照样会挂,我也遇到过,只是概率理论上会小一点。
备份才是王道,热备,冷备,离线,异地,方式越多越安全。

评论

没啥重要数据,顶多学习资料,现在平时也不用,一个月都不开机不了几次,黑裙组raid5成本又太高也不会,我想黑裙出问题的概率肯定高于硬盘盒,通电次数这么少,硬盘坏的机率肯迪也低

评论
公司业务数据用群晖?不至于吧

评论
电源很重要,白群挂硬盘也是不少的~

评论
若要可靠性高,就要购买白裙了,当然是企业型号如FS系列机架式1U2U的那种。黑裙要选择匹配的硬件,系统盘raid1,然后弄个LSI的RAID卡做硬RAID后以Basc方式挂载到黑裙里面,这样系统与数据分离,数据有硬RAID冗余,当然也要做好备份!

评论

群晖系统还好,每个盘都有,此次比较特殊,导致损坏,不过可以外挂硬盘做系统或者直接重做系统解决。
硬RAID不比软RAID好多少,有时候硬RAID崩溃比软RAID还难恢复。
其实不管怎么存储,重要数据还是备份最重要 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...