日本电子维修技术 NAS悲剧 & 求救:GEN8 raid 1 企业4T 双盘全坏



2016年1月入了 GEN8,Bay1+Bay2,双希捷企业 4T 组 raid 1(下称 A 盘);Bay3+Bay4 双西数蓝盘 1 T 也是组 raid 1(下称 B 盘)。可用容量(A+B)为 4T + 1T。

两年多下来,积累的文件多了,B盘 1T 实在太小,想扩容(https://www.chiphell.com/thread-1906934-1-1.html),咨询后发现不是很容易,最近也没时间折腾,但直接买了两个希捷企业 6T ( V5系列 6TB )替换了西数蓝盘 1T,还是 raid 1,换了之后用了 1 个星期,直到昨晚……

同事从 B 盘( 新6T )向 A 盘移了几个文件夹,大概一百多Mb,应该一眨眼的事却在 25% 左右卡了近 30 秒,然后似乎正常了。
过了一会儿,突然听到异响(后挂载到别的机器上,应该是机械臂),发现是 GEN8 闪黄灯,这时 A 盘、B 盘还能正常访问,又过了大概 2 小时, A 盘消失,GEN8 闪红灯。

等我回到公司调出日志如下:
[2018/9/18 20:18:27]
A drive failure notification has been received for the SATA physical drive located in bay 2.  This drive can be found in box 0 which is connected to port 2I of the array controller B120i [Embedded].  The failure reason received from the HP Smart Array firmware is: TIMEOUT.


[2018/9/18 22:01:29]
由于硬件错误,磁盘 1 (PDO 名称: \Device\0000002a)的逻辑块地址 0x847221f0 处的 IO 操作失败。
由于硬件错误,磁盘 1 (PDO 名称: \Device\0000002a)的逻辑块地址 0x84719670 处的 IO 操作失败。
由于硬件错误,磁盘 1 (PDO 名称: \Device\0000002a)的逻辑块地址 0x84719198 处的 IO 操作失败。
由于硬件错误,磁盘 1 (PDO 名称: \Device\0000002a)的逻辑块地址 0x84721650 处的 IO 操作失败。
系统无法将数据刷新到事务日志。可能发生损坏: VolumeId: D:,DeviceName: \Device\HarddiskVolume4。
(设备硬件出现致命错误,导致请求失败。)


[2018/9/18 22:01:40]
A drive failure notification has been received for the SATA physical drive located in bay 1.  This drive can be found in box 0 which is connected to port 1I of the array controller B120i [Embedded].  The failure reason received from the HP Smart Array firmware is: TIMEOUT.


[2018/9/18 22:01:40]
Logical drive 2 of array controller B120i [Embedded] has encountered a status change from:  
Status: INTERIM RECOVERY MODE  
to  
Status: FAILED


[2018/9/18 22:01:40]
Logical drive 2 of array controller B120i [Embedded] returned a fatal error during a read/write request from/to the volume.
Logical block address 6055048, block count 24 and command 48 were taken from the failed logical I/O request.  
Array controller B120i [Embedded] is also reporting that the last physical drive to report a fatal error condition (associated with this logical request), is located  in bay 0 of box 0 connected to port ??.复制代码

外设存储/服务器这一块不熟悉,我就纳闷为什么两块硬盘会连着损坏,供电不足,又没多挂一个硬盘,不就4个盘位么??还有,raid 1 不就是坏掉一块还能继续用么?




评论
看起来只是坏了一个,接着又一个没了,是不是被人拔下来了?

丢了一次数据丢怕了,现在都是定期冷备份,至少可以避免同时坏盘的可能性,24小时开机的建议还是配个在线式的ups,市电电压有时候不稳

评论
emmmm 同一批的话 就有可能
所以不太建议 r1用同一批的盘 甚至同一个厂也不太建议 真有可以一起翻车

评论
先声明我不是专家,是不是先取下确认数据是否完好再讨论是不是真的坏了两块盘?
同型号同批次的如果存在设计缺陷损坏时间相近是可能的,但是不会这么接近吧?
同意楼上不用同批次的盘组RAID 1,我就特意用的不同牌子的组的。(也可能是只是心理安慰吧,该一起挂的时候还是逃不过去)

评论
多盘才是王道。。

评论

意外拔出是不可能的,这些东东不会有别人理会……

现在两个盘轮流挂在其它机器上,开机就听里面“嘀嗒”响,识别很久也只能识别出未初始化的 4G 多一点,还有什么可以尝试的方法么?里面有8天的重要未备份数据


评论
用Ubuntu试着看能不能读出资料,可以赶紧转移

评论
seagate 企业 6T这么容易坏吗,前段时间刚入两个看来还得多买几个硬盘来备份

评论
传说中的R1双挂

评论

已经试过了,也不能读取数据

2018-09-19 23-04-18屏幕截图.png (111.64 KB, 下载次数: 0)

2018-9-19 23:07 上传




评论

我不是专家,无能为力了,hdd我觉得有可能是硬盘磁头的问题

评论
你的GEN8电源是150还是190的?挂了4个HDD后,有没有再挂SSD什么的,CPU和PCIE负载怎么样?

评论
这种软raid就是让你觉得你的数据很安全,硬盘坏了一块还可以换一块
实际上一般都是不坏都不坏,一坏都坏
还是得多硬盘备份

评论
曾经听说过,raid1并不是为了备份而生。。

评论

raid 5 会不会好一点?GEN8内置支持不?外置的阵列卡比内置的可靠在什么地方?什么卡合适?外置卡也可接内置的 4 盘位么?

评论

raid1是为了读取性能+一定的数据备份安全,并不是单纯的备份。当原始数据繁忙时,直接从另外一个镜像盘中读取数据,因此RAID 1可以提高读取性能。
毕竟机械硬盘只要通电,就有挂掉的机会。所以都是用额外的备份盘,备份完毕就切掉电源放着,即便阵列挂了,都一样可以恢复。
raid1只是为了给你另外一个随时恢复机会。。其实就是冗余校验。毕竟数据是不停增加,不可能每小时都用额外备份盘数据备份,所以raid的价值就体现在数据的随时性、最新性。

评论

外置的好处就是不用的时候拔掉。你看现在很多不就是外接4-8个盘位的贮存盒子?都是一个道理,内置的话,就是一直通电。。。。。

评论
smart情况呢?

评论
既然是raid1,就可以 恢复数据了。直接开盘恢复

评论
别在自己试了,有重要数据就去开盘恢复数据吧,自己操作的越多,到时恢复回来的可能性越小

评论

你好,GEN8后期的电源升级了,我买得迟,欧版的,自带就是200W

请问PCIE负载怎么看?

评论
恢复数据,还是小硬盘实惠 ,容量越大越贵

评论

以前买了一个北电专业版的测试插,一般是自己量,自己也能算一算,虽不太准,但差不多。

我GEN8也是德淘的,说是200W,我记得好像是190,后来把GEN8出掉了,没法仔细看。你看下它12V输出是多少A。

硬盘的工作原理我是不太懂的,但我那儿的技术和许多供货商都是做这个的,听他们讲过,具体细节没记住,但记住了供电要遵循少量溢出原理。

评论
建议 不要再自己弄了,去找专业的公司去开盘恢复数据吧!

评论
白群晖5盘开热备都同时坏了两块的路过

评论
查看了电源,实打实的200W

WeChat Image_20180922082053.jpg (205.23 KB, 下载次数: 0)

2018-9-22 08:22 上传




评论
花钱去开盖恢复吧……

评论
送专业数据恢复吧 开盘

评论
用的什么操作系统?

评论
楼主看你数据是有多重要了,双盘可以冒险其中一个恢复分区表试试看。之前WINDOWS下有个坏盘这么处理过,可以试着拿得回来数据。
非常重要还是找专业人士处理了,但是这种专业人士,小城市一般还是没有的。公司的几个惠普服务器都是raid1+s,不过是阵列卡

评论
这种情况我估计是市电问题了,我们单位的一个小机房(只有五六台交换机和一个锐捷NBR-2500G),接的是380V的电源,然后变电器,不知道是不是变电器的问题,电源不是很稳,机房内连接的电脑相继出问题,给师傅一看测量电源,果然是,换了变电器,一直都好很多了。


评论
所以raid不如一个ups有效

评论
我这个 GEN8 一直接在 UPS 上的,应该不是市电的问题

评论

raid1+s ? 这是什么?

评论
如果个人搞不定,RAID1的话找专业开盘的抢救下还是有希望的。

评论

我遇到过跟你一样的问题,不过是新盘就这样,用的是希捷的ST4000NM0024 ,故障情况跟你一样 只认4g,基本可以确定为固件缺陷我认为。

评论
先别折腾了,记得十年前希捷盘就暴出固件门。现象跟你一样,就是突然暴毙,再插上认盘满,认出来只有几G或几百MB,通电有“敲盘声”,就是啦哒啦哒声音。去JS那里买个同型号的电路板换上,或者买usb ttl线自己尝试重刷固件试试。一般都能救回来,并且数据无损。这个现象很像掉固件,和ssd掉固件现象几乎一样。祝你好运!

评论
谢谢各位了。

硬盘JD买的,客服电话来说维修要30天,换新立马换。硬盘里只有一个星期的增量数据没有备份,选择换新了事。

后又买了一块西数的企业盘,替换掉一个希捷,希望可以避免双盘同时坏的悲剧。

经过此事,突然发现,备份数据这事,真TM费钱啊…………

评论
那个西数的盘响声比希捷大得多,包装也 Low ,一副不省心的模样,不知道用下来哪个命长(哪个长都不要紧,千万不要一样)

评论

热备//////////////// 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...