日本电子维修技术 NAS终于搞明白Gen8的NAND为什么会损坏了




前几天很便宜的价格收了一台二手Gen8,IP无法进入,按F10以后显示一个Shell,提示文件丢失;尝试用最新的HP Intelligent Provisioning Recovery Media 1.71升级后NAND损坏,格式化、重新升级都无法修复,现在iLO登录界面始终显示“iLO Self-Test reports a problem with: Embedded Flash/SD-CARD. View details on Diagnostics page.”。

花了一天时间Google了很久,终于搞明白为什么NAND会损坏了。

参见HP的官方文档:https://support.hpe.com/hpesc/pu ... ocId=a00049583en_us
繁体中文版在这里:https://support.hpe.com/hpesc/pu ... r_na-a00049583zh_tw
没有官方简体中文版。

首先,Gen8所属的ProLiant系列服务器使用NAND来存储一些系统数据,Intelligent Provisioning应该也是安装在NAND里面的:

但是,NAND芯片是有寿命限制的:

在iLO4 2.61和iLO5 1.30中对NAND的写入做了改进,反面证实iLO早期版本中应该是有问题,会导致NAND写入过于频繁:

所以结论是:NAND肯定会坏的,只是早坏晚坏的问题;NAND的损坏是硬件损坏,没有办法通过软件修复;iLO一定要升级到2.61版本以上,至少能延长NAND的使用寿命;IP没问题就别升级了,自己家里也不是三天两头重新安装,重新安装也没必要非要用IP;IP有问题一定要升级的话,记住升级有导致NAND损坏的风险。




评论
那怎么解决呢?

评论
说了半天和没说一样

评论

硬件损坏,没有办法通过软件修复,可能唯一的办法是更换NAND芯片

评论
gen8是双芯片吧

评论
我觉得也没啥问题,nand用坏了,说明服务器差不多也该寿终正寝了,性能也跟不上了,不如直接换diy托盘+itx服务器主板来得方便。

评论
这寿命也太短了吧。

评论
所有的电子产品不都有寿命…几年前12xx的东西现在还卖1500…

评论
NAND早晚会坏是正常的,gen8是服务器会记录很多东西,日志记录这些在很早时我全关了结果也坏了一次,另外这是可以软件修复的问题,就跟硬盘一样,重新格式化后屏蔽坏块就等于修复问题,确实没必要经常升级,但有问题的版本还是尽量更新到最新版。并不是升级才会导致损坏,因为NAND在每次开机的时候才会检测错误,而大部分情况下NAND早就坏了,只是你一直没有重启机器,没检测到这个错误而已

评论

虾的赶紧也把日志记录关了,已经记录了600M

评论

看文档里这句:“保留的区块或储存格写入次数达到临界限制时,NAND 被视为磨损,且NAND 写入将会停用”

我这台Gen8现在就是报告“Controller firmware revision 2.10.00 NAND read failure: Media is in a WRITE-PROTECTED state”,说明保留的NAND区块已经全部达到临界限制,完全无法写入了。

我认为这是HP的一个设计失误,“电子产品都有寿命”这话没错,但是很明显NAND已经是Proliant服务器主板寿命的一块短板了,坛子里面看到很多NAND损坏的,但是似乎没有看到过别的部件损坏的帖子。

这大概也是为什么在HP的支持论坛里面询问NAND损坏相关问题的时候,HP的员工从来没有人提到过NAND会由于写入频繁导致损坏的原因。
在下一代的Gen9上,NAND已经被设计为可替换的了,应该就是考虑到了这个问题;参见https://community.hpe.com/t5/bla ... number/td-p/7068795的讨论:




评论

https://www.chiphell.com/thread-2253165-1-1.html

你可以看看这贴,未必就是NAND损坏,买这种机器的一般动手能力也不弱了,加上gen8硬件本身其实也没什么易损部件,当然更加难看到了,gen8的这块4G,NAND在设计寿命里确实偏短其实不单microeserver这款,ilo4的NAND损坏是很早就存在的问题,所以我看到后没多久就关闭了可以关闭的写入操作,结果还是坏了

评论

已经尝试格式化了很多次了,没用;重新升级也无效,提示“Intelligent Provisioning Error flashing the nvram”,可以确定是NAND损坏。

评论
为什么只有MICROSERVER GEN8这个问题比较明显,其他的GEN8几乎没有听用户反应过,或者我们这些经销商接触的少,维修站那边数据会更准确。

评论

你这种确定只能换板子了,别试了

评论

大概其他Gen8都是专业用户,不怎么折腾,只有MicroServer Gen8普通家庭用户比较多,折腾比较多所以导致损坏也比较多?

评论
我很好奇,楼主能告诉我一下,你现在还买gen8是出于什么考虑的?

评论

因为收这个二手Gen8的价格很便宜,比买个普通机箱都划算……

评论

难怪,那么那么多升级报错的其实是已经有问题了不过不升级重启不检测问题而不是升级出问题

评论
从哪关闭日志记录,没找到

评论
一年365天从未关过,所以估计就算坏了也不会报错,就这么一直用下去算了

评论
特斯拉的芯片.jpg

评论

相对diy,gen8有nas的专用设计,稳定性和可靠性都有保障。
相对hp最新家用nas,gen8实惠多了,升级cpu和内存都是白菜价。

评论
我们要趁他没损坏之前,二手区出掉,把损坏的几率转嫁到下家~

评论

我去年年初1650出的,感觉稳定还不错的,折腾其他的比较麻烦,还不如直接入性能更好的家用板子来自己组装,时至今日,我觉得家用板子也没有那么不稳定。
我觉得有三点很重要:
一是要用好一点的电源,这是根基。否则坏硬盘就是经常的事。
二是机箱风道设计要好,我出完GEN8后入了一款淘宝通路的8盘机箱,不好看不说,硬盘温度高,噪音超级大。还有据说某广那款风道也不好导致硬盘温度高。
三是硬盘背板。

评论

都到2020年了,我觉得普通家用板子稳定性和可靠性还是有保障的,毕竟也只是民用级的,矿渣产品除外。
我买了一套超微5028l的二手准系统,把原装的主板换成了z390itx+9300t,加起来也就2000左右,至少在性能及工艺制成方面比gen8强不少,如果还要玩缓存加速,还真非要用这些近两年的板子才行,所以我喜欢用新的,旧的再好我也会出掉。这箱子也不难看,现在超级稳定。

评论
看到这个贴子,把多年不更新的iLO 1.32破解版升级到iLO 2.75b
然后iLO就出现Embedded media manager failed initialization 的报错了
而且之前1.32破解版风扇是20%左右的,现在一下子上升到30%以上了
看来这个事情两难全,如果要风扇转速低,只能1.32破解版
如果要NAND算法合理,又必须上2.61以上版本

评论
18盘位洋垃圾Gen8一切都好,就是报嵌入式缓存损坏,也就是那块NAND,之前尝试过N多方法格式化啦,放电之类的操作,无解。现在也习惯了,反正装系统和配置阵列都可以通过启动镜像来完成。现在唯一蛋疼的是机器里塞满了各种硬盘,想逐步替换成大容量盘相当麻烦。

评论

18盘位……你这是哪个型号的Gen8?14楼刚说的“其他的GEN8几乎没有听用户反应过”……

评论

5U塔式的企业服务器,二手淘的,最多能上18块3.5或24块2.5,我用来做allinone,NAND的问题在很多HP服务器上都有的,国外论坛有很多吐糟的理论上来说,NAND不应该有经常写入的进程...
很多电子设备都会有NAND,游戏机XBOX360和PS3都有,但他们都可以活到现在都好好地
因为该设备里面的NAND,基本上都是升级系统才会写入,其他时间都是单向读取而已...
Gen8会坏NAND,排除质量问题的话,那就是iLO有可能有经常写入的进程,把NAND写死了...

评论
前几天更新了iLO2.76,现在也出现这问题了,但是我发现重启什么的都正常,是不是可以不用管它

顺便说一下,我没外加阵列卡,也没用自带的阵列卡,装的win server

评论

sshot-4.jpg (60.57 KB, 下载次数: 0)

2020-12-13 09:39 上传



2.76版  从来没觉得风扇有噪音,哪怕之前的ILO版本。就算是夏天不开空调室温28度也没见过百分之30的风扇转速。不过我没用RAID,直接黑群。
电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...