日本电子维修技术 NAS极其草率地用概率论比较Raid5和Raid1的安全性




前提假设:机械硬盘故障率p=0.89%
说明:故障率参考了最新Backblaze公布的2020Q3的年化故障率数据中的平均值。如果你使用的都是正规渠道的国行正品,你也可以选择较低的值,如果你和我一样都比较穷,只用得起拆壳白盘,那完全可以选择最高的1.44%来计算。

捕获.PNG (303.67 KB, 下载次数: 0)

2020-12-11 09:43 上传



网址:https://www.backblaze.com/blog/backblaze-hard-drive-stats-q3-2020/

Raid1数据损毁的概率P(Raid1)
前提假设:2块硬盘,故障率为0.89%计算目标:数据损毁的概率P
Raid5数据损毁的概率P(Raid5)
前提假设:4块硬盘,故障率为0.89%计算目标:数据损毁的概率P



问1. Raid5数据损坏的概率是不是一定比Raid1数据损坏的概率高?
Raid1数据损毁,意味着必须2块硬盘都损毁,所以概率P(Raid1)=p^2
Raid5数据损毁,意味着至少有2块硬盘都损毁,所以概率是P(Raid5)=C(4,4)*p^4+C(4,3)*p^3+C(4,2)*p^2
要看Raid5的损坏概率是不是一定比Raid1高,只需要确认P(Raid5)-P(Raid1)>0是否为真
P(Raid5)-P(Raid1)=[C(4,4)*p^4+C(4,3)*p^3+C(4,2)*p^2]-[p^2]=p^4+4p^3+5p^2
由于p是损坏率,必然是一个正数,所以P(Raid5)-P(Raid1)>0必然成立,也就是说Raid5的数据损害概率一定比Raid1高。

好吧,第一问就是个常识问题,属于废话。

问2. Raid5的损坏概率到底比Raid1高多少?
P(Raid1)=0.89%^2=0.0079%
P(Raid5)=C(4,4)*0.89%^4+C(4,3)*0.89%^3+C(4,2)*0.89%^2=0.0478%
P(Raid5)/P(Raid1)=0.0478%/0.0079%=6.05

所以Raid5数据损毁的概率要比Raid1高6倍以上。

好吧,我承认,我真的吃饱了撑着,忙工作去了。。。


评论
很多时候是不规范操作导致损毁而不是硬盘坏了。。。这咋算

评论
楼主没理解数字代表的意义,由于P很小,你这种计算出来有几倍差距是工业领域可以忽略不计的。
事实上就是大多数情况是:Raid5 or Raid10发生降级而非损毁的情况,用户可以重建Raid。
Raid5比Raid1最大劣势是重建时系统负载高,花费时间长,继续在线业务可能导致更糟糕的结果。
从最近的zfs重大优化之一就是增加Raid1恢复速度就知道了,这是企业大规模布置存储最常见的方式。

评论

你说的没错,但是貌似我们没在同一个话题上,囧。。。
这个简单的计算里面只是考虑了概率,就是最坏的数据损毁的情况。
其实raid1和raid5在实际工作效率上肯定是有很多大差别的

如果不考虑工业环境的话,单纯家用,只考虑数据安全性的话,一些重要的数据,就放raid1就可以了,千分之8的数据损毁概率。

评论
虽然R5的损毁概率高于R1,但是R5的容量利用率也高于R1嘛,有得必有失

评论

良好的操作习惯肯定是最重要的,这个你没法计算的。我只是考虑最坏的情况,数据损毁的概率罢了。

评论

你这个理论是没有意思的,raid5出现任何问题,做的第一件事是是拷贝


评论

家用需要考虑正常使用下Raid损毁概率如同行人走在路上需要考虑被雷劈中的概率。

家用多是用户自己操作引起Raid损毁,因此需要考虑的是重要数据多备份,避免自己手贱或脑残引起的数据丢失。

评论
还是老老实实RAID1.........血的教训

评论

你可能没理解楼上的话
当P足够小时,轮不到数据损坏,因为在损坏前会先有个降级的阶段供你恢复,而降级这一步,只要硬盘数相同,发生概率就相同

评论

4盘Raid5的磁盘利用率大概匡算一下是:75%*90%=67.5%
2盘Raid1的磁盘利用率大概是:50%*90%=45%

如果这么算:
4盘位4TB组raid5,有效磁盘空间大概在10TB左右
2盘位12TB组raid1,有效磁盘空间大概也在10TB左右

然后我们看下价格:
为了更低的数据损毁概率,我用红盘组Raid5,价格就按照最近一次PDD的价格560来算,4*560=2240
如果单盘损坏率就按照0.89%,数据损毁的概率是0.0478%

由于raid1比较安全,我就选便宜一点的白盘,价格就按照美亚的1300的价格算,2*1300=2600
由于是白盘,假设单盘损毁率比nas高一倍多,如果按照2%来算的话,数据损毁的概率是0.04%

好吧,个人自己选择吧。当然白盘单盘损坏率5%也有可能。那Raid1还不如Raid5安全。


评论
我感觉比较相同的可用容量更合适点儿吧,6块raid10比4块raid5这种

评论
3楼才是实操,raid5就怕重建过程......

评论

你这个说法确实是有道理的。
但是你不能否认一个事实,在坏第一张盘的时候,raid5四张盘坏一张盘的概率是raid1两张盘坏一张盘概率的2倍

而坏了一张盘以后,再坏一张盘的概率,raid5是三张盘坏一张,raid1是一张盘坏一张,raid5的概率是raid1的3倍。


评论

严重同意。。。举双手双脚赞成

评论

重建过程boom,还是要看概率的呀。。。并不是一定会boom的

评论

嗯,其实还可以考虑raid1的话用差一点的盘,raid5用好一点的盘,同容量比价格和数据损毁概率


评论
还是raid6吧,raid10万一同时坏同一边的盘。

评论
刚查到一个计算器,可以计算Raid1,Raid10,Raid5,Raid6下数据丢失概率,以及重建期间发生读取错误的概率,还挺有意思的:
https://wintelguy.com/raidmttdl.pl


评论
所以现在很多企业存储都改用RAID6了

评论

是的,其实重建过程中还会出现重建读取失败的概率,有的时候,如果盘的素质差一点,这个概率也不低的。

评论

我遇到过一个公司用raid 1,然后一天他们被雷劈了……然后就没有然后了。因为网管离任,连离线备份都没做。

评论
恕我直言,你说参考Backblaze的数据我就没往下看了

评论
理论上讲,盘数越多,坏的概率越高。但是,我要说但是,raid的意义在于,坏一块的同时能否迅速的补充上第二块,乃至于第三块而不对数据造成损坏。所以从确保数据层面分析,raid1和raid5作对比没什么意义,因为从抢救的机会上来讲,两者都只有一条命,即是一样的。

评论

这个。。。家里大楼应该有避雷针吧。

评论
RAID 5 最大的问题是重建中出现 URE

评论
楼主计算中引用的数据有问题,结果也不完整。

楼主引用的数据是磁盘故障几率对raid1来说,计算没问题,只要不同时坏一对就OK
但是计算raid5的时候就不能这么算。
首先,坏一块硬盘的时候raid5就降级了,坏2块数据损毁,这个几率使用故障率确定没问题
但是raid5需要使用奇偶校验恢复数据,恢复数据的时候还要考虑BER不可恢复的磁盘写错误带来的影响。
如果出现BER错误,会导致R5在恢复时候挂掉。而R1不受此影响。
阵列规模越大,写入总量越多,BER对R5恢复的影响就越大。

评论

被雷P了,这个,要做异地备份或者离线备份了吧。。。

评论



评论

概率论角度,不能这么说,因为当你发生需要你使用这条命的概率是不一样的。
第二,当你已经半死了,你死透了的概率也是不一样的。。。
这个补充,双手双脚赞成。所以后来搜到一个raid耐用性的计算器,里面你按照实际的设置,它能够估算在重建过程中出现读写错误的概率。

评论
raid6是double parity,然后可以triple parity这么搞上去,之后数据恢复速度就变瓶颈了。我十年前研究过这种问题。

评论
我的raid5已经换掉2块硬盘了,同时坏2块的几率确实微乎其微,只要换上一块新的就可以重建数据
raid1比5要浪费更多备份空间,安全性和性价比其实并不咋滴
ps,我坏的2块都是红盘4T,而且第三块有坏扇区在报警了,辣鸡红盘!

评论
比系统出问题把数据写坏的可能性低就行了。
绝对的安全是不存在的。

评论

你考虑过5和1的速度差别么。。。。

评论

我坏过一块红盘4T,群晖里面直接挂了

评论

千兆环境,还真没考虑速度差别。

评论

一般来说数据比盘贵得多,但是普通家用都是存**姐的话就另说了

评论
R5的是不是算错了

P(Raid5)=C(4,4)*0.89%^4+C(4,3)*0.89%^3+C(4,2)*0.89%^2=0.0478%

P(Raid5)=C(4,4)*0.89%^4+C(4,3)*0.89%^3*(1-0.89%)+C(4,2)*0.89%^2*(1-0.89%)^2=0.0470%

虽然差不多

评论
极其外行的说一句,对个人用户来说,数据坏了,损坏率100%,数据没坏,损坏率0%

评论

对的,应该是你这么算。。。囧。。。

评论

so what?

评论
重建过程中的损毁才是最可怕的

评论
我崩过一次RAID 5重建

因为模组线没插好,导致一个盘发生故障离线,重建过程中因为供电问题,第二个盘离线,崩。。。。
不过那机器上没有重要数据,实际并没有损失。

后来我备了一个RAID 6的机器。

评论
RAID5速度快、空间利用率高,别忘了现在2.5G的电口交换机已经开始出货了,等价格再降一降普及到家用机上速度上就拉开差距了

评论
家用南桥raid1,然后不要折腾,完全够用

评论

同意,我白裙1815+,7块4T红盘Raid5,24*7使用3年多,坏过3块,3次重建没问题(不用提醒我先拷贝数据:)
不过坏到第3块的时候,实在烦了,又插了一块改Raid6了

评论
玩raid 高要求1 低要求6
5是邪道,特别是单盘容量大的时候。。

评论

他们是郊区的厂房,3层的那种,附近一片空旷。

评论

其实他们之前有离线备份。2年前的数据,而且是备份后就断开的那种相当安全的。
但是他们老板觉得网管在哪里好像没用,天天没事,就把网管开了。
随后就没人接手过这个问题。直到被雷劈才发觉,数据没备份。

评论

问题是买硬盘的时候往往是同一批买的,一块出问题了其他盘出问题的概率也很大。

评论
但是有一个问题,raid5单个磁盘格式是raw,而raid1是ntfs(至少我接触过的都是)
也就是说raid5不及时恢复是会出事的,raid1炸了一半另一半还可以继续安逸

评论

同一批次不是问题啊,盘挂了本来就是随机事件啊。。。

评论

可以多盘位做raid1,并不是只能2块做

评论
久违的又把高中数学概率方面的内容复习了一遍

评论

哈哈其实没这么麻烦,Raid5数据损毁,意味着至少有2块硬盘都损毁,反过来说就是至多1块损毁(一块损毁或都没有损毁)
P(Raid5)=1 -(4C1*0.89%*(1-0.89%)^3+(1-0.89%)^4)=0.047%

评论

概率论鬼才。。。

评论
对于行业内来说,同时坏盘的情况相对容易规避,URE才是头疼的问题,超过40T的RAID5降级以后马上要做的就是备份,低容量的RAID5还敢冒险试试修复阵列

评论
Raid5换盘后重建,因为数据校验出现全部数据损毁的概率,楼主也要考虑进去哦。

评论

为什么没考虑多准备一台ups?我们都知道RAID0、1、5的工作原理,所以只要不是真对速度需求到那种程度了,最好还是独立盘吧。反之就用SSD加速机械硬盘也是一种很保险,又有速度的方法。

评论

其实都是那一根模组线的锅,单线串了5个盘,做RAID 5

然后没多久就坏了一个盘,换盘以后重建,
重建过程中因为接触不良又掉了一个盘。
接下来就是数据全灭。。。。还好都是废弃的文件。
有用的文件我在备份机器上还有一份。

只能说,即使做了RAID 5,也要备份。

至于那台机器,后来改成了5根模组线分别对应5个硬盘,彻底杜绝一拖多。
安全运行了很多年,一切正常,后来硬盘换大了一批,也没事。


评论

所以阵列人为操作失误挂掉的因素比自然死亡的因素大得多

评论
企业里用r1和r6,老板可能要干死你。
冗余是高了,看看价格。。。

评论

是滴是滴,成本太高,除非某些数据真的重要到某种程度才搞R1,R6 + 热备 + 异地,否则没有客户愿意出这个钱的

评论
阵列可靠性计算网上有现成的计算器,不用这么复杂……
按我用的HC520计算,4块Raid5和2块Raid1(我觉得这么比没什么意义……),重建按有热备,重建时间24h,5年数据丢失几率大概是1.7%比0.3%这样

评论
正规企业盘R5还可以,普通家用R6省心些,重建要安心很多。
R1确实更好些,只是性价比接受不了

评论
这个帖子我觉得最大的贡献不是啥硬盘故障概率,而是用活生生的事例证明了一群乌合之众在面对一个稍微复杂问题时因为智力水平不在同一个位置所导致的“鸡同鸭讲鹅叫唤”的杂乱结果。

为了避免有人看不懂我这的意思,换个结论性说法:永远别在网上的论坛里去讨论学术难度超过初三数学的那些问题。 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...