日本电子维修技术 显卡电源芯片应用工程师分析这次3080电容问题



本次3080电容问题大家都聊了很多,作为一个电源芯片应用工程师,我也来谈下我的看法。

1.问题原因
从各方反馈的问题上看,最大的原因应该是boost到2.0G以上的时候,电流上升太快,导致核心电压稳不住,所以掉驱动/花屏
本质上说:三星体质烂+官超=高频的时候需要的电流非常高     聚合物电容=高ESR=低响应速度
因此全使用聚合物电容的基本等于扑街

2. 聚合物钽电容还是MLCC
作为电源应用工程师来说,我是完全的MLCC派。

MLCC唯一的缺点在于说没法做大单体,电容值会比较低,但是剩下的都是优势。
超低的ESR,更低的ESL,高耐久,对温度环境不敏感,对电源工程师来说,MLCC可以认为是理想电容。特别是这种大电流/多相交错的应用场合,MLCC都是更好的选择。

聚合物钽电容,除了能提供更高的单体容值外,剩下的地方都很难受。耐压低,其ESR会随着温度特性变化极大。如果在冬天无室内取暖的最极端条件下,全使用聚合物电容,你可能需要暖机一段时间才可以达到正常使用。
而且聚合物钽电容还有一点,容易坏,在105℃高温工作2000小时,就会有0.5%失效率。如果你是闷罐机箱,你很可能会在2年后出现爆电容现象。
下面这是松下官方的失效说明

捕获11.PNG (74.89 KB, 下载次数: 0)

2020-9-27 13:55 上传



3.成本差距
一般来说,目前使用的330uF聚合物钽电容大概在7块钱左右,22uF 0805的MLCC单颗批量价格大概在0.6左右,两者不存在价格上的差距。
机贴费用,一个焊点1分钱不到,对这种级别的卡,约等于没有。

4.谁的锅
为什么老黄会在推荐设计里面推荐聚合物钽电容,我没想明白。从来没看到过显卡背面核心电容是聚合物钽电容的,风险太大了,效果也不好,万一高温炸了怎么办?
从各家板厂的情况上看,某几家台厂可能已经完全没有懂电源设计的人了,反正都是推荐设计做就完事了,出事了也不是我的锅。选聚合物电容,大概就是方便那么一点点。

5.怎么选

惟一建议,不要购买任何使用聚合物钽电容作为背面核心电容的卡。

核心背面等于高温,高纹波电流+高ESR等于高温,高温加聚合物电容等于你可能需要早点换卡。








评论
赞,多来点专业人士来分析,总比外行瞎猜强

评论
那你有考虑过核心稳不住boost的高频的问题吗?

不要随便下结论啊

评论

批量出问题,肯定不是全是核心稳不住BOOST的锅。

而且为什么用MLCC的卡,就一定比不用MLCC的好点,你想过没有。

你真的相信TUF这种卡就会用到特挑核心么?

为啥EVGA自己也说自己做试验,发现同样的卡换了MLCC就能稳住。他们自己实验室做,肯定是同一个卡直接换电容的啊。

失效分析机制,我经常做啊。就我们那些自己有个案子,用聚合物钽电容做输出电容,发热太厉害电容到140℃你见过没啊?换了MLCC之后纹波从 接近80mV变到20mV以内。



评论

那6组MLCC和4+2这种的哪种设计会更好一些呢

评论
很多老卡(1080以前)背面都是钽、铝聚合物电容的,也没什么问题。可能是这代oc到2ghz附近负载-空载周期产生的电压浮动太大导致稍微高一点impedence和esr的电容都表现不佳吧。

评论

从极限上看,理论上是6组mlcc更好。

但是很可能变成,过了某个阈值之后,只要总的esr满足要求,很可能表现一致。

我估计现在很多厂家很可能会先把库存的聚合物电容用完,后期应该会全部转MLCC。

现在不转的原因大概是除了3080以外,没有其他产品这样用聚合物钽电容

评论
原来如此(不懂装懂

评论
NGA有人说用华硕 TUF 3080也掉驱动 黑屏

TUF用的可是MLCC哦

评论
好,是这样的啊,点头(完全不懂

评论
那就只剩下打人硕了喂。。。不过反正也买不到,等买得到的时候,估计都换成MLCC了

评论
进来关注一下,3080 首批预估是要翻车了

评论

帖子里,tuf也有好几个版本吧,全mlcc,全聚合物,4加2的不是都有说有存在么?

我分析从我的专业角度说。你要说最后一定全是电容全锅,我不敢保证。我只能说用mlcc比聚合物肯定是更好的

评论
七彩虹Vulcan系列的新出货改版,无论是非OC,还是OC型号都改成4颗松下黑坦+20颗MLCC,不知道稳不稳。

评论
看一些2080Ti的背面核心,电容基本都是MLCC,这次公版用了聚合物电容,大家跟风,难道是考虑需要加大电容量,应对核心的boost尖峰功耗?

评论
以前的卡核心后面都是MLCC
只有供电部分才用聚合物钽电容
怎么现在的卡都倒退了。

评论

330uf vs 22uf x10是拉不开决定性的电容量差距的。我只能说老黄推荐的时候脑抽了。而且对于开关电源这种应用来说,低esr比50%电容量更关键。

比如说瞬时峰值电流100A,假设从远端不能及时响应,都需要从电容放电,6x钽聚合物,大概esr 2mr,这个时候电容内部esr压降可能0.2v,而使用60xmlcc,esr大概只有0.05mr这样,电容内部esr压降是5mV。在应对gpu核心的快速电流跳变的时候会存在关键性差距

评论
发重复了

评论
[email protected]

评论
售价上MLCC单价我看根本没到0.6这么高吧,批量价格我看是在0.3左右啊,MLCC的ESR并没有POSCAP或者SPCAP好吧,POSCAP的ESR大概是5mΩ,SPCAP是3mΩ,而47μF的MLCC一般都是X7R了吧,ESR大概在40mΩ左右吧,并联后也没有特别的优势啊,然后温度可靠性也是一个问题,MLCC本身随着温度升高容量大幅下降啊!而且还有高温下应力问题等。所以我觉得用了MLCC的就是缩水导致了瞎猫碰上死耗子,不过根本原因还是核心工艺问题导致的。

评论

好像MLCC电容有个缺点是承受直流偏压的话,电容量会下降比较大,会不会导致实际环境下电容量比标称值小不少,聚合物电容就比较稳定

评论
容量是电容的最基本参数了,脱离这个去比较工作条件优劣就没意义了。和其他工业零件一样,R&D设计至少需要考虑成本和应用场景。

3080 crash的root cause仅仅归咎于两组电容显然不是一个dfema工程师应该下的结论。tin的言论更为合理,因为他本身曾经是evga的kingpin R&D。root cause就是“大电流的电流传输是一种挑战”【high-current DC-DC PDN (power delivery network) is real challenge】

Intel的CPU用MLCC应该已经20年+了,GPU工作条件相似(电压及相应要求),理论上carry over是没问题的。至于POSCAP,nv这么设计自然有它道理,并不是在任何场合使用MLCC或POSCAP/SPCAP是最佳方案。比如按TIN所说,使用三种类型, 较小的 Poscap, 更大的 Poscap, 和一些 MlCC 能提供更好的3凹口的图形。如果全用MLCC,那么凹口太深了。

如果把这问题归咎于samsumg工艺差也是没道理的,评价工艺我们可以用良率和漏电流考虑,这和3080 crash么关系。3080只是boost到2050mhz+以后挂掉了,我们已知芯片本身是可以承受这个开关频率,因为3090世界记录高了多。只是这个频率下需要更大的电流,这个电流需要很好的vrm设计去支持前面所说的“大电流的电流传输是一种挑战”,芯片电容只是其中一个环节。他指出与其看这6个die背后的电容不如看看显卡背面VRM的空焊位,FE版本是有POSCAP的电容的,AIB全部空焊。如果他要设计一个卡,我会看看GPU的功率需求,然后首先添加足够的批量电容,以确保在中频范围内良好的功率阻抗裕量,同时再看电容器的高频去耦以后,因为这是相对容易调整的工作。

intel的8月份发布的2020 superfin技术怎么说的,1. 更大的电流,2. 能让电子在gateway中移动更快的载体,其实付出的代价就是功耗。在批判samsung 8nm的时候是不是也要把最新的superfin连带批评一遍?没有superfin,willow cove怎么可能4.8G稳定,ice lake的初代10nm频率去比较下

这些不需要了解GPU工作原理,就是供电设计,DC-DC转化的内容


https://www.techpowerup.com/foru ... hoice.272591/page-5

我觉得TPU对这个问题讨论已经很充分了,方向也正确



评论
显卡背面用POSCAP都有十年以上的历史了

评论
感谢大佬的指点 很受教
个人觉得很滑稽的是...这次老黄的售价和性能提升其实完全等得起amd先出招 顺带做更全面的测试和备货
现在强行出击 就不说是不是忌惮对手的性能提升吧
人家盾都还没有举起来就被空气弹反了... 这操作amd估计吊都笑歪了



评论

这是一个常用的MLCC的表格,TDK提供非常详细的ESR曲线C2012X7S1A226M125AC

捕获12.PNG (33.77 KB, 下载次数: 0)

2020-9-27 14:55 上传


在接近开关电源500k开关频率的时候,ESR大概是2mr,然后一个PSCAP的位置可以放10个MLCC。


报价上,我按MOUSER为准,大厂可以单独谈,最多再便宜20%。除了报价特别低的小厂,TDK和murata X6S(105℃)和X7R(125℃)的价格基本在0.5以上。

另外,我给大家算一个200A峰值电流(假设功耗都在核心电流)的情况,假设需要GPU核心突发电流从10%阶跃到100%(20A到200A)
这种错相的控制器,响应时间基本在2到4个开关周期,大概10us左右。

使用MLCC,掉压大概是  0.05mr x200A+200A/1320uF=0.16V

使用PSCAP,掉压大概是  1mr x200A+200A/2000uF=0.3V,





评论

都说了抢的不是amd的风头 是主机的风头啊

评论

对不起把这茬忘了23333

评论

应当是为了股价吧,早些发布让公司市值冲个高,毕竟收购ARM的协议有一部分是股票,股价高相对来说对他合算一些

评论

我觉得如果从性能上来看我也认同同等容量的MLCC占优,但是如果考虑到长时间可靠性的觉得还是POSCAP综合更优秀一些。

评论
11月以后再买3080 应该稳了吧。

QQ截图20200927153257.png (695 KB, 下载次数: 0)

2020-9-27 15:34 上传


为啥这里还吹 “ 优异的温度稳定性”


评论
大佬深藏不露,谢谢分享。彻底解毒。耐心等big navi 上市后再买

评论
如果焊点能贵出一毛8那就可观了
出货几百万的主板不是有的用日系电容有的用台系,虽然单个电容的价格也没多少

评论
用MLCC是看中它的高频滤波能力吧,容量小不是问题。。。。

评论
分析的还不错

评论
专业,反正也抢不到,等后面能抢到了,估计批次也稳定了。

评论
当年耕升就是堆料堆挂了,低温会出问题

评论

温度稳定性是指容值哦,不是指esr。聚合物钽电容在低温下esr会变得很差的。作为放在芯片背面做去耦的电容来讲,mlcc是更加合适的

评论

TUF零售的都是全MLCC,所以该翻车还是翻车,问题重点在核心,电容又不是决定因素......


评论
说得很好,但是我有一个问题,背面的那个电容真的是供电通路的吗?或者说对供电通路来说,板子上多走那几cm的线路应该不会造成有意义的影响吧?需要在接口处布置电容的不应该是高频的数据通路吗?这样的话问题的分析方式就不一样了吧

评论
其实背后这几颗电容远没有这么强的决定性,德国佬分析的太草率了,作为非专业人士的普罗大众更愿意一厢情愿的找一个自己觉得合理的原因来相信,结果就是变成了这场风波。。。我相信在讨论电容这事情的人,99%都不知道具体是什么原理,就是在吃瓜看热闹

评论
三星罪大恶极,拖了老黄的后腿?
老黄上次已经被镁光拖后腿了,业界怎么人人都拖老黄的后腿啊,唉!

评论
嗯,嗯,原来是这样(完全没懂)

评论
电容问题只是压垮骆驼的最后一根稻草,不应该背全锅的。主要问题还是代工工艺太烂了~~

评论

对于低电压大电流,这就是决定性的几cm啊。intel为了解决这个问题,不是把dc-dc塞到了cpu封装里面,结果有几代就特别容易过热

评论
tuf就是宣传图还是钽电容,出货的全都是mlcc

评论
除了MLCC电容之外,其他TUF翻车的有没有考虑过电源瓦数和是否双8pin是走的单独的两根供电?

我自己的全MLCC电容的TUF 3080目前还没出问题,使用的1200瓦电源,每个8pin供电都是单插了一跟电源线。

评论

QQ截图20200927185317.jpg (95.07 KB, 下载次数: 0)

2020-9-27 18:53 上传


TONY叔已经说了全是MLCC了,所以翻车还可能是别的原因


评论

出厂灰烬版本才是最大的问题  现在的处理器和显卡 都是灰烬版  

评论

一般能买3080都是会双8P电源线吧 不可能有人单条线双8P的

评论
非专业表示感觉很有道理,反正也买不到,等双十一……应该稳了吧那时候

评论

楼主说的第 4 点是错的,正在服役的GTX670四星大将 和 名人堂限量版 GTX1070,稳定得很,背后都有好几颗聚合物电容和MLCC电容的组合,其中后者BOOST最高频率超过2G。
RTX 3080花屏不能说全是聚合物电容的祸,三星的工艺良率差是关键,电容搭配只是其中一项,不是必须选项,核心良率差是不可推卸的责任,电容的组合应该是多或少的事,老黄成本缩水是他的问题。

评论
电容的选配和寿命的好坏。对于供电电路是很重要的。直接关系到周边其他电子芯片的工作寿命和稳定性。

评论
楼主要知道的是,NV官方给的参考是MLCC和POSCAP都可用,意思是搭配随意,而且不要求必须两者都有。
而且AIC修改设计,最终的版本也是要交给NV验证的,也就是说六颗POSCAP电容的设计是通过了NV的验证的。


评论

你说的是GEFORCE4时代的事情吧,当年耕升根本不是堆料,二是省料,将固态电容换成了半固态电容,导致低温性能差。

评论

5年前的Phone 6s/6s Plus 三星14nm版和台积电16NM版A9 SOC耗电门再演,台积电版的正常使用时间比三星版多了1个小时40分钟。

5年后没想到,老黄的安培芯片中招了,三星半导体和台积电的工艺差距没有缩小。

这次不是电容的锅,是三星半导体的锅!
疫情,苏妈,台积电的产能,都促使老黄冒险使用了三星代工,皮夹男永远年轻,咱用户体验差。


评论
坏的产品总是让客户学到无用的知识。

评论
随着老黄默认boost越来越高,功耗继续往上走,mlcc的需求之会比以前更高,因为只有多个mlcc并联能够顶住这种超高电流的瞬态。以前没问题,更多的是因为以前的boost速度,极限能力没那么高。

大家可以看下intel的设计,后面没见过i家装聚合物电容吧?当你超频超到最后和cpu一样的时候,你就会需要背面有足够的mlcc来抗你的睿频

评论

对于出厂即灰烬这种设计,任何一点风吹草动,都有可能成为最后一根稻草。



评论

因为大家都只注意看最后一根稻草,最后一个包子,最后一只老鼠
根本不是驱动问题  我把频率降低50左右 可以打一晚上奥德赛 大表哥 稳定的一批
默认频率连奥德赛的性能测试都过不了 必然崩溃

评论
哈哈稳健了那么多年的NV 终于也要躺一躺工艺的雷了 当年是为了追赶性能(NV30) 这次是为了成本和不用抢产能
当然能让三星积累些制造高性能大核心的经验也好 不然将来台积电漫天要价噩梦就来了

评论

芯片背面的电容位置是几mil都要抢的。

评论
不了解这个花屏的事情。但这两种电容一般都是混合用的。。。。各司其职美滋滋。
这么大量产的消费级产品,电源设计的仿真和测试应该是完善的。否则就是自掘坟墓。我觉得还是静观其变吧。(等等党大胜利)

评论
厂商极有可能甩个降频限制功耗的bios推送来结束这场风波

评论

那首发无论哪款,都刷成了丐版

评论
还好每次新卡发售都不抢第一波,等小白鼠了

评论

不是不抢,是抢不到吧。

评论

大电流,线要越短越好,越粗越好。。。

评论
钽电容不行MLCC看起来稳定,那么一点esr的差异导致稳定性的巨大区别,那这个电路或者芯片就是失败的。


评论
MLCC没有那么神,尤其是这种大容量高介电常数的MLCC。
一个典型的例子:
1V左右的直流偏置的影响,还好,不算太大-14%;

image.png (30.12 KB, 下载次数: 0)

2020-9-29 16:10 上传


90摄氏度的使用环境,又要-13%;

image (2).png (31.06 KB, 下载次数: 0)

2020-9-29 16:10 上传


这个就比较有意思了,纹波不够大,容量还有损失,算他0.1Vrms(已经很大了,毕竟供电才1V左右),-15%;

image (1).png (32.25 KB, 下载次数: 0)

2020-9-29 16:10 上传



这时,容量已经只剩下约64%了……
电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...