日本电子维修技术显卡rdna2背后的故事

日期：2021-09-30 栏目：维修经验

闲来无事，来聊聊rdna2背后的故事
1.rdna2初期开发计划是在大胃王回amd后主导开发，历时三年，目标是全平台从mobile，console到高性能图形计算卡都能使用
2.rdna2征召了cpu的rd资源，在每个电压/频率点参考了cpu的高频设计做了充足优化，因此我们才能看到rdna2在不改变工艺的情况下频率相比rdna1提高了百分之25甚至更多。这在三哥主政rtg时期各自为战是看不到的。
3.rdna2的infinity cache是在做了大量的case study和仿真模拟后才决定的，所以为什么console部分没有使用到类似技术，时间点上两者开发可能并不同调
4.infinity cache参考了zen架构的设计，运用了server级别的高密度库达成，相比传统设计的l3cache密度提高了三倍，以此来控制die size面积优化成本
5.光追单元集成在cu内，一是便于扩展（未来的mcm），二是光追单元的频率也能随核心整体频率提高而提高。有趣的是mark cerny在给ps5做预研的时候也是类似的设计思路 mark cerny认为较小规模但是高频率的gpu core效率更好当然ps5是受限于成本 navi21相比起来限制就少了很多
这个我个人理解是rdna2的目标是实现feature，未来的rdna3 rdna4随着cu的增加性能自然也会有线性的提升。AMD这边的思路认为ray tracing还是软硬结合的一个功能，没有像老黄那样那么坚决的走rt core，当然也是为了die size做出的取舍，毕竟老黄已经动不动就整个7 800平方毫米的硅片怪物。。。
6.hbm游戏卡就别想了，未来是gd6+infinity cache的天下

=====================================================================================
总的来说，我个人认为rdna2是真正结合cpu和gpu架构的产物。算是amd在lisa，纸大师，rick bergman，大胃王四位技术高管在amd收购ati 15年后真正携手开始重视在gpu领域上发力的成果，相比起之前三哥自己搞自己的独立王国和一些不着边际的设计思路，rdna2的开发目标明确简单而且非常高效，而且也充分说明领导者的重要性以及amd和ati深厚的技术储备。
因此我断言rdna3肯定会打破amd自己设下的performance/watt目标，并且在raytracing上面应该也会有长足的进步

评论
等一个7900xt
结论就是等等党又赢了

评论

我相信RDNA3的navi31比navi21强1.5倍（2.5倍性能），而且农企完全可以在一个CU里再加1-3个光追的模块吧，完全可以做到，到时候光追的性能大幅度提高也正常，不过游戏光追化之后，RDNA2估计无法战未来了

评论

强2.5倍就是3.5倍咯，不过也合理

评论

可见的未来还是光栅化为主的，本世代console才刚刚上市，起码也得5年时间才有下一代，而且这破新冠搞得全世界到处都爆炸我估计这世代的寿命起码7年。。。。
像地铁那样全盘做光追导致老卡玩不了只有老黄塞足了钱游戏公司才敢搞

评论
阿三瞎搞，罄竹难书

评论
RDNA2的RT加速器没输吧，算上主频甚至是胜了。他光追慢难道不是因为单精度算力被安培的双倍FP32单元按死了么...其实rdna2最大的问题还是没在光栅性能上把纯为了光追性能优化设计的安培给按住如果双方一加一减之下rdna2的光栅能赢3090 10%以上那他现在的评价就会完全不一样了。

评论

这个就是设计思路的区别了，nv有本钱可以在整个核心架构上为了raytracing堆某个单元，但是die size爆炸直接600+，就只能回头去用三棒的8nm（10nm改良版产物），但是效果当然是不错的，老黄确实不缺钱，但是给臭打游戏的那么好工艺好像也浪费了

amd则是在die size限制下跳舞，虽然跟着cpu能拿到很好的工艺但也不能超预算，所以现在的rdna2已经是rtg能拿出来的最优解了

评论
这代6900XT我已经很满足了

之前3080 COD17 2K分辨率核弹镇同样设置

之前3080FPS最高不过170最低110-120

换了6900XT后最高FPS200多点最低FPS160

但是光追和DLSS就是硬伤了没办法

评论

dlss我实际体验过真不行，动起来糊的一p
看看amd的fsr什么效果吧
个人觉得这些后处理技术都是奇技淫巧，短时间内为了解决算力不足而想出来的凑合解决方法，就像aa还是ssaa和msaa效果最好一样
要是gpu的mcm能成熟到zen这边chiplet的程度，那么最后还是堆核心解决问题，等rdna3出来吧

评论
就是这A卡驱动让人很烦躁不够智能化

换了6900XT 用POTPLAYER放4K片源直接能给我GPU频率2.5G跑满

最后摸索出来办法再全局设置里限制FPS199  可以把POTPLAYER 得影片FPS限制144

至于为什么要开到199 才能跑144限制完全不懂  但是游戏里的确限制是199

A卡很多问题只能自己摸索之前3080用起来真是省心太多驱动一装显卡设置一改基本都不用在去看驱动面板

评论
游戏卡追的比较近了，专业卡呢

评论

专业卡慢慢来咯，反正大胃王和rick在，rtg就有戏

评论

改了，表述错误

评论
RDNA3是不是可以把千层饼技术也用上  RDNA2的大缓存应该是为千层饼打基础

评论

千层饼是啥，3d堆叠？

评论

没必要把期待放低，反正不止2.5

评论

都这么自信的吗，3代直接干6块核心不成？

评论

zoo说是大杀器的东西  应该是

评论

保守估计吧，反正mcm的话，核心总面积可不止700了吧，到时候和nvidia正面堆面积了，mcm变相让农企可以做超大核心了

评论
哦嚯  舅妈故事会  顶一个

评论
插帧还会搞吗

评论

等ibm 2nm 再买

评论
征召了这么多资源RD的结果就是产能优先甚至还不如市场份额开始下跌的desktop cpu

评论

这么多R&D资源大部分都是为了完成游戏主机的contract。。Xbox Series跟PS5加起来大概已经卖了千万级别了吧。桌面卡一年都卖不了这么多。

评论
三哥raja说：吃我 Intel xe 一棒

评论

其实tsmc产能是够的问题是基板不够
所以封测产能优先server和console了 server今年涨了很多这是amd最看中的市场

评论
期待老黄的核弹啊，争取这五年内，显卡性能翻8倍！苏妈，老黄加油！

评论
我对舅妈的可信度从不质疑，但第四点“相比传统设计的l3cache密度提高了三倍”是纯粹的瞎扯。
别怪我较这个真哈。

图片1.jpg (481.68 KB, 下载次数: 0)

2021-5-15 22:00 上传

就算Navi 21只有500 mm2 那个cache也不会小于77mm2。
实际情况大概在1.6M per mm2左右
也就是说，传统设计密度 L3 cache大概是0.5x per mm2.
那么对比同级别制程下Zen3/TGL的L3

QQ图片20210515220510.png (511.24 KB, 下载次数: 0)

2021-5-15 22:05 上传

Zen3即便是算了互联的总线部分拖累，32M L3也就33.63 mm2 实际也有0.95 M per mm2，扣掉之后怎么也有差不多1.2 M per mm2.

QQ图片20210515220647.png (674.13 KB, 下载次数: 0)

2021-5-15 22:07 上传

膏子的L3跟ringbus总线划分的更清楚
3M l3也就 2mm2左右，甚至有1.5 M per mm2
至于ARM产品走高密度库的L3更是占比绝大多数。
其他的几点我都相信舅妈，就这一条建议改一下咯~

评论

老黄：我基板管够，有史以来最畅销的游戏卡，数据中心炼丹卡翻倍infinite cache还是要大些才行，现在128M在4k时已经全面落后90，68xt和69如果能上256的话应该对80 90在高分情况下就不会劣了

评论
还我补帧

评论
那么xsx2和ps5p是什么时候。4倍性能提升？

评论

其实地铁那种也远算不上全盘光追只是相对占比高

评论
作为a粉，之前还因为把6900xt卖掉（原价）有些遗憾，但是转念一想ps5也是用的amd家的东西rdna2这一代也算支持了

评论

根据新闻，去年全球pc出货2.75亿
老黄大概占pc gpu市场的15%上下，苏妈独显跟老黄的比例大概2：8到3：7，一年千万还是能卖到的

评论
游戏卡放弃HBM是必然的
目前所有的用HBM的游戏卡都是失败产品

评论
移动卡还没看到

评论

这个2.75亿包含了核显吧……

评论

看重server是必然的，PC市场能赚几个钱，DIY玩家在整个行业中更是小众。肯定优先高利润高发展性的行业。

评论

光栅的游戏，现在大家都能跑得动，6900就算比3090强10%，也不影响体验，但是3090的DLSS和光追搭配，是把不能玩变成能玩，例如2077 灵媒之类的开4K光追，想流畅只能DLSS，按摩店完全没办法，只能关光追，还有8K游戏也类似，而且我个人没觉得DLSS2.0开平衡以上模糊，不细看完全看不出，当然例如死亡搁浅漂浮石块的小BUG还是有的。

评论

后面老黄占15%上下也是包含核显的，amd独显算老黄的1/3吧，2.75亿*5%

评论

这个是大胃王自己开briefing的时候说的又不是我自己胡编的

评论

其实还是比较少要知道皓龙当年拿下了40%多还不是被Intel缓过神来

评论

这个确实非常关注，所以480卖掉后，还留了一张460，如果新卡也能开启补帧，老卡完全可以拜拜了

评论
总体来讲大卫王回归了以后RDNA就是做的有模有样
憨憨阿三就是要权不做事。 XE搞了3年多了，搞了个锤子出来。raja换个地方做VEGA而已。

评论

vega背后还有很多故事
rtg血泪史

评论

这也是为啥AMD能做到科技史上的奇迹。阿三真的拉跨

评论
三倍是说的对比L2，当然IC的速度比起L2也只有四分之一啊

评论

在游戏上失败，在挖矿上爬起来。还是赢两次。。

评论
为啥navi到现在还是不能炼丹有人能解释下么

评论

2000w电源哪家强

评论

navi可能还等着用mi200超算的国家实验室帮忙写驱动呢，等金坷垃的tenstorrent加速卡可能都比amd靠谱。。。

评论

插帧已经被放弃了不用再惦记新卡会有

评论

算shader的驱动稍微改改就就行，中高级API rocm都有，其实navi是完全具备炼丹能力的。

原因应该不是技术上的。

评论

翻翻这个github串https://github.com/RadeonOpenCompute/ROCm/issues/887。一个月前的说法是2-4个月会更新rocm。国家实验室那台机器应该得支持的，所以deadline应该是机器上线之前。。。

评论

2019年到现在其实应该早就做好了（只是可能没有做好debug和优化），一直没放出来。里面提到kernel function编程支持说明navi做dl没什么问题，只是自己手撸核函数比较麻烦，另外说一句核函数编程和shader编程比较类似。

我个人并不指望能够一开始就放出一个非常完美的rocm高级API支持，毕竟big navi后增加了ic，是有一定的优化难度的。当时发布rocm第一版的时候也不完美，但整个rocm同样包含了低级核函数实现到高级的api接口的全部内容，接口全部是照抄cuda。

评论

短时间内估计不会有咯现在都缺成这样等4年以后吧

评论

普通卡直接跑不了这种事情除了老黄可劲塞钱给乌克兰穷比公司能做别的公司基本不会接的

评论
GCN 系列和 NVIDIA 现在使用 HBM, GDDR6X 的 GPU，走的是 IMR (Immediate Mode Rendering) 的渲染路线。

AMD 则使用 Infinity Cache + GDDR6，这种优化数据处理平衡计算、访存负载的方式，在未来势必重构 PC 与主机端的渲染流水线。如果我们进一步考虑 AMD 在 RDNA2 发布会上推出的 Smart Access Memory 技术，大概可以想象到 Infinity Cache 与 Smart Access Memory 未来会进一步整合。

进一步去看，如果以 PICE 5.0 (甚至是 CXL 2.0) 作为基础，新一代的 Infinity Cache 与 Smart Access Memory (Cache) 或许可以让 AMD 平台的渲染方式由 IMR 转向能效表现更为优秀的 TBDR。

HBM / GDDR6X 与 Infinity Cache + GDDR6 会在未来持续交锋，我个人更看好 Infinity Cache + GDDR6，毕竟在设计上更加取巧、也更便宜实用。（个 P ，HBM 才是高性能计算的未来.jpg）
希望 RDNA3 如同「加强版的 HD 5870」，横扫顶级 GPU 战场，逼着新一代的 TITAN 上 HBM 显存。否则，未来想玩到的 HBM 游戏卡估计也就指望 The King 了。

评论
说穿了没啥稀奇的,要能耗比高就是少塞电晶体数量多的可编程单元，多塞不可编程单元
难点在於ATI从来设计过这类玩意,等於从新开始,RDNA算是与fusion时代AMD/ATI彻底告别

评论

Infinite Cache 首先要做的事与游戏厂商密切合作，优化渲染流程。

评论

4k的落後的原因是shader性能不足,分辨率越高shader占比越大,光加IF缓存没用
黄老板这样搞当然也不是为了4K碾压对手,而是炼丹性能
以前A卡挖矿强的时代也是分辨率越高越能战

评论
手上留著2012年的7770，4K SDR能正常插幀，2017年的1050TI支持8K60解碼
副卡搭配好解決RDNA/RDNA2架構的不足完事

评论
现在A卡最大的劣势反而是编码器解码器了。。

评论

是的，我也在等A卡赶上蓝厂的时候

其实我很想买张蓝卡，做解码用

评论

其他还有什么问题吗？

据说显存待机的时候也不降低频率？

评论

恩就跟那些专业软件一样公司收钱然后检查只要不是专业显卡就直接帧数砍一半或者1/10一样

评论
大量的6700xt在哪里？

评论

这个东西已经没必要做到显卡上了。苹果这个东西就是跟核显脱钩的

评论
我不A黑，我是A饭，但是A家只认JD吗？这背后又有啥故事？什么时候能买到平价卡？非得抢购吗？不能预约登记购买？挖矿有几个用6000系列的？这么下去把人都逼成A黑了，就不能在天猫放货？

评论

天猫出过货，就是那个挂着AMD旗舰店的渠道；而且天猫的店价格是直接对接海鲜市场的，难得有低价也是出多少基本转进小黄鱼，和狗东也没差了

评论

但是AMD CPU上也没有。。所以有点不好用

评论
五舅妈不要瞎下预言，被打脸不好看

评论

必须塞在显示输出端呀
相比解码前的视频码率，解码后的视讯带宽需求是非常大的。

评论

PCIe带宽足够大，你看论坛里好多人专门买个Polaris补帧，那个就是要在不同显卡之间copy解码后的视频裸流，还是补过帧的。同理如果是软解也要从主内存copy到显卡输出。

评论
“mark cerny在给ps5做预研的时候也是类似的设计思路”他在预研时期就已经这样设想了？GPU部分这么大的rop也想上2.23Ghz也真够冒险的（虽然现在事后诸葛看起来是压住了

评论
牙膏厂被三哥祸祸的哭都哭不出来了。。。。电路电子维修求创维42c08RD电路图评论电视的图纸很少见评论电视的图纸很少见评论创维的图纸你要说版号，不然无能为力评论板号5800-p42ALM-0050 168P-P42CLM-01 电路电子维修我现在把定影部分拆出来了。想换下滚，因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗？评论认真看，认真瞧。果然有收
·日本中文新闻日本26年新成人预估仅109万与去年并列历史第二低
·日本中文新闻日本皇居新年参贺突发裸奔事件男子涉公然猥亵被捕
·日本中文新闻印度宣布超越日本成为全球第四大经济体
·日本留学生活在熟悉的城市，遇見不一樣的感受
·日本留学生活求购一些水电燃气话费等公共料金请求书
·日本华人网络交流制造信息垃圾的产业，这种现象在日本尤其普遍。
·日本华人网络交流美军入侵委内瑞拉领空并非零伤亡
·日本华人网络交流年末采购食品，恰时间就能全半价。
·中文新闻马丁·克鲁内斯 (Martin Clunes) 在新剧中变身休·爱德华兹 (Huw Edw
·中文新闻当朋友们讲述他们对他们的阴谋感到震惊以及他们如何向他们隐

维修经验

日本电子维修技术显卡rdna2背后的故事

CPUcpu-z 1.77版低调发布

CPU这几天经常开机黑屏，热重启后又正常

CPU超频求助！关于华擎H170和6700K

CPU液态金属会侵蚀cpu核心吗？

CPUAMD Zen处理器、AM4接口实物曝光：1331个针脚

CPUm6i究竟支不支持e3 1231v3

CPU华擎 HYPER 妖板正确玩法

CPUE5 2686 V3和i7 6800K如何选择

CPUHD530硬解4K能力还是有点弱呀！

CPU在组一个小机箱，关于i5 6600和i7 6700的选择

CPUwin10超频稳定，但是睡眠唤醒不了，pll电压di

CPU6900k 1.25V到4.2体质怎么样

CPUI3 6100 华擎B150M pro4超4.5g测试。

CPU系统稳定性测试，我发现prime95半个小时内问题

CPU7系u会兼容100系主板吗？

CPU请教各位：J3710和G1840，哪个性能稍好些？

CPU昨日遇到土豪朋友，又被吓到了，有朋友比这

CPU有心入5820k了，求教下温度问题

CPU6600&6600K才100的差价

CPU打算组双路E5 2670，大家有什么好的建议吗？

日本电子维修技术 显卡rdna2背后的故事

相关推荐

日本电子维修技术显卡rdna2背后的故事