日本电子维修技术 显卡【超级超级巨大巨大的遗憾】安培图灵架构




一、前言       其实结合安培架构的实际产品表现,我很想在标题写上Poor Ampere。       后来想了想,其实提升和Maxwell2.0到Turing的幅度差不多,算不上Poor(【第四年的见异思迁】对比测试看图灵架构性能提升,当时得出的结论是,经过4年的研发,Turing对比Maxwell2.0纯架构提升2成)。那就写个遗憾吧。二、核心浅析和变量控制1、概述       (1)Ampere是NVIDIA用三星8nm制程打造的最新游戏显卡架构,按Tick-Tock玩法是Tick、Tock均有,即制程架构双提升,按理说应该是提升很大。其第三定位的游戏核心GA104是利用该制程节点打造的中高端级别核心,对比Turing的TU104,两者定位类似,功耗级别类似,可以说符合NVIDIA的一贯定位,甚至在发布前后被脑残舆论推到了打NAVI21的定位上,当然这是后话。       (2)安培的白皮书给到了6个关键特性,我试着逐一用几行字概括。       2x FP32 Processing从图灵的FP32+INT32变成FP32+FP32/INT32,纯FP32吞吐翻倍。       Second-Generation RT Core数量不变,每个单元增加一组三角形求交单元和插值运算单元,加强动态模糊下的光追性能,但是和游戏无关。白皮书原话:GA10xhardware-accelerated motion blur is supported by Blender 2.90, Chaos V-Ray5.0,Autodesk Arnold, and Redshift Renderer 3.0.X using the NVIDIA OptiX 7.0API. 也就是说,渲染用的。       Third-Generation Tensor Cores单SM的TensorCore数量减半,每个单元的FP16操作数翻倍。       GDDR6X MemoryGA104不搭载。将显存颗粒的速度从16-18Gbps推进到了19-21Gbps,目前暂无2GB单颗颗粒。       Third-Generation NVLinkGA104不搭载。对于安培架构来说,由于NV已经放弃了SLI,所以这个特性只对科学计算有用。       PCIe Gen 4追上业界最新标准,引入新特性DirectStorage,现在用不上。2、变量控制       本次测试选用的显卡是RTX 2080和RTX 3070,因为两款核心的规模类似,所以本次测试的原则是尽量同频。       (1)核心频率相同,3070保持1905MHz,2080用Afterburner降频121MHz(此时实际运行频率是1905MHz),保持基本一致的核心频率。       (2)显存频率相同,3070和2080均通过Afterburner调整到15000MHz,显存带宽完全一致为480GB/s。       (3)核心功耗相同,2080通过Afterburner降低功耗到91%(205W),此时,3070和2080的核心功耗均为165W左右(参考3DMarkTS测试)。       (4)3070对比2080的ROP增加了50%,解决了ROP的问题,这点变量无法控制。参考我之前的帖子(【黄氏刀法】震惊!NVIDIA主流显卡竟然采用“饥饿ROP”设计)。三、测试平台       AMD Ryzen7 4700GE ES 4.3GHz       GIGABYTEAORUS X470 GAMING 7 WIFI       CrucialBallistix Elite DDR4 3600 8G*4       WD Black SN750 1T       ASUS ROG THOR 850W       STREACOM BC1四、测试项目       1、理论性能       (1)测试数据GPUTU104GA104CUDA30726144ROP6496MC256bit256bitL24M4M驱动457.09457.09最大核心频率1905MHz1905MHzAIDA64 理论显存带宽480.0GB/s480.0GB/sAIDA64  理论像素填充率121920182880AIDA64  理论纹理填充率365760365760AIDA64 FP321168822999AIDA64 FP64365.4357AIDA64 INT321142411444AIDA64 memory  copy398444410256Fire Strike  Extreme1291116369Fire Strike  Ultra64118449Time Spy1092313663Time Spy  Extreme50866796Port Royal65628087DXR 1.121.1131.66VRS TEST2  uplift66.467.3DLSS uplift134.4140.13DMark06  Single-Texturing Fillrate89720.063118290.23DMark06  Multi-Texturing Fillrate188018.063221098.53DMark  Vantage Color Fillrate47.9774.43DMark  Vantage Texture Fillrate269.52296.83

评论
懂了,这就去买A卡

评论
懂了,算力喂楼主

评论
懂了 AMD YES

评论
ok,楼主请吃饼

评论
我觉得算力的优势还依赖于游戏和应用的跟进
就像当年X1900那样,初期游戏和应用下对7900优势不明显,但在后期游戏下完全是碾压的

评论
你这个比较一点都不科学啊。
买图灵你学习不了原来在显卡上还有保险丝,明白了什么叫MLCC电容,什么叫POSCAP电容。大家开始渐渐知道生产这些电容的厂商,开始知道它们之间的成本物料区别,开始知道它们的电气性能差异。
所以安培的提升要考虑这些启发民智的部分,那就是1145.14%提高

评论
真实N狗的测试

评论
懂了,这就去买a卡

评论
懂了,算力提升对我来说全都应验,反正游戏只是需求的一部分。
所以不买A卡

评论
临24小时发文,很六啊。

评论
不仅算力喂狗
填充率也喂狗
带宽也喂狗了

评论

《感觉这次 AMD 但凡争气一点,黄卡都要翻车》


评论
解除220w功耗限制,跑2.1还是可以的,超频能力并没有比20系低,没什么提高就是了

评论

乱说,这些gpu专家早就科普过了!!!都是你们这帮人天天恶意黑老黄!!!

评论
柯基,你邪恶指数马上正分了

评论
本质就是老黄根本就是没用心弄安培这代的游戏卡 随便弄个翻倍FP32和GDDR6X 应付应付 虽然FP32对于将来光追的变态算力要求 很重要 ,但是只增加FP32 其他部分单元不见同步增长多少 加上配合三星那个廉价工艺 完全就是为了对抗新A卡 敷衍了事。
只能期盼是老黄是为了下一代全新架构的推出而缓冲  不是真的为了敷衍PC玩家

另外我觉得安培产品明明有性能更好的方案,但是老黄却选择了毛利率最高那种

评论
工艺一定程度上和架构是一样的重要

评论

老黄又不是第一次这样了

评论

明天你就来老黄家上班吧

评论
104再拉跨 苏妈似乎拿不出同级别的核心

评论
这对比清晰明了

评论
啊 最后一句点醒了我

评论
实际上最适合用作对比的卡是3060和2060,ROP是一样的

但是这样结果会更难看,因为中低端卡只能用低分辨率才能跑出来能用的帧数

评论
继承了这么多sp还是这么菜

QQ图片20201030151315.jpg (23.37 KB, 下载次数: 0)

2020-11-4 15:29 上传




评论

我有六个粪瓢哥表情,你有几个

粪瓢1.jpg (21.35 KB, 下载次数: 0)

2020-11-4 15:38 上传




评论
老黄的30系卡,极大带动了千瓦级电源的销量,这是实实在在的给消费者带来更大的温暖啊!!

评论
等A卡发布看看测试,是不是能真的N转A。

评论
ga100和ga102这两个差异巨大的核心共用ampere开发代号是有道理的。因为它们共同完成了一个任务。

ga100专攻矩阵指令,ga102专攻向量指令。

评论
懂了,这就去喂狗。“道理我都懂,但是3070游戏几乎可以和2080ti一战了,而且价格便宜几乎一半了。”所以我选30系

评论

你就是蒜粒?

评论
建议把文中的2080改成2080Super

评论
选三棒子就是个败笔

评论
懂了,算力喂醉熊

评论
难怪   FP32从10多点 到30T      游戏提升50%都没有,,,

评论
人民币今天跌了不少

评论

从结果来看,老黄完全没有把pc玩家当一回事,安培也不是给游戏用的。一,老黄的利润不依赖pc游戏,实际上做显卡的在做cpu面前毛都不是,老黄的市值和利润近年来快速增长靠的是异构计算,ai,挖矿,深度学习这些乱七八糟的东西,核心是计算而不是图形,简单来说还是cpu而不是gpu;二是amd的7nm已经两代了,按理说工艺红利已经早就榨干,nv这边却是刚刚提升工艺,没想到第三代居然真的如此给力,简单来说轻敌;第三是,如果老黄只换工艺,不改架构,2080ti用8nm重新流片再加一下规模,就现在这个图形的结果来看,提升可能也差不多,但是老黄选择翻倍Cuda,效果却几乎没有,老黄还说这一代是重大突破,这翻倍的算力还是剑指计算而不是图形,ga100和ga102就是不同的计算取向。

评论
唯一能比较实在的反应算力提升的是各种gpgpu离线渲染器测试。实际上octane渲染器的提升比octanebench还高一点,3090约有2080ti的1.9倍

评论
反正我的观点就是买这卡一般都是为了升级的,以3A为参考,可以从现在1080的4K全开下20~30帧升级到60帧就够了,换这代卡我起初目标就是为了渡过4K60年代的,功耗增加我也认了。但是升级不等于我没卡用,加价这种事我不会认。

但是横向来看,这代AMD太给力,我有可能就不选择老黄家了……

评论
不要喂狗,20、30系我统统50包邮收...

评论

我不是……我没有……你别乱说……

评论
哈哈, N卡要隔代买的魔咒被打破了,以后要隔两代才能买

评论
感觉硬件行业就算没竞争对手
也会自己开翻车

评论
看着手里的2080super,心里默默的拔了草

评论
这样就没了?我很失望啊。

评论

QQ图片20201031093547.jpg (6.6 KB, 下载次数: 0)

2020-11-6 15:16 上传

我就看看那张gpuz图


评论

哪儿有GPU-Z图

评论

白皮书架构图什么的没说到的太多了




你以为A100的SM里每个sub core里有16个FP32,16个INT32,8个FP64和1个Tensor Core?

其实白皮书那只是示意图,和实际单元无关

实际上A100的SM里每个sub core里有有16个FP32/INT32,16个FP16和1个Tensor Core




A100的架构是GV100的延续,和图灵无关,瞎了狗眼

电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...