日本电子维修技术 显卡【第四年的见异思迁】对比测试看图灵架构




一、前言不要给我谈什么Maxwell老古董,不要跳,你Pascal(GP100除外)也就是个Maxwell3.0,NV官网上Pascal架构介绍写的第一个提升就是写的制程提升,铁Tick。https://www.nvidia.com/zh-cn/data-center/pascal-gpu-architecture/GTC2015,2015年3月18日,黄总发布了GeForce GTX TITAN X,最牛Maxwell以下简称GM200。不过有所关注的都知道,GM200的成品是捂了小半年才发布的,故我们以拆解上GM200核心的生产日期1448周作为基准。

GM200 die.jpg (182.05 KB, 下载次数: 0)

2019-3-8 21:41 上传

上个月,黄总低调发布了GeForce GTX 1660 Ti,最鸡Turing(是TU117发布之前的最鸡哈哈)以下简称TU116,没有Tensor,RT Core等传统光栅化渲染不需要的东西,适合本次对比。按你胃,这次老黄还是捂了小半年,依然以拆解上TU116核心的生产日期1848周作为基准。是不是十分巧合,都四年了,更巧合的还在后面!

TU116 die.jpg (273.19 KB, 下载次数: 0)

2019-3-8 21:42 上传

二、GM200和TU116浅析和变量控制1、概述(1)GM200是NV在28nm制程节点打造的最后一个大核心,为28nm盖棺定论。根据CB的推算,12nmFFN对比16nm FF+没有密度提升,实测频率也没有什么提升,属于小幅优化,所以TU116是NV在16nm制程节点打造的最后一个甜点核心,是GP100和Volta两代架构尝试后的集大成者,为16nm盖棺定论。(2)两款核心都是制程终极款,架构首发款,类比于Tick-Tock中的Tock年(架构年),更新微架构,矮马对比起来有看头了。图灵有2xFP16,独立的INT32单元

arch2.jpg (132.24 KB, 下载次数: 0)

2019-3-8 23:38 上传

有INT32并发

arch3.jpg (134.8 KB, 下载次数: 0)

2019-3-8 23:38 上传

有更多的寄存器

arch4.jpg (90.63 KB, 下载次数: 0)

2019-3-8 23:39 上传

还有实测更强的色彩压缩节约带宽2、细节本次测试项目,不涉及DLSS,不涉及VRS,不涉及任何因为画质损失导致的无法控制的变量。(1)巧合的是,不考虑单元结构变化,GM200对比TU116刚好是规模2打1,如果将频率控制在1打2,那么做个简单的乘法,2打2走起,变量控制住了。于是,我对比的计划是将两张卡的FP32单精度性能,显存带宽尽量控制到一致。(由于boost机制的存在,频率只能尽量吻合,后面的理论测试可以看出TTX稍占便宜)(你问我为啥不用MBT把TTX定频,我也想啊,可惜改bios降频超过一定幅度后,TTX变得非常不稳定,无法测试,只得用AB降频(2)GM200,本次测试将核心降频77MHz后模拟一张奔雷手TTXmax从1202.2降到1124.8左右,根据AIDA64 GPGPU测试,计算出频率大致稳定在1.05G/7G核心架构大致是6GPC*4TPC*1SM*128CUDA=3072CUDA,384bit,96ROPs,3M L2,不刻意忽略示意图上没标的TPC(又想起某村神论2333

蜂蜜浏览器_GM200.jpg (433.35 KB, 下载次数: 0)

2019-3-8 21:48 上传

(3)TU116,本次测试将核心和显存超频150/1000MHz后,频率大致稳定在2.1G/14G不考虑单元结构的变化,核心架构大致是GM200的一半,3GPC*4TPC*2SM*64CUDA=1536CUDA,192bit,48ROPs,1.5M L2

TU116.jpg (322.3 KB, 下载次数: 1)

2019-3-8 21:48 上传

三、测试平台CPUAMD Ryzen ThreadRipper 1920X主板ASUS  ROG ZENITH EXTREME内存海盗船 Dominator RGB  DDR4 3000C15*4硬盘Samsung  PM963 960G电源ASUS  ROG THOR 850W机箱Streacom  BC1

评论
黄家还是很有黑科技的

评论
围观一下柯桑

评论
naive靠着7nm靠着黄卡一时的自乱阵脚

应该可以和图灵平分秋色  就像5870对费米那样  就是时间晚了点

不过也算是给农企一个较(hui)好(guang)收(fan)官(zhao)吧

评论
能通过布线提高足够的频率也是技术........
君不见RX480 580乃至590换了工艺还是没有老黄那种boom式的频率提升~
确实期待NAVI以及NV家的7FF/7FF+显卡性能~

评论

所以,你买卡了吗?

评论

回光返照?navi是临死前踹老黄一脚?

前面看到一个新闻,i把显卡研发中心搬到了ati总部的附近,这样,a家的人跳过去都不用搬家了。

这样也好,优化资源配置,i和a本质上只不过是美帝资本家的左口袋和右口袋。

a:无可奈何花落去
i:似曾相识燕归来

评论

给三哥把研发中心搬到他老家海得拉巴了

评论
一个架构,打了人家5代人,等David Wang的新架构吧

评论
技术,回了,慢慢看

评论

毕竟连推土机都扛了23456五代酷睿呢

评论

所以自乱阵脚的结果就是自家独显市占率直接被干到了18%……而黄卡来了个近年市占率新高……这……

评论
AMD yes      

评论
如果有显卡摩尔定律的话~~我觉得现在一直在对标执行着~虽然没有那么标准

评论

最近apu强势替独显遮了不少丑,比如季度总出货降幅比老黄少这种指标

评论
额,还可以这么思考啊~这么一看,是TU116自高身价,还是GM200凤凰落地,且听下回分解

评论

FSE分上面的差距可以说是代表着旧游戏的差距而TS分上面的差距可以说是未来优化1~2年后两者在同样的新游戏里面的差距。图灵的INT跟FP并发架构确实是个重大革新但也不是什么别人无法跟随的技术AMD在大角星这代卡上面也搞类似设计应该不是难事。

评论
不错不错,好贴

评论

老黄有自己的定律,每隔多少个月推新产品,之前都是一直遵守的,可最近几代开始延长迭代周期了,原因大家都懂。

评论
3080今年能出来吗

评论
GCN一战四。。。。也从侧面反映了 GCN 的确也是很优秀 只是现在的确是太老了。。。

评论
N吹客机,十分邪恶!

评论
十分客观,看到最后建议授予AMD卧底小吹手荣誉

评论

何止一战四   战八也不是难事

毕竟战6010也是战嘛

评论

乃快去给柯基当RBQ(如果柯基不嫌弃的话)套点安培的资料来

评论

最初的GCN(Tahiti、Pitcairn、Cape Verde、Hawaii)恰好是Wang参与的作品

评论

教主就是法律,苏妈还需努力

评论

闭嘴RBQ!!

评论

闭嘴RBQ!!

评论
话说老游戏对比性能差距如何?毕竟老黄没对老卡优化新游戏。
我对steam上软硬件统计里一片翠绿已经习惯了........

评论

当年也不知道是谁说自己要靠那个啥羞耻的东西来赚钱了



评论
柯基真的厉害
柯基你什么时候拿到AMD的分析师OFFER?

评论
好奇跑深度学习有差距吗?还是和浮点计算能力一致(不开int8情况下)

评论
这个测试还有一些问题,比如TTX是12G显存而1660Ti只有6G

我会尽量找一张1660 GD6来对比980Ti

这样会更好

评论

肯定1660Ti吊打,有双倍FP16

评论
Turing相对于Maxwell最大的更新是增加了每线程独立的pc和堆栈,虽然实际上是Volta加的但是Volta没有游戏卡


评论

嗯,我记得好像volta的白皮书上有

等会儿去复习下

评论
GCN 1v4的另外一个好处大概就是驱动支持时间特别长吧
核弹黄那边Kepler的笔记本显卡都要EOL了

评论

迭代周期变长是因为制程进步速度开始放缓了,显卡要用上便宜7nm evu。要明年才行吧。老黄18年还给你整除个12nm升级版不错了。。。

评论

如果都跑fp32呢?好奇cuDNN有没有针对新卡做特殊优化

评论

线程独立调度turing白皮书没有提呢,对游戏意义可能不是很大,实际2080ti游戏还吊锤ttv呢,volta要比图灵少一些游戏渲染特性是主要的

评论
int指令越多,自适应着色率渲染比例越大,图灵优势就越大[td]
Babel Tech ReviewsTechPowerUpGame titles26 titles by the year 2017 vs. 14 titles of the years 2018/1910 titles by the year 2017 vs. 10 titles of the years 2018/19GeForce GTX 1660 Ti vs. GTX 1070 (@ 100%)-2.6% vs. + 3.1% = ▲ 5.7-1.6% vs. + 2.0% = ▲ 3.6GeForce GTX 1660 Ti vs. GTX 1060 6GB (@ 100%)+ 26.5% vs. + 34.7% = ▲ 8.2+ 35.8% vs. + 38.2% = ▲ 2.4Radeon RX Vega 64 Vs. GTX 1070 (@ 100%)-+ 0.5% vs. + 10.9% = ▲ 10.4Radeon RX 590 vs. GTX 1060 6GB (@ 100%)+ 6.0% vs. + 16.7% = ▲ 10.7+ 5.3% vs. + 13.9% = ▲ 8.6according to the benchmarks of Babel Tech Reviews (with factory overclocked maps) and TechPowerUp

评论

没说不代表没有吧,线程独立调度对光追的意义非常大,rtx单元只加速层次包围盒的遍历和射线三角形求交。光线的递归迭代还是靠sm单元的通用计算。在不支持rtx的gpu离线渲染器上相同浮点能力的turing对pascal有很大优势


评论
想看3DMark06所有细项成绩和老游戏对比,包括显卡危机这类。

评论

因为这玩意还是自动布线啊。。。

评论
除了单独的计算能力测试有一些说服力
其他的游戏或者3DMark之类的和驱动优化有关
楼主选了一款新驱动,对新卡肯定有作弊优化
对老卡只有移除了作弊代码的一般优化
所以出现了吊打的情形
老黄家驱动负优化是有了名的,不管怎么洗
新架构显卡出现后肯定会降低已停产上一代架构显卡的性能的
也许从某个角度上有吹嘘新卡的可能
但是二手980Ti的价格貌似会比1660便宜一点但是性能基本上相同
买新买旧就是个人选择问题
个人理解更多还是有点抵制二手卡
知根知底可以,撕逼鱼上的不知道是不是挖过矿或者有暗伤
推一波新卡不为错

评论

线程独立调度优势很大,2080ti咋还把ttv吊起来锤呢?ttv对比ttxp提升简直可怜

评论
好文章,收藏了
AMD你学着点

评论
AMD那边从初代GCN到现在的Vega,总共也没积累出20%的同频性能提升吧……

评论

从RX550对比7750的情况来看  20%有的

不过多半是蛆洞优化来的

评论
因为cuda是两倍,所以频率就减半?不能这么简单类比吧

评论

纯gpgpu的光追octanebench 4.0中ttv 397分,ttrtx 325分,2080ti 303分,考虑规模和显存的差距turing和volta的每流处理器效率在同一水平,都得益于线程独立调度而大幅领先ttxp的238分

评论
老铁,这篇文章我能转载么

评论

请随意处置,完全没有问题,没有任何版权2333333333

其实相比转载,我更希望我是抛砖引玉,希望能吸引大家补充更多的测试项目

主要是我不太懂计算和渲染这边,我一拍脑袋找不到合适的项目对比

而且也需要更多的老游戏测试,最近没多少时间弄啊

评论
帖子最后补上了主题图


评论
好想看到4850HD的7nm盛世再现

评论

是啊 就那一代主频大幅度提升开始AMD完全拼不过了

评论

王:我过了几年回来了,没想到还是我的GCN 真香 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...