日本电子维修技术 显卡完全压注AI导致塞满电炉丝而功耗爆炸的GA




老黄家大核弹又放出来了,不过不是游戏核心。

IMG_4793.JPG (159.22 KB, 下载次数: 0)

2020-5-14 23:56 上传


新上马 7nm DUV 工艺,发布会发出来的 GA100 并不是完整核心。
这年头连信仰产品都阉大刀了。上一次 GV100 从 5376sp 阉到 5120sp 幅度很小。这次直接砍掉接近 1/6 的单元。
DGX 和别家服务器里的 GA100 是 108SM,40GB HBM,6912sp,19.5TFLOPS FP32,1/2 FP64,432 Tensor Core,19.5 TFLOPS Tensor Core FP64,540 亿晶体管。
功耗高达 400W,纯 FP32 性能相对 2080Ti 提升很小。先前爆料 Ampere 的 IPC 提升 20%,频率提升到 2.4GHz 左右,GA100 的 FP32 完全没有表现出这两处爆料应有的性能。
当然这样的超大核心处于低频状态运行很正常。


不过很明显,那些些参数一看就能看出来都不是整数,很奇怪。
完整 GA100 是 128SM,48GB 6stack HBM,8192sp,512 Tensor Core。
和上一年晚些时候舅舅党爆料的,Geekbench 跑过分的几个 Ampere 大核心差不多。
事实上 GA100 的 48MB L2 缓存比 GV100 大了 8 倍,L1 从 128KB 升到 192KB。Tensor Core 和 CUDA core 可以同时计算 FP64,新支持了 TF32/BF16 等专门为 AI 优化的数值计算,以及 PCIe 4.0 界面。

但这些对于游戏玩家来说就是多了一大堆电炉丝。
所以 Ampere 的游戏版本,也就是 GA102 和以下,要日后再看了。
(黄老板说这一代不玩 Volta Turing 双线了。但 Ampere 的 RT Core 性能完全不明,因为 GA100 根本就没有 RT Core)

架构图在下面,看起来是软胶水两块 64SM 的集群。
赌五毛那堆无用的电炉丝要拿掉的,双集群也要拿掉的。

IMG_479.jpg (306.66 KB, 下载次数: 0)

2020-5-14 23:57 上传



普通玩家最常接触到的超大晶片应该是全画幅 CMOS 的 864sqmm,这货 826sqmm 已经非常接近了。GV100 是 815sqmm 210 亿晶体管,TU102 则是 754sqmm,189 亿晶体管。










评论
老黄梦想用TS的dlss对抗对面的FP32单元

评论
老黄在储备和部分应用mcm的思路了

评论

他还没提 Ampere 的 RT Core 有什么改进呢,难道 AI RT?

评论

看错,RT core的内容慢慢等吧
传统cuda core部分就是个volta 3.0,只变了L1/L2容量,花样就看tensor core/rt core这些了


评论
你说的那些爆料是假的

评论

现在完全不知道的频率性能其实也很重要,跨过 2.5GHz 的话能有很大提升。
之前 AMD 那些异步计算之类的东西在 Turing 都加上之后也让 A 优游戏没什么优势了。

评论
所以看起来差距大

评论

去年的时候有一些 8192sp 和 7000 多 sp 不等,阉割程度各不相同的核心跑过分。至于真假现在看可能不是假的。

至于现在 GA102 的爆料,还是等年底再回头看吧。

评论

如果有超高速nvlink能把两张2060虚拟成一张2080Ti的话,那游戏卡其实出到2060就可以了

评论

实时渲染的调度很重要。应用场景和离线渲染或者 HPC 有非常大差距。MCM 应该不是一个好的解决方案。

评论
A100用N7工艺倒是没想到,至于棒子工艺能拉多少频率也还是先别把期望拉满

评论

还是略放宽密度,换稳定性和可靠性占先的思路吧。如果不能提升频率,直接扩大规模,7nm 也基本能留出非常充足的空间了。不论 DUV 还是 EUV,密度都至少是 16/12nm 两倍。当然 Samsung 8nm 密度会差点。

评论
看到a100这表现我都开始担心老黄要晚节不保被外甥女的新卡给完爆了

评论

那你想假如有一半的电炉丝都换成 CUDA core 呢?

评论

a100里面应该是没有光追加速单元的而且为了加速rtx还得保留足够的tensorcore进行最后的降噪还有dlss计算呢。

评论

可以拆掉的有多余的 INT32 整数,多余的 L2,多余的 FP64,用于合并输出 FP64 的 Tensor Core 和其他多余的 AI Tensor Core,NVLink 控制器,HBM 控制器换成 GDDR6。
那样至少省出来一个 TU104 的晶体管数量。相当于 2080Ti/2080 直接叠加了。

651C6302-7C77-4532-B750-990E0D616907.jpeg (89.88 KB, 下载次数: 0)

2020-5-15 01:03 上传


当然有个问题是,老黄还愿意把消费核心做到 TU102 那么大吗?


评论
Ampere和游戏卡有啥关系……Pascal开始GP100和GP102就分道扬镳了,Volta/Turing彻底分开


评论

这代又合回来了,不过是要等 GA102 再说游戏卡的事。

评论

不知道是不是A100上面屏蔽了RT core,不然老黄说的计算游戏合并论无从谈起啊。
另外Volta就是过渡。

可惜这次没有Volta发布会现场抽奖送titan的好事了(我上次一起去参加活动的哥们抽到了星战)


评论

GP100 和 GP102 也几乎不一样,所以可能也就少起一个名的事。不可能像 Fermi 和 Vega,硬着头皮弄一模一样。

评论

没有任何可靠的证据显示要合并


评论

那GP102未来可期!不过GP102放在三星的8ff或者5euv,感觉也是不清楚到底怎么样。

评论

就算不合并,Turing 不也是 Volta 改的。名字而已。

评论

实际上真就取决于老黄打算卖多大面积芯片。多装 CUDA core 少装电炉丝,晶体管数量翻一番,规模都够冲抵频率了。GA100 的 TSMC N7 在最近几种高密度新工艺里密度算低的,大约 75MTr/sqmm 左右。Intel 10nm 100MTr/sqmm,N7+ 也有 95 左右。

评论
上一代volta同样初期发布的是阉割版本的v100,这纯粹是提升良率的做法。当然在去年9月份volta生命周期末才纸面/大客户专供发布了完整版本的v100s,据熟识的方案商说v100s的调货周期很长,达到4个月之久,才能拿到几块。

其实从p100开始,老黄的显卡构架就明显开始分开两条路线,而所谓分构架只是codename上的区别而已。这个后面说。

为什么要分主要是计算和图形的需求区分越来越大,设计一个大而全的显卡没人买单。计算向需要通用,否则无法上hpc,图像向需要专用(包含quadro),否则加速性能堪忧。所以即使是同一个codename,计算向卡和图像向卡都是不同的configuation。

那么分codename的意义是什么呢?第一个我认为是组建的团队不一样,可以同样的技术并行开发。第二个是技术冻结的timing不一样,发布的时间不同。

如果是共享一个codename,说白了就是一个团队开发的,无论计算卡还是图像卡,只要一者发布了,其主要规格就冻结了(比如sp),只需要再开发并加上不同configuation的单元即可,通常两者发布的时间不会差距很大。

如果是并行的codename,在第一个codename发布后,技术还是不会冻结,因为独立的codename有自己的开发管理。这就导致了比如volta和turing不仅仅是configuration的区别,它们的sp能力以及编解码器也有所不同,比如turing的sp就具备volta没有的concurrent交替发射int单元的能力,编解码器也进化了一个版本,cuda兼容版本也升级了。因为volta发布后,turing并没有技术冻结。

如果构架合并是真的,那么可以预见ampere的计算卡与图像卡在共享技术上是一样的。

评论
老黄就是那个创造出天网的人

评论
完全不提RT CODE,那么这些光追怎么搞呢?

评论
到底游戏卡何时发布?

评论
Mellanox 的高速传输芯片都做上去了,注定和游戏无关。

游戏卡还要等一段时间才会发布。
RTX要各家游戏厂买单,而各家游戏厂要先观望新Console~~~PS5/XSX的情况......so,现在的RTX很可能就是一波前浪,重演Gsync和Fsync的结果

评论

年底。计划是这样。

评论

里菊福

评论

发 Quadro 和游戏卡的时候再说吧,这两个应该完全共享架构。

评论

那ITX用户怎么办?

评论

再外挂一个显卡机箱。 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...