日本电子维修技术 显卡Turing的一些小细节




1,RT Core在干什么?
老黄并没有详细说明,但在介绍RT Core的时候,ppt上有这两个词组Ray Triangles Intersection 和 Bounding Volume Hierarchy Traversal。
在计算光线追踪的时候,并不是如同真实世界一样从光源开始顺着反射逐一计算,光线追踪是非常重的处理,我们只能关注我们肉眼能看到的范围,看不到的地方要尽量减去,所以一般是从虚拟摄像机开始反向追踪光线的反射。
在这个过程中,需要计算光线与多边形交汇的节点,这是一个相当繁重的处理。这个交汇点计算的任务就是nvidia重点硬件化的部分,就是RT Core的担当任务之一。这是前者。
后者BVH则是遍历整个多层空间结构的任务,剔除不需要参与光线追踪运算的部件,这也是交给RT Core执行。

2,新设计的SM单元有什么不同?
cuda核心呈72*64的布局,核心在计算TFlops的时候,可以同时用于TIPs的计算。
因为新设计的shader核心可以同时运行浮点单元与整型单元,SM内置指令可以以可变长的形式访问寄存器。所以它的峰值其实是16Tflops + 16TIPs,不知道挖矿性能会不会翻倍。

3,新Tensor Core有什么不一样?
明显它是由volta的Tensor Core改进而来,增加了新的INT8和INT4的SIMD指令,性能也分别是2倍和4倍于fp16。
低精度性能的大幅增强,极大提升了这个核心的推理性能,为消化DLAA庞大的性能需求做好准备。

图灵是一款很认真的产品,这个命名也看的出来。但目前的RTX 8000/6000/5000是用于内容生产(content create)的,用于内容消费(content consume)的游戏卡会不会有RTX版本的呢,我感觉并没有什么能砍的部分,除了显存,那么999刀买得到么。
gameworks的rtx和这里的rtx真的是同一个东西么。


评论
看到这句话,

我心里咯噔一下.....

评论
咦?999都买不到吗?

那我是不是应该给大V寄点啥……悠悠的抱枕?

评论
2080ti估计会上万。。。。

评论
支持树导师的科普讲座

评论
砍点SM、砍点显存及带宽、砍掉双精度

评论

本来就没有双精度,还能砍的就是RT core了

评论

RTX 8000不是Quadro系列?Quadro系列现在连双精度都没有了?这么堕落了?太久不关心这些了

评论

是啊,但Quadro也分几种版本的啊,大的核心像GP100和GV100这种才有双精度单元,其他都没有

评论
volta浮点和整型alu也是分开的,能不能同时运行浮点和整型?

评论

除了GV100和GP100,GeForce和Quadro都是用GP102/104/106/107,凭什么Quadro有双精度

评论

嗯嗯嗯,真是堕落啊,不过还是可以砍显存容量、砍显存带宽、砍ROP,还有你说的那个什么砍RT,无非就哪几种刀法嘛。下一代准备用核显了,游戏都戒了

评论

rendering专精的核心,没双精度正常。

评论

你是人吗

评论

想想9年前编CUDA应用的时候,连游戏卡的双精度都是单精度的1/4,老黄真是练就了少林还是武当刀法

评论

这不是,感觉真的因为大V我才能躲开一发根本买不起的卡

然后大V又被好多ID花式欺负想安慰一下大V嘛……

怎么就不是人了呢?

评论
在没用到光追的游戏里不就浪费了么。多了60%的面积和晶体管,但才比gp102多30%的单精度浮点。难道也是战未来?

评论

反正现在大家都砍了,你买amd的新Radeon Pro也一水的1/16

评论
所以rtx2080很贵并不是空穴来风,起码就目前看来和专业卡相比除了显存没啥地方可以再阉割了

评论
说不定老黄会掏出安培。

评论

买啥哦,都米不起了,下一代直接核显走起了

评论

但nvidia是1/32

评论

不用独显了?

评论
云里雾里

评论

intel的核显是1/4 DP... 真的是...

评论
GTX680,[email protected],SP 3100+, DP 150+
UHD630,[email protected],SP 400+,DP 100+

评论

真不用了,生存都成问题了,以后要么牙膏核显要么APU

评论
quadro的价格历来都是对应geforce的5倍,其他的自己想

评论

那双11上9900k吗?

评论

看价格溢出情况,>3500 肯定不会上这样看来INTEL还真是良心企业,舅妈不是说明年3月就有INTEL显卡了吗?可以期待一下,AMD是别指望了

评论

貌似这代Intel集显的EU是512bit宽度,所以理论上1EU = 16ALU吧?

评论

核显和APU不惹矿老板啊。哪有什么独立显卡,都是独立矿卡装成显卡的样子搞个发布会

评论

有区别嘛,一般人一辈子用不上真需要的人无论是1:16还是1:32都完全不够用只会去买有完整dp的计算卡。

评论
所以说三家里最没商业头脑(最良心)的就是酥麻


评论

不关心咯,没挖过矿,也不太了解现在是否能盈利

评论

带宽比TTV还高了,除去HPC应用,双精度要来没啥用

评论

我现在怎么觉得有这钱还不如买台ps4,便宜又好玩

评论

嗯,DP算力上来看,是的...

想不明白为毛intel要搞DP性能...

评论

没错,买台ps4pro和switch,玩游戏很舒坦啊,电脑就让它干它应该干的

评论
RTX原理都是一样的,不分工作站和游戏之分
区别只有软件,

评论

谢东哥关心,不过游戏也不玩了,9900K价格合适也是买来玩一玩DIY,也许再过2年彻底不玩机了

评论
RTX是nv单方面在推还是伙同ms一起呢?
如果是前者的话,AMD未来几年内都不跟进(主动或被动),次时代主机都不鸟的话
这个项目会不会和physx一样沦为边缘

评论
我有个疑问就是跑传统游戏时候TC跟RT单元都在休眠状态这TDP还能压制在正常的200W左右,那一但跑用上RTX的游戏让那两个平时偷懒睡觉的单元也全速工作的话这功耗又要怎么算呢?

评论

我电脑总共花了3w多,结果现在不是玩守望就是刷论坛,都够买全套的游戏主机了

评论

控制单元不够···
另外L2不够

Turing几乎都是加倍··

评论

现在配电脑不就是为了开开关关看看灯,刷刷论坛看看剧么。。。。



评论

能高特效280F+玩守望也未必不值我玩守望开个中特效都感觉心情和低特效明显不一样

评论
主机画质垃圾,帧数也低,只能玩那几个独占游戏

评论

[email protected] , 把1080ti出了换了个1063,等着换2080ti,目前发现1063足够我用了。。。。

评论

说实话,那几个独占挺诱惑人的,目前pc上没几个好玩的游戏

神海 美国末日 战神 塞尔达  都想玩玩试试


评论

正是因为只有60hz所以才更需要高帧数啊,我用着60hz感觉没有240fps以上,跟枪都很困难,[email protected]��多了

评论

die大任性啊。挖矿只用整型,貌似有的算法还可以改得不用过显存,以后看看会不会有边挖矿边打游戏的操作。

评论

我平时都开垂直同步的,可能水平太次了吧,也准备换个120或者144的

评论

因为intel集显多少要办点正事儿的……

虽然聊胜于无

这么大出货量和极低的晶体管成本,一股脑造了兴许成本还低一些

评论

可能我比你更次,60hz开了垂直同步我莫伊拉都吸不到人

评论

。。。volta可以啊
volta和turing都是16 lane simd,warp是32 wide的,通过交替发射,可以让任意两个或者两个以上的不同类型的simd满载。
和l2没半毛钱关系

评论

Volta
可以让FP32 INT32同时满载?
我记得Volta 描述FP&INT是Simultaneous ExecutionEach iteration of a pipelined loop can update addresses (INT32 pointer arithmetic) and load data for the next iteration while simultaneously processing the current iteration in FP32.
老黄描述Turing SM:Concurrent FP&INT Execution


如果我没理解错··前者是依赖关系并发进程同步 后者是并发




评论

要是与L2没关系··那老黄干嘛把Shared Memory Size / SM提升为Configurable up to 96 KB,相当于最大值提升到GM200的2倍,GP100的1.5倍··
目前没看到Turing的数字··但是总数6MB与GV100相当··SM数却降低了··

评论

。。。那随你理解吧
明明上一段都给你说了两者都能达到full throuput了,
还非要找一段本来也没什么歧义的东西来脑补曲解。
别说L2,就是L1也和SM能跑成什么样没关系,这些东西只是缓存而已。唯一有关系的只有寄存器bank够不够,port够不够而已,执行单元打交道的只有这个。

评论

要是觉得并发执行,进程同步,并行是同样的东西··
那就当没讨论过吧

评论

通篇都没有process甚至thread这个词,愣是被你理解出来了进程同步。
英语不好,不妨查一下词典,或者google翻译。
simultaneous : 同时的; 同时发生的,同时存在的; 联立的;
concurrent:同时发生的; 同时完成的; 同时存在的;

TIM截图20180819125549.jpg (27.15 KB, 下载次数: 0)

2018-8-19 12:56 上传



评论

砍tensor啊

评论

办公这种事情,为啥要DP性能...

且,单就整个GT的die size来说,不小了,GT2都有4个Core大了

评论

就数这句最真实。。。。毕竟游戏很多都得照顾现阶段主机。。。主机性能又如此弱鸡。。。

评论

了解了一下, DXR已经标准定好了
就看农企跟不跟和怎么跟了
nv先走一步, 就是短期前景未明

评论

我就搅不懂那些移植的作品画面肯定是不怎么好的,而且很多特效都不是顶尖,问题要求却很高。。。比如最近的猛汉世界。。

评论
又是Tensor Core又是RT Core的,感觉又回到了Vertex Shader和Pixel Shader的时代

评论

移植和硬件优化是技术活,基本只有最顶尖的几家具备
卡婊这方面还是欠缺吧
看看几年前国产泰坦陷落6就是最好的反例 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...