日本电子维修技术 显卡DXR光追诞生2周年之际 我谈一些看法




      2年前,性价比稀烂的20系列,激起了部分玩家的“反N”情绪,愤怒、失望、BS、不屑,城门失火,殃及池鱼,产品口碑不利,随着20系首秀登场的“光线追踪”,一并受到牵连。用户的不满,发泄到“光追”上,认为是“光追”这么个“没用”的玩意儿,导致N卡售价虚高。其实,你要攻击的是性价比稀烂的产品销售策略,而不是“光追”本身。
      今年,在PS5/XBX,甚至是一鸣惊人的navi21,AMD也玩起了光追,只不过,是第一代,并且开启后纹理单元会缩水(4个纹理单元充当一组ray tracing硬件加速单元,无法同时进行纹理/光追运算 ,既然有人要纠结这个“充当”,无非就是一个CU里,1个ray op工作就有4个texture赋闲,单发,这不就是“充当”么?我工作的时候你下岗,我不是“充当”你?啥变形金刚理论都出来了,搞笑?老黄缩水的是FP,无法同时进行int32和FP32运算),而且即便是6900XT的RT性能也只比3070高一些(但无可否认,6000系列的非光追性能的确足够撼动老黄王位,价格更香)~~~

      当两家GPU制造商不约而同的投入光追的阵营的时候,我们就有必要再度审视这个东西,是否真如一些“选择看不见”的玩家口中所言,on/off,没有区别。而给这个争论画上句号的,不是首发试水、效果差强人意的《BFV》,也不是让RTX开始起飞的《地铁离去》,更不是让RTX性能可以普及到主流用户的首次使用DLSS 2.0《德军新血脉》,而是看门狗,一个终于让RTX效果作用在开放世界沙盒游戏上,并且成功让这个世界活起来的作品。


      我说的“活起来”,并不是打开RTX,你就能马上拥有翻天覆地的画质,事实上,很多时候,光追开启,并不能让画质马上从游戏级的画面,升级为电影级。但,“活起来”,意味着这个世界因为光追,变得更有代入感、更加生动、真实,令人相信“我的屏幕里真的有一个世界”。

随手拍的照片:

30de8435e5dde71185da0eb6b0efce1b9c1661a6.jpg (91.63 KB, 下载次数: 0)

2020-11-14 22:11 上传


这是我上午拍的一张随手照,一个普通的生活场景,司空见惯,就是简单的一个有大理石地板的室内场景~~

02ad91ef76c6a7efd62ee566eafaaf51f2de66a6.jpg (84.01 KB, 下载次数: 0)

2020-11-14 22:11 上传

0061e61190ef76c6b0dab66b8a16fdfaae5167a6.jpg (69.61 KB, 下载次数: 0)

2020-11-14 22:11 上传


937aa6efce1b9d16e7cfd721e4deb48f8d5464a6.jpg (71.2 KB, 下载次数: 0)

2020-11-14 22:11 上传


6089e4dde71190ef60f3df9fd91b9d16fcfa60a6.jpg (65.18 KB, 下载次数: 0)

2020-11-14 22:11 上传


RTX ON/OFF对比,很显然,ON的场景更接近现实照片的感觉。也许你会说,切,这只是狗3偷工减料,没有好好做SSR效果罢了。

213144xymyy1wogmwyytok.jpg (314.93 KB, 下载次数: 0)

2020-11-14 22:11 上传


但正好相反,狗3的SSR反射是媲美《美国末日2》/《大表哥2》的存在,至于为什么RTX ON/OFF会如此明显,往下看~~~

现实照片2:

31838694a4c27d1e8c2e76840cd5ad6edcc438a6.jpg (65.45 KB, 下载次数: 0)

2020-11-14 22:11 上传



7c99bd315c6034a876eaf5c1dc134954082376a6.jpg (94.79 KB, 下载次数: 0)

2020-11-14 22:11 上传


7152f11f3a292df5c3cbe155ab315c6035a873a6.jpg (82.71 KB, 下载次数: 0)

2020-11-14 22:11 上传


RTX ON/OFF对比,显然on更加接近现实的情况。前面说了,狗3的SSR也很棒,为什么还是会出现反射不出来?因为,SSR只能呈现当前屏幕内的物体的反射,并且只能是静态呈现,一旦镜头转动,反射就变得错误+粗糙,并且无法像这个链接的视频里的一样,还原动态的反射场景:https://v.youku.com/v_show/id_XN ... qq-pf-to=pcqq.group,画质神作《美末2》也难逃这个定理。

更多DXR ON/OFF对比图:

8bba1c950a7b0208b7ce50a075d9f2d3562cc8ad.jpg (95.45 KB, 下载次数: 0)

2020-11-14 22:11 上传


4cbd4d086e061d95c04158796cf40ad163d9caad.jpg (85.85 KB, 下载次数: 0)

2020-11-14 22:11 上传



e2b429381f30e9247da3f3705b086e061c95f7ad.jpg (60.39 KB, 下载次数: 0)

2020-11-14 22:11 上传


c2c39f2f07082838dc0ab355af99a9014d08f1ad.jpg (61.16 KB, 下载次数: 0)

2020-11-14 22:11 上传


fa8ce824b899a9018b3234770a950a7b0308f5ad.jpg (85.07 KB, 下载次数: 0)

2020-11-14 22:11 上传


7b93060828381f302d1ee2e8be014c086f06f0ad.jpg (64.27 KB, 下载次数: 0)

2020-11-14 22:11 上传



b29010dfa9ec8a13b71d38a1e003918fa1ecc0ad.jpg (70.98 KB, 下载次数: 0)

2020-11-14 22:11 上传


4c508b13632762d02139cbfeb7ec08fa503dc6ad.jpg (62.61 KB, 下载次数: 0)

2020-11-14 22:11 上传



455009fa513d269785d4671c42fbb2fb4216d8ad.jpg (76 KB, 下载次数: 0)

2020-11-14 22:11 上传


f463a8ec8a136327b7eaad72868fa0ec09fac7ad.jpg (46.55 KB, 下载次数: 0)

2020-11-14 22:11 上传



efc703087bf40ad1ace3a8a2402c11dfa8eccead.jpg (95.51 KB, 下载次数: 0)

2020-11-14 22:11 上传


f8290b7b02087bf4c7eb38a8e5d3572c10dfcfad.jpg (72.54 KB, 下载次数: 0)

2020-11-14 22:11 上传



a9b46f061d950a7bc93221851dd162d9f3d3c9ad.jpg (76.9 KB, 下载次数: 0)

2020-11-14 22:11 上传


cd841e30e924b8996f3b167979061d950b7bf6ad.jpg (62.67 KB, 下载次数: 0)

2020-11-14 22:11 上传



176f562c11dfa9ec5929395675d0f703908fc1ad.jpg (40.8 KB, 下载次数: 0)

2020-11-14 22:11 上传


8765f3d3572c11df7bd6d062742762d0f603c2ad.jpg (36.93 KB, 下载次数: 0)

2020-11-14 22:11 上传



实际上,现有光追是混合型光追,并非全路径光追,并不能开启后让游戏画面秒变电影,但能带来传统光栅无法表达的那种丰富、真实的动态世界,让游戏的代入感提升几个档次。这也是为什么新主机会把“光追”作为主要宣传点,和AMD也开始在桌面GPU上玩硬件光追,追赶Nv的原因。虽然AMD的硬件光追还是第一代,处于起步期,但上来就能超越2080ti,可以和3070一战,也是很可以了。至于6000系列的真实性能,希望能实现PPT中的性能表现。

题后话:
一、为啥我强调是“随手拍的”照片,因为这些和RTX效果一样的场景,在生活中比比皆是,你不用“刻意擦亮眼睛削尖脑袋”去找,也就是说,游戏中的RTX ON/OFF效果,并不是某些玩家所言,“盯着XXX看半天才有”,而是每时每刻都在与你的感官发生作用,影响着世界的真实度和代入感;

二、我想着要不要换6900XT,现在只剩两个问题:1、AMD官方公布的6900XT的性能测试数据,在开启了双buff(rage mod灰烬模式+smart access memory平台黑科技)后,才在10个游戏中,和默频的3090战得五五开,并且在AMD的官方文档里,3090和3080/2080Ti的性能差距明显是偏小了,远小于其他媒体的实测和我自己对比3090/2080Ti的幅度...2、从泄漏的光追性能看,6800XT和6900XT的性能分别在3070和3080稍低的水平,作为画质党,还是略有纠结。




评论
好文,让我对现有的光追有深刻的认识了。

评论
我怎么感觉我在哪儿看到过这个帖子

评论
最近在玩号称最强光追游戏的control,4K全特效,玩的时候只觉得光线很牛逼,还有一堆堆的镜面反射,但好像也没有好到惊世骇俗,然后我把光追关掉,落差感太大了,光追还是个好技术,就是性能损耗还是太大了,不开dlss没法玩

评论
你要考虑极限光追那估计暂时不要考虑A卡了,FSR不还没实装

评论
有关A\N,在公开场合,吴司令讲话还是有一定格局的,手动狗头



评论

混合光追是把厂家之前做贴图的事儿省了一大堆

评论
仔细看了楼主的贴子,楼主用真实世界照片与游戏DXR照片做了对比,DXR确实完美!
其实我个人觉得光追实际是对游戏开发者更实用,通过SDK轻易获得光线效果。不过如倒影特效,传统特效单周期多质材也可以实现,就是对于开发者麻烦。
实际出道2年,光追游戏确实没有几个,这确实很令人郁闷。
至于开启光追后,6800XT约3070,6900XT约3080,这点其实也有来回,传统性能可能更好,16G显存,这点就看用户怎么想了

评论
我觉得光追这个技术本身还是有很大存在意义的,相比以前用各种全局光照的复杂算法,这个算是“简单粗暴效果好”了。
对我带来的感受提升不亚于我当年从DX7的显卡直接跳到DX9带来的震撼(COD2->COD6)
而且玩过开启光追的游戏后,再玩非光追的游戏,确实能感觉到很多地方的光线反射不到位/不对劲。
只是可能还要等几代显卡后才能享受到真正的原生分辨率+高帧率+全局光追。

评论
光追仅仅是锦上添花罢了,游戏好不好玩才是最重要的,以前游戏画质那么渣还不是乐在其中,现在的游戏真的很无聊

评论
其实现在游戏的RTX大部分效果 用传统光栅化都可以完成 反射不能用SSR 就cube

但光线追踪是必须发展的方向 即使现在是垃圾 你现在不发展 就永远不会有发展

评论
我感觉是  目前的光锥  反射效果 过于锐利  看起来 有点跳脱   
不过看老黄的讲解   是从摄像机出发 逆向求得光路得,,,

评论
并没有什么“4个纹理单元充当一组光追加速单元”的说法,光追单元就是BVH加速单元,纹理单元是纹理单元,这俩不是一个东西。只不过光线追踪可以利用纹理单元的寄存器存储BVH数据。

GPU的计算单元是可以运行多个线程不停切换的,当光追的相关线程需要访问BVH数据有停顿时,会切换到其他线程掩盖延迟。
这点对AMD、NV的GPU都是如此。所以AMD的描述说“在进行BVH求交的时候,计算单元可以进行其他着色计算”,说的就是这个道理。
计算光线追踪的时候纹理单元被占用,这个毛病nv也有。
AMD光追性能弱不是因为这个,而是因为采用了inline raytracing的方法。

评论
我觉得楼主说的蛮对的

其实论分辨率、抗锯齿、贴图分辨率、建模精度这些传统画面参数来说

游戏这种商业化的卖品,已经达到了成本和效果的平衡极限

想要进一步进化,催动大家更换新硬件新游戏

必须寻找其他的发展方向

光线追踪、复杂物理计算、AI等等都是需要大幅度提高的

就好比手机领域,多年前大家拼屏占比,最后都是全面屏了,又开始拼刷新率

一类商品总需要寻找新的卖点刺激消费

算是推动技术进步的原动力吧

评论
另外,很多画面很强的游戏,在光追出现之前

就已经用SSR、贴图预渲染烘焙、阴影计算方法等技术

让画面很接近DXR了,等到DXR技术真的出现了,他们没有第一时间用DXR去取代传统技术

因为支持DXR完美运行的显卡用户数量太少

他们的游戏如果迎合DXR而放弃传统渲染技术,会导致不支持DXR的电脑运行效果一塌糊涂

如果固守传统不去拥抱DXR,又等于失去了那些“有钱又尝鲜”的DXR硬件群体

最后合计了一下,来了个折衷

比如70%传统渲染迎合普通用户,30%光追特效吸引高端用户

不同的厂家游戏这个比例可能发生变化

但没人敢让其中一边变成0%

说到底,销量才是根本

评论

如果两年前黄老板选择正常价格更新换代,同档显卡价格不变,光追当免费送。让今天steam上占比最高的不是1060而是2060,局面应该会很不一样

评论
3A游戏是什么样,由主机决定,只有主机可以允许什么形式的游戏进化方式,游戏才能最后演变成什么样子

评论
AV游戏有光追会如何?逼真么?

评论

QQ截图20201115001018.jpg (166.81 KB, 下载次数: 0)

2020-11-15 00:10 上传


哦~~嗯?~~哦


评论

是的,等实测出来我在考虑一下吧,大不了搞张6900XT组3奶专门玩非光追的就行了~~


评论

001.png (134.33 KB, 下载次数: 0)

2020-11-15 00:31 上传


?你真的看过官方的架构图?


评论

甚至你自己贴出来的XSX的这张CU示意图上都把光追单元和纹理单元分开画了。
我是不知道你是如何能把这两者混为一谈的

002.png (228.2 KB, 下载次数: 0)

2020-11-15 00:37 上传





无法同时进行INT32 FP32计算,老黄也哭了:我图灵、安培这两代白玩了么。。。。


评论
纯玩fps的真没必要去追求光追,哪有时间去代入之类的,而且弄得不好还容易让现实生活中的场景影响到游戏的发挥就惨了。

评论
没有玻璃没有水的游戏要被老黄开除了

评论
等到电子竞技需要用上光追的时候光追才是真正的普及

评论
阴影是提升最大的部分,光追效果很好,还能减轻开发难度,再过几年电影画质就很容易了

评论
光线追踪,光影,材质,都离不开的(绝对不是只有水和玻璃金属这种地方),是最基础的技术。因为计算慢,以前只有电影这种高预算的项目才能用,随着硬件的不断进步和各种近似算法的应用,现在离线渲染已经应用的非常普遍了。在线式渲染使用这个也是大势所趋,只要性能足够,视觉效果肯定是有一个大的飞跃的。但是,现在性能还不够不是。所以我觉得不是光线追踪好不好的问题,如果不好,是没有把它用好;二是性能够不够的问题。现在只是开了个头……

评论

001024bzyyo5p2ax5vva2f.jpg (168.85 KB, 下载次数: 0)

2020-11-15 01:25 上传


啊?哦?嗯~~


评论

感觉游泳池和玻璃杯的光追特效特别夸张,就是感觉过了那种感觉,游泳池有反射,但是正常的还是可以看见底的,光追一开全是反光,看不到下面了。个人来说这2个场景还是喜欢光追OFF。 门店玻璃那块的光追还不错。 感觉现在是为了光追而光追,夸张效果反而不真实了,感觉要恰当好处,为了真实来适度使用光追。

评论

我就是“某些玩家”。

除了个别场景有明显差异。整体完全没有楼主说的“代入感提升几个档次”,我觉得顶多0.1个档次,帧数倒是下降了不止一个档次。
至少目前为止,光追游戏的光追效果都比较鸡肋。
感觉最好的选择是 如果看重光追,等下一代A N产品
这带随意 我选AMD

评论
我个人也是画面党,新游戏画面不到位再好玩我也不玩。
感受了地铁离去的光追后,就感觉这玩意必开。
可惜就是光追/性能/功耗 目前都没有很优秀
只能等下一代了。

评论
光追这个技术是好的,当然游戏画面能越接近现实环境,沉浸感越强。只是现阶段的民用显卡在实际游戏里面,并没体现出和成熟技术特别大的差别,但是又要给这个技术买单,消费者的钱也不是白来的啊………我买之前多想想也很合理吧,而且隔几年后总是还要换新显卡的,到时再买也正常。

评论
感觉这技术真正能做到普及,连电竞都用上的话,按目前速度,至少还得再发展三代吧,目前好画质的游戏比比皆是,但是长寿命的几乎没有,所谓3a大作,一般也就几百小时寿命,玩完索然无味,再也不想玩了。电脑,还是网游,联机的好,但是一联机了谁有精力去盯着看画质,对于现在的光追,我觉得可以抱一种,我可以不用,但你不能没有的态度就好了,偶尔有感兴趣的3a了,去感受下就行

评论
光追这个现在才第二代,还有很长的路要走,技术在发展,游戏画面也越来越真实

评论
算了吧,这些表现,光栅化早做出来了,效率也不低

评论

是的,光栅化的漏光效果至今光追都只能做到其片鳞

评论

yygq前还是补好功课。4个纹理单元合体成一个光追单元,战神金刚吗?

评论
我就一句话:消除光追 降低价格。同意的人不会少。

评论
还有一般玩游戏特别是3A大作都是节奏非常紧张刺激的,焦点很少放在这些半成品光追效果上,还是那句话体验感太差。你停下游戏仔细看才会注意到这些光追华丽效果,但是这和游戏的节奏冲突,结构性矛盾。

评论

除去光追的16X0系列确实也热销

评论

游戏画质和游戏玩法不要混为一谈,也不要割裂来看。


评论

哦,那么全med玩不就完了么,反正你也不看对吧……用个2070足够满帧了还买高端卡干嘛啊

评论

DOOM作为一代FPS,节奏快。核显就够了。
不知道你有没有看过没有特效和后期制作的金刚狼电影。知道观感对一个人有多么的重要。

你比较一下第一代和DOOM和地铁离去。你就知道观感的差距有多大。

每代画质的提升也都不乏你这样的人,实际技术也不会受到抑制依旧会不断的进化。



评论

我还没注意看,真人才,片汤儿话说得一段一段的

“4个纹理单元充当一组ray tracing硬件加速单元”,你搁这儿玩变形金刚呢?

人家英伟达也是4个纹理单元对应一个RT Core,架构图看过没?你要不要也批判下?

-RT Core实质上就是SM里面加了一条专用的流水线(ASIC)来计算射线和三角形求交,可以访问BVH,由于是ASIC专用电路逻辑,所以和用shader code来做求交计算相比,性能/mm^2可以有数量级的提升。
-RA实质上就是CU里面加了一条专用的流水线(ASIC)来计算射线和三角形求交,可以访问BVH,由于是ASIC专用电路逻辑,所以和用shader code来做求交计算相比,性能/mm^2可以有数量级的提升。

妈蛋都是一样的东西搁你这儿就变了

评论
AMD这个inline raytracing效率有待观察,FP32规模也少了太多,光追性能肯定会落后的

评论

那你肯定也不会把焦点放在VXAO GTAO HBAO SSAO有什么区别上吧
也不会把焦点放在SSR与cubemap的互补上吧
也不会把焦点放在平面映射 Shadow Volumes Map有什么区别上吧
更不会把焦点放在Shadow Map里PCF PCSS VSMESM有什么进步上吧

“光栅化的一切努力都和游戏的节奏冲突,结构性矛盾”,那为何光栅化一直在发展呢

评论

就像好莱坞电影,看过能记住或者能重复看的没几部,但如果特效拉胯那肯定不行~~~你可以不做回头客,但这特效必须有,没有的话,索然无味~~


评论

是的,我一直认为游戏性和画面非要扯上因果关系的都是伪命题,本来就是衡量游戏品质的两个独立的部分,非得2选1?


评论

哦,那么DX7就能满足你了,反正“还有一般玩游戏特别是3A大作都是节奏非常紧张刺激的,焦点很少放在这些半成品的纹理/质材/光照效果上(反正都不是电影级)”

评论

001024bzyyo5p2ax5vva2f.jpg (168.85 KB, 下载次数: 0)

2020-11-15 15:16 上传


?嗯?哦~~~to?~~~or!
1个CU对应4个纹理单元 or 1个 Ray ops,也就是在1个CU中,1个ray ops作用的时候,就会有4个T赋闲,不能双发并行,懂?这图我都反复发这么多次了,还能迷糊么?

QQ截图20201115151717.jpg (31.38 KB, 下载次数: 0)

2020-11-15 15:17 上传


请把英伟达20/30系构架 带有4 Texture to 1 RT Core的构架图发上来,谢谢~~注意哦,是“to”或者“with”或者“ /”或者“ +”,不是“or”哦!不然就是老黄玩的那套int32 or fp32的缩水了哦!  

在英语中,表示“不是变形金刚”、“大家哥俩好”、“同时存在不矛盾”的,有and,with,+,/,然而,以英语为母语的PPT使用了“OR”,OR二选其一,选择条件...如果A卡工程师真的被您代表成功,不是二选一,建议su m将PPT改成以上单词,以免我和类似我这样的非专业人员试图充当专业人员的角色,有误解的空间后进行没有意义的争论~~~



评论

不知道为什么拿 4 texture or ray ops/clk per CU这点来说事儿。
光线追踪,BVH求交、着色发生在像素阶段,本来就是要先判定出来光线碰撞情况,确定光照信息后,才能进行着色,这时候占用纹理单元的部分资源是没影响的。
等到着色的时候才用得上纹理单元,获取贴图信息,再经过深度测试、模板测试、混合等一系列确定像素的颜色。
这也是为什么NV、AMD都把RTcore、RA单元放在纹理单元附近的原因,因为可以利用现有资源而和固有的着色过程互不干扰。

你洗菜的时候不能腾出身来吃饭,那么能说洗菜影响了吃饭的效率吗?
并不,洗菜本来就发生在吃饭之前,在你吃饭的时候,洗菜这个过程已经执行完了。
另外很不幸的一点就是,图灵、安培还真是4个纹理单元“对应”一个RTcore。当然这仅仅是因为每个SM恰好包含了4个纹理单元和1个RTcore而已,并不存在什么组成的关系

timg.jpg (236.92 KB, 下载次数: 0)

2020-11-15 15:33 上传





评论

QQ截图20201115154046.jpg (81.27 KB, 下载次数: 0)

2020-11-15 15:41 上传

我洗菜的时候当然不能吃饭了,但是我洗菜的时候其他人也可以吃饭啊~~~我吃饭的时候其他人也可以洗菜啊!这叫做and,不叫做or在英语中,表示“不是变形金刚”、“大家哥俩好”、“同时存在不矛盾”的,有and,with,+,/,然而,以英语为母语的PPT使用了“OR”,OR二选其一,选择条件...如果A卡工程师真的被您代表成功,不是二选一,建议su m将PPT改成以上单词,以免我和类似我这样的非专业人员试图充当专业人员的角色,有误解的空间后进行没有意义的争论~~~

001024bzyyo5p2ax5vva2f.jpg (168.85 KB, 下载次数: 0)

2020-11-15 15:37 上传


?嗯?哦~~~to?and?~~~or!

1个CU对应4个纹理单元 or 1个 Ray ops,也就是在1个CU中,1个ray ops作用的时候,就会有4个T赋闲,不能双发并行,懂?BVH这些属于ray ops本身的工作内容,关纹理什么事?你BVH的时候就不能算纹理了?BVH的时候你游戏画面就贴图错误了?哈?这图我都反复发这么多次了,还能迷糊么?

请把英伟达20/30系构架 带有4 Texture to 1 RT Core的构架图发上来,谢谢~~注意哦,是“to”,不是“or”哦!不然就是老黄玩的那套int32 or fp32的缩水了哦!




评论

你这个“洗菜的时候其他人也可以吃饭”,这点本身就存在谬误,因为别人要吃的菜恰好就是你要洗的那一波。
不获取光照信息,就没办法执行后续的着色。明白这个道理很困难么?

你可以说,我就是任性,我就是要在光线求交的时候用纹理单元做其他的,我就是任性不靠光照信息直接着色,有啥问题?这也没问题啊,只不过这等于是“RT OFF”。

BVH的时候不但没法用纹理,甚至你整个SM这时候计算的都是光线生成、光线追踪的shader。而跑不了顶点、像素的shader。有问题么?没问题啊,本来流水线就是这样的。

CU或者SM  不但没办法同时计算BVH和纹理,甚至不能同时进行顶点和像素的计算。这是落后吗?并不是落后。为什么?因为流水线就是这样的,你得先把顶点的算完才能进入像素阶段。同样你得先把BVH算完,得出光照的信息,某个像素到底有没有光线碰撞,它的光照信息是什么样子的,获取到这些之后,这时候纹理单元才派的上用场,结合贴图信息等各种操作,确定像素的最终颜色。
什么计算BVH的时候贴图错误,我怎么不知道你在说什么?BVH计算,或者像素着色阶段,还没有走完整个流水线,一帧还没有完成,还没有输出到帧缓冲区甚至屏幕上,你根本没办法看到这一帧,哪里就来的贴图错误?


能不能不要再民科了嘛~~~~INT32  FP32能不能并行,whitepaper上也都写得清清楚楚的,还在这里嘴硬呢


评论

洗菜学说不是您这位民科首先引入的嘛?大家自行查找回帖记录即可~~

在英语中,表示“不是变形金刚”、“大家哥俩好”、“同时存在不矛盾”的,有and,with,+,/,然而,以英语为母语的PPT使用了“OR”,OR二选其一,选择条件...如果A卡工程师真的被您代表成功,不是二选一,建议su m将PPT改成以上单词,以免我和类似我这样的非专业人员试图充当专业人员的角色,有误解的空间后进行没有意义的争论~~~

评论

QQ截图20201115161929.jpg (53.69 KB, 下载次数: 0)

2020-11-15 16:20 上传

???我主贴不是说了这个问题么?

QQ截图20201115162026.jpg (47.78 KB, 下载次数: 0)

2020-11-15 16:20 上传


您的身份真的迷,我都傻了~~~主贴明明我也说了这个问题,您就选择性忽视?您是有多喜欢老黄同时又想为su ma说话呢?

int32 or fp32这是老黄自己的PPT里说的,安培架构中,每个SM单元中有4个分区,每个分区有一组是16个FP32单元,另一组是16个FP32、16个IN32组成的单元,后者可以同时执行FP32或者INT32运算。但是,当游戏进行int32运算时,后者的fp32运算失效,懂?这就是int32 or fp32~~~

怎么老黄的or是二选一,到了AMD的or就是不冲突,就是哥俩好了?

难道老黄的英文和苏玛的英文一个是美式一个是英式?寻思着美式英式or都是or 啊~~






评论

你终于想起来安培SM的subcore里除了INT32/FP32单元之外,还有一组FP32单元了?

FP32执行FP32的同时,INT32/FP32单元执行INT32,请问安培能不能做到FP32、INT32并行?

图灵架构就更简单了,subcore里是一组FP32一组INT32。人老黄在架构图里千方百计科普了从图灵这一代实现了FP32 INT32并行,在安培架构里执行得更灵活,更接近现实游戏里整数、浮点指令的比例。既可以FP32+FP32,也可以FP32+INT32。到你这怎么就扯出来一堆 or and什么的

害搁这儿“懂”呢~~~
没有给你科普的必要,但是为了减少对大家的误导,还是有必要纠正你的错误。

架构上的东西,是,就是,不是,就不是,和什么苏妈老黄站立场的有啥关系,这又不是饭圈。

另外你自己发的图都把你的观点驳倒了不是么?我实在不知道你坚持的是什么观点?纹理单元和光追单元自始至终就压根不是同一个东西,对于RDNA2,XSX架构图是这样的,农企官网上的架构图也是这样的。

002.png (228.2 KB, 下载次数: 0)

2020-11-15 16:45 上传



你这个“充当”理论就很可笑,人在吃饭的同时不能在厕所拉内啥,所以拉内啥和吃饭是一个东西?能说拉内啥“充当”了吃饭么?


评论
光追是没问题,问题是价格。
本来应该4-5K的旗舰卡,一搞好几万。我不喜欢就不买

评论

没有玻璃的游戏还是蛮多的,没有水的还真难找。

评论

但是,目前来说 去掉光锥,价格降3/1,甚至哪怕4/1,80%的人都愿意.....
光锥这东西 典型的厂家引导消费的产物
主要是农企实现的是inline ray tracing,内联光线追踪,在DXR1.1里支持的。
https://devblogs.microsoft.com/directx/dxr-1-1/
用微软自己的话说,当场景比较复杂的时候,使用动态着色器的光线追踪,也就是像老黄那样的比较有效率。inline RT适用于比较简单的场景。
两者实现的功能没什么区别,也没有硬性划分,但效率上确实有区别。估计这也是农企光追的demo做得那么丑的原因。

评论

QQ截图20201115202428.jpg (42.16 KB, 下载次数: 0)

2020-11-15 20:26 上传

老黄的OR指的是什么呢?我们来看看

QQ截图20201115200019.jpg (73.82 KB, 下载次数: 0)

2020-11-15 20:26 上传


每组SM里,有一组既可以运行int32,也能运行fp32的单元,但是这组单元,是共享整数和浮点的数据通道,因此,老黄PPT里说“do int32 or fp32”,这个是老黄的“or”

QQ3.jpg (98.65 KB, 下载次数: 0)

2020-11-15 20:26 上传


更详细点,这个是OR


NV说FP翻倍,大家却心知肚明另外一半fp怎么来的~~明摆着缩水~~

001024bzyyo5p2ax5vva2f.jpg (168.85 KB, 下载次数: 0)

2020-11-15 20:31 上传


到了AMD这边,OR就成了“不缩水”,都是可以计入总量的,嗯~~~

老黄的or和老苏的or~~嗯~~到底谁才是正统的英语单词呢?


评论

以前是本版动物园大佬说的吧,这代AMD光追铁定输,只不过是输多少的区别。
如果像DXR feature test这种纯光线追踪应用,和安培的差距可能更大,因为安培的FP32性能有了飞跃的进步,对光线追踪场景的降噪提升非常显著

评论

那没有特效,拍摄成本下来,电影票只卖原价1/3,你看不?我是不看的~~

评论

其实在光线追踪游戏里,安培和图灵差距还不怎么大,现在游戏里光线追踪使用的效果还是太少了,所以光追游戏里性能提升的原因大部分还是源自光栅性能的提升,以及RTcore的数量增加,FP32的提升效应并不显著。
但如果是DXR feature test那种重度光线追踪场景,FP32提升带来的性能增益就很可观了,我在贴吧看到别人贴的DXR feature test成绩图,3080甚至跑出2060s  3倍帧数

评论

我表述的已经很清楚了:
1. 安培里确实有一组单元INT32 “or” FP32指令计算二选一,但你不要忘了还有一组单元是执行FP32指令的。所以每个时钟内FP32+INT32是可以实现的。同样也可以实现FP32+FP32。你的错误在于只看到了那个FP32/INT32
2.光线BVH计算和纹理映射等操作在图形流水线里位于不同阶段,它们没必要而且也不能同时进行。就像你的GPU一个计算单元也没有办法同时进行顶点和像素处理,因为这个同样属于“没必要而且也不能同时进行”的情况。
3.纹理单元和光追单元是两码事,这个你自己贴的图已经说得很清楚了

评论

行吧,我自己被这个or绕进去了,我的锅,大家请心明眼亮~~~

评论

-
想法是好的,但可惜执行到现实当中会有一些不足。
游戏制作受周期、制作水准等等因素制约,很多时候并不一定是机能问题。看过个图,PS2时期的游戏,镜子能反射出场景,但PS4时代FF7R的镜子却是一团黑。再比如UE5演示出的时候提出了超多面数这一概念,第一感觉非常兴奋,场景的复杂度可以提升很多。但细想一下,其实不一定。阻碍现在游戏场景复杂度的,性能是一方面,还有费时费力的问题。最后很有可能是一张1万面的报纸给你直接放进场景去,会出现类似这样的欠优化、或者是主观上形成一个单纯面数多==场景密度高的概念。

并且场景复杂度,与现在游戏当中愈来愈多的生成化,一定程度是背道而驰的。复杂度越高,特点越分明,所需要的资产就越多,素材就更难复用。

为什么要说场景复杂度,因为现实当中的场景,其“面数”,“材质”,“光源”都是极端复杂的,不可能在游戏当中全都呈现出来。但玩家玩游戏的时候并不会去集中注意力去看所有场景,这其实和UX当中的眼动测试类似,反映到游戏里,我只要集中精力去设计玩家视线聚焦的部分就可以了。某些快节奏、高强度游戏,当中可以使用一些复杂度比较低的场景,如果这时玩家的视线聚焦在一个重点反射物体上,那么甚至完全可以脱离实际的计算,直接把更细腻的反射结果放上去,没必要去追求真实,只要美术主观觉得好看就行了,这样等于是以更小的性能代价实现了更好的效果。

但现在光追来了,那我可以不再去专心做那些部分,完全计算生成处理。问题是,你前面也说了,比如传统方式只能呈现当前屏幕内的物体的反射,反面来说就是我要追求真实的话就需要一个屏幕以外的完整场景。你的场景复杂度有可能不够,可能没办法生成一个很好的反射效果。光追再真实,它也只能呈现你给它的东西。它不可能反射出场景没有的东西。游戏制作就是一个造假的过程,但技术上来说,光追恰恰是与这个概念相反的。于是乎程序和美术不得不给机器打工,比如遇到上述我提到的状况,原来只需要重点调整,现在我就需要全局调整。我需要做很多玩家不会注意到的东西来实现我想要达到的效果。

或者是,为了节约时间,我干脆也不调整了,就当作是走真实路线了。

游戏里很多的设计都是完全脱离实际的,一个击中破碎的动画为了更好的效果,可能是经过夸张处理、调整过的,然后播放动画而已,并不是说就直接忠实反映物理计算的效果。游戏最后呈现的很多时候都不是追求真实,而是要把现实当中必然的因果关系拆开、调成想要的样子,再组装回去。而光追从某种程度来说是和这样的设计思路反向而行的。

我并不否认很多场景下光追确实可以增强画面,因为有时设计思路就是“我要调一个真实的光照”,只是担心单纯追求RTX ON留给微调的空间在变小,或者为了省事都交给计算去做,自动生成什么样就是什么样。


评论

问题是现在PC端游戏特别纠结的就是

大制作的3A大部分都是游戏机作品,基于AMD的硬件构架

论PC显卡硬件装机量,老黄完胜

论PC游戏关联、涵盖的硬件基础量,苏妈又碾压

你说投靠谁的怀抱,还真是不容易的选择

评论
这个人在3DM的号叫skywalker,在他的帖子或者他评测的游戏画质里面。他认为好的就是好,他认为不好的就是不好。别人说不好就会被他各种人身攻击。之前跑到别人的地平线画质评测里面去口嗨被3DM封停了1个月,现在又来CHH口嗨了。

评论

嗯,对的,大家可以去关注我的3DM账号,看看我的帖子,就知道这货是跑哪里都能去带节奏和引战的了,我挺想不通的,怎么真的有这种特殊癖好的到哪里都能引战的人存在~~~说到人身攻击,我可不及楼上这位兄台的1/3啊~~~

评论

https://bbs.3dmgame.com/thread-6066906-1-1.html 去看看你的精彩表演。跑到别人的帖子下口嗨然后被举报封停1个月。

评论

对的,大家都去看看这种引战党是怎么带节奏的吧,还有,把其他论坛陈年烂谷子的事抖这来说,不觉得自己很秀么?

评论

你是年年玩这套,这是今年8月份的,心理没点B数吗?

评论

我有没有B数到不用你代言,但是你这节奏党什么德行,我相信看过我帖子的CHH坛友自己心里就真的是有B数了~~

评论

最大的问题是现在支援光追的游戏都是跑在DXR1.0,对XSX和AMD非常不利
不过光追普及下一代主机比较现实,这代顶多在小场景短距离凑合用
我更看重Mesh Shader.SF和DirectStorage,读取真是上一代游戏的痛点
不过估计要等个五年再看

评论

特效片子没有特效当然不看

但游戏没有光追我一样玩

这说明什么?说明你打这个比方不等价啊

评论

看电影和打游戏是一码事吗?感受能一样吗?

评论
看不出啥区别……不如省钱再抽一次新衣服开心///



评论

……这论调都持续8年了,除了某几个塞钱的定向优化以外,也没见广大厂商能给什么特殊优化,最后还是硬指标说话……所以就别炒这个,都炒了8年了啥也该糊了

评论

不注重特效的话那玩高端显卡干嘛……随便一个2070跑med或者high都能跑到你满意的帧数,特效你一样不注意盯着看不出来……合着med/high和ultra的区别激烈对战的时候一眼就能看出来且影响体验,然后光追onoff就完全不影响……没道理啊,这样还讨论啥3090/6900xt啊,白花那钱干嘛,2000多块买个2070/57xt不就完全够了么

评论
游戏永远内容大于画质。旷野之息画质稀烂,不影响大卖。
光追就像风扇噪音,真投入的时候谁会在意?

评论

错是没错,但既然瞄准高端卡,旗舰卡了.
明摆着对特效开高,甚至极致有需求啊.这时候说RTX不在意.那何必上旗舰高端卡.

评论

臭烘烘的人还是见得太少啊,光追哥这些是十多年前论坛上非常原生态的行为方式。

评论

我没说不注重特效。而且每个人对效果重视程度不一样,这是程度差别,不该简单分为重视和不重视。
目前光追的效费比太烂。效果弱,降帧厉害

比如一个游戏在保证流畅的前提下,开光追其他效果只能mid,不开光追可以ultra,那我肯定选ultra。


至于为什么讨论3090,3090强的又不只是光追。




评论

微软的游戏机api性能貌似一直都不如那些“没技术力”的日厂

评论

只是没想到刚8月份被3DM封了1个月,现在又跑到CHH上面来恶心别人了。

评论

他这一样的帖子3DM发,贴吧发,这不一眼就被看出来了。

评论


但是3080以上现在开光追和dlss都能流畅4k60啊……新dlss性能又不差,质量也不错,比光追onoff的区别还小,所以为啥不开光追呢?或者有人觉得现在的dlss2.0开关的区别比光追onoff的区别大么……
6900xt那边也准备开fxr来应对光追了,这不就很说明问题了么,两家的独有技术现在基本上也快一样了,amd版的dlss和nv版的sam都快出来了,也就是无线缓存和rtcore这俩是硬件没法复制……已经很说明问题了

评论

那么问题来了,现在这世代的游戏只要下限接近PS4的,那ultra和low给你截两张图你也未必能分辨出区别,性能损失也会超过一半,你不会以为光栅化的效费比高吧.  
大镖客2的console画质几乎是PC的中低,一般人能看出xbx的大镖客2和pc的最高画质有多大区别吗?而最高画质的耗费是中低的两倍以上
low夸张了啊,那个看不出来就该去看眼睛了,high和med跟ultra的画质区别倒是真的不大,帧数能差一倍以上,更别说ultra和extreme就看不出啥区别但是帧数依然能差一大节……

评论

不夸张,我举个例子比如星战绝地的low和ultra给你丢两张截图,你不去仔细看cubemap反射的部分,就几乎分不出区别
甚至上世代就有,比如孤岛危机3


评论

其他效费比低的效果,我也会选择性地关一些,并不存在对光追的双标对待。

评论
虚幻5快出来···好引擎带来新时代

评论

是的哦,在不同平台转载自己原创的文章你们这群引战党也能批判哦?你和那个mayc还真是典型的坛chong啊,不会正常讨论,到处搬弄是非,回复没有任何技术含量的带节奏的口嗨内容,你们的生活还是蛮无聊的~~

评论

所以总结下来源头根本就是绝大部分光影“特效”的效费比低(何况RT还是光栅化的努力的终点),而不需要去单独把光追拎出来批判,我看很多人有把光追单独拎出来批判的意思

评论

没想到吧,都出来一个月了,你才后知后觉?然后马不停蹄的追随我的脚步来这里引战?那个panzerlied和你可真是绝配啊,一唱一和的,大号小号演双簧可以啊,看你们两个的发帖记录大家都心里有数是什么料了,坛chong~~~现在回复帖子还是这么阴阳怪气的带节奏,我怀疑你们到底是心理特别阴暗还是咋的?生活没有奔头只能这样到处引战diss寻找生存的意义?可怜哦~~

但是你自己引战被封了不要追到这里来哭诉啊?这么输不起么?

QQ截图20201116112104.jpg (50.2 KB, 下载次数: 0)

2020-11-16 12:33 上传





评论
LZ去医院干啥?菊花被轮废了?

评论

坛chong,你这几个大小号自己和自己演戏的累不累啊?能不能整点有营养的回复啊?就事论事讨论帖子内容不行,非得像个niang们一样到处搬弄是非引战,不只是我BS你啊,主要是现在看帖的成熟的大人们BS你啊~~


评论

这话说得实在~~~的确,我觉得光栅化其他特效越来越显现出边际效应,加上硬件性能的发展达到一定水平,才会催生出实时光追游戏,并不是厂商或者开发商为了强行提价而强行提画质~~

评论

是因为光追本身在这几年就是一个关注和讨论热点,自然吸引火力。

评论
这个技术有个开头是好的,但是真正普及,再过10年吧

评论

那么这样还用高端显卡干嘛呢?完全没意义嘛……

评论
就这人身攻击程度,我觉得无论是扣xe还是啥,我们都可以和lz说再见了……

评论

怎么思维老是这么非黑即白呢

我又没有说要关到连中低端卡都能流畅的程度。每个人对画质和帧数的平衡点不一样吧。

评论

来,截个我这帖子里人身攻击的图出来,自己口嗨被我diss了反咬人身攻击?棒棒哦~~~

评论

你知道109楼说你非黑即白啥意思么?自己心里没点数的?为什么被群diss不知道?还继续?

评论

可是med或者high真的是2070可以完全流畅而且对画面影响相当小的……

评论

没事,咱们就看版主怎么判呗,您跟我说没用的

评论

大表哥2 4k high  ,2070能完全流畅?

评论

我前面还说了med啊……

评论

我不太想开mid啊。每个人有自己的平衡点,为什么一定要来说服我

评论
如果说光追还只是停留在水平和玻璃反射这种初级阶段的话,那我就觉得没什么很大的提升,聊胜于无 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...