日本电子维修技术 显卡Vega is better than you think 自己瞎翻



VEGA10(GCN5.0)架构的性能现在是基于Frontier版本做出评价的,然而Frontier版的驱动并不能在(专业卡和游戏卡)两者之间切换,现在没有VEGA10的驱动支持VEGA10的特性如HBCC专业卡驱动的确能支持FP16/32/64,然而相对地,游戏卡驱动仅支持FP32(原生)以及通过Atomics支持FP16,Atomics允许一个特性能够使用但是现在仍然被限制在驱动内建的限制中,其刚好与Direct GPU的优化相反FP16 Atomics没法提供和原生FP16管线一样的优化性能本质上我们说的区别是与增加20%的FP32管线以及增加60%的性能相比的现在应该注意到的是,我们目前看到的并不是100%的(RX VEGA)的性能,因为….异步计算引擎(ACE)目前仍限制在4个管线,而且仅支持Packed Math Formats(打包的计算命令格式?  等大神),该东东需要一个比FP32版本更大且更复杂的ACE,因此当前无法严格地将8个FP16或者4个FP32单元作为一个合法线程,然而命令的解包与压缩是由驱动完成的(即CPU),因此还需要加上(CPU通信的)延迟,而且上述过程可被称为“软线程”所以,yeah~ 目前看到的性能(Frontier版游戏性能)与纯硬件完成上述过程相比有40%的差距/波动,这个和N社通过Giga线程完成的方式差不多,该方法几乎可以被称为CUDA的“超线程”在这种处理方式下,就可能在不可预测分支的场景(如游戏之类的)中出现边缘性的效能提升(最高30%哟),以及在可预测分支场景中(比如深度学习,渲染,挖矿)中有60%的提升(shit…矿主怕是要…)由于拆分命令的过程由软件(驱动)完成,假设该方法能够让ACE支持Packed Math Format(再次求大神)…这也就是为啥目前VEGA frontier版仅仅与同频的GCN3.0(如果超得上来的话)性能相当。所以嘞,呃…目前的性能是不太体面,但是要知道,目前我们看到的是VEGA架构在FIJI(GCN3.0)驱动下能够达到的性能简单来说,目前的状况就是驱动充当一个限制器(EVA EVA暴走了!),本质上和你在道路模式下开布加迪(本质上并不一样…有了布加迪还纠结买不买VEGA?)是一样的,你得到的仅仅是开得更舒服而已…但是!人家下面还是有一台W12的发动机的!是能比你目前限制到的150迈跑得更快的!问题讨论到最后就是“驱动的不同能带来多大的提升?”… 保守来说,基于VEGA在FIJI驱动下的表现,VEGA的游戏卡驱动几乎可以肯定的是能够有20~35%的性能提升几乎所有的优化来自于对FP16的滋磁,块状渲染,几何分拆管线(求大神…)之类的,而且HBCC能够确保GPU不会爆显存,而且这些可能使N社开始有点小紧张仍然要声明,这不是VEGA架构为了来个“萨普莱斯”大家好像都没注意AMD在Vega公布的时候对Vega性能的说法首先Vega滋磁两倍的线程吞吐量,这看起来没啥,但是有些人似乎不是淡定(N社就不淡定了啊,因为他们赶紧让市场部尽快ASAP ASAP ASAP在宣传广告上说TTXP和1080ti也滋磁),这个可以说的上是架构中最让人觉得屌的地方了所以,这是个啥意思?最初的ACE(GCN1-GCN4架构)为4管线,单个线宽128bit。这表明它在处理64位命令时处于一个时钟周期上升沿和下降沿(开始和结束?求大佬T.T)现在每个CU(64流处理器)实际上是16只SIMD(单指令单元,多个数理逻辑单元ALU),每个SIMD滋磁单个128bit的向量(4个32bit标量)而且由于可以处理里面的单个标量,因此其被称为64流处理器,因为4x16等于64呀而且我意识到,ACE有4个管线,每时钟4x128bit的线程数最小的操作时间是4个时钟周期…也就是说每个异步操作的时钟周期下可进行:4x4=16x128bit的异步操作(或者是每时钟操作64x32bit的数据)GCN5.0(VEGA)仍然是4管线,但是单个位宽256bit,这意味着单时钟周期内在上升和下降沿处理128bit的数据 每个CU仍然是16个SIMD,但是滋磁单个256bit向量或者两个128bit向量或者4个64bit向量(4x64bit,8x32bit,16x16bit)GCN5.0仍然保留了SIMD原有的功能,但是还另外支持多位寄存器,这个方法和A社的CPU的AMD64架构上的SIMD很像,而且不管你信不信,因为A社的技术,使得AMD SIMD(SSE)是比Intel要快的哟,这也就是为啥Intel老是推出新的(AMD打不过的)SSE/AVX之类的intel为了保证其市场占有率因此强制地推行自家新标准使AMD的硬件表现及性能难以匹敌,这件就是当年的推土机架构为啥难以在大多数场景中发挥性能无论如何,掰扯这么多就是想说Vega是能够跑出和目前的GCN架构一毛一样的成绩的所以为了稳定性,性能提升之类的,目前的Vega就好像一个64CU的Polaris跑在1600上跑出来的成绩一样,这也就是目前看到的Vega FE的跑分成绩但似!需要泼点冷水的是,严格上来说上述过程是动用整个GPU的,所以与其(理论上)提供的(高)性能一样的是巨高的耗电量,但是这是仅仅在100%使用的情况下出现的但是实际使用时其使用率可能仅有50%以下是一种(看似)合理的解释可以解释为什么在trade convention上是使用交火的Vega展示的,是为了将其作为一个暗示,暗示其单个RX Vega在原生驱动下可发挥的能力当然,Vega在跑BF1,战争前线,Doom,爆蛋精英4的时候有很牛逼的性能([email protected])这些游戏TTXP能够在4K下跑到120FPS左右,如果到5K就会降到52FPS,这也可以解释为什么N社突然进入了“红色警戒”状态….因为Volta目标是20%左右的提升,而且达成的方式就是堆更多的CUDA核心Vega则打破了N社目前的境地但是这也就带来了一个问题“如果AMD胯下这么厉害,那么干嘛不赶紧把N社按在地上,让他们尝一下AMD的白浊液?”hin简单,AMD没必要,而且那样做对AMD没好处(伤肾?)目前AMD的Vega能够让其在旗舰卡的战斗中撑12-18个月,N社又不蠢,他们仍然能变得更有竞争性(?)无论是合法(!?)或者是利用其目前市场占有率而且人们当然愿意AMD放大来变“翻身”,但是如果AMD不过于激进而让N社仍然保持在统治地位,但是慢慢地将N社从甜点级/入门级市场挤出去,之后AMD就能够在推出一个“翻身”级的便宜又大碗的旗舰的同时不用担心任何N社产品带来威胁AMD也可以(而且貌似目前就在这么干)推出与N社可以抗衡的工作站产品(专业卡),而且能够提供N社不能提供的,而且在专业战场上N社没有游戏领域的小伎俩,其对于AMD的出招没有太多还手之力而且在AMD这种扮猪吃老虎的操作下N社没法体面地,或者不违法反垄断法的情况下回击AMD可能目前对N社最虐心的就是他们眼睁睁地看着AMD的骚操作但是却无可奈何。因为无论他们干啥,AMD都能够在一周内推出翻身之作,推出新的神油驱动提升到能够匹敌的性能,同时再降价个20,30欧即使到时候N社降到同样的价格,也会让人们感觉N社虚了这就是Vega,Polaris对于AMD的意义,这也是ryzen,threadripper,EPYC的意义AMD并不是追求在一代内的短期胜利,而是追求将他们的竞争对手(牙膏厂,N社)从行业中彻头彻尾地摧毁另,如果你不信我说的N社目前很方的话,那么可以瞅瞅,目前最新的TTXP的驱动已经解锁了其专业卡特性,基本上把它拉到了P100同样的性能水平TTXP卖1200刀,quadro P1000卖4500刀,他俩区别就一驱动的事情,基本上丢了3000刀就买了个专业卡的名字而已。如果你的对手做的事情没有让你发出“窝草”的话,你是不会这么干的


评论
我去reddit上看了原文,原文是从ytb转的,没梯子,就没去看了,但是可以预料到底下很多人对于游戏对FP16的支持程度的质疑

个人保留意见,自己对电脑硬件啥都不懂,自己瞎翻的,看个意思就行,估计看得懂原文的大神也不用看这个

原作者结尾的猜想实在是...

评论
都是车轱辘话。没意义。

vega是better,原来猜测是500W功耗1066性能,现在变成了400W功耗1070性能,难道不是better了????减少五分之一的功率增加三四成性能,能耗比成倍增长。

评论

你够了…

评论
竟然全看完了 期待 就等发售了

评论
希望别是VLIW年代那种“只要驱动到位了”“只要游戏优化到位了”的调调...

评论

是风车车的车轱辘话么     好奇谁猜的维嘉500W1066性能,选择性无视坡里亚斯10的存在

评论
然后失望至极纷纷入手1080ti对吧?

评论
楼楼你把这段也翻译一下好嘛?

Why AMD is sandbagging with the RX 480

Submitted 1 year ago by princeoftrees

After all the hype and leaks I went to the PC Gaming show expecting the 490, a dual 480, benchmarks and gameplay footage for everything. "This was the real Polaris launch!" I proclaimed here on Reddit. But it wasn't. Not even close. Why?

Step 1: Let retailers clear as much existing inventory as possible. If the Polaris 10 can reach all the way to Fury levels you're going to cannibalize your sales, by waiting til the last minute retailers can drop prices and squeeze inventory as much as possible.

Step 2: Driver maturation, waiting til the last second gives your driver team more time for last minute tweaks and to get feedback from reviewers/ beta testers to get your numbers as high as possible and fix any coil whine, fan curve and flickering issues.

Step 3: Sandbag Nvidia, Nvidia's 1070 is effectively a paper launch with very low inventory anywhere, prices well over MSRP and scalpers killing the supply. In the last round of benchmarks the 980ti has begun to slip in 1/2 the titles to the Fury X and the Fury X even beats the 1070 in some titles. In addition Nvidia has even less time to respond with the 1060, 1050 and price drops. Nvidia will have to cannibalize its own lineup and sales, competing it's own cards against the 1070 in PPF in order to remotely challenge the 480.

Step 4: Build supply, fuck 100 cards to Newegg how about 5 figure inventories? If the fab leak is to be believed AMD will have over 150k cards on store shelves for launch across the globe. This allows for real hype to build, with glowing user experiences instead of pages of complaints like Nvidias current subreddit posts.

Step 5: Control the media, the RX 480 is already trending on Yahoo without reviews, by waiting until after E3 AMD can dominate an entire press cycle for a week and make it out of just the gaming press into mainstream media, really driving sales and share prices.

Step 6: Profit



评论

先来谷歌娘的机翻占楼 等下我就编辑成棱工翻译

为什么说AMD其实在用RX480扮猪

1年前 由princeoftrees提交

在所有的炒作和消息泄漏之后,我去参加了PC游戏展,期待能看到490,双480,各种基准测试结果各种游戏画面还有其他乱七八糟的一大堆东西。“这才是真正的北极星发布会!”我在Reddit上这么宣称了但事实上……这一发是真(哔——)的完全走远了。为什么?

步骤1:让零售商尽可能清除现有库存。如果北极星10可以一路战上去打平狂怒级别的卡,这就是在让自家的卡相互抢销售额。如果啥都不说或者扮猪扮到最后一刻,那么零售商可以咕咕到最后一刻才降价,并尽可能的挤压掉多余的库存。

步骤2:让驱动程序成熟,扮猪扮到最后一刻将给您的司(qu)机(dong)团队更多的时间进行最终紧急调整,并获得各路测评人员/测试人员的反馈,修复任何线圈呜咽(aka 电感啸叫),风扇曲线和屏幕闪烁的问题,以让你的产品的评分达到最高。

第3步:放个巨大的烟雾弹捧杀NVNvidia的1070实际上是一个纸张发行,根本没多少库存,价格远远超过MSRP,还有黄牛党在大量囤卡。在最后一轮的基准测试中,980ti已经在一半数量的游戏中干不过狂怒X了,而狂怒X甚至在某些游戏中艹翻了1070。此外,Nvidia还有更少的时间使用1060,1050和降价手段进行反击。 Nvidia将不得让自己的产品们搞一出窝里斗相互竞争销量,在PPF中使用自己的卡与1070竞争,以远程挑战480。

步骤4:囤好库存(哔——)新蛋那100张卡的库存,如果他们有五位数的库存会咋样?如果晶圆厂泄漏的消息可信,AMD将在全球范围内甩出超过150k张卡的上架库存。这能让真正的正面宣传到处爆发,发光的用户体验,而不是像当前Nvidias的subreddit那样铺天盖地全是抱怨。

步骤5:控制媒体,虽然没有测评啥的,RX480在雅虎上已经独领风骚,如果AMD等到E3,那么它可以在整个新闻周期中主宰一个星期,并将消息从游戏媒体传播到主流媒体,真正推动销售和股价。

步骤6:数钱


评论
RX Vega的性能其实进步很多了,本来预估是打1050ti的,现在可以对抗1060不落下风

评论

r9 390x和fury系列是amd唯一真旗舰卡

评论

智商感人。。。。。。

这文风和百度A吧部分吧友一个路数。。。。
AMD在下一盘很大的棋


评论
最后那段让刚刚发布的wx9100如何是好

评论

喂喂喂你这么说话小心真的把AMD奶死啊

评论
来来来,奶一口,投票的11k的fse希望能达到!

评论
看懂了中文翻译,顿时对AMD的商业策略五体投地!

20161017141073535.jpg (78.93 KB, 下载次数: 0)

2017-8-7 00:54 上传




评论

居然从爱你哦那边收到了一张自带三水印的表情图
这感受也是……无比复杂啊

评论
就看黑科技fp16给不给力了

评论
半精度也要游戏支持啊

评论
好像说功耗是降不下来么

评论
楼主真是厉害了,看的我激动的抱紧了我的vega64

评论
看完一阵兴奋 一看发布日期 呵呵呵

评论
就等双12苏妈给打肾上腺素了

评论
vega挖矿还真的双倍提升了,哈哈

评论
现在VEGA挖矿真是美滋滋啊
Cryptonight稳稳的2000hash,150W,100天回本。
一张卡几乎顶三张RX580/570,功耗还更低。
不说了,去收卡了。

评论

挖矿卖给谁啊?国内的交易都关闭了。

评论

场外交易啊。。堵不住的。。

评论

我看了自己原来的bter交易,转到海外去了,人民币先兑换成美刀,这样可以赚2笔钱。我当时傻了,错误提早立场了,哎。

评论

场外交易一般比较容易,线下打款的,卖家给平台付手续费。
要是直接交易所的话国外都很严,也要身份登记,长的一个月才给通过。楼上还在挖? 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...