日本电子维修技术 显卡<後藤 弘茂>AMD Vega64 发布,夏日大反击




AMD正式发表下一代GPU Radeon RX Vega64http://pc.watch.impress.co.jp/docs/column/kaigai/1073276.html
11点的文章,抓到了。粗翻,轻喷。
AMD在夏日开始大反击
AMD的反击终于开始了。8月份,AMD将向市场投入新的GPU Radeon RX Vega64(Vega10)和16核心CPU(Ryzen Threadripper)。
对于今年新的AMD产品来说,最重要的一点就是无论是CPU还是GPU都在构架上有了巨大的变化。在通过Zen架构刷新了CPU的微架构之后,这次轮到Vega了。对于AMD来说,这是5年来首次大规模的革新GPU的微架构。全新微架构的VegaVega10的具现化产品为RadeonRX Vega64Radeon RX Vega64的性能指标
以GPU产品的视角来看,Radeon RX Vega64是AMD两年来的首个旗舰型号。AMD去年并没有发表hi-end型号的GPU,所以高端型号的GPU跳过了Polaris一代直接过渡到Vega。Vega将发布一系列的家族型号,而本次率先发布是最上位的Vega10.
Vega10架构最大的特点是并未追随NVIDIA使用巨大die的道路,而是在这一代控制了die的大小。Die size为486mm2,只有NVIDIA GV100的815mm2的60%的程度。也只有2015年AMD的旗舰Fury X 596mm2的82%的程度。晶体管数量达到12.5B个,这也比NVIDIA要少不少。堆叠显存HBM2也只有两层,比起NVIDIA的4层也少一些。

在微构架方面,nvidia在本世代大规模的转向深度学习,选择了将深度学习向的GPU和图形图像向的GPU完全分开的道路。然而AMD却在添加了面向深度学习机能的同时,却控制了晶体管数量。结果就是Vega10在坐拥高性能图形性能的同时,制造成本却很低,价格也便宜,是非常平衡的一款GPU。


核心数量一致,性能却有47%的提升
Vega10的CU数量是64个,单精度运算单元(AMD称为Stream Processor)数量是4096个。数量上与Fury X是一致的。但FP32的性能对比Fury X的8.6T,Vega64有12.66T,有了近47%的性能提升。

性能大幅度提升的主要原因还是频率的提升。Fury X只有1050mhz,而Vega64的基础频率就有1247mhz,boost频率达到1546mhz。简单的频率提高就能带来不错的性能提升。
Vega构架相对于以往的GCN构架而言,在渲染流水线上并没有什么变化。向量单元在计算管线上仍然是4个时钟周期。而是在critical path上进行了非常彻底的优化。逻辑电路根据path不同所产生的延迟而不同。而延迟较长的path群被称为critical path。同类型的处理器频率的提升,就是受限于最长的path。所以只要优化critical path,缩短它们的延迟,就可能提升处理器频率。Vega10通过对critical path的调优,可能在14nm LPP的工艺下,达到1.7GHz的频率。

AMD通过电路设计达到高频率

来自zen组的馈赠,使用了cpu风格的定制电路SRAM寄存器
之所以没有改动流水线,是因为如果贸然加深流水线,那么数值运算的延迟会增加,那么为了满足流水线的需求,可能需要更多的线程参与其中。为了维护众多线程的并行性能,又进一步需要更多的类似于寄存器之类的资源,最终拖垮总体性能。所以只采用了优化critical path的方法,在构架的原理上没有修改。
GPU核心上的微构架更新
Vega在CU层面上还是进行了微构架的大规模刷新。新设计的名字叫NCU(Next-Generation Compute Unit)。NCU的最大特点就是被称为Rapid Packed Math (RPM)的Packed(一个SIMD为一个pack)在运算格式上支持了FP16运算。
开始支持ed FP16
源生指令集上也做了扩展
AMD的GPU具备对FP32运算的最佳化管线。而在Vega中,32bit的管线可以同时放置2组16bit的SIMD格式的数据,同时进行运算,从而获得两倍的FP32性能。
FP16在手机游戏中被广泛应用以外,在机器学习领域也正在大展身手。机器学习的训练层面,也在积极的使用FP16。Vega支持包含FMA以内的所有FP16运算。
packed 8位整数运算也是支持的
Vega构架同时也支持packed 8为整数运算,但只支持SAD这么一个指令(Sum of Absolute Difference差的绝对值之和)。这是面向视频和图像处理的指令,机器学习就用不了。除此以外,还有几何流水线的更新,新的缓存设计,FreeSync的扩展等诸多构架上的更新。以后再说。
名称Radeon Pro SSGRadeon Pro WX9100Radeon RX Vega64 Liquid Cooled EditionRadeon RX Vega64代号Vega10Vega10Vega10Vega10基础频率
1,406MHz1,247MHz核心频率(最高)1,500MHz?1,500MHz?1,677MHz1,546MHz构架GCN 5.0GCN 5.0GCN 5.0GCN 5.0运算单元数量 FP324,0964,0964,0964,096CU数64646464FP32 MAD/CU64646464运算单元数量 FP168,1928,1928,1928,192运算单元数量 INT816,38416,38416,38416,384FP32 GFLOPS10,21510,21511,51810,215FP32 GFLOPS (boost clock)12,28812,28813,73812,665FP16 GFLOPS20,43120,43123,03620,431FP16 GFLOPS (boost)24,57624,57627,47625,330Texture Units256256256256Texture Fill Rate319.2GT/s319.2GT/s359.9GT/s319.2GT/sROP Units64646464Pixel Fillrate79.81Gpixels/s79.81Gpixels/s89.98Gpixels/s79.81Gpixels/sL2 cache4,096KB4,096KB4,096KB4,096KB内存种类HBM2HBM2HBM2HBM2内存传输率1,892Mtps?1,892Mtps?1,892Mtps?1,892Mtps?位宽2,048bit2,048bit2,048bit2,048bit带宽(GB/Sec)484GB/s484GB/s484GB/s484GB/s内存大小16GB16GB8GB8GBDRAMdie8Gb8Gb8Gb8GbDRAM個数16 個16 個8 個8 個SSG(NAND Storage)2TB

制程14nm14nm14nm14nm制程特征14LPP14LPP14LPP14LPP晶体管数12,500M12,500M12,500M12,500Mdie size486平方mm486平方mm486平方mm486平方mmTDP Max300W250W345W295W

评论
```` 这个套装可以加入麦当劳豪华午餐么······

评论
Vega成本很低吗?

评论
最低配能打赢1070,就考虑搞个玩完,不过温度又是个大问题···

评论

明明是肯德基豪华午餐,麦当劳的叫天天超值套餐

评论

比Fiji低

评论
1546/1050,正好是147%

评论
逼格版Vega64只有买套装才买得到。。。求合买。

评论
只要le不要套装不行?我有显示器还要花这冤枉钱干蛋…

评论
A卡战未来啊,人工智能学习也被加入,这个是优化了挖矿吗?以往都是挖矿程序调用一部分流处理器去挖矿,现在在人工智能干预下,所有的流处理器都被拉去挖矿。

评论

人家就是这样算的……自然正好……

评论
有VEGA NANO  赢了

评论

那是米国才有的优惠,国内没有。还有,说不定出来会有一个惊喜价格,参考瑞龙,但是千万不要抢首发。

评论
PPT没用的

直接来个FSE FSU成绩就行


评论
目测这些套餐都不会在国内上市 至少不会送两款游戏 不知道fendi限量版会以什么形式进行销售~~

评论
AMD是打算一块芯片通吃所有领域?

评论
不愧是三倍营销费用 但是显卡还是垃圾啊

评论

惊喜个球 贵的飞起

评论


树卡没有16G显存版。。。。。。。

评论

那就算了,没有理由为高价垃圾买单。老实用我的1066。

评论
规格向gp102看齐,性能向gp104看齐

评论

amd现在要的是利润,不是销量。。。
所以vega这个东西真的挺两难的

评论

我靠,居然比fiji还低,那看来vega即使赔钱,也不会亏太多了

评论

这么说CPU部门一直都是隔岸观火的了?说好的APU没下文了?


评论

稍微卖卖满足下粉丝情怀就退市不就行了。。。

不然搞了好几年最后太监了,也太伤人了。

评论

RYZEN备货充足,但是水冷不是说是限量版嘛,就怕开头不抢,后续抢不到。。。

评论

你确定旷工不会扫货??

评论

能用显卡挖的矿最近价格已经腰斩一半还多了,只有比特币坚挺,但是那是有矿机存在的,现在每天一块1066每天挖到的矿的价值只有4元左右,一块1066显卡就算1500,回本也要一年,你确定这个时候还有矿工敢进入。尤其是高价显卡。

评论

我是看狗东 现在 580  1060 1070 价格都没有回到前期的价格啊  挖矿行情不是很关注 关注的是挖矿把显卡价格挖上去了

评论

明天8月1日,你再看看,不知道狗东的价格周期是多久,也许到8月份就会回归,但是不会到挖矿前的价格,这个一方面是因为挖矿的存在,另外一个方面也是因为内存芯片涨价导致的。
多谢老铁解惑

评论
好专业的文章
支持一下!!

评论

头像好评

评论
The new GPU king!!!





Under $500

评论
也就是说终于不是GCN了吗

评论
关键的问题是,是否能买到或者说以正常的价格买到

评论
辛苦楼主转过来!喜欢看这类文章,学习! 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本留学生活 求个大阪合租
·日本留学生活 自家房招租求
·日本留学生活 东京地区出9成新lv钱包
·日本育儿教育 孩子从国内过来如何学习日语
·日本育儿教育 明年四月横滨招月嫂
·日本育儿教育 请问咋让娃突破识字关?感谢分享中文共读和学习经验的妈妈
 ·中文新闻 东区明星迈克尔·格列柯,53 岁,将在第一次出生两年后第二次
·中文新闻 《爱情岛》明星卡米拉·瑟洛和杰米·朱维特在透露即将迎来第三

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...