AMD基于7nm的RDNA显卡架构解析,RDNA显卡架构简析

2019-07-05 07:15 来源:未知

在我们的记忆中AMD的显卡产品已经用了很久的GCN架构,虽然每代产品所用的GCN架构都改良的地方,但本质上还是GCN架构。某种程度上我们可以说GCN架构很成功,因为使用了那么长时间,已经得到了市场的充分考验,我们也可以说GCN架构潜力很大,从发布至今那么长的时间依然可以展现出不俗的实力。

虽然GCN架构已经在AMD的显卡产品中,已经经受住了市场的历练与考验,加之长时间的不断优化积累,从某种程度上来说已经相当成功。但毕竟时代在发展,旧架构迟早也是要被淘汰在历史的长河中的,所以既然GCN逐渐开始无法满足我们的需求,那么AMD也是时候推出全新的架构了。

但GCN架构毕竟不是完美的,随着竞争对手的发展,GCN架构的应对能力确实开始下滑了。那对于一直为推出顶尖产品而奋斗AMD显卡团队来说,GCN架构显然满足不了他们的需求,为此那么拿出了核心代号为Navi的新产品,也就是新近发布Radeon RX 5700系列显卡,这里面所用的RDNA架构可以说是青出于蓝而胜于蓝,因为RDNA架构虽然得到了GCN架构的一些启发,但是从整体来说是一种全新架构,从绝对性能、运行功耗、能效比等多方面来说都全面胜于前辈,是AMD显卡团队的精品之作。

永利集团304手机版 1

永利集团304手机版 2

在凝结了研发团队4年的心血后,AMD也正是开启了第五代架构的革新之路,也就是最近发布的Radeon RX 5700系列所采用的Radeon DNA架构,即RDNA架构。从结果看来,RDNA架构的性能、功耗、能效比等多方面,均要全面领先于老式的GCN架构。RDNA也并非是GCN的修改版或是升级版,而是AMD彻头彻尾经过全方位重新设计的全新架构,完全兼容GCN架构的指令。

RDNA架构又叫做Radeon DNA架构,这个名称是什么意思相信不用我们多做解释了。AMD之所以这么命名,自然是认为RDNA架构是决定新一代显卡表现的关键,就像DNA对于生物的重要性。

永利集团304手机版 3

永利集团304手机版 4

RDNA架构也是构成Radeon RX 5700系列显卡“Navi 10”GPU核心的重要组成之一,而其其它要素则分别是7nm工艺、GDDR6显存、PCI-e 4.0总线。

永利集团304手机版,Navi核心显卡一共有4个重要的地方,其一是7nm工艺,其二是GDDR6显存,其三是PCI-E 4.0接口,最后一个就是RDNA架构了,可以说缺少任何一个,Navi显卡都实现当前的性能表现。

永利集团304手机版 5

永利集团304手机版 6

永利集团304手机版 7

我们直接把目光聚焦到RDNA架构上,RDNA架构有三大重点,一个是全新的计算单元设计,第二是多级缓存制度,第三是精简化的图形管道,三者的配合让RDNA架构的运算效率相比GCN架构有极大的提升。

“Navi 10”GPU核心集成103亿晶体管,虽然比于自家Vega 64的125亿晶体管少了18%,但核心面积却比484mm?的Vega 64小了接近一半,大小仅251mm?,单位面积性能提升超过130%。而“Navi 10”GPU核心的性能相比于Vega 64提升14%,功耗降低23%,能效比提升超过50%。

永利集团304手机版 8

永利集团304手机版 9

Radeon RX 5700XT的图形核心是目前已知的Navi核心或者说RDNA架构产品中的完全体,其拥有40组RDNA CU单元,共计2560个流处理器、80个标量单元和160个64位双线性过滤单元。

永利集团304手机版 10

永利集团304手机版 11

RDNA架构在设计上的三大重点,分别是全新的CU计算单元设计、多级缓存一致性的结构、精简化的图形管道优化。

RDNA架构支持Wave32和Wave64两指令长度模式,这个很重要

永利集团304手机版 12

永利集团304手机版 13

永利集团304手机版 14

AMD R100显卡架构到RDNA显卡架构的的变迁史

全新的CU计算单元一共分为40组,共计2560个流处理器、80个标量单元,以及160个64位双线性过滤单元。同时,RDNA架构中SIMD单元的组合方式不同,GCN拥有4组SIMD16单元、1个共享标量单元、1个共享向量单元。而RDNA则拥有2个SIMD32单元、2个共享标量单元、2个共享向量单元,整体的执行效率更高。

永利集团304手机版 15

永利集团304手机版 16

那么到底RDNA架构相比GCN架构有什么地方是更为领先呢?首先我们可以从两者的CU单元来判断。首先GCN架构是拥有4组SIMD16单元、1个共享标量单元和1个共享向量单元;RDNA架构拥有2组SIMD32单元,2个共享向量单元和2个共享标量单元,可以看出其SIMD单元的组合方式不同,向量和标量单元也更多。

以Wave64指令为例,GCN架构仅支持Wave16长度的指令,因为仅有1个共享标量单元,所以Wave64指令会被分给4组SIMD单元中去,但每个时钟周期只能运行1组,所以需要4个周期才能完成一个Wave64指令。

永利集团304手机版 17

永利集团304手机版 18

RDNA这样的组成有什么好处呢?以运行一个Wave64指令为例,由于GCN架构仅支持Wave16长度指令,仅有一个标量单元,因此Wave64指令会被分到4组SIMD单元中,每个时钟周期运行一组,这样就需要4个时钟周期才能完成一个Wave64指令。

永利集团304手机版 19

永利集团304手机版 20

永利集团304手机版 21

而RDNA架构有两组SIMD32单元,支持Wave32长度指令,而且有两个标量单元,因此一个Wave64指令可以同时由两个SIMD32单元运行,一个时钟周期就完成了。

永利集团304手机版 22

也正因为这样的结构,RDNA结构可以同时运行两个不同Wave32指令或一个Wave64指令,这也是其Wave32/64双模式的来由。

永利集团304手机版 23

永利集团304手机版 24

永利集团304手机版 25

从结果来看,运行Wave64指令时,GCN架构的SIMD单元利用率只有25%,而RDNA架构的利用率可以达到100%,这就是为什么后者可以在硬件规格接近的情况下,迸发出凌驾于GCN架构效能的原因。

但拥有2个SIMD32单元和2个共享标量单元的RDNA架构,却可以在一个时钟周期内同时由2个SIMD单元运行完成,整体效率提升4倍。

永利集团304手机版 26

永利集团304手机版 27

RDNA架构SIMD单元组成

永利集团304手机版 28

永利集团304手机版 29

永利集团304手机版 30

支持Wave32与Wave64双模式

永利集团304手机版 31

永利集团304手机版 32

也正是如此,RDNA架构可以同时运行两个不同的Wave32指令或是一个Wave64指令,即Wave32/Wave64模式。除此之外,RDNA架构还能将2个CU计算单元组合成为一个工作组处理器,比如达到2倍与GCN架构的ALU单元与4倍于GCN架构的缓存带宽。

当然除此之外RDNA架构还进行了很多的增强,例如2倍与GCN架构的ALU单元与4倍于GCN架构的缓存带宽,这些都是我们表面上看不到的规格,为此即便是CU单元和流处理器数量相同,RDNA架构的性能会比GCN架构性能高出一个甚至几个档次的原因。

永利集团304手机版 33

永利集团304手机版 34

永利集团304手机版 35

不同架构之间的区别

永利集团304手机版 36

永利集团304手机版 37

永利集团304手机版 38

RDNA架构缓存系统

缓存方面,RDNA架构设计的多级一致性结构,让每对由CU计算单元所组成的工作组处理器都拥有属于自己的零级缓存,在增加4组新的一级缓存同时,降低了二级缓存的拥堵,大幅降低了整体的延迟与功耗。

永利集团304手机版 39

永利集团304手机版 40

缓存带宽相比GCN架构有很大的提升,延迟则有大幅度的下降

永利集团304手机版 41

永利集团304手机版 42

图形管道方面也进行了精简的优化,包括4个增强的ACE异步计算引擎、地位更加中心化的结合处理器、64个像素单元。

精简化的图形管道使数据处理的速度更加迅速

永利集团304手机版 43

永利集团304手机版 44

RDNA架构在设计过程中,也借鉴过“Zen”架构设计的先进理念,比如在时钟门控方面,效率与能效极高,并且进一步减少了到达更高频率时需要的逻辑层级。

因此与RX Vega 64显卡相比,Radeon RX 5700 XT也就是Navi核心显卡在性能领先14%的前提下,功耗还有23%的下降,而且得益于7nm工艺,Navi核心的面积只有251平方毫米,Vega 10核心却已经接近500平方毫米,单位面积可以提供的性能,前者是后者的2.3倍。

永利集团304手机版 45

永利集团304手机版 46

永利集团304手机版 47

当然除了硬件上改进外,这次RDNA架构显卡还给游戏玩家带来了软件上的优化。首先是AMD FidelityFX套件,这是一个开源的画质工具,目前可以实现的作用是提升游戏换面的锐利度和对比度,使原本因为抗锯齿等原因而导致模糊的画面重新变得锐利。

最后,Radeon的媒体引擎大幅改善了视频编码,增加了H.265 HDR/WCG编码器。全面支持H.264格式的4K 90FPS、1080P 360FPS编码和4K 150FPS、1080P 600FPS解码,H.265格式的4K 60FPS、1080P 360FPS编码和8K 24FPS、4K 90FPS、1080P 360FPS解码,VP9格式的8K 24FPS、4K 90FPS解码,同时整体编码速度提升40%。

永利集团304手机版 48

精彩资讯报道,专业视频评测,尽在聚牛科技

当然这并不是AMD FidelityFX的唯一功能,事实上AMD FidelityFX还能完成很多事情,只是其他功能目前尚处于开发阶段,因此并未进行公开。此外这个套件虽然开源但并不是一个外部优化软件,而是需要融入到游戏本身的,不过目前已经有不少游戏厂商跟AMD合作将AMD FidelityFX加入到自己游戏中,就像当年的“海飞丝”特效那样。

永利集团304手机版 49

已经可以确定的是《F1 2019》和《无主之地3》都会支持AMD FidelityFX,未来会有更多的游戏加入,有兴趣的玩家也可以到GPUOpen网站下载开源包,自己来玩一玩。

永利集团304手机版 50

很多游戏厂商已经确定会支持AMD FidelityFX

永利集团304手机版 51

而AMD图像锐化功能则是由显卡驱动提供的功能,这意味着什么游戏都能支持,其作用同样是锐化游戏画面,使其看上去更加清晰。

永利集团304手机版 52

AMD表示相应的功能会在Radeon RX 5700显卡发售后的最新版的驱动中提供,不过目前仅支持RDNA架构显卡,后期是否会支持GCN架构显卡,他们表示这不方便透露,因此大家也只能等待了。

永利集团304手机版 53

对于电竞玩家来说RDNA架构显卡还有一项很重要的功能就是抗延迟功能,这是一项降低从操作到画面响应所需要的时间的功能,AMD表示开启抗延迟功能后,操作到显示的延迟时间将缩短三分之一,对于电竞玩家来说是非常重要的。

TAG标签:
版权声明:本文由永利集团304手机版发布于科学普及,转载请注明出处:AMD基于7nm的RDNA显卡架构解析,RDNA显卡架构简析