AMD全新GPU架构解析性能提升14％功耗降低23％-德赢Vwin官网网

E3 2019游戏大会期间，AMD正式发布了基于7nm新工艺、Navi新核心、RDNA新架构的新一代显卡Radeon RX 5700系列，包括RX 5700 XT、RX 5700两款型号，均面向规模最为庞大的甜点级市场和主流游戏玩家。

AMD发布的新一代RX 5700系列显卡基于7nm新工艺和Navi新核心，而在底层是全新的RDNA架构，已经走过七年半的GCN架构就此挥手作别。

这些年来，很多用户玩家尤其是A饭一直期待一个全新的GPU架构，但这种事儿的难度远超一般人想象，某种程度上设计一个新的GPU架构甚至要比设计一个新的CPU架构还要难。RDNA架构就花费了AMD研发团队长达四年的时间，凝聚了无数人的心血，也开启了AMD显卡历史上第五代重大架构的新时代。

2000年前，R100核心是A卡的第一代架构，用的还是固定单元设计，3D几何转换和光照效果如今看起来都极为原始。

2001-2007年的R200-R500是第二代架构，简单的VS纹理着色器、PS像素着色器分离式设计，不同的只是比例不同，整个渲染流水线就像一个单通道的单行道。

2008-2011年的第三代TeraScale架构(代表核心R600)实现了一个飞跃，VS、PS融合为统一着色器，也就是我们常说的流处理器，支持VLIW(超长指令字)，然后就是2011-2019年的GCN架构(代表核心Southern Islands)，统一着色器加独立的标量、矢量单元，二者比例为1:4。

如今，迎来了全新的RDNA(Radeon DNA)，还是统一着色器，但标量和矢量单元走向融合，支持SIMT(单指令多线程) ILP(指令集并行)，类似CPU处理器的SIMD(单指令多数据流)，单线程性能和指令集执行效率大大提升。

需要强调的是，RDNA是一个全方位重新设计的架构，并不是GCN的又一个升级版，也不是与GCN的混合体，只是集成了GCN架构的指令以保持向下兼容，现有技术仍然可以在RDNA架构上得到支持。

RDNA架构将是AMD GPU显卡未来多年的基石，接下来我们将看到采用7nm+工艺的第二代版本RDNA 2，看路线图有望明年初和我们见面。

除了RDNA新架构，Navi核心还有7nm工艺、GDDR6显存、PCIe 4.0总线、Radeon媒体引擎、Radeon显示引擎等诸多全新特性。

Navi 10核心集成了103亿个晶体管，相比Vega 64 125亿个少了大约18％，而核心面积只有251平方毫米，相比Vega 64 495平方毫米更是小了足足一半，因此单位面积性能提升了足足1.3倍。

尽管晶体管更少、面积更小，Navi 10核心的性能相比于Vega 64却提升了14％，同时功耗降低了23％，能效比因此大涨50％。

纯架构性能上，Navi相比于Vega在同等功耗、同等配置下提升多达50％，反应到实际产品上，这贡献了产品性能提升的60％左右，另外有大约25％来自7nm新工艺的加持，还有约15％来自频率以及功耗的改进。

AMD表示，RDNA架构的设计理念主要有四个方面，性能上要满足在现代游戏负载需求，能效上要充分优化功耗和带宽利用率，功能上要壮大生态，扩展性上要从移动到桌面到云端通吃。

为实现上述目标，RDNA架构主要从三大方面进行了变革，包括CU计算单元、缓存、流水线，接下来我们逐一和大家分享，但鉴于GPU架构的技术性太强，我们只是蜻蜓点水地大致看一下，最后还有AMD关于光线追踪的规划。

新的计算单元设计一共分为40组，每组2个标量处理器、64个流处理器、4个64位双线性过滤单元，总计80个、2560个、160个，执行延迟更低，单线程性能更强，缓存效率更高，整体计算能效比GCN架构有着巨大的提升，而且可适应从游戏到计算各种负载。

多级缓存一致性可以带来更低的延迟、更高的带宽、更低的功耗，包括各处零级缓存、512KB一级缓存、4MB二级缓存。

整个图形引擎也做了重新调整，更加顺畅高效，包括几何引擎、64个纹理单元、4个异步计算引擎(ACE)，负载分配更加均衡，可以在更低的功耗下达成更高的频率，能效更高。

CU计算单元方面，虽然看起来每一组还是64个流处理器，数量没变，但这个数字是AMD反复设计后与处理资源最为平衡的的组合，同时整个计算单元的结构进行了彻底重组，和GCN时代完全不一样了。

RDNA架构下，每个CU计算单元的标量解码和发射单元、矢量解码和发射单元、调度器的数量都增加了一倍来到两个，指令处理率因此也提升一倍。

同时，四个SIM16矢量单元、四个SIMD4特殊功能单元变为两个SIMD32、两个SIMD8，比如64个线程可组合为两个Wave32，然后由两个SIMD32执行两个Wave32，实现单时钟周期指令发射(之前需要四个)，SIMD ALU单元的利用率也从25％来到了100％，而且支持Wave32、Wave64两种执行模式，以应对不同负载需求。

此外，为了强化资源调度和利用的效率，RDNA架构还将每两个CU计算单元紧密地捆绑在了一起，组成一个工作组处理器(Work Group Processor)，使得可用ALU单元、寄存器数量翻番，缓存带宽更是之前的四倍。

缓存方面，RDNA架构设计了一套多级一致性结构，每个双CU组合内都有自己的零级缓存，与ALU单元的载入带宽翻番，增加了四组新的一级缓存(都是16-way 128KB)，降低了二级缓存(16-way 4MB)的拥堵，整体延迟和功耗大大减低。

按照AMD的说法，零级缓存的延迟降低了21％，一二级缓存降低24％，内存延迟也低了7％。

另外在一致性多级缓存下，到处都支持Delta数据压缩(DCC/图中箭头黄色部分)，提高传输率，同时还改进了色彩压缩算法，可供显示引擎读取，着色器也能同时读写压缩的色彩数据。

图形引擎流水线方面进行了大刀阔斧的重组，包括四个增强的ACE异步计算引擎，地位更加中心化的结合处理器(包含四个原语单元)，64个像素单元。

异步计算一直是A卡的独门绝技，也是起在DX12、Vulkan API下表现更好的关键，如今得到增强后，可以更精准地实时控制其他模块。

有趣的是，RDNA GPU架构设计也借鉴了Zen CPU架构设计的一些先进理念，尤其是在时钟门控方面，效率和能效极高，同时还减少了达到更高频率所需要的逻辑层级。

Radeon显示引擎也大幅跃进，支持FreeSync 2 HDR、HDMI 2.0/DisplayPort 1.4 HDR，针对高分辨率HR显示器优化，可输出4K/240Hz、8K/60Hz，而且都只需一根数据线即可达成，同时还优化了VR头显显示。

Radeon多媒体引擎则大大改进了视频编解码，增加了新的H.265 HDR/WCG编码器，全面支持H.264 1080p600、4K150、8K30解码和1080p360、4K90编码，H.265 1080p360、4K90、8K24解码和1080p360、4K60编码，VP9 4K90、8K24解码，整体编码速度加快40％。

对于大家非常关注的光线追踪支持，GCN、RDNA架构都没有专门的硬件单元加速，不过事实上，AMD ProRender、Radeon Rays都早就支持了光线追踪，分别面向内容创作渲染和游戏开发。

在下一代RDNA架构上，AMD会通过硬件单元，支持特定的光线追踪效果在游戏中实时渲染，而即便到了更遥远的未来，AMD也不会将光线追踪全部一股脑扔给硬件来本地处理，否则效率会非常低下，而是将借助云计算，实现全场景的光线追踪，保证画面效果的同时，不会给本地硬件太大的压力。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

处理器

处理器

+关注

关注
68

文章
19259

浏览量
229649
amd

amd

+关注

关注
25

文章
5466

浏览量
134087
显卡

显卡

+关注

关注
16

文章
2431

浏览量
67573
GPU架构

GPU架构

+关注

关注
0

文章
15

浏览量
8463

原文标题：四年研发，终成正果！AMD 全新GPU架构解析：相比 Vega 64 面积更小，性能提升14％，功耗降低23％

文章出处：【微信号：wc_ysj，微信公众号：旺材芯片】欢迎添加关注！文章转载请注明出处。

AMD最强AI芯片，性能强过英伟达H200，但市场仍不买账，生态是最大短板？

。其中，全新旗舰AI芯片的型号为AMD Instinct MI325X GPU，虽然仍然是采用CDNA 3架构，但是相较于AMD In

发表于 10-14 01:32 •3406次阅读

<b class='flag-5'>AMD</b>最强AI芯片，<b class='flag-5'>性能</b>强过英伟达H200，但市场仍不买账，生态是最大短板？

芯原推出新一代高性能Vitality架构GPU IP系列

芯原股份（芯原，股票代码：688521.SH）今日宣布推出全新Vitality架构的图形处理器（GPU）IP系列，具备高性能计算能力，广泛适用于云游戏、AI PC、独立显卡和集成显卡等

发表于 12-19 15:55 •91次阅读

《CST Studio Suite 2024 GPU加速计算指南》

问题，但会降低旧GPU硬件性能，可通过NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式（Windows only）：某些GPU计算需要启用，可通过命令行

发表于 12-16 14:25

《算力芯片高性能 CPUGPUNPU 微架构分析》第3篇阅读心得：GPU革命：从图形引擎到AI加速器的蜕变

在数据挖掘工作中，我经常需要处理海量数据的深度学习任务，这让我对GPU架构和张量运算充满好奇。阅读《算力芯片》第7-9章，让我对这些关键技术有了全新认识。 GPU

发表于 11-24 17:12

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU

本篇阅读学习第七、八章，了解GPU架构演进及CPGPU存储体系与线程管理 █从图形到计算的GPU架构演进 GPU图像计算发展 ●从三角形开始

发表于 11-03 12:55

AMD与NVIDIA GPU优缺点

在图形处理单元（GPU）市场，AMD和NVIDIA是两大主要的竞争者，它们各自推出的产品在性能、功耗、价格等方面都有着不同的特点和优势。一、性能

发表于 10-27 11:15 •639次阅读

AMD全新处理器扩大数据中心CPU的领先地位

在Computex 2024 开幕主题演讲上，AMD 详细介绍了全新的 CPU、NPU 和 GPU 领先架构，为从数据中心到个人电脑的端到端 AI 基础

发表于 09-19 11:01 •524次阅读

名单公布！【书籍评测活动NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

和像素统一的G80到现在重金难求的H100；AMD的Zen系列CPU和RDNA系列GPU两线作战；中国的高性能计算芯片逐步获得更多TOP500排名；华为Ascend 910 NPU芯片也成为AI时代

发表于 09-02 10:09

GPU云服务器架构解析及应用优势

GPU云服务器作为一种高性能计算资源，近年来在人工智能、大数据分析、图形渲染等领域得到了广泛应用。它结合了云计算的灵活性与GPU的强大计算能力，为企业和个人用户提供了一种高效、便捷的计算解决方案。下面我们将从

发表于 08-14 09:43 •380次阅读

AMD推出全新AMD锐龙和EPYC处理器，扩大数据中心和PC领域领先地位

、游戏、内容创造和工作效率提供领先性能在Computex 2024 开幕主题演讲上，AMD (纳斯达克股票代码: AMD) 详细介绍了全新的 CPU、NPU 和

发表于 06-04 19:21 •992次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

冷却技术，提高计算密度，减少占地面积，并通过高带宽、低延迟的GPU通信，有效减少数据中心的碳足迹和能源消耗。相较于传统的NVIDIA H100风冷基础设施，GB200在相同功耗下实现25倍的性能

发表于 05-13 17:16

天玑9300旗舰芯：全大核CPU架构，性能与能效的提升

“全大核”CPU 架构设计打破常规，摒弃小核，采用超大核（Arm Cortex-X）与大核（Arm Cortex-A）的组合，以更高时钟频率提升性能和能效，同时降低功耗，延长电池寿命。

发表于 05-06 10:22 •619次阅读

深入解读AMD最新GPU架构

GCN 取代了 Terascale，并强调 GPGPU 和图形应用程序的一致性能。然后，AMD 将其 GPU 架构开发分为单独的 CDNA 和 RDNA 线路，分别专门用于计算和图形。

发表于 01-08 10:12 •1212次阅读

AMD的GPU架构GCN现代化解读

随着HD 5000和6000系列的发展，AMD的Terascale（万亿级）架构变得非常具有竞争力。

发表于 01-08 09:58 •1204次阅读

搜索历史

AMD全新GPU架构解析性能提升14％功耗降低23％

评论

AMD最强AI芯片，性能强过英伟达H200，但市场仍不买账，生态是最大短板？

芯原推出新一代高性能Vitality架构GPU IP系列

芯原发布全新Vitality架构GPU IP系列

《CST Studio Suite 2024 GPU加速计算指南》

《算力芯片高性能 CPUGPUNPU 微架构分析》第3篇阅读心得：GPU革命：从图形引擎到AI加速器的蜕变

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU

AMD与NVIDIA GPU优缺点

AMD全新处理器扩大数据中心CPU的领先地位

名单公布！【书籍评测活动NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

GPU云服务器架构解析及应用优势

AMD推出全新AMD锐龙和EPYC处理器，扩大数据中心和PC领域领先地位

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

天玑9300旗舰芯：全大核CPU架构，性能与能效的提升

深入解读AMD最新GPU架构

AMD的GPU架构GCN现代化解读

搜索历史

AMD全新GPU架构解析 性能提升14％功耗降低23％

评论

AMD全新GPU架构解析性能提升14％功耗降低23％