NVIDIA CPU+GPU超级芯片大升级！-德赢Vwin官网网

NVIDIA官方宣布了新一代GH200 Grace Hopper超级芯片平台，全球首发采用HBM3e高带宽内存，可满足世界上最复杂的生成式AI负载需求。

NVIDIA 2022年3月推出了Grace Hopper超级芯片，首次将CPU、GPU融合在一块主板上，不过直到今年5月份才量产。

其中，Grace CPU拥有72个Armv9 CPU核心、198MB缓存，支持1TB/s高带宽的LPDDR5X ECC内存，还支持PCIe 5.0。

Hopper GPU则采用台积电4nm定制工艺，800亿晶体管，集成18432个CUDA核心、576个Tenor核心、60MB二级缓存，支持6144-bit HBM高带宽内存，此前版本配备的是96GB HBM3。

双路配置的系统中，两颗新一代GH200超级芯片可带来144个CPU核心、8PFlops(8千万亿次浮点计算每秒) AI性能、282GB HBM3e内存，容量是现在的3.5倍，而高达10TB/s的带宽也是现在的3倍。

基于NVLink高速总线，GH200超级芯片还可以继续拓展互连，GPU可以访问全部的CPU内存，双路配置下总容量可达1.2TB。

NVIDIA没有透露采用的HBM3e来自哪家供应商，很可能是SK海力士。

首批基于GH200超级芯片的系统将在2024年第二季度出货。

顺带一提，AMD Instinct MI300A、MI300X AI加速器分别配备128GB、192GB HBM3，后者带宽超过5TB/s。

NVIDIA Ada Lovelace架构在桌面、笔记本游戏卡上已经布局完毕，如今在工作站上也圆满了。

今天，NVIDIA正式发布了RTX 5000 ADA、RTX 4500 ADA、RTX 4000 ADA三款新专业卡，加上此前的旗舰级RTX 6000 ADA、半高式RTX 4000 SFF ADA，高中低端都齐了。

RTX 6000 ADA旗舰卡为双插槽、单涡轮风扇设计，满血的AD102 GPU核心，配备18176个CUDA核心、568个Tensor核心，核心加速频率可达2.5GHz。

显存搭档384-bit 48GB GDDR6 ECC，等效频率20GHz，带宽为960GB/s，整卡功耗300W，四个DP 1.4a接口。

FP32浮点性能91.1TFlops(每秒91.1万亿次)，价格高达6800美元，约合人民币4.90万元。

RTX 5000 ADA延续了老大哥的造型、AD102核心，精简到12800个CUDA核心、400个Tensor核心。

显存也砍到256-bit 32GB，频率18GHz，带宽降至578GB/s，功耗也来到250W。

浮点性能65.3TFlops，相当于旗舰卡的约72％，价格4000美元，约合人民币2.88元。

RTX 4500 ADA外观依然不变，但内部改成了AD104核心(跳过AD103)，7680个CUDA核心、240个Tensor核心的规模与RTX 4070 Ti完全一致。

核心频率是全系列最高的2.6GHz，显存是192-bit 24GB GDDR6 ECC，频率18GHz，带宽432GB/s。

浮点性能39.6TFlops，价格2250美元，约合人民币1.62万元。

RTX 4000 ADA改成了单插槽设计，还是单个涡轮风扇，AD104核心，6144个CUDA核心、192个Tensor核心、160-bit 20GB GDDR6显存，接口四个mini DP 1.4a，这些都和SFF半完全一致。

不过核心频率从1.56GHz大幅提高到2.2GHz，显存频率也从16GHz提高到18GHz，浮点性能来到了26.7TFlops，功耗也从70W大幅增至130W。

价格倒是没变，还是1250美元，约合人民币9000元。

Boxx、戴尔、Lamdda、联想、惠普等将从今年秋天开始陆续推出搭载新卡的工作站，甚至有的会配备四块RTX 6000 ADA，总显存多达192GB。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

晶体管

晶体管

+关注

关注
77

文章
9682

浏览量
138079
缓存器

缓存器

+关注

关注
0

文章
63

浏览量
11658
PCIe接口

PCIe接口

+关注

关注
0

文章
120

浏览量
9702
GPU芯片

GPU芯片

+关注

关注
1

文章
303

浏览量
5804
NVIDIA显卡

NVIDIA显卡

+关注

关注
0

文章
15

浏览量
3149

原文标题：NVIDIA CPU+GPU超级芯片大升级！史无前例282GB内存

文章出处：【微信号：hdworld16，微信公众号：硬件世界】欢迎添加关注！文章转载请注明出处。

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X™ 以太网网络平台，该平台

发表于 10-30 09:33 •142次阅读

<b class='flag-5'>NVIDIA</b> 以太网加速 xAI 构建的全球最大 AI <b class='flag-5'>超级</b>计算机

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

本帖最后由 1653149838.791300 于 2024-10-16 22:19 编辑感谢平台提供的书籍，厚厚的一本，很有分量，感谢作者的倾力付出成书。本书主要讲算力芯片CPU

发表于 10-15 22:08

名单公布！【书籍评测活动NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

纸质媒体的高质量和专业网络媒体的信息更新速度。算力芯片在最近15年有着巨大性能突破，这些年Intel的CPU芯片从双核128位SIMD到众核512位SIMD；NVIDIA的

发表于 09-02 10:09

NVIDIA GB200超级芯片引领液冷散热新纪元

，特别是其单颗B200芯片功耗高达1000W，以及由一颗Grace CPU与两颗Blackwell GPU组成的超级芯片GB200功耗惊人地

发表于 08-01 16:35 •968次阅读

NVIDIA GB200 CPU+GPU超级芯片功耗达2700W

7月31日，集邦咨询发布的最新报告揭示了AI服务器领域的一个重要趋势：随着计算能力与功耗的同步攀升，特别是NVIDIA计划在年底推出的下一代Blackwell平台将带来显著的功耗增长，液冷散热技术正逐步成为行业标配，预计今年底其市场渗透率将达到10%。

发表于 07-31 13:02 •1012次阅读

超级猛兽 GPU ?NVIDIA GeForce RTX 5090 基本频率接近 2.9 GHz

ABSTRACT摘要根据最新传言，旗舰级NVIDIAGeForceRTX5090GPU看起来将是一款超级猛兽。据称，显卡的基本时钟速度将设定在2.9GHz左右，几乎达到3GHz的门槛

发表于 07-12 08:26 •433次阅读

<b class='flag-5'>超级</b>猛兽 <b class='flag-5'>GPU</b> ?<b class='flag-5'>NVIDIA</b> GeForce RTX 5090 基本频率接近 2.9 GHz

CPU渲染和GPU渲染优劣分析

GPU的出现，基于GPU的渲染获得了很大的普及。这些GPU是特定用途的芯片，在某些情况下提供与CPU渲染相当的结果。从广义上讲，

发表于 05-23 08:27 •588次阅读

<b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染优劣分析

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

CPU和72个Blackwell GPU，并通过NVIDIA NVLink技术连接。DGX SuperPOD可以通过NVIDIA Quantum InfiniBand连接多个机架，实

发表于 05-13 17:16

利用NVIDIA组件提升GPU推理的吞吐

本实践中，唯品会 AI 平台与 NVIDIA 团队合作，结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）将推理的稠密网络和热 Embedding 全置于

发表于 04-20 09:39 •714次阅读

AI服务器异构计算深度解读

AI服务器按芯片类型可分为CPU+GPU、CPU+FPGA、CPU+ASIC等组合形式，CPU+GPU是目前国内的主要选择（占比91.9%）

发表于 04-12 12:27 •606次阅读

NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell 超级

发表于 03-21 09:49 •692次阅读

NVIDIA 推出 Blackwell 架构 DGX SuperPOD，适用于万亿参数级的生成式 AI 超级计算

基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术，可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个，通过

发表于 03-19 10:56 •419次阅读

深度解读Nvidia AI芯片路线图

Nvidia是一个同时拥有 GPU、CPU和DPU的计算芯片和系统公司。Nvidia通过NVLink、NVSwitch和NVLink C2C

发表于 03-13 09:25 •920次阅读

Nvidia与AMD新芯片，突破PCIe瓶颈

AMD 和 Nvidia 的 GPU 都依赖 PCI 总线与 CPU 进行通信。CPU 和 GPU 有两个不同的内存域，数据必须通过 PCI

发表于 03-08 14:15 •664次阅读

为什么GPU比CPU更快？

GPU比CPU更快的原因并行处理能力：GPU可以同时处理多个任务和数据，而CPU通常只能一次处理一项任务。这是因为GPU的架构使得它可以同时

发表于 01-26 08:30 •2392次阅读

搜索历史

NVIDIA CPU+GPU超级芯片大升级！

评论