1 NVIDIA CPU+GPU超级芯片大升级!-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA CPU+GPU超级芯片大升级!

硬件世界 来源:硬件世界 2023-08-10 09:37 次阅读

NVIDIA官方宣布了新一代GH200 Grace Hopper超级芯片平台,全球首发采用HBM3e高带宽内存,可满足世界上最复杂的生成式AI负载需求。

NVIDIA 2022年3月推出了Grace Hopper超级芯片,首次将CPUGPU融合在一块主板上,不过直到今年5月份才量产。

其中,Grace CPU拥有72个Armv9 CPU核心、198MB缓存,支持1TB/s高带宽的LPDDR5X ECC内存,还支持PCIe 5.0。

Hopper GPU则采用台积电4nm定制工艺,800亿晶体管,集成18432个CUDA核心、576个Tenor核心、60MB二级缓存,支持6144-bit HBM高带宽内存,此前版本配备的是96GB HBM3。

双路配置的系统中,两颗新一代GH200超级芯片可带来144个CPU核心、8PFlops(8千万亿次浮点计算每秒) AI性能、282GB HBM3e内存,容量是现在的3.5倍,而高达10TB/s的带宽也是现在的3倍。

基于NVLink高速总线,GH200超级芯片还可以继续拓展互连,GPU可以访问全部的CPU内存,双路配置下总容量可达1.2TB。

NVIDIA没有透露采用的HBM3e来自哪家供应商,很可能是SK海力士。

首批基于GH200超级芯片的系统将在2024年第二季度出货。

顺带一提,AMD Instinct MI300A、MI300X AI加速器分别配备128GB、192GB HBM3,后者带宽超过5TB/s。

NVIDIA Ada Lovelace架构在桌面、笔记本游戏卡上已经布局完毕,如今在工作站上也圆满了。

今天,NVIDIA正式发布了RTX 5000 ADA、RTX 4500 ADA、RTX 4000 ADA三款新专业卡,加上此前的旗舰级RTX 6000 ADA、半高式RTX 4000 SFF ADA,高中低端都齐了。

RTX 6000 ADA旗舰卡为双插槽、单涡轮风扇设计,满血的AD102 GPU核心,配备18176个CUDA核心、568个Tensor核心,核心加速频率可达2.5GHz。

显存搭档384-bit 48GB GDDR6 ECC,等效频率20GHz,带宽为960GB/s,整卡功耗300W,四个DP 1.4a接口

FP32浮点性能91.1TFlops(每秒91.1万亿次),价格高达6800美元,约合人民币4.90万元。

RTX 5000 ADA延续了老大哥的造型、AD102核心,精简到12800个CUDA核心、400个Tensor核心。

显存也砍到256-bit 32GB,频率18GHz,带宽降至578GB/s,功耗也来到250W。

浮点性能65.3TFlops,相当于旗舰卡的约72%,价格4000美元,约合人民币2.88元。

RTX 4500 ADA外观依然不变,但内部改成了AD104核心(跳过AD103),7680个CUDA核心、240个Tensor核心的规模与RTX 4070 Ti完全一致。

核心频率是全系列最高的2.6GHz,显存是192-bit 24GB GDDR6 ECC,频率18GHz,带宽432GB/s。

浮点性能39.6TFlops,价格2250美元,约合人民币1.62万元。

RTX 4000 ADA改成了单插槽设计,还是单个涡轮风扇,AD104核心,6144个CUDA核心、192个Tensor核心、160-bit 20GB GDDR6显存,接口四个mini DP 1.4a,这些都和SFF半完全一致。

不过核心频率从1.56GHz大幅提高到2.2GHz,显存频率也从16GHz提高到18GHz,浮点性能来到了26.7TFlops,功耗也从70W大幅增至130W。

价格倒是没变,还是1250美元,约合人民币9000元。

Boxx、戴尔、Lamdda、联想、惠普等将从今年秋天开始陆续推出搭载新卡的工作站,甚至有的会配备四块RTX 6000 ADA,总显存多达192GB。

43f9e084-36cd-11ee-9e74-dac502259ad0.png

442e621e-36cd-11ee-9e74-dac502259ad0.png






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 晶体管
    +关注

    关注

    77

    文章

    9682

    浏览量

    138079
  • 缓存器
    +关注

    关注

    0

    文章

    63

    浏览量

    11658
  • PCIe接口
    +关注

    关注

    0

    文章

    120

    浏览量

    9702
  • GPU芯片
    +关注

    关注

    1

    文章

    303

    浏览量

    5804
  • NVIDIA显卡
    +关注

    关注

    0

    文章

    15

    浏览量

    3149

原文标题:NVIDIA CPU+GPU超级芯片大升级!史无前例282GB内存

文章出处:【微信号:hdworld16,微信公众号:硬件世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

    市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper  GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X™ 以太网网络平台,该平台
    发表于 10-30 09:33 142次阅读
    <b class='flag-5'>NVIDIA</b> 以太网加速 xAI 构建的全球最大 AI <b class='flag-5'>超级</b>计算机

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 编辑 感谢平台提供的书籍,厚厚的一本,很有分量,感谢作者的倾力付出成书。 本书主要讲算力芯片CPU
    发表于 10-15 22:08

    名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    纸质媒体的高质量和专业网络媒体的信息更新速度。 算力芯片在最近15年有着巨大性能突破,这些年Intel的CPU芯片从双核128位SIMD到众核512位SIMD;NVIDIA
    发表于 09-02 10:09

    NVIDIA GB200超级芯片引领液冷散热新纪元

    ,特别是其单颗B200芯片功耗高达1000W,以及由一颗Grace CPU与两颗Blackwell GPU组成的超级芯片GB200功耗惊人地
    的头像 发表于 08-01 16:35 968次阅读

    NVIDIA GB200 CPU+GPU超级芯片功耗达2700W

    7月31日,集邦咨询发布的最新报告揭示了AI服务器领域的一个重要趋势:随着计算能力与功耗的同步攀升,特别是NVIDIA计划在年底推出的下一代Blackwell平台将带来显著的功耗增长,液冷散热技术正逐步成为行业标配,预计今年底其市场渗透率将达到10%。
    的头像 发表于 07-31 13:02 1012次阅读

    超级猛兽 GPU ?NVIDIA GeForce RTX 5090 基本频率接近 2.9 GHz

    ABSTRACT摘要根据最新传言,旗舰级NVIDIAGeForceRTX5090GPU看起来将是一款超级猛兽。据称,显卡的基本时钟速度将设定在2.9GHz左右,几乎达到3GHz的门槛
    的头像 发表于 07-12 08:26 433次阅读
    <b class='flag-5'>超级</b>猛兽 <b class='flag-5'>GPU</b> ?<b class='flag-5'>NVIDIA</b> GeForce RTX 5090 基本频率接近 2.9 GHz

    CPU渲染和GPU渲染优劣分析

    GPU的出现,基于GPU的渲染获得了很大的普及。这些GPU是特定用途的芯片,在某些情况下提供与CPU渲染相当的结果。从广义上讲,
    的头像 发表于 05-23 08:27 588次阅读
    <b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染优劣分析

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    CPU和72个Blackwell GPU,并通过NVIDIA NVLink技术连接。DGX SuperPOD可以通过NVIDIA Quantum InfiniBand连接多个机架,实
    发表于 05-13 17:16

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热 Embedding 全置于
    的头像 发表于 04-20 09:39 714次阅读

    AI服务器异构计算深度解读

    AI服务器按芯片类型可分为CPU+GPUCPU+FPGA、CPU+ASIC等组合形式,CPU+GPU是目前国内的主要选择(占比91.9%)
    发表于 04-12 12:27 606次阅读
    AI服务器异构计算深度解读

    NVIDIA推出搭载GB200 Grace Blackwell超级芯片NVIDIA DGX SuperPOD™

    NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell 超级
    的头像 发表于 03-21 09:49 692次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个,通过
    发表于 03-19 10:56 419次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI <b class='flag-5'>超级</b>计算

    深度解读Nvidia AI芯片路线图

    Nvidia是一个同时拥有 GPUCPU和DPU的计算芯片和系统公司。Nvidia通过NVLink、NVSwitch和NVLink C2C
    发表于 03-13 09:25 920次阅读
    深度解读<b class='flag-5'>Nvidia</b> AI<b class='flag-5'>芯片</b>路线图

    Nvidia与AMD新芯片,突破PCIe瓶颈

    AMD 和 NvidiaGPU 都依赖 PCI 总线与 CPU 进行通信。CPUGPU 有两个不同的内存域,数据必须通过 PCI
    的头像 发表于 03-08 14:15 664次阅读
    <b class='flag-5'>Nvidia</b>与AMD新<b class='flag-5'>芯片</b>,突破PCIe瓶颈

    为什么GPUCPU更快?

    GPUCPU更快的原因并行处理能力:GPU可以同时处理多个任务和数据,而CPU通常只能一次处理一项任务。这是因为GPU的架构使得它可以同时
    的头像 发表于 01-26 08:30 2392次阅读
    为什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?