0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心
发布

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

NVIDIA英伟达企业解决方案 来源:未知 2023-05-30 01:40 次阅读

新型AI超级计算机将 256 个 Grace Hopper 超级芯片连接为巨大的、1-Exaflop、144TBGPU,用于支持生成式 AI、推荐系统和数据处理的巨型模型

COMPUTEX—2023 年 5 月 29 日—NVIDIA 今天宣布推出一款新型大内存 AI 超级计算机——由 NVIDIA GH200 Grace Hopper 超级芯片和 NVIDIA NVLink Switch System 驱动的NVIDIA DGX 超级计算机,旨在助力开发面向生成式 AI 语言应用、推荐系统和数据分析工作负载的巨型、下一代模型。

NVIDIA DGX GH200的超大共享内存空间通过NVLink 互连技术以及NVLink Switch System使 256 个 GH200 超级芯片相连,使它们能够作为单个 GPU 运行。其提供 1 exaflop 的性能和 144 TB 的共享内存——相较 2020 年推出的上一代 NVIDIA DGX A100 内存大了近 500 倍。

NVIDIA 创始人兼首席执行官黄仁勋表示:“生成式 AI、大型语言模型和推荐系统是现代经济的数字引擎。DGX GH200 AI 超级计算机集成了 NVIDIA 最先进的加速计算和网络技术来拓展 AI 的前沿。”

NVIDIA NVLink 技术大规模扩展 AI

GH200 超级芯片使用NVIDIA NVLink-C2C芯片互连,将基于Arm的 NVIDIA GraceCPU与 NVIDIA H100 Tensor Core GPU 整合在一起,从而不再需要传统的 CPU 至 GPU PCIe 连接。与最新的 PCIe 技术相比,这将 GPU 和 CPU 之间的带宽提高了 7 倍,将互连功耗减少了 5 倍以上,并为 DGX GH200 超级计算机提供了一个 600GB 的 Hopper 架构 GPU 构建模块。

DGX GH200 是第一款将 Grace Hopper 超级芯片与 NVIDIA NVLink Switch System 配对使用的超级计算机,这种新的互连方式使 DGX GH200 系统中的所有 GPU 作为一个整体协同运行。上一代系统在不影响性能的前提下只能通过 NVLink 把 8 个 GPU 整合成一个 GPU。

DGX GH200 架构相比上一代将 NVLink 带宽提升了 48 倍以上,实现在单个 GPU 上通过简单编程即可提供大型 AI 超级计算机的能力。

面向 AI 先锋的新研究工具

谷歌云、Meta 和微软是首批有望接入 DGX GH200 来探索其用于生成式 AI 工作负载的能力的公司。NVIDIA 还打算将 DGX GH200 设计作为蓝图提供给云服务提供商和其他超大规模企业,以便他们能够进一步根据他们自己的基础设施进行定制。

谷歌云计算副总裁 Mark Lohmeyer 表示:“构建先进的生成式模型需要创新的 AI 基础设施。Grace Hopper 超级芯片的全新 NVLink 和共享内存解决了大规模 AI 的关键瓶颈,我们期待它在谷歌云以及我们的生成式 AI 计划中发挥强大的能力。”

Meta 基础设施、AI 系统及加速平台副总裁 Alexis Björlin 表示:“随着 AI 模型规模越来越大,它们需要可扩展的强大基础设施,以满足不断增长的需求。NVIDIA 的 Grace Hopper 设计看起来能够让研究人员探索新的方法来解决他们面临的最巨大挑战。”

微软 Azure 基础设施企业副总裁 Girish Bablani 表示, “在以往训练大型 AI 模型是一项资源和时间密集型任务。DGX GH200 所具备的处理 TB 级数据集的潜力使得开发人员能够在更大的规模和更快的速度下进行高级别的研究。”

全新 NVIDIA Helios 超级计算机将推进研发

NVIDIA 正在打造自己的基于 DGX GH200 的 AI 超级计算机,以支持研发团队的工作。

这台名为 NVIDIA Helios 的超级计算机将配备四个 DGX GH200 系统。每个都将通过 NVIDIA Quantum-2 InfiniBand 网络互连,以提高训练大型 AI 模型的数据吞吐量。Helios 将包含 1024 个 Grace Hopper 超级芯片,预计将于今年年底上线。

完全集成,专为巨型模型而构建

DGX GH200 超级计算机包含 NVIDIA 软件,可为最大的 AI 和数据分析工作负载提供一个交钥匙式全栈解决方案。NVIDIA Base Command 软件提供 AI 工作流程管理、企业级集群管理和多个加速计算、存储和网络基础设施的库,以及为运行 AI 工作负载而优化的系统软件。

此外还包含NVIDIA AI Enterprise,即 NVIDIA AI 平台的软件层。它提供 100 多个框架、预训练模型和开发工具,以简化生成式 AI、计算机视觉、语音 AI 等生产 AI 的开发和部署。

供货情况

NVIDIA DGX GH200 超级计算机预计将于今年年底上市。

观看黄仁勋在 COMPUTEX 2023 的主题演讲中介绍NVIDIA DGX GH200 超级计算机

3a09e2ea-fe47-11ed-90ce-dac502259ad0.png

点击 “阅读原文”,或 扫描下方海报二维码,观看 NVIDIA 创始人兼 CEO 黄仁勋为 COMPUTEX 2023 带来的主题演讲直播回放,了解 AI、图形及其他领域的最新进展!


原文标题:COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3597

    浏览量

    89579

原文标题:COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英伟达GH200、特斯拉Dojo超级算力集群,性能爆棚!算力之争加剧!

    德赢Vwin官网 网报道(文/李弯弯)今年8月,在 计算机图形学顶会SIGGRAPH 2023现场,英伟达发布了新一代 GH200Grace Hopper平台,该平台专为处理大语言模型、推荐系统、矢量数据库等
    的头像 发表于09-14 09:10 2908次阅读
    英伟达<b class='flag-5'>GH200</b>、特斯拉Dojo<b class='flag-5'>超级</b>算力集群,性能爆棚!算力之争加剧!

    借助NVIDIA超级计算机加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA驱动的 超级 计算机,验证了量子 计算的商业化途径。
    的头像 发表于07-25 09:55 350次阅读

    NVIDIAAIEnterprise荣获金奖

    NVIDIA AIEnterprise、 GH200Grace Hopper 超级芯片和 Spectrum-X 在 COMPUTEX20
    的头像 发表于05-29 09:27 297次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise荣获金奖

    NVIDIA和Recursion利用AI超级计算机加快新药研发

    BioHive 由 NVIDIA AI驱动,用于加速医疗领域科学家的工作。在全球 超级 计算机TOP500 榜单中,它的排名上升了 100 多位。
    的头像 发表于05-16 09:46 1060次阅读
    <b class='flag-5'>NVIDIA</b>和Recursion利用<b class='flag-5'>AI</b><b class='flag-5'>超级</b><b class='flag-5'>计算机</b>加快新药研发

    进一步解读英伟达 Blackwell 架构、NVlink及GB200超级芯片

    2024年3月19日,[英伟达]CEO[黄仁勋]在GTC大会上公布了新一代 AI芯片架构BLACKWELL,并 推出基于该架构的 超级芯片GB 200,将助推数据处理、工程模拟、电子设计自动化
    发表于05-13 17:16

    NVIDIABlackwellDGXSuperPOD助力万亿级生成式AI计算

    全新 DGXSuperPOD 采用新型高效液冷机架级扩展架构,基于 NVIDIA DGXGB 200系统构建而成,在 FP4 精度下可提供 11.5 exaflops 的
    发表于03-21 09:49 141次阅读

    NVIDIA推出搭载GB200Grace Blackwell超级芯片的NVIDIADGXSuperPOD™

    NVIDIA于太平洋时间 3 月 18 日发布新一代 AI 超级 计算机—— 搭载 NVIDIAGB
    的头像 发表于03-21 09:49 513次阅读

    NVIDIA推出Blackwell 架构DGXSuperPOD,适用于万亿参数级的生成式AI超级计算

    —— NVIDIA于今日发布新一代 AI 超级 计算机—— 搭载 NVIDIAGB 200
    发表于03-19 10:56 270次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>推出</b> Blackwell 架构 <b class='flag-5'>DGX</b> SuperPOD,适用于万亿参数级的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>

    Tesla 计划斥资 5 亿美元建造一台由NVIDIAAIGPU 提供支持的 Dojo超级计算机

    ABSTRACT摘要Tesla计划斥资5亿美元建造一台由 NVIDIA的AIGPU提供支持的Dojo 超级 计算机,因此该公司正在加大基于 AI的开发力度。JAEALOT2024年1月27日T
    的头像 发表于02-19 12:45 454次阅读
    Tesla 计划斥资 5 亿美元建造一台由 <b class='flag-5'>NVIDIA</b> 的 <b class='flag-5'>AI</b> GPU 提供支持的 Dojo <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    AWS成为第一个提供NVIDIAGH200Grace Hopper超级芯片的提供商

    2023年的AWS re:Invent大会上,AWS和 NVIDIA宣布AWS将成为第一个提供 NVIDIA GH200Grace Hopper 超级
    的头像 发表于11-30 09:24 500次阅读
    AWS成为第一个提供<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GH200</b> Grace Hopper<b class='flag-5'>超级</b>芯片的提供商

    亚马逊云科技与NVIDIA宣布开展战略合作,为生成式AI提供全新超级计算基础架构、软件和服务

    亚马逊云科技将提供首款搭载 NVIDIAGrace Hopper 超级芯片 和亚马逊云科技可扩展性 UltraCluster 的云 AI 超级
    的头像 发表于11-29 21:00 497次阅读
    亚马逊云科技与 <b class='flag-5'>NVIDIA</b> 宣布开展战略合作,为生成式 <b class='flag-5'>AI</b> 提供全新<b class='flag-5'>超级</b><b class='flag-5'>计算</b>基础架构、软件和服务

    Blackwell GB100能否在超级计算机AI市场保持领先优势?

    NVIDIA下一代 Blackwell GB100 传将采用芯片堆栈设计提升效能和效率,但也面临工艺和封装的挑战,能否在 超级 计算机AI市场保持领先优势?
    的头像 发表于10-24 17:43 792次阅读

    NVIDIAAI现已在 Oracle Cloud Marketplace推出

    OCI 在业内率先扩展了企业对 NVIDIA DGXAI 超级 计算平台和 NVIDIA
    的头像 发表于10-24 10:30 342次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> 现已在 Oracle Cloud Marketplace <b class='flag-5'>推出</b>

    NVIDIAGrace Hopper超级芯片横扫MLPerf推理基准测试

    平台无论是在云端还是网络边缘均展现出卓越的性能和通用性。 此外, NVIDIA宣布 推出全新推理软件,该软件将为用户带来性能、能效和总体拥有成本的大幅提升。 GH200 超级
    发表于09-13 09:45 623次阅读
    <b class='flag-5'>NVIDIA</b> Grace Hopper<b class='flag-5'>超级</b>芯片横扫MLPerf推理基准测试

    NVIDIAGrace Hopper超级芯片横扫 MLPerf 推理基准测试

    平台无论是在云端还是网络边缘均展现出卓越的性能和通用性。 此外, NVIDIA宣布 推出全新推理软件,该软件将为用户带来性能、能效和总体拥有成本的大幅提升。 GH200 超级芯片在
    的头像 发表于09-12 20:40 354次阅读