1 NVIDIA BlueField-2 DPU性能测试方法-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA BlueField-2 DPU性能测试方法

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-01-04 14:25 次阅读

查看文末海报,免费注册成为 DOCA 开发者

DPU(数据处理器)将服务器和存储之间的 IOPS 性能提升至 4100 万以上,超过之前世界纪录的四倍。

数据中心需要超高速存储访问,而目前还没有哪个 DPU 的速度能比 NVIDIA BlueField-2 更快。

NVIDIA 近期测试显示,两个 BlueField-2 DPU(数据处理器)的每秒输入/输出(IOPS)性能达到 4150 万次,超过任何其他 DPU 性能的 4 倍。

BlueField-2 DPU 使用标准网络协议和开源软件打破性能纪录,使用业界常用的存储介质访问方法 NVMe over Fabrics(NVMe-oF)以及最通用的互联网协议之一 TCP 网络,其 4KB IOPS 性能超过 500 多万,而 512B IOPS 则达到 700 万至 2000 万以上。

为了加速 AI、大数据和高性能计算应用,BlueField 还支持流行的 RoCE 网络传输选项以提供更高的存储性能。

在测试中,initiator 端和 target 端都部署了 BlueField,使用不同类型的存储软件库和不同的应用来vwin 真实世界的存储配置,都展现出超强的性能。BlueField 在 InfiniBand 网络上还支持快速存储连接,而 InfiniBand 是许多 HPC 和 AI 应用的首选网络架构。

测试方法

BlueField 所达到的 4150 万 IOPS,是之前使用专有存储产品创造的 1000 万 IOPS 世界纪录的 4 倍多。这一性能是通过连接两台快速 Hewlett Packard Enterprise Proliant DL380 Gen 10 Plus 服务器实现的,其中的一台作为应用服务器(存储 initiator),另一台作为存储系统(存储 target)。

每台服务器均配备两个英特尔Ice Lake” 至强白金 2.3GHz 8380 处理器,支持 160 个超线程核以及 512GB 的 DRAM、120MB 的 L3 缓存(每个处理器60MB)和 PCIe Gen4 总线。

为了加速网络和 NVMe-oF,每台服务器均配备了两块 NVIDIA BlueField-2 P系列 DPU 卡,每块卡带有两个 100Gb 以太网端口,在 initiator 和 target 之间有四个网络端口合计 400Gb/s 线速带宽,并通过 NVIDIA LinkX 100GbE Direct-Attach Copper(DAC)无源电缆背对背连接。两台服务器均安装 Red Hat Enterprise Linux(RHEL)8.3 版本。

对于存储系统软件,测试 SPDK 和标准 upstream Linux 内核 target,使用默认内核 4.18 和最新内核之一 5.15。对三种不同的存储 initiator 进行了基准测试,分别为 SPDK、标准内核存储 initiator 和 SPDK FIO 插件。使用 FIO 和 SPDK 生成负载并进行测量,使用 4KB 和 512B 这两种常见的中型和小型存储 I/O 大小来测试。

在网络传输层使用了 TCP 和 RoCE 两种协议来测试 NVMe-oF 存储,每种配置都在全双向网络的条件下以 100% 读取、100% 写入和 50/50 读取/写入负载模型进行测试。

测试显示 BlueField DPU 还具有以下性能特点:

用较小的 512B I/O 大小测试,结果显示 IOPS 更高,但吞吐量低于端口线速,而用 4KB I/O大小测试,结果显示吞吐量很高,而 IOPS 有所降低。

100% 读取和100% 写入两种负载的 IOPS 和吞吐量性能类似,而 50/50 读/写混合负载由于充分使用网络连接的两个方向产生了更高的性能。

使用 SPDK 测试,得出的性能高于内核软件性能,但同时带来了更高的服务器 CPU 利用率,这是因为 SPDK 在用户空间中运行并不断进行轮询,因此这一情况在预期之内。

由于 Linux 社区会定期加入存储改进,因此较新的 Linux 5.15 内核比 4.18 内核表现更好。

创纪录的 DPU 存储性能

为存储安全提供了性能保障

在如今的存储领域,绝大多数云和企业部署都需要快速、分布式、通过以太网或 InfiniBand 访问的网络闪存。更快的服务器、GPU、网络和存储介质都要求服务器的 CPU 能够跟上,而最好的方法就是部署具有存储功能的 DPU。

BlueField-2 DPU 所展现的惊人存储性能,使整个数据中心的应用服务器和存储设备都具有更高的性能和效率。

在快速存储访问的基础上,BlueField 还支持对以太网存储流量和存储介质本身的硬件加速加密和解密,这有助于防止数据被盗或外泄。

它能以高达 100Gb/s 的速度卸载 IPsec(线上数据),以及高达 200Gb/s 的速度卸载 256 位 AES-XTS(静态数据),能够在对手入侵存储网络或者物理存储驱动器被盗、被出售或被不当处置的情况下,减少数据被盗的风险。

客户和领先的安全软件厂商正在使用最近更新的 BlueField 的 NVIDIA DOCA 框架,以在 DPU 上运行分布式防火墙,或提供微分段的安全组等网络安全应用,来进一步提高计算服务器的应用和网络安全,降低服务器存储的不当访问或数据修改风险。

NVIDIA BlueField-2 DPU 测试结果细节如下图:

使用 NMe-oF on TCP 测试 NVIDIA BlueField-2 DPU。测试结果是配置了两个 BlueField-2 DPU 的合并性能。

使用 NVMe-oF RoCE 测试 NVIDIA BlueField-2 DPU。测试结果是配置了两个 BlueField-2 DPU 的合并性能。

NVIDIA DOCA 现已开放接受申请,扫描下方海报二维码,或点击“阅读原文”,即可注册加入,抢先体验,走在技术前沿!

原文标题:NVIDIA BlueField 再创 DPU 性能世界纪录

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4978

    浏览量

    102981
  • DPU
    DPU
    +关注

    关注

    0

    文章

    357

    浏览量

    24169
  • 性能
    +关注

    关注

    0

    文章

    271

    浏览量

    18981

原文标题:NVIDIA BlueField 再创 DPU 性能世界纪录

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    电镀膜的性能测试方法

    电镀膜性能测试的几种主要方法。 1. 外观检查 外观检查是电镀膜性能测试的第一步,主要检查电镀膜的表面是否光滑、有无缺陷等。 表面粗糙度
    的头像 发表于 11-28 14:21 207次阅读

    NVIDIA DOCA-OFED的主要特性

    NVIDIA DOCA 软件平台释放了 NVIDIA BlueField 网络平台的潜力,并为NVIDIA BlueField和Connec
    的头像 发表于 11-09 13:50 249次阅读

    IaaS+on+DPU(IoD)+下一代高性能算力底座技术白皮书

    数据中心的第三颗“主力芯片”,主要通过其专用处理器优化数据中心的网络、存储、安全等处理性能,助力服务器运行效率显著提升,有效降低成本。因此,在新型数据中心建设时,围绕 DPU 构建数据中心网络的基础设施
    发表于 07-24 15:32

    NVIDIA BlueField-3 DPU助力思科提高工作负载安全性和运营效率

    、位置和外形尺寸的应用程序工作负载。 思科最近发布了Cisco Secure Workload 3.9 版,将企业的安全性和运营效率提升到了新的水平。它提供了新的功能来缓解威胁和漏洞,并为部署微分段(microsegmentation)提供了更大的灵活性。它现在还扩展到NVIDIA
    的头像 发表于 06-27 17:31 757次阅读

    中科驭数发布高性能DPU芯片K2-Pro

    在信息技术领域,每一次芯片技术的突破都代表着行业的一次飞跃。近日,DPU领域的领军企业中科驭数宣布,成功研发并发布了其第三代DPU芯片——“K2-Pro”。这款芯片的发布,标志着中科驭数在DP
    的头像 发表于 06-21 11:41 766次阅读

    性能测试的实现方法是什么

    性能测试是一种评估软件系统在不同负载下性能表现的测试方法。它可以帮助开发团队发现性能瓶颈,优化系
    的头像 发表于 05-29 15:44 609次阅读

    借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API,以便为 NVIDIA BlueField DPU 和 SuperNIC 创建高
    的头像 发表于 05-29 09:22 485次阅读

    NVIDIA DPU编程入门开课仪式在澳门科技大学成功举办

    5 月 24 日,NVIDIA DPU 编程入门开课仪式在澳门科技大学成功举办。作为首个在中国开设 NVIDIA DPU 编程相关课程的高校,来自澳门科技大学不同院系的师生共同见证了本
    的头像 发表于 05-28 09:40 391次阅读

    Nvidia的AI芯片路线图分析与解读

    SmartNIC智能网卡/DPU数据处理引擎的下一跳ConnectX-8/BlueField-4目标速率为 800G,与1.6T Quantum和Spectrum-X配套的SmartNIC和DPU的路标仍不明晰,NVLink5.
    发表于 04-29 09:59 985次阅读
    <b class='flag-5'>Nvidia</b>的AI芯片路线图分析与解读

    明天线上见!DPU构建高性能云算力底座——DPU技术开放日最新议程公布!

    技术在不同行业中的应用解决方案有哪些?能带来怎样的业务效果? 3月29日本周五,中科驭数集结产品大咖及解决方案专家团,诚邀您参加以“DPU构建高性能云算力底座”为主题的线上DPU技术开放日! 他们将逐一与您分享中科驭数系列
    的头像 发表于 04-03 18:12 998次阅读

    DC电源模块的安全性能评估与测试方法

    BOSHIDA DC电源模块的安全性能评估与测试方法 DC电源模块的安全性能评估与测试方法应包括
    的头像 发表于 03-08 11:15 688次阅读
    DC电源模块的安全<b class='flag-5'>性能</b>评估与<b class='flag-5'>测试</b><b class='flag-5'>方法</b>

    URAT测试性能测试方法

    Technology,非授权无线接入技术)测试作为确保无线通信设备性能的关键步骤,具有不可或缺的重要性。 URAT测试是一种针对非授权频谱中无线通信设备的性能
    的头像 发表于 03-06 10:29 499次阅读
    URAT<b class='flag-5'>测试</b>的<b class='flag-5'>性能</b><b class='flag-5'>测试</b><b class='flag-5'>方法</b>

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    网络平台上快速创建应用程序和服务,并启用 NVIDIA BlueField DPUNVIDIA BlueField SuperNIC
    的头像 发表于 02-23 10:02 463次阅读

    NVIDIA DOCA 2.5 长期支持版本发布

    正值 NVIDIA DOCA 面世三周年之际,NVIDIA 于近日发布了适用于 NVIDIA BlueField-3 网络平台的 NVIDIA
    的头像 发表于 12-26 18:25 404次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 2.5 长期支持版本发布

    《数据处理器:DPU编程入门》DPU计算入门书籍测评

    来说,DPU的需求也越来越大,大量边缘计算的算力需求在飙升,边缘数据预测,边缘决策,边缘图像识别,一个个需求都在暴增着未来Xlinx的业务肯定是会增长的,当然,有了国产替代就不一定了。 2、云计算 在云计算
    发表于 12-24 10:54