就如同智能手机10余年前在移动通信掀起的革命一样,以太网的格局也在慢慢发生变化,数据中心里的以太网通信正在被SmartNIC改写。SmartNIC作为这个时代智能网卡的代名词,提供了远高于CPU的通信效率,加上可编程的特性,足以跟上网咯协议不断的变化的步伐。
再次以我们的手机为例,手机的负载在近年来其实增长并不大,即便存在图形计算或是AI计算的压力,但基本都能胜任它们被赋予的角色。正因如此,摩尔定律的推进得以为其提供源源不断的“芯”动力。但这在数据中心端是恰恰相反的,我们所追求的科技小型化在这里并不适用,庞大的机架与复杂的线路比比皆是。
这是因为数据中心工作负载的增加速度要远快于摩尔定律,虚拟化与微服务将不少数据中心CPU性能分得一干二净。服务器因为运行数据中心软件定义的网络架构而处于满载状态,这个占比在每年3000多万出货量的服务器中达到了三分之一。SmartNIC作为分担这些负载的重要组成部分,已经在数据中心普及了。
考虑到目前数据中心与云计算成了销售占比与利润率最高的业务,不少厂商都将SmartNIC视为一块香饽饽。一些大力发展数据中心的厂商也开启了疯狂收购,将知名的SmartNIC难入麾下,比如被英伟达收购的Mellanox,被AMD收购的Xilinx。除此之外,不少云服务厂商,例如微软的Azure以及亚马逊的AWS,也纷纷开始自研自己的SmartNIC。
英伟达
英伟达的ConnectX-7是一块针对现代云计算、AI以及传统企业负载的SmartNIC,支持1/2/4个NRZ、PAM4网络端口,在不同的端口配置下最高可做到400Gb/s的带宽。ConnectX-7集成了最新PCIe5.0 x16/x32的主机接口,不仅支持PCIeFHHL/HHHL这样常规的PCIe智能网卡配置,也支持OCP 3.0 SFF这样的小卡。
ConnectX-7上的英伟达自研芯片 / 英伟达
ConnectX-7这张卡最强大的地方不在其带宽,而是在与其配套的技术上。内建了英伟达的交换与数据包处理加速技术(ASAP),通过ASIC嵌入式交换机,既裸机服务器提供了极高的性能和效率,也为虚拟化和容器提供了SDN加速。
同时ConnectX-7也通过RoCE和GPUDirectStorage这样的技术,实现了高性能的存储和数据访问,对于NVMe-oF这种存储架构来说也可以通过RoCE和TCP同时加速,可以说是与当下主流的数据中心架构兼容了。
中科驭数
国内其实也有不少在发展智能网卡的公司,中科驭数正是其中一家。中科驭数的SWIFT-2100N是一款主打高性能和超低时延的SmartNIC,基于其自研KPU架构的DPU芯片打造而成,实现了芯片级的网络卸载,支持全硬件有状态TCP、UDP、ARP、ICMPv4和IGMPv3协议的卸载。
中科驭数DPU / 中科驭数
既然主打高性能和低时延,我们就来看一看这方面的性能。SWIFT-2100N在DPU的加持下,INT8算力最高可以达到18.6TOPS,片外内存容量64GB,总带宽可达77GB/s。在时延方面,其内部TCP/IP协议处理时延在200ns左右,1/2RTT时延低于1.2us,网络抖动小于20ns,如此优秀的时延表现特别适合一些金融计算、视频点播场景。
除了Xilinx之外,同为FPGA厂商的英特尔也有自己的SmartNIC,其N6000-PL基于自家的Agilex高性能FPGA,在英特尔以太网控制器E810和PAC N3000的支持下,提供了2x100GE的连接性,支持多种通信负载,比如开源虚拟交换机、vRouter、5G用户平面功能和分段路由版本、vRAN等等。
在接口上,N6000-PL支持PCIe4.0 x16以及DDR4内存。FPGA提供的极高灵活性让N6000-PL成了不少移动网络基础设施虚拟化部署的首选。比如启碁和Silicom都推出了基于N6000-PL的智能网卡,或用于4G/5G的vRAN,或用于5G NR的前向纠错和前传网络紧急同步。
小结
尽管现在的SmartNIC提供了足够的网络性能,不过如果你的使用场景属于世界上最大的几个数据中心,或是通信需求特别高的话,还是需要用到DPU。正如Broadcom曾经提出的一种比喻,SmartNIC就像是大服务器中的小服务器,而DPU则是可以作为独立的网络端点,但不管怎么说,SmartNIC都将在大数据驱动的网络环境下留下自己的重要印记。
-
英伟达
+关注
关注
22文章
3770浏览量
90984 -
Mellanox
+关注
关注
0文章
15浏览量
9372 -
中科驭数
+关注
关注
0文章
118浏览量
3985
发布评论请先 登录
相关推荐
评论