0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU/CPU玩腻了?一种新的算力芯片出现!大厂、资本热捧!

Carol Li 来源:德赢Vwin官网 网 作者:李弯弯 2021-07-26 07:36 次阅读

在2020年GTC大会上,NVIDIA创始人兼首席执行官黄仁勋谈到,在现代化、安全的加速数据中心中,DPU已成为其重要的组成部分。CPUGPU和DPU的结合,可构成完全可编程的单一AI计算单元,提供前所未有的安全性和算力。

DPU,全称是Data Processing Unit,是继承CPU、GPU之后,数据中心场景中的第三颗重要的算力芯片,为高带宽、低延迟、数据密集的计算场景提供计算引擎。

目前国内外已经有不少DPU玩家,根据THENEXTPLATFORM的分析指出,在2020年,国外主要玩家包括博通英特尔英伟达、Netronome、Pensando、Fungible和Xilinx,还包括云供应商三大巨头。

国内厂商DPU芯片厂商主要有芯启源、大禹智芯、中科驭数、星云智联等,近年来这几家厂商都在积极推进优化自家产品,并且资本也在积极投入到这个领域,近段时间,芯启源、星云智联都宣布完成不同数额的融资。

那么近几年兴起的DPU到底是什么,具有哪些功能?目前各大玩家都取得了怎样的成绩,该领域未来前景如何?

什么是DPU?

根据英伟达此前发布过的一篇文章显示,DPU是一种新型可编程处理器,集三个关键要素:

第一个是行业标准的、高性能及软件可编程的多核CPU,通常基于已应用广泛的Arm架构,与其的SOC组件密切配合;
第二个是高性能网络接口,能以线速或网络中的可用速度解析、处理数据,并高效地将数据传输到GPU和CPU。
第三个是各种灵活和可编程的加速引擎,可以卸载AI、机器学习、安全、电信和存储等应用,并提升性能。

所有这些DPU功能对于实现安全的、裸性能的、原生云计算的下一代云上大规模计算至关重要。

DPU可以用作独立的嵌入式处理器,但通常是被集成到SmartNIC(一种作为下一代服务器中关键组件的网卡)中。


DPU专注于数据处理,网络数据路径加速引擎至少需要具备下述10项功能:

1、像OVS(开放式虚拟交换机)一样对数据包进行解析、匹配和处理
2、基于Zero Touch RoCE的RDMA数据传输加速
3、通过GPU-Direct加速器绕过CPU,将来自存储和其他GPU的数据通过网络直接传给GPU
4、TCP通信加速,包括RSS、LRO、checksum等操作
5、网络虚拟化的VXLAN和Geneve Overlay卸载和VTEP卸载
6、面向多媒体流、CDN(内容分发网络)和新的4K / 8K IP视频(如基于ST 2110规范的RiverMax)的“Packet Pacing”流量整形加速
7、电信Cloud RAN的精准时钟加速器,例如5T for5G(精准时钟调度5G无线报文传输技术)功能
8、在线IPSEC和TLS加密加速,但不影响其它正在运行的加速操作
9、支持SR-IOV、VirtIO和PV(Para-Virtualization)等虚拟化
10、安全隔离:如信任根、安全启动、安全固件升级以及基于身份验证的容器和应用的生命周期管理等

国内都有哪些厂商在布局DPU?

数据中心建设带动DPU未来发展,根据根据Fungible和Nvidia的预测,用于数据中心的DPU量级将达到和数据中心服务器等量的级别。目前,服务器每年新增大约千万量级,每台服务器可能没有GPU,但一定会有一颗或者多颗DPU,每颗DPU如果1万元计算,这将是千亿量级的市场规模。

面对如此大的市场规模,而且因为是新兴产品类型,国内外差距其实不会很大,目前国内已经有多家厂商正在加速布局,并不时传出新进展,同时芯片是一个需要大额资金投入研发的行业,可以看到,资本也在积极投资,与企业一起共同加快推动该领域的规模量产应用。


芯启源

芯启源是一家针对超大规模电信和企业级的智能网络提供核心芯片和系统的企业,致力于打造DPU产业生态,快速布局5G云数据中心和高端EDA市场,为云数据中心提供最优的智能网卡,为芯片设计公司提供最具竞争力的仿真EDA解决方案。

芯启源有量大板块核心产品,该公司的智能网卡是目前国内唯一基于SoC架构的成熟DPU的完整解决方案,并拥有自主知识产权,已经成熟量产,可提供从芯片、板卡、驱动软件和全套云网解决方案产品。

据介绍,中国移动苏研院的首批智能网卡订单正是采购的芯启源的产品,在中移动大云系统网络层面,芯启源智能网卡通过透明卸载SDN控制器关键云网流表至网卡硬件中加速,可彻底释放大量被网络业务消耗的服务器CPU和内存资源,全面提升中移动云机虚拟化效率,双方已成立了联合实验室,将共同推进下一代智能网卡开发。

芯启源在今年2月和今年6月分别完成了数亿元的Pre A2和Pre A3轮融资,Pre A3轮融资由SIG海纳亚洲、浦东科创、晶晨半导体、熠美投资等联合投资,该公司表示,本轮融资将继续用于吸引全球尖端研发与管理人才加入芯启源团队,并启动DPU芯片下一阶段技术研发和市场拓展。

大禹智芯

大禹智芯致力于DPU产品设计、研发和服务,核心团队拥有十年以上云计算平台设计、研发和运营的经验,曾服务于百度、阿里、美团及英特尔、思科等公司,对云计算平台的使用场景及基础设施的搭建有着清晰的理解和丰富的实践经验。

大禹智芯的DPU产品具有高速网络处理、无缝对接分布式存储和裸金属管理等功能特性,可广泛应用于云计算、数据中心、边缘计算、5G等领域,产品面向企业客户,目前已经完成第一代产品的测试工作,正在批量生产过程中,产品预计将于今年第三季度出货。第一代产品主要应用于边缘平台,流量编排与管控等两方面,并且已经开始研发100G产品,将面向更广阔的云计算场景。

公司于本月9日宣布完成数千万元Pre-A轮融资,由华义创投和奇绩创坛投资,据介绍,本轮融资资金将用于DPU产品的研发、生产投入以及高端人才的引入,大禹智芯在成立初期还获得了由中科创星和惟一资本联合投资的天使轮融资。

中科驭数

中科驭数成立于2018年,专注于专用处理器研发,致力于解决后摩尔定律时代通用算力不足的核心问题,为智能时代提供核心芯片和解决方案。

公司创新性地提出了软件定义加速器技术,自主研发了KPU芯片架构,打造了业界首颗拥有网络数据库一体化加速功能的DPU芯片和智能网卡系列产品和解决方案。

2019年中科驭数基于自研的KPU架构流片了K1芯片,目前解决方案主要落地于金融场景。今年3月31日,该公司发布了下一代DPU芯片计划,将基于自研的KPU芯片架构,推出新一代DPU芯片K2,该芯片可应用于金融科技、数据中心、混合云及边缘计算等高带宽、低延迟、数据密集型的计算场景。

K2的功能包括完善的L2/ L3/L4层的网络协议处理,可处理高达200G网络带宽数据。融合了数据库、大数据处理能力,直接面向OLAP、OLTP及大数据处理平台,还囊括了机器学习计算核以及安全加密运算核,该颗芯片预计将于2021年底流片。

星云智联

星云智联专注于数据中心基础互联通信架构和DPU芯片研发,致力于构建数字世界算力的智能连接和开放生态,让云计算和数据中心成为构建未来数字社会的坚实基础。

公司汇聚了来自硅谷、以色列、加拿大等地ICT领域顶尖专家,这支过往成功的实现了多领域通信与网络芯片开发的团队,是目前国内唯一达到了全球领先水平,真正有能力开发出DPU及其生态系统的团队,核心成员都参与了网络大芯片从零到一探索、发展、优化、超越的全过程,具备全系统、长周期工程开发经验,拥有对云计算、互联网、运营商等多场景的深度理解,以及设计满足不同市场需求产品的能力。

星云智联近日宣布完成数亿元Pre-A轮融资,本轮融资由老股东鼎晖VGC领投,现有投资方高瓴创投、华登国际继续追加投资;BAI资本、复星、华金投资、金浦投资、嘉御基金、松禾资本、沃赋资本等多家投资机构跟投,在三个月前该公司才完成天使轮融资。

星云智联认为,无论从市场的分散度,还是细分市场的可复制性两个维度考虑,DPU赛道都满足独立芯片公司成长的条件。在完成这轮融资后,星云智联将持续引入多领域研究型人才构筑技术纵深竞争力,引入开源和生态建设运营人才构筑生态影响力和新商业模式。

DPU芯片赛道未来前景如何?

从上述内容来看,目前在DPU芯片布局的厂商还不算多,因为毕竟是一个新兴赛道,不过从国内几家公司的融资情况来看,资本对DPU的青睐程度倒是很高,可以看到,芯启源、大禹智芯、星云智联近来都宣布完成融资,其中芯启源、星云智联在两三个月时间就完成三轮融资。为何资本看好这个全新赛道?

首先,从这个行业未来可能的市场规模来看,可以说是相当巨大,当前全球算力需求早已远超算力的增长速度,云数据中心发展正面临软硬件的颠覆性变革,DPU应运而生,负责数据中心传输和数据处理,与CPU、GPU共同组成未来计算的三大支柱。

DPU可以解放CPU的算力,释放服务器的负载,并凭借低功耗显著降低综合成本,未来每台服务器都一定需要一颗或者多颗DPU,好比每台服务器都必须配网卡一样,就如上文提到的,用于数据中心的DPU量级将达到和数据中心服务器等量的级别,而且目前服务器每年以大约千万量级增长,DPU的市场规模达到千亿量级。

另外,除了市场规模巨大以外,下游数据中心厂商已经在积极部署,包括中国移动、亚马逊、阿里等巨头厂商都已经部署DPU产品,未来,在这些下游厂商的需求推动下,DPU芯片的产品和市场也更容易走向成熟、走向规模化。

整体而言,DPU在数据中心的应用未来前景可期,不过也有值得关注的地方,比如虽然大型云服务厂商已经大量部署了DPU产品,不过DPU产品真正商业化还不算成功,因为目前市面上DPU产品功能覆盖和场景覆盖能力不足,难以满足不同客户对于DPU产品快速使用的需求,因此,未来DPU芯片厂商、云服务厂商、资本等还需要携手积极优化产品、推进应用,共同促进DPU产业发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4756

    浏览量

    102349
  • DPU
    DPU
    +关注

    关注

    0

    文章

    337

    浏览量

    24034
  • 算力
    +关注

    关注

    1

    文章

    807

    浏览量

    14525
收藏 人收藏

    评论

    相关推荐

    服务器为什么选择GPU

    随着人工智能技术的快速普及, 需求日益增长。智 中心的服务器作为支撑大规模数据处理和计算的核心设备,其性能优化显得尤为关键。而 GPU服务器也进入了大众的视野,成为高性能计算的首选。那
    的头像 发表于07-25 08:28 196次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>服务器为什么选择<b class='flag-5'>GPU</b>

    IaaS+on+DPU(IoD)+下代高性能底座技术白皮书

    DPU 是当下 基础设施的核心创新之 。如果把 CPU比做大脑,那么 GPU就好比是肌肉,而 DPU 就是神经中枢。
    发表于07-24 15:32

    CPU渲染和GPU渲染优劣分析

    GPU出现,基于 GPU的渲染获得了很大的普及。这些 GPU是特定用途的 芯片,在某些情况下提供与 CPU
    的头像 发表于05-23 08:27 391次阅读
    <b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染优劣分析

    揭秘芯片:为何它如此关键?

    在数字化时代, 芯片作为电子设备的核心组件,其性能直接关系到设备的运行速度和处理能力。而 芯片 ,即其计算能力,更是衡量 芯片性能的重要指标。
    的头像 发表于05-09 08:27 575次阅读
    揭秘<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>:为何它如此关键?

    AMD推出锐龙8000嵌入式处理器,AI高达39 T

    此款 CPU选用4纳米制程、AMD基于“Zen 4”架构的 CPU核心以及使用RDNA 3架构 GPU和XDNA架构NPU,实现高达39TOPS的AI
    的头像 发表于04-03 10:39 613次阅读

    Sora需求引发业界对集结国内AI企业的探讨

    据周鸿祎观察,Sora视频分析所需 恐远超千亿规模模型。因而,考虑到如今国内 芯片供应受限, 问题至关重要。事实上,Meta已有约50万台
    的头像 发表于02-25 10:03 413次阅读

    gpu是什么和cpu的区别

    GPUCPU是两 常见的计算机处理器,它们在结构和功能上有很大的区别。在这篇文章中,我们将探讨 GPUCPU的区别,并详细介绍它们的原理、
    的头像 发表于02-20 11:24 1.2w次阅读

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    深入了解浮点运算—CPUGPU是如何计算的?

    随着国家大力发展数字经济, 的提升和普惠变得越来越重要。在数字化时代, 已成为推动科技发展和创新的关键要素。
    的头像 发表于01-18 18:20 2819次阅读
    深入了解浮点运算—<b class='flag-5'>CPU</b>和<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>是如何计算的?

    ChatGPT芯片如何做输出

    卡的核心当然还是计算 芯片,会搭配大容量高带宽的内存、缓存,以及搭载 CPU用于调度,为了帮助数据传输,便会使用高速通道,这便是PCIe(高速串行计算机扩展总线标准)在系统中的作用:提
    发表于01-11 10:01 353次阅读
    ChatGPT<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>如何做<b class='flag-5'>算</b><b class='flag-5'>力</b>输出

    GPU是显卡吗cpugpu哪个

    很大的区别,因此它们的计算能力也不同。 首先,我们来看 CPU(中央处理器)的 CPU一种
    的头像 发表于01-10 15:45 4207次阅读

    文读懂:什么是“”?

    的定义 即计算能力(ComputingPower)。《中国 白皮书(2022年)》将其定
    的头像 发表于12-22 08:27 5849次阅读
    <b class='flag-5'>一</b>文读懂:什么是“<b class='flag-5'>算</b><b class='flag-5'>力</b>”?

    浅谈DPU和CPUGPU的关系

    CPU大部分 卸载给 GPU之后,人们发现可以把很多其他功能也外包出去,于是又有了智能网卡,或者叫做DPU。
    发表于12-14 11:44 634次阅读
    浅谈DPU和<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>的关系

    什么是可分为哪些类别?

    计算是人类解决问题的 一种方式。 在漫长的历史长河中,人类遇到过很多问题,都需要通过计算来解决。这些计算任务,仅凭大脑这个“原生” 工具,是无法完成的。 于是,人类发明了很多
    的头像 发表于11-20 09:27 1.2w次阅读
    什么是<b class='flag-5'>算</b><b class='flag-5'>力</b>?<b class='flag-5'>算</b><b class='flag-5'>力</b>可分为哪些<b class='flag-5'>算</b><b class='flag-5'>力</b>类别?

    人工智能为什么需要GPU

    GPU前面加 个“GP”,就变为General-Purpose Computing on Graphics Processing Units,即通用计算图形处理器。我们去术语化,可以直接说这是 一种用于处理非特定需求(通用类型)计
    发表于11-10 14:48 5295次阅读
    人工智能<b class='flag-5'>算</b><b class='flag-5'>力</b>为什么需要<b class='flag-5'>GPU</b>?