0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

天翼云DPU技术研究和实践

西西 来源:SDNLAB 作者:SDNLAB 2022-09-07 15:32 次阅读

9月2日,第二届SmartNIC&DPU技术创新峰会在京举行,天翼云在2022 SmartNIC&DPU Awards年度评选中荣获匠芯技术奖。天翼云资深研发专家刘禄仁出席SmartNIC&DPU技术分会场并发表“天翼云DPU技术研究和实践”主题演讲,向行业分享天翼云以DPU为核心的新一代计算架构的研究及场景落地。

随着数据量爆发式增长,数据中心规模持续扩大,驱动网络带宽不断升级,以满足当前和未来云端海量数据流需求。在摩尔定律明显放缓的背景下,随着更高带宽的到来,CPU算力增长速度和数据中心网络传输速率增长速度的差距被逐渐拉大,效率更高的计算芯片成为刚需,DPU应运而生。

DPU作为计算负载的引擎,直接效果是给CPU“减负”,能够提高数据中心的运算效率,减少能耗浪费,进而降低成本,在数字时代具有巨大的商业价值与发展潜力。

天翼云作为国内领先的云服务商,抢跑DPU赛道,基于当前DPU技术演进路线,结合需求的零散化、动态变化以及对DPU产品线上运维问题的考量,以FPGA+CPU的架构作为切入点,成功研发出天翼云DPU1.0产品,并以DPU云核为基础打造了为云而生的全新云计算体系结构。天翼云DPU1.0实现了虚拟化的零损耗,具备高性能、低延迟、低抖动的特性,网络转发性能高达4000万PPS,存储云盘IOPS可以达到60W。此外,天翼云DPU1.0还可以将传统运行在主机侧的应用转到DPU云核上,减少大量的适配工作,在主机不同算力核和不同架构上做到即插即用。 在天翼云DPU1.0产品从研发到落地的过程中,天翼云DPU团队在网络、存储及RDMA方面进行了丰富的实践。

在网络卸载方面

针对流表数量大、转发性能要求高、对SoC和FPGA的内存容量需求大、稳定性要求高等挑战,天翼云对rte_flow等主要数据结构进行压缩,并对流表空中计算,优化裁剪offload卸载路径的多层级缓存,从而支持4M流表,实现了内存优化;对所有流表进行合并计算,避免在硬件层执行包重注,使转发效率达到4000万PPS;

基于硬件精确流表特点设计专用老化统计线程,减轻OVS Revalidator压力;初步拆分OVS的统计和老化事务逻辑,优化硬件流表的老化统计上报实现逻辑,提升软件OVS Revalidator执行效率;支持热升级、热迁移及热恢复,做到B/V/C全场景的并池,大幅提升稳定性。

在存储卸载方面

针对经常出现的SoC异常重启、SPDK异常重启、热迁移丢IO等现象,天翼云从中抽象出共同特性,利用软件协同的思想,将SoC侧软件的正常行为和异常行为进行统一,组件启动时统一发送msg信息给硬件,硬件收到该msg会解析其内容,进而从硬件保存的queue指针信息进行分析,在用户无感状态下实现全部异常的统一化处理。

在高性能网络方面

拥塞算法是RDMA的核心和关键,为提高RDMA网络的性能,天翼云聚焦下一代高效CC算法设计,以更好地避免拥塞、保证公平性,实现更快速收敛、更低时延、更简单部署。针对不同应用场景,天翼云设计了2套算法eSurfing-CC:

针对智能网卡+商用交换机的组合,提出基于RTT+CNP的2段式端到端CC算法,具有主动拥塞控制、无需依赖交换机的配置、支持快速启动快速收敛等优势;

针对智能网卡+可编程交换机的组网场景,在交换机上部署CC算法,使交换机同样具备主动拥塞通知能力和主动发包能力,可以有效降低端到端响应时延,同时简化建模和配置复杂度,提高系统的可扩展性。

目前,基于天翼云DPU核心技术打造的多款产品已落地应用,以天翼云弹性裸金属服务器为例,该服务器兼具云服务器弹性和物理机性能,通过将网络、存储等功能卸载至DPU卡,可极大降低物理机侧CPU和内存等资源消耗,最终算力远超普通云主机,现已服务于金融、汽车等多行业企业。

会上,还发布了2022 SmartNIC&DPU Awards年度评选结果,天翼云凭借以DPU云核为基础打造的全新一代云计算体系结构,荣获匠芯技术奖。该体系结构将计算、存储、网络和安全算力迁移到自研的软硬结合体系中,构建了面向不同算力、全国产化自主可控的第二平面,可实现网络、计算、存储资源云化加速,在DPU领域极具创新性。 DPU、CPU、GPU将成为未来计算市场的三大支柱,DPU作为计算市场的“芯”生事物,在技术标准和生态方面仍处于早期阶段,具有广阔的发展前景。未来天翼云将持续探索DPU技术,不断完善DPU产品,助力海量算力高效释放,助推数字经济发展。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    337

    浏览量

    24032
  • RDMA
    +关注

    关注

    0

    文章

    73

    浏览量

    8884

原文标题:干货!天翼云DPU技术解码

文章出处:【微信号:SDNLAB,微信公众号:SDNLAB】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    《数据处理器:DPU编程入门》DPU计算入门书籍测评

    , 数据加速应用 实践。 分别介绍了 DPU 技术和英伟达 DPU 技术DPU的诞生 现代计算架构
    发表于12-24 10:54

    IaaS+on+DPU(IoD)+下一代高性能算力底座技术白皮书

    了可观的经济效益。这种正向循环促进了相关 技术栈的快速迭代与成熟,也帮助他们发展成为 计算业务领域的领军企业。 随着众多芯片厂商投身到 DPU 技术领域后,业界对
    发表于07-24 15:32

    激光偏角测量技术研究.pdf

    激光偏角测量 技术研究.pdf
    发表于07-20 23:14

    物联网环境下的存储安全技术研究,不看肯定后悔

    物联网环境下的 存储安全 技术研究,不看肯定后悔
    发表于05-19 06:15

    什么是,是什么意思?

    什么是 , 是什么意思? 的英文全称是: “
    发表于05-21 09:38 1.3w次阅读

    中国电信与华为联手发布3.0

    中国电信广东公司在广州召开“聚势而为,从心定 —— 3.0华南节点”发布会,携手华为公司发布
    发表于12-08 15:42 769次阅读

    《企业上水平白皮书》发布提供实战指南

    实践才是检验真理的唯一标准。此次 云和中国信通院共同编写的《企业上 白皮书》从企业特点、企业诉求、上
    的头像 发表于12-27 11:59 1560次阅读

    存储上传文件存储操作攻略

    存储怎么上传文件? 是一款能够提供文件同步、备份及分享等服务的网络
    发表于06-28 11:11 4077次阅读

    中国电信发布AI和产品,推进数字化转型的最新实践

    5G 技术的成熟与大规模建设,正在推动人工智能与行业的融合发展。未来人工智能将颠覆哪些行业?11月8日,中国电信 即将揭晓答案。同时,
    的头像 发表于11-02 13:57 2364次阅读

    携手行业合作伙伴,构建应用生态

    11月18日,“5G+ +AI 与城市共成长”-- 云中国行在重庆成功举行,
    发表于11-19 09:10 929次阅读

    携手行业合作伙伴,构建应用生态

    11月18日,“5G+ +AI 与城市共成长”-- 云中国行在重庆成功举行,
    的头像 发表于11-19 14:25 2661次阅读

    软通动力成为首批MSP战略合作伙伴

    近日, 科技有限公司(以下简称“ ”)对2022年首批MSP伙伴招募结果公示,软通动力信
    的头像 发表于04-29 15:19 1364次阅读

    GTC 2023:百度智能DPU落地实践

    百度太行●计算:深度拥抱 DPU的弹性计算基础架构 百度智能 DPU落地 实践:极致弹性、高可用的裸金属实例 百度智能
    的头像 发表于03-24 16:22 3510次阅读
    GTC 2023:百度智能<b class='flag-5'>云</b><b class='flag-5'>DPU</b>落地<b class='flag-5'>实践</b>

    发布智算平台能力体系

    在第七届数字中国建设峰会期间,2024智算 生态大会于福州盛大召开。中国电信集团有限公司总经理助理、 科技有限公司董事长、总经理胡志强亲临大会主论坛,并隆重发布了
    的头像 发表于05-28 09:20 404次阅读

    DTCC2024前瞻:数据库专家共话TeleDB发展蓝图

    数据库首席 技术官李跃森将发表《 在数据库
    的头像 发表于08-19 14:53 122次阅读
    DTCC2024前瞻:<b class='flag-5'>天</b><b class='flag-5'>翼</b><b class='flag-5'>云</b>数据库专家共话TeleDB发展蓝图