1 双向4Tbps、兼容PCIe5.0!英特尔光学I/O chiplet再突破-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

双向4Tbps、兼容PCIe5.0!英特尔光学I/O chiplet再突破

Hobby观察 来源:德赢Vwin官网 作者:梁浩斌 2024-07-05 09:04 次阅读

数据中心高速传输是提升目前算力的重要技术之一,光通信已经在数据中心内部服务器互联中广泛应用,而在更微观的角度,光互连还能够被应用到主板上CPUGPU的互连,甚至是更小尺度下的片上互连。

在2024年光纤通信大会(OFC)上,英特尔集成光子解决方案(IPS)部门展示了业界首款完全集成的光学计算互连(OCI)chiplet芯粒,该芯粒与英特尔CPU封装在一起,将过去通过铜线实现的电气I/O接口传输数据,变成采用光学I/O解决方案,实现了高带宽片上互连的突破。

AI数据中心,需要更高带宽的互连

随着“百模大战”的打响,目前市面上琳琅满目的AI大模型产品都需要大量的算力进行支撑,包括模型研发阶段的训练以及在实际落地中进行的推理计算都需要海量算力。随着AI模型变得越来越复杂,它们需要更多的计算资源和数据交换能力。高带宽互连可以提供必要的数据吞吐量,以支持这些大型模型的训练和推理。

而目前数据中心算力提升主要包括两部分,一是采用算力更高的计算卡,二是提高大规模数据中心服务器或CPU和GPU之间的带宽,提高整体系统的效率,比如英伟达的NVLink、AMD/英特尔/谷歌/微软等巨头共同组建的UALink标准等。

而从更加微观的角度来看,在算力芯片中,每个模块或者说每个Die、chiplet模块之间其实也需要进行互连。以往芯片上都采用传统的电互连,铜作为电传输信息的介质。但毕竟铜是有电阻的,在高速数据传输过程中,发热、损耗、功耗等都较高,相比之下,光传输损耗极低,且过程中不产生热量,非常适合解决数据传输瓶颈问题。

在AI计算中,尤其是深度学习算法通常需要大量的并行计算,更高带宽的互连能够让芯片上信息交换效率大大提升,从而实现更高效的并行处理。另外在chiplet封装的趋势下,多个模块封装在同一基板上集成为单颗SoC,更高速的片上互连则能加快这些芯粒之间的数据传输,从而提升计算能力。

从结构上看,片上光互连其实是一种光子集成芯片技术,将不同功能的有源器件和无源器件集成在同一块光电基板上。光电基板上具有光子路由波导,这些波导被用于数据通信,和用于电路走线的多层金属层。CMOS电芯片堆叠在硅光芯片上,在光电基板上形成二维阵列。

光从基板上的激光光源中发出,输入到基板上的路由波导,通过波导到达光芯片上的调制器。这个时候电芯片上的信息数据,通过电芯片和光芯片之间的微凸块加载到环形调制器中,将数字1和0转换为光的强度差异。

调制后的光信号通过光电基板上的波导传播,到达其他光芯片上的光电探测器中。这个时候光信号就被转换成电信号,这些信息就被不同的电芯片所接收。

当然在实际应用中,每个CMOS芯片和光芯片之间,都有数以千计的微凸块被用于数据传输。因为光信号传播不需要铜导线,损耗小,延迟低,这样就实现了在光电基板上进行高能效、高带宽密度、低延迟的光互连。

英特尔的集成OCI芯粒有哪些亮点?

据英特尔介绍,在OFC上展示的OCI芯粒集成了硅光子集成电路,包括片上激光器和光放大器、与电子集成电路。OCI芯粒除了在现场展示的与英特尔CPU封装在一起外,还可以与下一代的CPU、GPU、IPUs以及其他SoC集成。

英特尔OCI支持高达4Tbps的双向数据传输速率,与第五代PCIe兼容。在OFC现场光学链路演示展示了两个CPU平台之间通过单模光纤(SMF)跳线连接的发射机(Tx)和接收机(Rx)。CPU生成并测量了光比特错误率(BER),演示展示了在单根光纤上8个波长、200GHz间隔的Tx光谱,以及一个32Gbps的Tx眼图,展示了强大的信号质量。

目前的OCI芯粒支持每个方向上64个通道的32Gbps数据传输,传输距离可达100米(尽管由于飞行时间延迟,实际应用可能限制在几十米以内),使用八对光纤,每对携带八个密集波分复用(DWDM)波长。共封装解决方案的能效也非常高,每比特仅消耗5pJ,相比之下,可插拔光收发模块大约为15pJ/bit。这种超高效能水平对于数据中心和高性能计算环境至关重要,并且可能有助于解决人工智能不可持续的功率需求问题。

作为在硅光领域投入多年的半导体巨头,英特尔的主要优势就是高度集成化,采用混合激光器晶圆上技术和直接集成,这带来更高的可靠性和更低的成本。这种独特的方法使英特尔能够在保持效率的同时提供卓越的性能。英特尔强大、高容量的平台已经出货超过800万个光子集成电路(PICs),集成了超过3200万个芯片级激光器,显示出时间失效(FIT)率低于0.1,可靠性极高。

小结:

除了英特尔之外,目前在片上光互连领域还有曦智科技、Ayar Labs等企业在投入研发,并取得了一定成果。2023年Hot CHIPS会议上,曦智科技展示了其片上光互连技术上的最新进展,该系统的通道数为512,单通道最长广播距离为50mm,广播延时1ns,单通道频率4GHz,片上总带宽达到2Tbps。可以预见,随着数据中心算力需求的提高,片上光互连将会加快落地的进程。



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    9949

    浏览量

    171687
  • chiplet
    +关注

    关注

    6

    文章

    431

    浏览量

    12584
  • PCIe5.0
    +关注

    关注

    0

    文章

    17

    浏览量

    1373
收藏 人收藏

    评论

    相关推荐

    刚刚!英特尔最新回应

    不断被爆存在各种漏洞,“表明其对客户极不负责任的态度”。“从2023年底开始,大量用户反映,使用英特尔第13、14代酷睿i9系列CPU玩特定游戏时,会出现崩溃问题。” 今日中午,英特尔中国在微信公众号发文称:注意到相关媒体的报道
    的头像 发表于 10-17 17:35 263次阅读
    刚刚!<b class='flag-5'>英特尔</b>最新回应

    PCIe 5.0 SerDes 测试

    #01 PCIe Gen 5 简介 PCIe 是用于硬盘、固态硬盘 (SSD)、图形卡、Wi-Fi 和内部以太网连接的先进互连 I/O 技术。PCI
    的头像 发表于 08-16 09:33 821次阅读
    <b class='flag-5'>PCIe</b> <b class='flag-5'>5.0</b> SerDes 测试

    英特尔OCI芯粒在新兴AI基础设施中实现光学I/O(输入/输出)共封装

    (IPS)团队展示了业界领先的、完全集成的OCI(光学计算互连)芯粒,该芯粒与英特尔CPU封装在一起,运行真实数据。面向数据中心和HPC应用,英特尔打造的OCI芯粒在新兴AI基础设施中实现了
    的头像 发表于 06-29 11:47 840次阅读

    英特尔实现光学I/O芯粒的完全集成

    在科技日新月异的今天,数据传输速度的提升已成为推动各行业发展的关键因素。近日,英特尔在高速数据传输的硅光集成技术上取得了令人瞩目的突破,为数据中心和HPC(高性能计算)应用带来了革命性的变化。
    的头像 发表于 06-29 09:27 510次阅读

    英特尔推出集成光学计算互联OCI Chiplet芯片

    在全球信息技术飞速发展的今天,数据传输速度和效率成为了决定科技竞争力的关键因素之一。英特尔,作为全球领先的半导体公司,始终站在技术革新的前沿。近日,英特尔宣布了一项具有划时代意义的里程碑成果——集成光学计算互联(OCI)
    的头像 发表于 06-28 10:55 1376次阅读

    英特尔实现光学IO芯粒的完全集成

    (IPS)团队展示了业界领先的、完全集成的OCI(光学计算互连)芯粒,该芯粒与英特尔CPU封装在一起,运行真实数据。面向数据中心和HPC应用,英特尔打造的OCI芯粒在新兴AI基础设施中实现了
    的头像 发表于 06-28 10:16 365次阅读
    <b class='flag-5'>英特尔</b>实现<b class='flag-5'>光学</b>IO芯粒的完全集成

    DS320PR410支持PCIe5.0、CXL 2.0的四通道线性转接驱动器数据表

    德赢Vwin官网 网站提供《DS320PR410支持PCIe5.0、CXL 2.0的四通道线性转接驱动器数据表.pdf》资料免费下载
    发表于 06-21 11:07 0次下载
    DS320PR410支持<b class='flag-5'>PCIe5.0</b>、CXL 2.0的四通道线性转接驱动器数据表

    AlmaLinux 9.4兼容弃用的RHEL硬件,包括英特尔Data Streaming设备

    AlmaLinux 9.4效仿 RHEL 9.4增强多项功能/特性,例如全力兼容英特尔Data Streaming Accelerator驱动及英特尔SGX,同时以技术预览方式支持NVMe over TCP,并为用户提供Pyth
    的头像 发表于 05-07 10:57 737次阅读

    BittWare提供基于英特尔Agilex™ 7 FPGA最新加速板

    BittWare 当前的加速板产品组合包括最新的英特尔 Agilex 7 FPGA F、I 和 M 系列,包括 Compute Express Link (CXL) 和 PCIe* 5.0
    的头像 发表于 04-30 15:22 820次阅读
    BittWare提供基于<b class='flag-5'>英特尔</b>Agilex™ 7 FPGA最新加速板

    下一代PCIe5.0 /6.0技术热潮趋势与测试挑战

    迫切。 一、PCIe 5.0 /6.0技术升级 1)信号速率方面 从PCIe 3.0、4.0、5.0 到 6.0,数据速率翻倍递增,6.0支持64GT/s,16路
    的头像 发表于 03-06 10:35 1017次阅读
    下一代<b class='flag-5'>PCIe5.0</b> /6.0技术热潮趋势与测试挑战

    英特尔Clearwater Forest系列突破高核心数服务器CPU

    在封装方面,英特尔表示,对于Clearwater Forest,将使用其他工艺节点来实现SRAM和I/O,因为这些节点在较新的工艺上无法很好地扩展。
    发表于 03-01 14:30 515次阅读

    英特尔1nm投产时间曝光!领先于台积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    英特尔登顶2023年全球半导体榜单之首

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月01日 11:55:16

    英特尔正在将其重心倾向Chiplet小芯片

    近日,英特尔首席执行官帕特基辛格(Pat Gelsinger)指出公司正按计划在四年内完成五个节点,最终将在 2025 年达到顶峰,包括 Intel 7、Intel 4、Intel 3、Intel 20A 和 Intel 18A 工艺。
    的头像 发表于 01-22 14:04 599次阅读

    英特尔在2024年CES上推出首款软件定义汽车SoC芯片

    英特尔在2024年CES上推出首款软件定义汽车SoC芯片,也是全球首款采用Chiplet的车规级芯片。
    的头像 发表于 01-12 11:40 2846次阅读
    <b class='flag-5'>英特尔</b>在2024年CES上推出首款软件定义汽车SoC芯片