0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

异构计算的前世今生

E4Life 来源:德赢Vwin官网 原创 作者:Leland 2021-12-17 09:35 次阅读
异构计算已经成了 半导体业界不得不思考的一个 话题,传统通用计算的性能捉襟见肘,过去承诺的每隔一段时间 芯片性能翻倍的豪言壮语已经没有人再提了。如今我们用到的 手机中,各种除 CPU以外的计算单元层出不穷,无论是 神经网络 处理器还是图像处理器。

异构计算的存在可以说创造了另一个维度,这个维度上我们又有了堆性能的空间,小至手机SoC、汽车芯片,大到服务器芯片和超算处理器,异构带来了更大的算力。但与此同时,异构计算也带来了一些潜在的问题。

异构计算的崛起

异构计算其实早在计算机时代的早期就开始零星出现了,比如 英特尔在80年代推出的浮点协处理器(FPU)i487,Inmos./ST在1996年推出的多媒体加速器Chameleon等等。转眼进入了新世纪,异构出现的频率也越来越高,2010年苹果推出了首个自研的处理器A4,将CPU、 GPU和其它加速器集成至一起。在超算领域,加速器和协处理器也数量也在逐步增加。

全球超算系统加速器/协处理器的应用趋势 / TOP500

2020年以后,各国的超级计算机计划都定位在了Exascale的百亿亿级别,要想实现目标,要么靠堆核心规模来堆性能,要么就是选择异构计算。如今前十的超算系统中,有一半以上都采用了CPU+GPU的异构设计。

明眼人都能看出,这种CPU+GPU的异构设计也开始变得愈发紧密,比如 英伟达今年宣布的 ArmCPU Grace,该处理器靠着英伟达专利互联技术NVLink的加持,成功将CPU与GPU之间的互联速度做到了夸张的900GB/s,是传统PCIe的10倍以上,CPU更是靠LP DDR5X实现了500GB/s的内存带宽。

非传统的架构更是层出不穷,Graphcore的IPU、谷歌的TPU、矢量引擎和 FPGA等等,相信XPU的命名形式马上就要用完26个字母了。促使大家选择异构的动力究竟是什么?答案很简单,异构给到了一个更高效的方案,能够实现的算力更高。既然你CPU在计算上落后了,我GPU自然要上位,更何况我还有这么多成熟的I/O和互联技术为我撑腰。

异构计算真就完美无缺?

异构计算就真的如此完美吗?并非如此。异构计算的存在其实也引出了不少隐患,比如极度差异化的 编程模型,从过去的单向编程转为了多向编程。因为异构系统中存在多个计算设备,又有着不同的系统架构、指令集和编程模型,因此异构系统的编程与传统的CPU编程相比有很大的差距。通常来说,异构混合计算系统需要多套不同的代码,这增大了应用开发的难度,纸面 参数是好看了,却苦了软件 开发者

IPU / Graphcore

其次,GPU、FPGA和 AI处理器 厂商都推出了截然不同的加速器方案,这些方案不仅仅采用了自己专用的处理器架构,还有自己的执行指令和编译器。在这样不统一的架构下,将并行程序移植到异构处理器上需要的可不只是重新编译,还有代码重写。也正因如此,HPC的代码生态虽然不弱,但近半数以上可能永远都不会被移植到其他加速器上,甚至这一部分工作量还分摊到了加速器厂商的软件开发工作量上。

所以,必须得使用优秀的软件栈,这样才能让开发者充分利用异构处理器的计算资源,而不用在编程时考虑复杂的 硬件细节。现在已经有了不少跨平台的编程标准,比如 C++/F ortran、OpenMP、SYCL和Kokkos等。

最后是复杂的数据存取过程,异构带来的不仅是不同层级的计算架构,还有不同层级的存储架构,比如主存储、主缓存、设备主存、设备缓存和 寄存器等等。数据要在多种存储类型之间移动,程序执行要在同时对多种存储进行存取,这些存储方式的带宽和延迟也不尽相同。

异构计算的未来

在近期举办的CIUK 2021大会上,HPC研究组的 Simon McIntosh-Smith教授发表了他自己对异构计算未来的看法。他认为异构计算的趋势还将继续发展下去,差异化不会消失,但也不会出现极度差异化的情况。

其次CPU与GPU的关系将更加紧密,比如缓存一致和封装集成等,其他加速器在特定场景下声称的性能数据都很优秀,但要说通用计算性能,GPU还是要略胜一筹。而且依目前的趋势来看,CPU也在慢慢汲取GPU上的优点,比如HBM、宽矢量处理器的核心、核心内部的加速器等等。编程的困境固然已经有了改善的迹象,但还有一段长路要走。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 异构
    +关注

    关注

    0

    文章

    37

    浏览量

    12977
  • 异构计算
    +关注

    关注

    2

    文章

    97

    浏览量

    16207
收藏 人收藏

    评论

    相关推荐

    打造异构计算新标杆!国数集联发布首款CXL混合资源池参考设计

    参考设计是首个支持 异构计算架构的CXL硬件设备,标志着CXL技术在数据中心领域迎来 异构计算新阶段。 国数集联基于FPGA与自主研发的CXL协议IP的先进特性,可实现CPU、GPU、DDR、SSD
    的头像 发表于08-06 14:19 168次阅读
    打造<b class='flag-5'>异构计算</b>新标杆!国数集联发布首款CXL混合资源池参考设计

    AvaotaA1全志T527开发板AMP异构计算简介

    Avaota SBC 的部分平台内具有小核心 CPU,与大核心一起组成了 异构计算的功能。 在 异构多处理系统中,主核心和辅助核心的存在旨在共同协作,以实现更高效的任务处理。这种协作需要系统采取一系列
    发表于07-24 09:54

    异构计算:解锁算力潜能的新途径

    在这个数据爆炸的时代, 计算力是推动社会与科技创新的核心。从日常智能设备的流畅运行到超级 计算机的尖端模拟,均依赖强大的 计算能力。但面对多样化的复杂 计算任务,单一处理器难以胜任。于是,
    的头像 发表于07-18 08:28 7227次阅读
    <b class='flag-5'>异构计算</b>:解锁算力潜能的新途径

    高通NPU和异构计算提升生成式AI性能 

    异构计算的重要性不可忽视。根据生成式AI的独特需求和 计算负担,需要配备不同的处理器,如专注于AI工作负载的定制设计的NPU、CPU和GPU。
    的头像 发表于03-06 14:15 529次阅读

    二极管的前世今生

    二极管的 前世 今生
    的头像 发表于12-14 18:35 891次阅读
    二极管的<b class='flag-5'>前世</b><b class='flag-5'>今生</b>

    科学计算与Julia技术研讨会 | 张先轶:从OpenBLAS到异构计算软件栈

    蓬勃发展,新兴科学 计算语言不断涌现,Julia以其高性能、动态性成为其中的佼佼者。 12月9日上午1020 ,澎峰科技创始人 张先轶博士 将 在 主论坛:Julia与数字化和AI 上 作 “ 从OpenBLAS到 异构计算软件栈” 主题演讲,期待与大家见面 ! 研讨会完整详
    的头像 发表于11-30 19:35 575次阅读
    科学<b class='flag-5'>计算</b>与Julia技术研讨会 | 张先轶:从OpenBLAS到<b class='flag-5'>异构计算</b>软件栈

    什么是异构集成?什么是异构计算异构集成、异构计算的关系?

    异构集成主要指将多个不同工艺节点单独制造的芯片封装到一个封装内部,以增强功能性和提高性能。
    的头像 发表于11-27 10:22 5321次阅读
    什么是<b class='flag-5'>异构</b>集成?什么是<b class='flag-5'>异构计算</b>?<b class='flag-5'>异构</b>集成、<b class='flag-5'>异构计算</b>的关系?

    情感语音识别的前世今生

    的支持。本文将探讨情感语音识别的 前世 今生,包括其发展历程、应用场景、面临的挑战以及未来发展趋势。 二、情感语音识别的发展历程 起步阶段:早期的情感语音识别技术主要依赖于声谱分析、特征提取等传统信号处理方法,但这
    的头像 发表于11-12 17:33 486次阅读

    基石数据:TOC理论物理学浅析—MES的前世今生(十一)

    MES的 前世 今生前面的文章大体介绍了TOC下的低结存,计划统一性原则,列队生产,日结日清,品质问题碎片化等,有很多朋友问是否基石公司不再做数字化,而做流程梳理,非也!其实所有不同的制造业生产方式都有
    的头像 发表于11-09 10:39 347次阅读
    基石数据:TOC理论物理学浅析—MES的<b class='flag-5'>前世</b><b class='flag-5'>今生</b>(十一)

    带你探索吹风筒的前世今生【其利天下高速风筒方案开发】

    电吹风作为如 今生活中不可或缺的小家电之一,这个看似简单的设备,已经走过了漫长的发展历程,从它的 前世今生,经历了许多变革和创新,本文将带您穿越时间,探索其 前世
    的头像 发表于11-02 16:15 1415次阅读
    带你探索吹风筒的<b class='flag-5'>前世</b><b class='flag-5'>今生</b>【其利天下高速风筒方案开发】 

    异构计算为什么会异军突起?基于FPGA的异构计算讨论

    简单的介绍几个概念,同道中人可以忽略这一段。云 计算取代传统IT基础设施已经基本成为业界共识和不可阻挡的趋势。
    发表于10-26 10:04 521次阅读
    <b class='flag-5'>异构计算</b>为什么会异军突起?基于FPGA的<b class='flag-5'>异构计算</b>讨论

    异构时代:CPU与GPU的发展演变

    异构计算是指在一个系统中使用不同类型的处理器来执行不同的 计算任务,以提高性能,效率和可靠性。随着摩尔定律的放缓,单一类型的处理器已经难以满足日益增长的运算需求。与此同时,不同类型的处理器具有各自
    的头像 发表于10-24 10:17 1070次阅读
    <b class='flag-5'>异构</b>时代:CPU与GPU的发展演变

    高性能计算环境下的深度学习异构集群建设与优化实践

    随着人工智能在工业和学术界大规模的应用,深度学习训练需求日益迫切。各组织机构投入大量资金购置和搭建配置GPU和InfiniBand网卡 异构计算集群。集群管理系统(也称平台)支持模型训练,提供作业
    的头像 发表于09-25 09:07 582次阅读
    高性能<b class='flag-5'>计算</b>环境下的深度学习<b class='flag-5'>异构</b>集群建设与优化实践

    COT控制模式的前世今生

    恒定导通时间(COT)控制作为电源界的新宠,广泛应用于 计算领域核心IC的供电。随着人工智能的发展,COT的应用必将更为广阔。
    的头像 发表于09-17 10:23 4417次阅读
    COT控制模式的<b class='flag-5'>前世</b><b class='flag-5'>今生</b>

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft 异构计算吗?
    发表于09-14 08:13