1 新AI时代的“利器”,异构计算将重塑产业格局-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新AI时代的“利器”,异构计算将重塑产业格局

7GLE_Intelzhiin 来源:YXQ 2019-04-28 17:38 次阅读

正如约翰·齐曼(J.Ziman)所言:“不同规模、不同层次的各种技术形成相互共生、寄生与竞争的生态关系,使得任何技术的生存与发展不是孤立的事件”。芯片架构的革命也随着IC业浪潮的演进“合成”向前,从32位到64位,从单核到多核,从同构到异构,每一次架构革命都让芯片产生质的飞跃。而在智能互联的AIoT时代,异构计算芯片成为当仁不让的主角。

毕竟,在经历了“数字化、互联网化、移动互联网化”的洗礼之后,“人工智能化”时代的海量计算需求、算法迭代让传统的通用CPU“难堪重任”,应运而生的异构计算芯片“晋级”成为支撑先进和更复杂AIoT应用的必然选择。作为一种将不同指令集和架构的计算单元(如传统的CPU、GPUDSP还有创新的TPU、DLA等)融合在一起、实现高效协同运行的计算技术,业界有人认为,将传统架构的芯片比作汽油引擎的话,那么异构计算芯片就是混合动力甚至新能源引擎。

整装待发

不论是什么样的技术路线图,都必须在关键时间节点上更新。而这一“引擎”的横空出世”其实是市场与技术相互碰撞的结果。

异构计算的显著优势在于实现了性能、成本和功耗均衡的技术,同时也是让最适合的专用硬件去做最适合的事如密集计算或外设管理等,从而达到性能和成本的最优化。这样“各成其就”的异构芯片,理所当然自带光芒。

英特尔中国研究院院长宋继强在上周的英特尔媒体分享会上表示,异构计算不是一个新词,其实上世纪80年代就有了,即超过一种以上的硬件架构设计组合。而这种组合有两种形式,比如将CPU、GPU、FPGA等组成一个一体化设计的SoC,将达到最高的能效比,但需要量大面广,才值得投入;另一种是这些独立的芯片通过板级连接实现异构计算,其优势在于灵活,但板与板之间连接的功耗、带宽都大打折扣。

与之相呼应的是,近几年来不仅众多IP厂商在加强异构芯片IP研发,主流芯片厂商也均加大新一代异构芯片的出新频率,异构芯片开始大行其道,或将迎来新的爆发期。有预计说,在高性能计算、人工智能等应用领域,异构计算芯片市场规模将突破千亿美元。

这一风向标对产业带来的影响或是全方位的,一方面众多芯片厂商加强横向扩展,运用资本力量大肆整合全面出击,构筑异构芯片领域的护城河;另一方面,异构阵营泾渭分明,各大厂商合纵连横,同时一些新生力量亦角逐其中,有望改写产业未来格局。

软硬件挑战

异构计算虽不是全新的概念,但最早的异构融合还基于CPU和GPU,而真正崛起要从2001年用GPU实现通用矩阵计算开始。而且,其“外延”已延伸至CPU、DSP、GPU、ASIC、FPGA等各种计算单元、使用不同类型指令集、不同体系架构的“整合”,让各种核心有效地协同合作。

显然,这激起了“连锁”反应,由于设计难度大、生态系统需重构等挑战,在过去很长一段时间仍处在不断演进当中。毕竟从编程方式、软硬件架构到生态系统,异构计算仍面临着诸多挑战。

其硬件实现就不简单。首先,不同芯片之间的互联布线,要求性能高、速度快,同时功耗要低。其次,要通过混搭方式,将不同种类的、不同技术的芯片封装在一起,支持互联,保持高带宽和高频率,分外复杂。最后,选择大批量生产的工艺,快速验证等等,决定了在硬件上从选择用什么样的基底,到用什么材料实现互联,都需通盘和全面考量。

为了让异构计算发挥最大性能优势,还需要对硬件设计特定的算法以及软件优化,才能够最大化硬件能力,即软硬结合。做到真正的软硬结合,软件环境的优化亦是重中之重,如何打造完善的软硬件体系,让“众选手”各展所长、协同合作,并进而提供良好的生态体系,来支撑异构计算体系的全面应用亦是一大挑战。

可以说,无论是总线及接口、编程工具、存储管理、应用软件技术等,在诸如异构多核架构指令集、微架构、工具链设计等环节仍需投入大量资金和时间。

三大阵营的心机

显然作为新AI时代的“利器”,异构计算将重塑产业格局,各方势力各藏心机,激烈角逐。

目前,全球异构计算领域呈现三足鼎立的态势,分别是以AMD高通ARM三星、北京华夏芯等为主体的全球异构计算系统HSA联盟,以IBM、Google、英伟达为主体的OpenPOWER联盟和英特尔最新提出的超异构计算愿景。

这三大体系均在全力推进:HSA联盟强调生态共建,资源共享,主推OpenCL的异构编程框架。自从2012年成立以来,围绕异构计算发展中最迫切需要解决的编程语言、技术标准、知识产权等问题已经做了大量卓有成效的工作,包括发布了新一代异构计算技术规范、搭建开放的异构计算平台、推出了一系列专用工具和较为完善的面向人工智能的开发环境等等。

而AMD 3A平台、ARM Coretex处理器和Mali图形核心、Imagination PowerVR图形核心、德州仪器OMAP处理器平台等都将成为HSA基金会的基石。

而OpenPower联盟利用Power8等芯片在高性能计算领域的技术优势和IBM产品的应用生态基础,在高性能计算领域占有优势。自2013年IBM在联合Google、NVIDIA、TYAN、Mellanox成立以来,目前已有数百位成员,中国成员除了浪潮、新云东方等硬件供应商外,也有腾讯、阿里、网易这样的互联网巨头。据悉在OpenPower研发平台上,已有10万+应用,以及10万+经过行业认证的产品,包括软件、服务管理和解决方案。特别是其基于CAPI总线的全新加速器解决方案,使Power服务器完全支持CAPI+FPGA,开启了第二代异构计算。

虽然英特尔在以一已之力对抗,但在英特尔转型制定了“以数据为中心”的发展战略之后,一切创新与变革都以此为轴心。而在AI时代风起云涌之际,“全武行”的英特尔也祭出了“超异构计算”的旗帜,在异构计算技术路径发展方面已然自成一派。

超异构计算的“超”

超异构计算的横空出世,缘于英特尔对数据洪流引发的变革,有了更加“系统”的思考,认为在智能联所带来的数据洪流推动下,为应对未来数据的多样化、数据量的爆发式增长以及处理方式的多样性,单纯发展先进工艺或封装或架构改善已不足以满足未来多元化的计算需求。

以AI为例,产业应用对AI计算需求跃升至“无所不能”,涉及多种计算加速、可扩展性、训练速度快、能效比高、开发难度小、可加快上市等,在这一发展态势下,传统的异构计算将失去“用武之地”。宋继强解释说,一体化的SoC虽然体积小、能效比高,但扩展性差,增加功能则需重新设计,再走一整套流片流程,上市时间较慢;而分体式板卡虽然比较灵活,时间也快,但整体价格偏高,能效比也不高。

正所谓不破不立,超异构计算成为解决“左右为难”的利器。宋继强解读超异构计算的三大要素时认为,一是有多种架构、多功能芯片,无论是CPU/GPU,还是FPGA、ASIC、Modem内存等;二是需要多节点+先进封装技术的整合,不论是10nm的高端芯片还是40nm、65nm的芯片都能通过2.5D或3D封装“成全”;在“硬”功能实现之后,三是统一的异构计算软件,英特尔开发了通用的one API,一套API就可让用户方便地开发并承接超异构集成带来的利好。

超异构计算将以制程与封装、架构、内存与存储、互连、安全、软件为六大支柱,互相关联,紧密耦合

具体来看,在制程和封装层面,一方面英特尔10纳米工艺仍继续推动着发展,另一方面先进封装2.5D、3D成为推手。两年前英特尔开发的“嵌入式多芯片互连桥接(EMIB)”2.5D封装技术,成为其异构计算策略的一大关键技术。而英特尔不断精进,在去年年底架构日活动上展示了名为“Foveros”的3D封装技术,开辟了新的先河。2.5D和3D封装解决了传统封装面积大、带宽不足等问题,并可让连接的芯片不只是逻辑芯片和内存,还能把逻辑芯片和逻辑芯片相连,同时实现立体堆叠,让体积减少、功耗降低、带宽提升。

而随着海量的数据推动计算架构快速演进并呈指数级扩展,未来十年架构创新将是创新的主要驱动力。英特尔可提供多样化的计算架构包括标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial),分别应用于CPU、GPU、AI和FPGA。

而英特尔的矩阵战略实现了“端到端”。英特尔有通用CPU集成AI加速,可将深度学习性能提升十倍以上。在专用AI芯片方面,有面向训练的高性能GPU和专门做神经网络加速学习的NNP-L;推理侧也是两路并发,面向边缘端的推理芯片要求功耗更低、性能更强,英特尔有VPU、EYEQ以及嵌入式EYEQ、FPGA等;而数据中心推理的芯片则有GPU、FPGA。如此通过将制程封装和架构设计组合在一起,来有效提升“积木式组合”的稳定度,满足定制化和灵活化的需求。

而在内存与存储、互连、安全、软件层面,英特尔也齐头并进。通过重塑内存层级结构,来破解内存和存储方面的带宽“瓶颈”,提升数据管道的运行速度和系统性能;全面的互连产品包括在祼片间实现互连,从而助力实现大规模的异构计算;在安全至上的数据层面,英特尔着力从端到端全面提升安全性。同时英特尔也深谙“硬件+软件”配合才能给出最好的加速功能,在软件方面创建了统一的OneAPI软件架构,以进一步简化并延伸整个堆栈中的应用开发。

这六大支柱也相当于“六大护法”:以先进制程技术进行设计,颠覆性内存层次结构提供支持,通进先进封装集成到系统中,使高速的互连技术进行超大规模部署,提供统一的软件开发接口以及安全功能。

有了“六大护法”加持,一路狂飙的英特尔释放了超异构计算的最大优势,既可灵活地运用各节点芯片的功能,又解决了内存、连接、功耗以及安全、开发等问题,这些创举远远跳出了以往单纯异构计算的“窠臼”,将为异构计算的下一步发展全面“加速”,亦让“自成体系”英特尔站在了异构计算的“超”起点。

未来对决

万物智联时代作为解决计算能力和功耗瓶颈的有效途径之一,异构计算如今可谓正逢其时。

就异构计算的发展过程来看,异构计算从单纯挖掘并行潜力、到具有加速器的异构计算、再到针对特定应用定制的计算平台、到多种平台的高效融合,在这一过程中,异构计算的演进也伴随着起伏。

而无论谁是异构芯片的“轴心”,首要的仍是封装的“不破不立”。不得不说,英特尔超异构计算的概念,配合制程与封装、架构、内存、互连、安全、软件“六脉神剑”,在伴随着异构计算的“新陈代谢”和发展模式的过程中,破解了总是如影随形的关联制约性,可谓意义重大,使得芯片设计从2D平铺转向3D堆叠,为高性能、高密度和低功耗异构芯片制程奠定了坚实的基础,亦为IC业的发展和突破打开了一扇新的大门,提供了更广泛的灵活性和可塑性。

毫无疑问,在传统芯片架构向异构计算演进、软硬件生态面临颠覆性变革之际,各大阵营的开放、众创、共赢的异构生态体系,将成为异构计算芯片对决的重要衡量。异构计算已走到台前,未来是百家争鸣还是一家独大?让我们等待好戏开场。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30726

    浏览量

    268870
  • 异构计算
    +关注

    关注

    2

    文章

    100

    浏览量

    16293

原文标题:英特尔超异构计算愿景,实现新“超越”

文章出处:【微信号:Intelzhiin,微信公众号:知IN】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    广和通开启端侧AI时代

    AI发展正酣,随着终端芯片算力越来越高、端侧模型能力越来越强、实时响应及隐私保护的端侧应用需求增加,端侧AI已然具备落地的条件。端侧AI离客户和应用场景更近,也是具象化AI的重要方式。
    的头像 发表于 12-12 10:35 157次阅读

    【一文看懂】什么是异构计算

    随着人工智能、深度学习、大数据处理等技术的快速发展,计算需求的复杂性不断提升。传统的单一计算架构已难以满足高效处理复杂任务的要求,异构计算因此应运而生,成为现代计算领域的一个重要方向。
    的头像 发表于 12-04 01:06 1338次阅读
    【一文看懂】什么是<b class='flag-5'>异构计算</b>?

    详解Arm计算平台的优势

    对于人工智能 (AI) 而言,任何单一硬件或计算组件都无法成为适合各类工作负载的万能解决方案。AI 贯穿从云端到边缘侧的整个现代计算领域,为了满足不同的
    的头像 发表于 12-03 16:53 274次阅读

    3D异构集成重塑芯片格局

    本文由半导体产业纵横(ID:ICVIEWS)综合AI的激增推动了对先进半导体芯片的需求,推动了芯片设计和制造的界限。AI的快速发展迎来了半导体比以往任何时候都更加重要的时代。从训练到部
    的头像 发表于 11-22 01:08 167次阅读
    3D<b class='flag-5'>异构</b>集成<b class='flag-5'>重塑</b>芯片<b class='flag-5'>格局</b>

    百度百舸AI计算平台4.0震撼发布

    在2024年百度云智大会的璀璨舞台上,百度智能云重磅推出了百舸AI异构计算平台的全新力作——4.0版本。此次升级,标志着百度在AI基础设施领域迈出了坚实的一步,致力于为行业提供更为强大、高效的算力支持。
    的头像 发表于 09-26 14:46 468次阅读

    开启全新AI时代 智能嵌入式系统快速发展——“第六届国产嵌入式操作系统技术与产业发展论坛”圆满结束

    计算机学院牛建伟教授主持。 中科院软件所副所长、总工程师,武延军研究员做了“AI大模型时代下的操作系统发展思考”主题演讲。 武延军介绍了操作系统的发展历程,指出应用的高速发展给操作系统带来的算力和数
    发表于 08-30 17:24

    打造异构计算新标杆!国数集联发布首款CXL混合资源池参考设计

    参考设计是首个支持异构计算架构的CXL硬件设备,标志着CXL技术在数据中心领域迎来异构计算新阶段。   国数集联基于FPGA与自主研发的CXL协议IP的先进特性,可实现CPU、GPU、DDR、SSD
    的头像 发表于 08-06 14:19 310次阅读
    打造<b class='flag-5'>异构计算</b>新标杆!国数集联发布首款CXL混合资源池参考设计

    AvaotaA1全志T527开发板AMP异构计算简介

    Avaota SBC 的部分平台内具有小核心 CPU,与大核心一起组成了异构计算的功能。 在异构多处理系统中,主核心和辅助核心的存在旨在共同协作,以实现更高效的任务处理。这种协作需要系统采取一系列
    发表于 07-24 09:54

    异构计算:解锁算力潜能的新途径

    在这个数据爆炸的时代计算力是推动社会与科技创新的核心。从日常智能设备的流畅运行到超级计算机的尖端模拟,均依赖强大的计算能力。但面对多样化的复杂计算
    的头像 发表于 07-18 08:28 7817次阅读
    <b class='flag-5'>异构计算</b>:解锁算力潜能的新途径

    智能时代的路,将由异构计算铺就

    AI时代,在计算支持领域,云计算、边缘计算等相继崛起,我们能看到的算力形态逐渐多样化。同时,在我们看不到的地方,算力需求依然旺盛。随着“十四
    的头像 发表于 07-03 08:28 226次阅读
    智能<b class='flag-5'>时代</b>的路,将由<b class='flag-5'>异构计算</b>铺就

    AI服务器异构计算深度解读

    AI服务器按芯片类型可分为CPU+GPU、CPU+FPGA、CPU+ASIC等组合形式,CPU+GPU是目前国内的主要选择(占比91.9%)。
    发表于 04-12 12:27 599次阅读
    <b class='flag-5'>AI</b>服务器<b class='flag-5'>异构计算</b>深度解读

    新火种AI|AI重塑社交:腾讯与字节跳动的新战场

    AI重塑万物,它会如何重塑我们的社交?
    的头像 发表于 04-07 16:38 416次阅读
    新火种<b class='flag-5'>AI</b>|<b class='flag-5'>AI</b><b class='flag-5'>重塑</b>社交:腾讯与字节跳动的新战场

    解锁AI时代利器——讯飞AI鼠标AM30助你在AI时代脱颖

    解锁AI时代利器——讯飞AI鼠标AM30助你在AI时代脱颖而出 随着
    的头像 发表于 03-25 13:37 547次阅读
    解锁<b class='flag-5'>AI</b><b class='flag-5'>时代</b>的<b class='flag-5'>利器</b>——讯飞<b class='flag-5'>AI</b>鼠标AM30助你在<b class='flag-5'>AI</b><b class='flag-5'>时代</b>脱颖

    AI时代必备利器!讯飞AI鼠标AM30带你领略无线办公的便捷

    AI时代必备利器!讯飞AI鼠标AM30带你领略无线办公的便捷与智能 在这个AI时代,如果你想不被
    的头像 发表于 03-23 11:39 687次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>时代</b>必备<b class='flag-5'>利器</b>!讯飞<b class='flag-5'>AI</b>鼠标AM30带你领略无线办公的便捷

    高通NPU和异构计算提升生成式AI性能 

    异构计算的重要性不可忽视。根据生成式AI的独特需求和计算负担,需要配备不同的处理器,如专注于AI工作负载的定制设计的NPU、CPU和GPU。
    的头像 发表于 03-06 14:15 782次阅读