在CPU+GPU协同计算中,CPU和GPU的计算能力不同,静态地给CPU和GPU划分任务会导致CPU和GPU计算不同步,导致严重的负载不均衡,为了实现CPU和GPU的负载均衡,需要对CPU和GPU不同的划分方法。把每个节点上的所有CPU看成一个设备,每块GPU卡看成一个设备,对集群节点上的所有CPU设备和GPU设备分别编号,每个节点上有M块GPU卡,N个节点上共有N个CPU设备,编号为1,2,…,N;N个节点上共有M*N个GPU设备,编号为1,2,…,M*N。
设备编号之后就可以对设备进行分组,根据算法的要求,有些任务不能细分,一个CPU设备或GPU设备上可用的内存空间可能不能满足计算的内存要求,需要多设备数据划分、共同计算,这时需要根据CPU内存或GPU内存进行分组
1)根据CPU内存大小和计算对内存的要求可以计算得到一组内的CPU设备数目为GC个, GC=(Mcom+MemC-1)/MemC,其中一个节点的内存大小为MemC,每个计算任务需要的内存大小为Mcom。
所有的CPU设备分为N/GC个组,每个组计算同一个任务,组内的CPU设备再进行数据划分,数据划分采用静态的划分,因为组内的CPU设备计算能力一致;
2)根据GPU内存大小和计算对内存的要求可以计算得到一组内的GPU设备数目为GG个, GG=(Mcom+MemG-1)/Mem,其中,一个GPU设备的内存大小为MemG,每个计算任务需要的内存大小为Mcom。
所有的GPU设备分为M*N/GG个组,每个组计算同一个任务,组内的GPU设备再进行数据划分,数据划分采用静态划分的方法。
CPU和GPU设备分组之后,就可以把任务动态分划分给每个CPU组或GPU组,可以采用MPI通信进行划分,由主进程进行动态的发送任务编号给各个CPU组或GPU组内的组长,组长再把任务编号广播给组内的组员,然后组内的设备同时计算,计算完毕之后即可向主进程请求下一个任务,直到所有任务计算完毕为止。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网
网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
原文标题:CPU+GPU集群计算中的一种动态负载均衡设计方法
文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。
相关推荐
的整体性能,特别是在处理大量数据或运行复杂程序时,如视频编辑、3D渲染和高端游戏等场景。快速的内存可以缩短CPU和内存之间的通信时间,从而提升整体系统的响应效率。 二、多任务处理能力
发表于 11-20 14:25
•588次阅读
) 操作系统会将部分内存数据暂时存储到硬盘上,这个过程称为页面交换。如果频繁发生,说明内存不足。 高CPU使用率 由于内存不足,CPU需要花
发表于 11-11 09:53
•772次阅读
北桥芯片,也被称为内存控制器或系统控制器,是计算机主板上的一个重要组成部分。它负责管理CPU、内存、以及其他系统组件之间的数据传输和通信。 1. 北桥芯片的定义和功能 北桥芯片是主板上
发表于 10-14 10:37
•491次阅读
Windows操作系统提供了多种方式来管理内存,以确保系统资源的有效利用和性能的优化。以下是关于Windows管理内存的三种主要方式的详细阐述,包括堆
发表于 10-12 17:09
•699次阅读
前端总线(FSB)与内存频率的配合是确保计算机系统稳定运行并发挥最佳性能的关键因素之一。以下是对前端总线与内存频率配合关系的介绍: 一、前端总线与内存频率的基本概念 前端总线 :前端总线是CP
发表于 10-12 09:10
•246次阅读
德赢Vwin官网
网站提供《C2000 CPU内存内置自检功能.pdf》资料免费下载
发表于 10-10 09:27
•0次下载
内存控制器是计算机系统内部控制内存并负责内存与CPU之间数据交换的重要组成部分。它不仅是连接CPU与内存
发表于 09-04 14:19
•702次阅读
应用场景和目的反射内存卡:主要用于需要多个设备或系统之间进行高速、实时数据共享和通信的场景,例如工业控制、航空航天等领域。普通内存卡:通常用于个人电子设备,如手机、相机、平板电脑等,用
发表于 09-04 10:24
•597次阅读
主板内存故障灯亮并不一定是CPU的问题,但CPU与内存之间的交互确实可能影响这一故障现象。以下是对主板内存故障灯亮可能原因的分析: 一、
发表于 09-02 14:42
•2654次阅读
检查CPU安装 :确保CPU正确安装在主板上,接触良好。 检查散热 :确保CPU散热器安装正确,没有松动,且散热膏涂抹均匀。 检查电源 :确保电源线连接正确,电源供应稳定。 1.2 内存
发表于 09-02 14:38
•9652次阅读
DevEco Studio集成的DevEco Profiler性能调优工具(以下简称为Profiler),提供Time、Allocation、Snapshot、CPU等场景化分析任务类型。内存快照
发表于 05-11 13:51
HBM全称为High Bandwidth Memory,直接翻译即是高带宽内存,是一款新型的CPU/GPU内存芯片。
发表于 04-20 15:27
•1533次阅读
传输方式常见于需要将外设采集的数据快速传输到内存进行处理的应用。 • 内存和内存之间 :例如在两个不同的数组之间传输数据,或者在不同的
发表于 02-28 16:48
•931次阅读
大规模数据集时比CPU更快的根本原因。内存带宽:GPU的内存带宽比CPU高得多。内存带宽是指数据
发表于 01-26 08:30
•2392次阅读
系统内存和运行内存都是计算机中重要的概念,它们在计算机的存储和运行方面起着不可或缺的作用。虽然它们与计算机存储和运行息息相关,但是它们具有不同的功能和实现方式。接下来我将详细介绍系统内存
发表于 01-15 16:32
•3315次阅读
评论