1 CPU内存或GPU内存进行分组方式实战-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CPU内存或GPU内存进行分组方式实战

Dbwd_Imgtec 来源:互联网 作者:佚名 2018-05-03 09:01 次阅读

CPU+GPU协同计算中,CPU和GPU的计算能力不同,静态地给CPU和GPU划分任务会导致CPU和GPU计算不同步,导致严重的负载不均衡,为了实现CPU和GPU的负载均衡,需要对CPU和GPU不同的划分方法。把每个节点上的所有CPU看成一个设备,每块GPU卡看成一个设备,对集群节点上的所有CPU设备和GPU设备分别编号,每个节点上有M块GPU卡,N个节点上共有N个CPU设备,编号为1,2,…,N;N个节点上共有M*N个GPU设备,编号为1,2,…,M*N。

设备编号之后就可以对设备进行分组,根据算法的要求,有些任务不能细分,一个CPU设备或GPU设备上可用的内存空间可能不能满足计算的内存要求,需要多设备数据划分、共同计算,这时需要根据CPU内存或GPU内存进行分组

1)根据CPU内存大小和计算对内存的要求可以计算得到一组内的CPU设备数目为GC个, GC=(Mcom+MemC-1)/MemC,其中一个节点的内存大小为MemC,每个计算任务需要的内存大小为Mcom。

所有的CPU设备分为N/GC个组,每个组计算同一个任务,组内的CPU设备再进行数据划分,数据划分采用静态的划分,因为组内的CPU设备计算能力一致;

2)根据GPU内存大小和计算对内存的要求可以计算得到一组内的GPU设备数目为GG个, GG=(Mcom+MemG-1)/Mem,其中,一个GPU设备的内存大小为MemG,每个计算任务需要的内存大小为Mcom。

所有的GPU设备分为M*N/GG个组,每个组计算同一个任务,组内的GPU设备再进行数据划分,数据划分采用静态划分的方法。

CPU和GPU设备分组之后,就可以把任务动态分划分给每个CPU组或GPU组,可以采用MPI通信进行划分,由主进程进行动态的发送任务编号给各个CPU组或GPU组内的组长,组长再把任务编号广播给组内的组员,然后组内的设备同时计算,计算完毕之后即可向主进程请求下一个任务,直到所有任务计算完毕为止。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10854

    浏览量

    211568
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4729

    浏览量

    128887

原文标题:CPU+GPU集群计算中的一种动态负载均衡设计方法

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    DDR内存频率对性能的影响

    的整体性能,特别是在处理大量数据运行复杂程序时,如视频编辑、3D渲染和高端游戏等场景。快速的内存可以缩短CPU内存之间的通信时间,从而提升整体系统的响应效率。 二、多任务处理能力
    的头像 发表于 11-20 14:25 588次阅读

    RAM内存不足的表现及解决方法

    ) 操作系统会将部分内存数据暂时存储到硬盘上,这个过程称为页面交换。如果频繁发生,说明内存不足。 高CPU使用率 由于内存不足,CPU需要花
    的头像 发表于 11-11 09:53 772次阅读

    北桥芯片负责与cpu的联系并控制内存

    北桥芯片,也被称为内存控制器系统控制器,是计算机主板上的一个重要组成部分。它负责管理CPU内存、以及其他系统组件之间的数据传输和通信。 1. 北桥芯片的定义和功能 北桥芯片是主板上
    的头像 发表于 10-14 10:37 491次阅读

    Windows管理内存的三种主要方式

    Windows操作系统提供了多种方式来管理内存,以确保系统资源的有效利用和性能的优化。以下是关于Windows管理内存的三种主要方式的详细阐述,包括堆
    的头像 发表于 10-12 17:09 699次阅读

    前端总线与内存频率怎么配

    前端总线(FSB)与内存频率的配合是确保计算机系统稳定运行并发挥最佳性能的关键因素之一。以下是对前端总线与内存频率配合关系的介绍: 一、前端总线与内存频率的基本概念 前端总线 :前端总线是CP
    的头像 发表于 10-12 09:10 246次阅读

    C2000 CPU内存内置自检功能

    德赢Vwin官网 网站提供《C2000 CPU内存内置自检功能.pdf》资料免费下载
    发表于 10-10 09:27 0次下载
    C2000 <b class='flag-5'>CPU</b><b class='flag-5'>内存</b>内置自检功能

    内存控制器概述和工作原理

    内存控制器是计算机系统内部控制内存并负责内存CPU之间数据交换的重要组成部分。它不仅是连接CPU内存
    的头像 发表于 09-04 14:19 702次阅读

    反射内存卡与普通内存卡的区别

    应用场景和目的反射内存卡:主要用于需要多个设备系统之间进行高速、实时数据共享和通信的场景,例如工业控制、航空航天等领域。普通内存卡:通常用于个人电子设备,如手机、相机、平板电脑等,用
    的头像 发表于 09-04 10:24 597次阅读
    反射<b class='flag-5'>内存</b>卡与普通<b class='flag-5'>内存</b>卡的区别

    主板内存故障灯亮会是cpu的问题吗

    主板内存故障灯亮并不一定是CPU的问题,但CPU内存之间的交互确实可能影响这一故障现象。以下是对主板内存故障灯亮可能原因的分析: 一、
    的头像 发表于 09-02 14:42 2654次阅读

    主板自检cpu内存灯一直来回闪

    检查CPU安装 :确保CPU正确安装在主板上,接触良好。 检查散热 :确保CPU散热器安装正确,没有松动,且散热膏涂抹均匀。 检查电源 :确保电源线连接正确,电源供应稳定。 1.2 内存
    的头像 发表于 09-02 14:38 9652次阅读

    HarmonyOS实战开发-内存快照Snapshot Profiler功能使用指导

    DevEco Studio集成的DevEco Profiler性能调优工具(以下简称为Profiler),提供Time、Allocation、Snapshot、CPU等场景化分析任务类型。内存快照
    发表于 05-11 13:51

    聊聊GPU背后的大赢家-HBM

    HBM全称为High Bandwidth Memory,直接翻译即是高带宽内存,是一款新型的CPU/GPU内存芯片。
    的头像 发表于 04-20 15:27 1533次阅读
    聊聊<b class='flag-5'>GPU</b>背后的大赢家-HBM

    CW32L052 DMA直接内存访问

    传输方式常见于需要将外设采集的数据快速传输到内存进行处理的应用。 • 内存内存之间 :例如在两个不同的数组之间传输数据,或者在不同的
    的头像 发表于 02-28 16:48 931次阅读
    CW32L052 DMA直接<b class='flag-5'>内存</b>访问

    为什么GPUCPU更快?

    大规模数据集时比CPU更快的根本原因。内存带宽:GPU内存带宽比CPU高得多。内存带宽是指数据
    的头像 发表于 01-26 08:30 2392次阅读
    为什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?

    系统内存和运行内存的区别

    系统内存和运行内存都是计算机中重要的概念,它们在计算机的存储和运行方面起着不可或缺的作用。虽然它们与计算机存储和运行息息相关,但是它们具有不同的功能和实现方式。接下来我将详细介绍系统内存
    的头像 发表于 01-15 16:32 3315次阅读