1 GTC 2023:深度学习之张星并行和流水线并行-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC 2023:深度学习之张星并行和流水线并行

西西 来源:GTC 2023 作者:GTC 2023 2023-03-23 17:21 次阅读

除了数据并行之外,还有其他的主流并行技术,即张星并行和流水线并行训练。

张星并行和流水线并行技术通常被描述为模型并行,在开源社区中,最著名的两个系统是NVIDIA的Megatron- M和Microsoft的DeepSpeed。

Megatron- M使用一维张量并行,线算符的权重被分割,大型矩阵乘法被分解为在不同设备上执行的较小矩阵藏法,这可以是模型大小在集群中扩展并提高计算效率。

微软的DeepSpeed和NVIDIA的Megatron- M兼容,并通过Zero Redundancy Optimizer改善数据并行训练,消除内存冗余。

Colossal-AI不仅提供了完整的现有并行方法,还提供了更高级的办法,例如2D、2.5D 和3D张星并行,以及序列并行。

与1D张量并行相比,这些并称为是2.5D 和3D张星并行,不仅切分参数,而且沿更多张量唯独切分输入和输出,正方形或者立方体的每个子集,表示可以分配给不同处理器的部分数据和工作。

2D张量并行基于经典SUMMA矩阵利法算法

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47183

    浏览量

    238209
  • 英伟达
    +关注

    关注

    22

    文章

    3770

    浏览量

    90980
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121109
  • gtc
    gtc
    +关注

    关注

    0

    文章

    73

    浏览量

    4425
收藏 人收藏

    评论

    相关推荐

    FPGA中的流水线设计

    令预取、 译码、 执行、 写回结果, openrisc采用的是 5 级整数流水线。当然它们的核心思想都是利用并行执行提高效率。总结一下,流水线就是插入寄存器,以面积换取速度。`
    发表于 10-26 14:38

    基于流水线负载平衡模型的并行爬虫研究

    针对并行爬虫系统在多任务并发执行时所遇到的模块间负载平衡问题,提出流水线负载平衡模型(PLB),将不同的任务抽象为独立模块而达到各模块的处理速度相等,采用多线程的方式
    发表于 03-31 10:19 19次下载

    基于流水线技术的并行高效FIR滤波器设计

    基于流水线技术的并行高效FIR滤波器设计 基于流水线技术,利用FPGA进行并行可重复配置高精度的FIR滤波器设计。使用VHDL可以很方便地改变滤波器的系数和阶数。在DSP中采用
    发表于 03-28 15:12 813次阅读
    基于<b class='flag-5'>流水线</b>技术的<b class='flag-5'>并行</b>高效FIR滤波器设计

    什么是流水线技术

    什么是流水线技术 流水线技术
    发表于 02-04 10:21 3927次阅读

    流水线中的相关培训教程[1]

    流水线中的相关培训教程[1]  学习目标     理解流水线中相关的分类及定义;
    发表于 04-13 15:56 1046次阅读

    基于流水线并行FIR滤波器设计

    基于流水线技术,利用FPGA进行并行可重复配置高精度的 FIR滤波器 设计。使用VHDL可以很方便地改变滤波器的系数和阶数。在DSP中采用这种FIR滤波器的设计方法可以充分发挥FPGA的优势。
    发表于 07-18 17:09 63次下载
    基于<b class='flag-5'>流水线</b>的<b class='flag-5'>并行</b>FIR滤波器设计

    CPU流水线的定义

    cpu流水线技术是一种将指令分解为多步,并让不同指令的各步操作重叠,从而实现几条指令并行处理,以加速程序运行过程的技术。
    发表于 12-14 15:29 4687次阅读

    电镀流水线的PLC控制

    电镀流水线的PLC控制电镀流水线的PLC控制电镀流水线的PLC控制
    发表于 02-17 17:13 36次下载

    Verilog基本功流水线设计Pipeline Design

    ,并暂存中间数据的方法。 目的是将一个大操作分解成若干的小操作,每一步小操作的时间较小,所以能提高频率,各小操作能并行 执行,所以能提高数据吞吐率(提高处理速度)。 二. 什么时候用流水线设计 使用流水线一般是时序比较紧张
    发表于 09-25 17:12 6372次阅读

    EE-383:基于MDMA的双SHARC+并行流水线音频直通

    EE-383:基于MDMA的双SHARC+并行流水线音频直通
    发表于 04-29 17:30 0次下载
    EE-383:基于MDMA的双SHARC+<b class='flag-5'>并行</b><b class='flag-5'>流水线</b>音频直通

    各种流水线特点及常见流水线设计方式

    按照流水线的输送方式大体可以分为:皮带流水装配线、板链线、倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线
    的头像 发表于 07-05 11:12 7332次阅读
    各种<b class='flag-5'>流水线</b>特点及常见<b class='flag-5'>流水线</b>设计方式

    嵌入式_流水线

    ,每个子过程由专门的功能部件来实现。• 把多个处理过程在时间上错开,依次通过各功能段,这样,每个子过程就可以与其他的子过程并行进行。流水线中的每个子过程及其功能部件称为流水线的级或段,段与段相互连接形成
    发表于 10-20 20:51 6次下载
    嵌入式_<b class='flag-5'>流水线</b>

    什么是流水线 Jenkins的流水线详解

    jenkins 有 2 种流水线分为声明式流水线与脚本化流水线,脚本化流水线是 jenkins 旧版本使用的流水线脚本,新版本 Jenkin
    发表于 05-17 16:57 1083次阅读

    以Gpipe作为流水线并行的范例进行介绍

    和充沛优质的硬件资源 算法的迭代创新 在大模型训练这个系列里,我们将一起探索学习几种经典的分布式并行范式,包括 流水线并行(Pipeline Parallelism),数据
    的头像 发表于 05-25 11:41 1086次阅读
    以Gpipe作为<b class='flag-5'>流水线</b><b class='flag-5'>并行</b>的范例进行介绍

    Google GPipe为代表的流水线并行范式

    但在实际应用中,流水线并行并不特别流行,主要原因是模型能否均匀切割,影响了整体计算效率,这就需要算法工程师做手调。因此,今天我们来介绍一种应用最广泛,最易于理解的并行范式:数据并行
    的头像 发表于 05-26 14:40 1022次阅读
    Google GPipe为代表的<b class='flag-5'>流水线</b><b class='flag-5'>并行</b>范式