1 TMS320C6678存储器访问性能 (下)-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TMS320C6678存储器访问性能 (下)

电子工程师 来源:网络整理 2018-02-19 01:11 次阅读

1. DMA访问存储器的性能

EDMA3架构支持很多功能,可以实现高效的并行数据传输。本节讨论影响它性能的很多因素,如存储器类型,地址偏移等。

1.1 DMA传输的额外开销

一般的传输时延被定义为EDMA被触发到真正的数据传输开始的时间。由于数据传输开始的时间无法用简单的方法测量,所以我们用最小数据单元的传输完成时间来代表DMA传输的时延或额外开销。根据不同源/目的地址的组合,这个值会有所不同。表4列出了在1GHz C6678 EVM(64-bit 1333MTS DDR)上测得的从EDMA触发(写ESR)最小数据传输(1 word)到EDMA 传输结束(读到IPR=1) 的平均的时钟周期数。

表4 EDMA CC0传输的额外开销

表5 EDMA CC1和EDMA CC2传输的额外开销

由于EDMA CC0 连接到离SL2 和DDR 比较近的内部总线交换网络,因此它访问SL2 和DDR 额外开销比较小。而EDMA CC1 和CC2 连接到离DSP 核的L1 和LL2 比较近的内部总线交换网络,所以它们访问L1 和LL2 的额外开销比较小。

IDMA 一般用来在LL2 内部拷贝数据,测试得到的IDMA 的平均额外开销是61 个时钟周期。

传输的额外开销是小数据量传输要考虑的重要因素。单个数据单元的传输时间完全由DMA 的额外开销决定。所以,对于小数据量的拷贝,我们需要在用DMA 和用DSP 核之间做权衡选择。

1.2 EDMA 10 个传输引擎的区别

C6678 上包含10 个EDMA3 TC (Transfer Controller) 。这10 个传输引擎并不完全相同。Table 6 总结了它们之间的区别。

表6 EDMA 传输引擎之间的区别

表7 比较了在1GHz C6678 EVM(64-bit 1333MTS DDR)上测得的各个EDMA TC 的最大吞吐量。测试的参数ACNT=1024,BCNT=128,AB_Sync(一次传完ACNTxBCNT)。

表7 1GHz C6678 上EDMA TC 吞吐量比较

对SL2 和DDR 之间的传输,TC0_0 和TC0_1 能达到的吞吐量是其它TC 的两倍。在本文其它部分,如果没有特殊说明,EDMA 性能数据都是在TC0_0 上测得的。

1.3 EDMA 带宽和传输灵活性的权衡

EDMA3 支持很多灵活的传输参数配置。多数配置情况下EDMA 可以充分利用存储器带宽;但在某些情况下,传输性能可能会有所下降。为了设计高效的系统,我们需要理解什么样的配置能够实现高效的传输,而某些情况下必须在灵活性和效率之间做权衡。

1.3.1 第一维大小 (ACNT) 的考虑(突发数据块大小)

为了充分利用传输引擎的带宽,传输尽量大的数据块是非常重要的。

为了充分利用128-bit 或256-bit 的总线,ACNT 应该是16 bytes 的整数倍;为了充分利用EDMA的突发数据块,ACNT 需要是64 bytes 的整数倍;为了充分利用EDMA FIFO,ACNT 应该至少是512 bytes。

图7 画出了在1GHz C6678 EVM(64-bit 1333MTS DDR)上,从SL2 到DDR 传输1~24K bytes 数据时测得的吞吐量。

图7 ACNT 对EDMA 效率的影响

从测试结果可以看出,ACNT 越大,带宽的利用率越高。

1.3.2 二维传输的考虑(传输优化)

如果2D 传输 (AB_Sync)是线性的 (BIDX=ACNT),并且ACNT 是2 的幂次方,EDMA 会把这个2D 传输优化为1D 传输。我们在1GHz C6678 EVM(64-bit 1333MTS DDR)上测试了不同的ACNT 和BCNT 的组合;图 8是线性2D 传输的测试结果,它说明,不管BCNT 是多少,带宽由ACNTxBCNT 的乘积决定。

图8 线性 2D 传输

如果2D 传输不是线性的,带宽的利用率完全有ACNT 决定(参见图 7)。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7484

    浏览量

    163759
  • TMS320C6678
    +关注

    关注

    3

    文章

    38

    浏览量

    18141
收藏 人收藏

    评论

    相关推荐

    想建立一个TMS320C6678的工程,但是DEVICE选择的时候没有TMS320C6678的选项,能指点一吗?

    本帖最后由 一只耳朵怪 于 2018-6-19 14:37 编辑 我想建立一个TMS320C6678的工程,但是DEVICE选择的时候没有TMS320C6678的选项,能指点一吗?如下图:?
    发表于 06-19 00:31

    请问SM320C6678TMS320C6678的区别有哪些?

    出温度范围外,请问SM320C6678TMS320C6678的区别有哪些?谢谢。
    发表于 07-24 06:42

    TMS320C6678 连接CMOS摄像头的接口,请问是将摄像头连接到TMS320C6678的哪个端口?

    您好!我们项目中需要使用TMS320C6678连接摄像头进行图像数据采集,请问是将摄像头连接到TMS320C6678的哪个端口?是将CMOS摄像头直接连上吗?还是中间需要转换
    发表于 08-03 08:33

    请问tms320c6678在CPCI板卡上如何设计

    我想用tms320c6678作为处理设计一款CPCI的板卡,可是6678上只有PCIE,没有PCI,我应该怎么做才能实现6678与上位机之间通信,谢谢!!!
    发表于 12-28 11:05

    TMS320C6678处理性能怎么样?

    TMS320C6678处理性能怎么样?怎么探讨TMS320C6678处理的VLFFT演示?
    发表于 04-19 10:53

    TI TMS320C6678是什么?有何功能

    CPU处理TI TMS320C6678是一款TI KeyStone C66x多核定点/浮点DSP处理,集成了8个C66x核,每核心主频高
    发表于 12-30 06:08

    TMS320C6678的相关资料推荐

    CPU处理TI TMS320C6678是一款TI KeyStone C66x多核定点/浮点DSP处理,集成了8个C66x核,每核心主频高
    发表于 01-03 06:07

    TI推出适合高性能计算的8核DSP产品TMS320C6678/TMS320TCI6609

    德州仪器 (TI) 宣布推出 TMS320C66x系列最新产品TMS320C6678TMS320TCI6609 数字信号处理 (DSP),为开发人员带来业界
    发表于 11-22 10:40 3165次阅读

    TMS320C6678视频编解码实现

    TI 提供了包含有综合而全面的视频、音频和语音编解码组合的全新多媒体解决方案。TMS320C6678可以帮助实现系统级的低成本、低功耗和高密度媒体解决方案,适用于多媒体网关、IMS 媒体服务、视频会议服务以及视频广播设备等应
    发表于 01-20 15:52 15次下载

    TMS320C6678的用于多核软件开发套件 (MCSDK) K的安装资料

    TMS320C6678的用于多核软件开发套件 (MCSDK) K的安装资料
    发表于 10-19 09:25 15次下载
    <b class='flag-5'>TMS320C6678</b>的用于多核软件开发套件 (MCSDK) K的安装资料

    TMS320C6678处理的VLFFT演示探讨与研究

    1,2,4或8核时各自的运行时间。演示的结果证明了C66X DSP内核的优异性能,以及TMS320C6678处理跨多核平行化执行性能与内核
    发表于 01-31 22:58 4373次阅读
    <b class='flag-5'>TMS320C6678</b>处理<b class='flag-5'>器</b>的VLFFT演示探讨与研究

    TMS320C6678存储器访问性能详细中文资料

    TMS320C6678 有8 个C66x 核,典型速度是1GHz,每个核有 32KB L1D SRAM,32KBL1P SRAM 和512KB LL2 SRAM;所有DSP 核共享4MB SL2 SRAM。一个64-bit1333MTS DDR3 SDRAM接口可以支持8
    发表于 04-26 17:46 14次下载
    <b class='flag-5'>TMS320C6678</b><b class='flag-5'>存储器</b><b class='flag-5'>访问</b><b class='flag-5'>性能</b>详细中文资料

    TMS320C6678 多核定点和浮点数字信号处理

    德赢Vwin官网 网为你提供TI(ti)TMS320C6678相关产品参数、数据手册,更有TMS320C6678的引脚图、接线图、封装手册、中文资料、英文资料,TMS320C6678真值表,TMS32
    发表于 11-02 19:35
    <b class='flag-5'>TMS320C6678</b> 多核定点和浮点数字信号处理<b class='flag-5'>器</b>

    TI TMS320C6678 DSP多核通信开发说明手册

    前言本文主要介绍TMS320C6678处理开发中比较常用的两种多核通信方式:TI-IPC和OpenMP,以及多核编程注意事项。OpenMP依赖于BIOS-MCSDK多核软件开发包中
    发表于 01-06 09:37 32次下载

    基于TMS320C6678的八核DSP雷达信号分选电路

    德赢Vwin官网 网站提供《基于TMS320C6678的八核DSP雷达信号分选电路.pdf》资料免费下载
    发表于 11-06 10:28 1次下载
    基于<b class='flag-5'>TMS320C6678</b>的八核DSP雷达信号分选电路