1 当深度学习遇上TDA4-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

当深度学习遇上TDA4

星星科技指导员 来源:TI 作者:Fredy Zhang;Kangjia 2023-03-15 10:09 次阅读

深度学习机器学习的一个子集,常用于自然语言处理,计算机视觉等领域,与众不同之处在于,DL(Deep Learning )算法可以自动从图像、视频或文本等数据中学习数据特征。DL可以直接从数据中学习,这比较类似于人脑的运行方式,获得更多数据后,准确度也会越来越高。TIDL(TI Deep Learning Library) 是TI平台基于深度学习算法的软件生态系统,可以将一些常见的深度学习算法模型快速的部署到TI嵌入式平台。 TDA4拥有TI最新一代的深度学习加速模块C7x DSP与MMA矩阵乘法加速器,可以运行TIDL进行卷积等基本计算,从而快速地进行前向推理,得到计算结果。 当深度学习遇上TDA4,你的模型部署流程将变得简单,你的模型将高效地运行在TDA4上。

TI 最新一代的汽车处理器TDA4VM集成了高性能计算单元C7x DSP(Digital Signal Processor)和Deep-learning Matrix Multiply Accelerator(MMA),可以高效地进行卷积计算、矩阵变换等一些基本地深度学习算子。TIDL 是TI的针对于嵌入式平台部署深度学习不方便,计算效率低下而设计的一个软件生态系统,用于加速 TI 嵌入式设备上的深度神经网络Deep Neural Networks (DNN)计算加速。 上一代产品 TDA2/3 系列处理器,集成了计算单元 DSP(Digital Signal Processor)和 EVE(Embedded Vision/Vector Engine),用于加速计算深度学习神经网络。相比于上一代TDA2/TDA3系列处理器,最新一代的TDA4处理器在算例上得到了大幅提高的同时,在软件方面提供了更好地支持,同时提供了更多的深度学习模型的部署示例,方便开发人员快速开发迭代产品,极大地缩短的产品开发周期。

pYYBAGQRKMqAH9FhAAFvNQDUgPE901.png

图1. TIDL SW Framework

基于深度神经网络 (DNN) 的机器学习算法用于许多行业,例如机器人工业和汽车。越来越多的基于 DNN 的机器学习算法被应用于 ADAS 产品中,如车道线检测,交通信号灯识别,行人识别等ADAS基础功能均采用DNN算法实现。这些DNN神经网络算法通常需要大量的计算,而TI TDA4系列处理器中的C7x和MMA可以将一些DNN中的算子进行加速计算,以实现快速推理得到识别结果。RTOS SDK 中集成了众多的Demo展示TIDL在TDA4处理器上对实时的语义分割和 SSD 目标检测的能力。如下图2:AVP的demo展示了使用TIDL对泊车点、车辆的检测。

pYYBAGQRKMuAeg4sAAEMaFGB14E810.png

图2. TIDL SW Framework

TIDL当前支持的训练框架有Tensorflow、Pytorch、Caffe等,用户可以根据需要选择合适的训练框架进行模型训练。TIDL可以将PC端训练好的模型导入编译生成TIDL可以识别的模型格式,同时在导入编译过程中进行层级合并以及量化等操作,方便导入编译后的模型高效的运行在具有高性能定点数据感知能力TDA4硬件加速器上。 TIDL提供了一些的工具,如模型导入工具,模型可视化工具等,非常便捷地可以对训练好地模型进行导入。

poYBAGQRKMyADFmTAABsREPFg54349.png

图3. TIDL Tools

TIDL Runtime 是运行在TDA4端的实时推理单元,同时提供了TIDL的运行环境,对于input tensor,TIDL TIOVX Node 调用TIDL 的深度学习加速库进行感知,并将结果进行输出。

pYYBAGQRKM2AJiObAABamsWM3iI992.png

图4. TIDL Runtime

如图5所示,是TIDL的软件框架。在TIDL上,深度学习网络应用开发主要分为三个大的步骤(以TI Jacinto7TM TDA4VM处理器为例):

pYYBAGQRKM6AbMypAABOgWqM8K8253.png

图5. TIDL SW Framework

基于Tensorflow、Pytorch、Caffe 等训练框架,训练模型:选择一个训练框架,然后定义模型,最后使用相应的数据集训练出满足需求的模型。

基于TI Jacinto7TM TDA4VM处理器导入模型: 训练好的模型,需要使用TIDL Importer工具导入成可在TIDL上运行的模型。导入的主要目的是对输入的模型进行量化、优化并保存为TIDL能够识别的网络模型和网络参数文件。

基于TI Jacinto7TM SDK 验证模型,并在应用里面部署模型:

PC 上验证并部署

在PC上使用TIDL推理引擎进行模型测试。

在PC上使用OpenVX框架开发程序,在应用上进行验证。

EVM上验证并部署

在EVM上使用TIDL推理引擎进行模型测试。

在EVM上使用OpenVX框架开发程序,在应用上进行验证

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5082

    文章

    19104

    浏览量

    304763
  • 计算机
    +关注

    关注

    19

    文章

    7488

    浏览量

    87846
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121109
收藏 人收藏

    评论

    相关推荐

    TDA4深度学习的重要性

    快速的部署到TI嵌入式平台。 TDA4拥有TI最新一代的深度学习加速模块C7x DSP与MMA矩阵乘法加速器,可以运行TIDL进行卷积等基本计算,从而快速地进行前向推理,得到计算结果。
    发表于 11-03 06:53

    超异构芯片TDA4内核解析

    1、超异构芯片TDA4内核解析超异构芯片最近是比较火的一个名词,其集中特性是将各类不同的芯片内核进行融合,这种集成式芯片设计可以充分整合芯片资源,进一步提升数据计算效率。并且由于芯片在设计之初就打
    发表于 12-09 16:29

    基于深度学习算法的软件生态系统

    模型快速的部署到TI嵌入式平台。 TDA4拥有TI最新一代的深度学习加速模块C7x DSP与MMA矩阵乘法加速器,可以运行TIDL进行卷积等基本计算,从而快速地进行前向推理,得到计算结果。
    的头像 发表于 06-30 17:01 2110次阅读
    基于<b class='flag-5'>深度</b><b class='flag-5'>学习</b>算法的软件生态系统

    TDA4行泊一体,打开智能驾驶的新篇章

    TDA4行泊一体,打开智能驾驶的新篇章
    发表于 10-28 11:59 13次下载
    单<b class='flag-5'>TDA4</b>行泊一体,打开智能驾驶的新篇章

    深度学习遇上TDA4

    深度学习遇上TDA4
    发表于 10-28 11:59 2次下载
    <b class='flag-5'>当</b><b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>遇上</b><b class='flag-5'>TDA4</b>

    TDA4动态热检测与控制方案

    TDA4动态热检测与控制方案
    发表于 10-28 11:59 1次下载
    <b class='flag-5'>TDA4</b>动态热检测与控制方案

    德州仪器TDA4背后的OpenVX介绍

    近年来行泊一体大行其道,德州仪器的TDA4占了行泊一体大约70%的市场。其背后关键的就是OpenVX。
    的头像 发表于 02-16 09:18 8504次阅读

    TDA4 SPL SBL启动流程简析

    TDA4是TI推出的一款高性能、超异构的多核SoC,拥有ARM Cortex-R5F、ARM Cortex-A72、C66以及C71内核,可以部署AUTOSAR CP系统、HLOS(Linux或
    的头像 发表于 10-24 16:37 2408次阅读
    <b class='flag-5'>TDA4</b> SPL SBL启动流程简析

    TDA4刷写技术

    德赢Vwin官网 网站提供《TDA4刷写技术.pdf》资料免费下载
    发表于 08-23 10:15 2次下载
    <b class='flag-5'>TDA4</b>刷写技术

    TDA4:定制电路板启动指南

    德赢Vwin官网 网站提供《TDA4:定制电路板启动指南.pdf》资料免费下载
    发表于 08-28 11:50 0次下载
    <b class='flag-5'>TDA4</b>:定制电路板启动指南

    TDA4系列的SPI启用和验证

    德赢Vwin官网 网站提供《TDA4系列的SPI启用和验证.pdf》资料免费下载
    发表于 09-04 10:50 2次下载
    <b class='flag-5'>TDA4</b>系列的SPI启用和验证

    基于Pytorch训练并部署ONNX模型在TDA4应用笔记

    德赢Vwin官网 网站提供《基于Pytorch训练并部署ONNX模型在TDA4应用笔记.pdf》资料免费下载
    发表于 09-11 09:24 0次下载
    基于Pytorch训练并部署ONNX模型在<b class='flag-5'>TDA4</b>应用笔记

    TDA4 Edge AI处理器的性能和效率基准测试

    德赢Vwin官网 网站提供《TDA4 Edge AI处理器的性能和效率基准测试.pdf》资料免费下载
    发表于 09-11 09:21 0次下载
    <b class='flag-5'>TDA4</b> Edge AI处理器的性能和效率基准测试

    TDA4泊车应用中的超声波雷达集成方案

    德赢Vwin官网 网站提供《TDA4泊车应用中的超声波雷达集成方案.pdf》资料免费下载
    发表于 09-27 11:26 1次下载
    <b class='flag-5'>TDA4</b>泊车应用中的超声波雷达集成方案

    TDA4 HS Prime密钥烧录以及vHSM的集成

    德赢Vwin官网 网站提供《TDA4 HS Prime密钥烧录以及vHSM的集成.pdf》资料免费下载
    发表于 09-27 11:05 1次下载
    <b class='flag-5'>TDA4</b> HS Prime密钥烧录以及vHSM的集成