1 AI Engine架构的构成及应用优势-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI Engine架构的构成及应用优势

FPGA技术驿站 来源:TeacherGaoFPGAHub 作者:TeacherGaoFPGAHub 2022-03-09 15:47 次阅读

AI Engine阵列是由一系列的AI EngineTile构成。每个AI Engine Tile包含一个AI Engine,一个存储单元和一个互连单元,如下图所示。可以看到相邻两行AI Engine Tile的存储单元与AI Engine的位置正好相反。

da237382-9e02-11ec-952b-dac502259ad0.png

存储单元可被东西南北四个方向的AI Engine共享,当然这也跟AI Engine的位置有关。例如图中红色AI Engine可访问与之相邻的4个存储单元(黄色标记)。最右侧的橙色AI Engine就只能访问三个存储单元,因为其位于边界。每个方向的存储单元都有对应的存储器接口,AI Engine在访问相应方向的存储单元时正是通过这些接口实现的。每次访问的最大位宽为256。

水平方向相邻的两个AI Engine之间还有级联端口,用于传送累加器的结果。仍以上图为例,最下方的一行AI Engine可从左至右级联,倒数第二行的AI Engine可从右至左级联。同时,最下方级联至最右侧时可与倒数第二行最右侧的AI Engine级联,形成蛇形级联。

互连单元采用AIX4 Stream接口将数据在东西南北四个方向传送。同时每个AI Engine Tile的存储单元都包含一个DMA。每个DMA由一个独立的S2MM和一个独立的MM2S构成。前者用于将数据从Stream上取下来写入到存储单元,后者用于将存储单元的数据上传到Stream,如下图所示。

da32f7a8-9e02-11ec-952b-dac502259ad0.png

再看AI Engine自身,如下图所示。每个AIEngine包含一个程序存储单元,大小为16KB,有2个Stream输入接口和2个Stream输出接口,均为32位。因此,每个时钟周期可从一个Stream上获取一个32位数据或每4个时钟周期可从一个Stream上获取一个128位数据。每个AI Engine还有4个存储单元访问接口,但每个时钟周期只可以有两次读操作和一次写操作。

da4b3c8c-9e02-11ec-952b-dac502259ad0.png

至此,我们可以看到AI Engine有三种数据源:存储单元、AXI4-Stream和级联接口。因此,编程时需要充分了解AIE的数据访问能力:2个32位AXI4-Stream输入,2个32位AXI4-Stream输出,1个384位级联Stream输入,1个384位级联Stream输出,2个256位读操作和1个256位写操作。

AI Engine本身是一个高度优化的SIMD(Single Instruction Multiple Data)& VLIW(Very Long Instruction Word)处理器,包含1个标量处理单元,1个向量处理单元,2个读地址发生器,1个写地址发生器,1个取指和译码单元,如下图所示。正因为有2个读地址发送器和1个写地址发生器,所以每次访问可实现2个256读操作和1个256写操作。

da7e52ca-9e02-11ec-952b-dac502259ad0.png

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19259

    浏览量

    229638
  • AI
    AI
    +关注

    关注

    87

    文章

    30726

    浏览量

    268870

原文标题:AIE(12)—AI Engine架构概览

文章出处:【微信号:Lauren_FPGA,微信公众号:FPGA技术驿站】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NanoEdge AI的技术原理、应用场景及优势

    能耗并提高数据安全性。本文将对 NanoEdge AI 的技术原理、应用场景以及优势进行综述。 1、技术原理 NanoEdge AI 的核心技术包括边缘计算、神经网络压缩和低功耗硬件设计。边缘计算
    发表于 03-12 08:09

    AI芯片热潮和架构创新有什么作用

    魏少军谈AI芯片热潮和架构创新 透露清华Thinker芯片将独立融资
    发表于 04-23 14:59

    AI芯片热潮和架构创新是什么

    魏少军谈AI芯片热潮和架构创新 透露清华Thinker芯片将独立融资
    发表于 04-24 11:29

    基于ATCA的测试系统架构是如何构成的?

    ATCA在测试领域有哪些应用实例?基于ATCA的测试系统架构是如何构成的?
    发表于 05-11 07:01

    UltraScale DSP48 Slice架构优势是什么?

    UltraScale DSP48 Slice架构优势是什么?UltraScale内存架构优势是什么?
    发表于 05-24 06:34

    Openharmony的ACE engine lite部分是否需要MMU的支持?

    `M7架构的能不能跑OpenHarmony的ACE ENGINE?目前对ace依赖的环境还不熟悉,如果支持ACE的话,需要修改哪些部分呢?`
    发表于 05-31 09:25

    基于docker技术的工业App架构是如何构成

    基于docker技术的工业App架构是如何构成的?
    发表于 09-28 06:35

    XILINX FPGA 芯片整体架构是如何构成

    XILINX FPGA 芯片整体架构是如何构成的?XILINX FPGA 芯片有哪些资源?
    发表于 10-29 06:26

    STM32芯片的架构是如何构成

    STM32是什么?有哪几种分类?STM32芯片的架构是如何构成的?
    发表于 10-29 07:53

    基于CMSIS标准的软件架构是怎样构成

    CMSIS标准是什么意思?基于CMSIS标准的软件架构是怎样构成的?
    发表于 11-04 06:06

    【CC3200AI实验教程11】疯壳·AI语音人脸识别-AI语音系统架构

    CC3200AI实验教程——疯壳·开发板系列AI语音系统架构AI语音识别系统的系统架构如图1.0.1所示。图1.0.1
    发表于 08-30 14:54

    【CC3200AI实验教程14】疯壳·AI语音人脸识别-AI人脸系统架构

    CC3200AI实验教程——疯壳·开发板系列AI人脸系统架构AI人脸识别系统由7大块组成,分别是摄像头、CC3200、串口调试助手、路由器、公网、服务器、数据库以及百度
    发表于 08-31 16:35

    Map Service Engine Based On We

    Abstract:A design and implementation of map service engine based on web is introduced
    发表于 07-23 10:43 17次下载

    Qualcomm推出人工智能引擎AI Engine

    优势包括即时响应、隐私保护增强和可靠性提升。得益于人工智能引擎AI Engine的支持,骁龙核心硬件架构——Qualcomm® Hexagon™ 向量处理器、Qualcomm® Adr
    发表于 03-20 18:07 1855次阅读

    蚂蚁数科发布新一代融合AI风控引擎“AIR Engine

    在数字化浪潮的推动下,金融科技领域的风控技术正迎来新的突破。近日,蚂蚁数科旗下的蚁盾风控团队正式发布了新一代融合AI风控引擎——“AIR Engine(AIFUSERiskEngine)”,该引擎在原有的决策式AI
    的头像 发表于 06-26 18:20 1236次阅读