1 ARM NEON技术在车位识别算法中有哪些应用？ - 嵌入式学习小组 - 电子技术论坛 - 广受欢迎的专业电子论坛! - 德赢Vwin官网

发帖

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

ARM NEON技术在车位识别算法中有哪些应用？

1958 ARM Linux

问答对人有帮助，内容完整，我也想知道答案 0 随着城市越来越多家庭拥有汽车，相应的停车场建设数目也越来越多，停车场管理系统也越来越重要。而国内城市车多人多，空间拥挤给停车厂管理带来诸多不便。车位检测系统设计成嵌入式终端是一个好的选择。图像检测算法的复杂度给实时检测带来难题，一般的图像处理都是基于DSP完成，这带来了成本的上升。 ARM 公司CORTEX-A 系列处理器的出现，极大地缓解了这个难题。 0
2019-9-2 07:34:48　　评论淘帖0 邀请回答您可以邀请以下用户，快速回答问题 × HengDu 该类别下有 16 个回答。邀请回答 heks 该类别下有 16 个回答。邀请回答 ChristineGu 该类别下有 16 个回答。邀请回答 dfasda 该类别下有 15 个回答。邀请回答 nhonglan 该类别下有 15 个回答。邀请回答 yonglanzhang 该类别下有 15 个回答。邀请回答杀狼000 该类别下有 14 个回答。邀请回答 wenminglang 该类别下有 14 个回答。邀请回答 C880U 该类别下有 14 个回答。邀请回答 jhdfvs 该类别下有 14 个回答。邀请回答 chm5 该类别下有 14 个回答。邀请回答 muwersddg 该类别下有 14 个回答。邀请回答 kszdj113 该类别下有 13 个回答。邀请回答飞雪9366 该类别下有 13 个回答。邀请回答 billbian 该类别下有 13 个回答。邀请回答 a732538 该类别下有 13 个回答。邀请回答 hrtuoyu 该类别下有 13 个回答。邀请回答 hfgdzc 该类别下有 13 个回答。邀请回答 thyysbk 该类别下有 13 个回答。邀请回答凡人wlj 该类别下有 13 个回答。邀请回答举报 h1654155275.6347 相关推荐 • RJMU401在车载T-BOX中国密算法的流程是怎样的 1858 • NEON汇编与NEON intrinsics编程的优缺点比较 3469 • 几类汽车识别系统的经典设计方案 2079 • 如何利用NEON内置函数来加速实现统计一个数组内的元素之和 3100 • NEON在armv8(arch64)下如何去使用呢 2801 • 你知道ARM处理器 neon优化技巧有哪些吗 5653 • 立体停车场车位状态显示，传感器，PLC 3092 • 什么是人脸识别技术 3312 • 基于starterware的VFP/NEON应用指导 2949 • 有没有人知道在车牌识别中进行字符的归一化 4299 4个回答

答案对人有帮助，有参考价值 0 ARM 平台能够很好地支持Linux 系统，Linux 系统具有强大的网络通讯功能，也给程序移植等带来便利。本文的检测算法在ARM平台基于NEON技术进行了优化，在保证检测精度的同时，处理速度提升明显，与使用DSP相比，大大节约了成本，为停车场管理系统的研究提供新的方向。 1 ARM NEON技术介绍 ARM 的NEON 通用SIMD 引擎可有效处理当前和将来的多媒体格式，从而改善用户体验。NEON 技术是通过清晰方式构建的，并可无缝用于其本身的独立流水线和寄存器文件。NEON 技术是ARM Cortex-A系列处理器的128 位SIMD(单指令多数据)体系结构扩展，旨在为多媒体应用提供更加强大的加速功能，从而明显改善程序性能。它具有32 个寄存器，64 位宽(是16 个寄存器，128 位宽的双倍视图)NEON 指令特点如下： (1)寄存器被视为同一数据类型的元素的矢量; (2)数据类型可为：有符号/无符号的8 位、16 位、32 位、64 位单精度浮点; (3)指令在所有通道中执行同一操作。 NEON 寄存器可在多个通道内进行并行运算，如图1所示。 NEON 的指令都是以v 字母开头的，例如：vadd.i16q0,q1,q2,这就是一个NEON 的指令了，很明显的特点就是v 开头，i 主要用来表明是一个整型(int)，16 表示一个16 位的型，q0,q1,q2 都是128 位的寄存器(q 打头的寄存器都是128 位的)。这个指令就是让q1,q2 中装载8 个16位的数据，然后执行加法操作，最后放到q0中去。这么一个指令就完成了8次加法运算，这也就是性能的提升，对于其他运算也是如此。

2019-9-2 15:46:41 评论举报李开心

答案对人有帮助，有参考价值 0 2 系统设计和算法介绍本系统基于CORTEX-A8平台实现，车位检测系统架构如图2所示。采集通过模拟摄像头，由TVP5150解码后输出8位Y∶Cb∶Cr=4∶2∶2的数据传送的A8平台，TVP5150驱动基于VIDEO FOR LINUX2(V4L2)开发，因此视频采集程序调用V4L2相关API函数即可完成。然后调用相关图像处理程序，提取多个图像特征，与背景图像对比，进行有车无车检测，然后TCP/IP网络将图像和有车位车情况发送到上位机。车位检测算法流程如图3所示。本系统目前在一处地下停车场进行测试验证，如图4在停车中采集到的背景和待测图像，通过对100幅采集到800×600 分辨率的现场图像，在CORTEX-A8 平台上进行测试，平均检测时间为538 ms,该算法在地下停车场中准确率97%.表1 中给出了处理一幅待测图像CORTEX-A8 和ARM11 平台优化前平均时间的测试对比结果(均使用GCC交叉编译)。

2019-9-2 15:46:54 评论举报张亮

答案对人有帮助，有参考价值 0 3 图像处理算法在CORTEX-A8 平台上的优化本系统是Cortex-A8和Linux系统上搭建，Linux下使用的编译器为GCC.本文中使用普通C 语言优化和NEON编程优化对图像相关函数进行了优化，并进行了测试对比，下面给出方差函数variance代码进行优化前后的对比说明，如图5优化前的代码。 3.1 C语言级别优化对于一般C语言级别的优化，对于图像这类矩阵数据而言，主要针对循环优化。以第一个循环为例，如图6对于C语言级别循环优化后的代码如图6所示。由优化后的结果可见，通过对循环展开，有效的减少了循环跳转次数，跳转为原来的1 4 .但是也可以发现，加法运算次数，几乎和原来相同并没有减少。对于其他for循环和其他函数进行优化后，测试时间对比如表2所示。由表中数据可见，使用普通C 语言界别优化，并没有明显提升，原因是在Linux系统上使用GCC编译器进行编译的，在选择-O2 级别优化的时候，已经对循环进行了优化，所以运行速度没有明显提升。 3.2 使用NEON技术的优化 GCC 编译器从4.3 版本开始，很好地提供了对ARM NEON 技术的支持。例如GCC 中的函数： uint32x2_t vadd_u32(uint32x2_t,uint32x2_t)，对应汇语言：vadd.i32 d0,d0,d0.uint32x2_t代表这个数据类型是2 个32 位无符号整型。在使用GCC 编译器中的NEON 技术时，需要包含头文件.NEON增强指令集是在Cortex-A系列发布后才具有的功能，因此ARM11 无法使用NEON 技术。对方差函数variance第一个for循环优化后的代码对比如图7所示。由优化后程序代码可见，循环跳转次数为原来的1 4 ,但是由于使用了NEON 相关的vld1q_u32 函数，一次可在NEON的128位寄存器中装入4个32位数值，调用vaddq_u32可对4个数据时同时进行加法运算，在一个指令周期就完成了4次加法运算，理论上加法运算次数为原来的1 4 ,大大提高了运算性能。对于第二个for循环也可以采用类似方法优化，只是调用的函数略有不同，具体考参考GCC的技术文档，有详细的使用说明。其他函数如预处理、角点、相关度函数的优化和此方法类似，重点针对循环和可以并行运算的代码进行优化。表3 中给出了Cortex-A8 平台使用NEON 技术优化后与ARM11测试时间的对比。

2019-9-2 15:46:59 评论举报康选谦

答案对人有帮助，有参考价值 0 4 结语通过使用ARM NEON 技术，对于图像处理这类矩阵运算进行并行优化，可大大提高处理速度，进行优化后，速度较优化前提升了达2倍之多，较ARM11提升了8 倍的速度。ARM COTEX-A 系列所使用的NEON 技术，不仅使车位图像检测算法的速度有很大提升，在信号处理等多媒体处理算法中，也有广阔的应用前景。

2019-9-2 15:47:00 评论举报尹明

只有小组成员才能发言，加入小组>>

嵌入式学习小组

7948个成员聚集在这个小组

精选推荐

推荐一个支持js的嵌入式设备开发平台

791 浏览 0 评论
如何在KEIL中添加NUC972芯片？

1151 浏览 1 评论
如何设计多路数据采集系统中FIFo？

2527 浏览 5 评论
FreeRTOS中如何写硬件中断程序啊？

2860 浏览 9 评论
移植了freeRTOS到STMf103之后显示没有定义的原因？

2710 浏览 6 评论

最新话题

热门话题

keil5中manage run-time environment怎么是灰色，不可以操作吗？

1070浏览 3评论
求助，求推荐性价比较高的单片机

193浏览 2评论
N76E003 GPIO初始化后电平异常怎么解决？

455浏览 2评论
nu_link在keil烧录完程序后复位脚会拉低怎么解决？

368浏览 2评论
M0518 PWM的电压输出只有2V左右，没有3.3V是怎么回事？

453浏览 1评论

创建小组步骤

创建小组创建自己的地盘
个性设置精心打造小组空间
邀请好友邀请好友加入我的小组
小组升级小组积分升级赢得社区推荐

创建属于自己的小组

快速回复 返回顶部 返回列表

关注微信公众号

德赢Vwin官网网

德赢Vwin官网论坛

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@huaqiu.com

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

返回嵌入式学习小组

回复

关闭

站长推荐 /6

快速回复 返回顶部 返回列表

- 技术社区: HarmonyOS技术社区

RISC-V MCU技术社区

FPGA开发者技术社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM技术论坛

STM32/STM8技术论坛

嵌入式技术论坛

单片机/MCU论坛

RISC-V技术论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源技术论坛: 电源技术论坛

无线充电技术

- 综合技术与应用: 机器人论坛

USB论坛

电机控制

模拟技术

音视频技术

综合技术交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI技术

蓝牙技术

天线|RF射频|微波|雷达技术

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS技术论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量技术

传感技术

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

time

recommend

hot

post

—
—
—

版
块
导
航