手机识别模型案例-德赢Vwin官网网

导读

2023年以ChatGPT为代表的大语言模型横空出世，它的出现标志着自然语言处理领域取得了重大突破。它在文本生成、对话系统和语言理解等方面展现出了强大的能力，为人工智能技术的发展开辟了新的可能性。同时，人工智能技术正在进入各种应用领域，在智慧城市、智能制造、智慧医疗、智慧农业等领域发挥着重要作用。

本期介绍：模型案例：|手机识别模型！

RT-DETR

RT-DETR是基于DETR架构的端到端对象检测器，完全消除了对NMS的需求。通过这样做，RT-DETR显着减少了之前基于卷积神经网络（CNN）的对象检测器（如YOLO系列）的延迟。它结合了强大的主干、混合编码器和独特的查询选择器，可以快速准确地处理特征。

RT-DETR架构的关键组件

Backbone网络：通常采用高效的卷积神经网络（CNN）作为特征提取的基础，例如ResNet或EfficientNet，以获取图像的多尺度特征。从主干，RT-DETR提取三个级别的特征- S3，S4和S5，这些多尺度特征有助于模型理解图像的高级和细粒度细节。

Transformer编码器-解码器：RT-DETR中使用了Transformer的编码器-解码器结构，该混合编码器包括两个主要部分：基于注意力的尺度内特征交互（AIFI）和跨尺度特征融合（CCFF）。

基于注意力的尺度内特征交互（AIFI）

这个组件的核心思想是利用自注意力机制在同一尺度内进行特征交互。AIFI能够让模型有效地捕捉同一尺度特征图中各个位置之间的关系。

具体而言，AIFI通过计算特征的注意力权重，使得模型能够关注到重要的区域，并抑制冗余信息，从而增强对目标的定位和表征能力。

这种尺度内的交互有助于在相似尺寸的物体之间建立联系，提高对密集目标的检测能力。

跨尺度特征融合（CCFF）

CCFF负责整合来自不同尺度的特征，以便于模型能够从多层次的信息中获得更全面的上下文。这一过程通常涉及将来自不同尺度的特征图进行融合，通过卷积操作、上采样或下采样等方式，将这些特征进行对齐并结合在一起。

CCFF不仅允许模型综合不同尺度特征的优势，还能提高对各种大小目标的检测能力。

多尺度特征金字塔：RT-DETR通常会借助特征金字塔网络（FPN）来融合来自不同层次的特征，以加强对不同大小目标的检测能力。

目标查询（Object Queries）：解码器使用的目标查询是关键组件，它们用于引导模型对目标的检测，允许模型在生成检测结果时关注不同的潜在目标。

类别和边界框回归：在解码器中，RT-DETR通过类别预测和边界框回归来输出目标的类别和位置。

高效的训练策略：RT-DETR往往结合了一些改进的训练策略，如动态图损失（Dynamic Loss）和图像增强技术，以提高模型的收敛速度和检测精度。

后处理：如NMS（非极大值抑制）处理步骤，以去除冗余的检测框和优化最终的检测结果。

手机识别模型

该 AI 模型由 Swift yolo 算法生成，专为 Seeed Studio Grove Vision AI （V2）设备设计，能够高效识别和检测到手机。

应用场景

该模型适用于多种应用场景，包括零售、安全、公共空间监控和个人监督。

在零售业，该模型可以实时监控手机库存，帮助员工及时补货；

在安全方面，它可以帮助识别和跟踪丢失或被盗的手机；

在个人监督，很多学生上课玩手机，可以通过此模型进行监控。

SenseCraft Al平台

SenseCraft Al平台，是柴火母公司矽递科技旗下的AI平台，支持Grove-Vision AI V2、XIAO ESP32S3 Sense和NVIDlA Jetson设备的模型部署、模型训练和数据输出。

SenseCraft Al平台为使用者提供海量模型，简化模型训练过程并提供专业的AI视觉工作空间。

在Grove - Vision AI V2模块上部署模型

1、打开SenseCraft AI平台，如果第一次使用请先注册一个会员账号，还可以设置语言为中文。

平台地址：

https://sensecraft.seeed.cc/ai/#/model

2、在顶部单击【预训练模型】菜单，在公共AI模型列表中找到【手机检测】模型，单击此模型图片，如下图所示。

3、进入【手机检测】模型介绍页面，单击右侧的“部署模型”按钮，如下图所示。

4、进入部署手机检测模型页面，按提示步骤先连接摄像头，再连接设备到电脑 USB 接口上，最后单击【连接设备】按钮，如下图所示。

5、弹出部署模型窗口，单击“确定”按钮，如下图所示。

6、弹出连接到串行端口窗口，选择端口号后单击“连接”按钮，如下图所示。

7、开始进行模型部署、固件下载、设备重启等过程，完成后在预览中即可看到当前摄像头视频内容，将摄像头对准手机图片查看预测效果，如下图所示。

原型设计

利用此手机识别模型，设计一个桌面手机监控装置，此装置在检测到有人用手机时会点亮led模块，也可改为蜂鸣器模块进行报警，这样就有了一个防沉迷手机检测装置。

模型推理演示，请看如下视频

Grove Al视觉模块 V2套装介绍

Grove Al视觉模块 V2

OV5647-62摄像头

Grove - Vision Al Module V2是一款拇指大小的人工智能视觉模块, 配备Himax WiseEye2 HX6538处理器和Arm Ethos-U55嵌入式神经网络加速单元（NPU）, 该处理器采用 ArmCortex-M55双核架构。

Arm Ethos-U55 嵌入式神经网络处理器（NPU）

嵌入式神经网络处理器（NPU）是一种特别设计用于执行神经网络计算的高效率处理器。它主要基于数据驱动并行计算架构，特别擅长处理视频、图像等大量的多媒体数据。NPU模仿了生物神经网络的架构，与CPU、GPU相比，它能够通过更少的指令（一条或几条）完成神经元的处理，因此在深度学习的处理效率方面具有明显优势。

它具有标准的CSI接口, 并与树莓派相机兼容。它有一个内置的数字麦克风和SD卡插槽。它非常适用于各种嵌入式视觉项目。

有了SenseCraft Al算法平台, 经过训练的ML模型可以部署到传感器, 而不需要编码。它兼容XIAO系列和Arduino生态系统, 是各种物体检测应用的理想选择。

主要硬件配置

- 板卡基于WiseEye2 HX6538处理器, 采用双核ARM Cortex-M55架构

- 配备集成Arm Ethos-U55嵌入式神经网络处理器（NPU）, 兼容的树莓派相机

- 板载PDM麦克风, SD卡插槽, Type-C, Grove接口, 丰富的外设支持样机开发

- Seeed Studio XIAO的可扩展性, SenseCraft Al的现成AI模型用于无代码部署。

- 支持各种有效的模型, 包括MobilenetV1、MobilenetV2、 Eficientnet-Lite、Yolov5和Yolov8.

写在最后

SenseCraft-AI平台的模型仓数量还很少，但是好消息是它支持自定义模型上传并输出推理结果，平台会逐渐增加模型仓的数量和分享有爱好者设计的模型仓原型，敬请关注！

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

手机

手机

+关注

关注
35

文章
6874

浏览量
157542
模型

模型

+关注

关注
1

文章
3226

浏览量
48807

原文标题：模型案例：| 手机识别模型！

文章出处：【微信号：ChaiHuoMakerSpace，微信公众号：柴火创客空间】欢迎添加关注！文章转载请注明出处。

AI大模型在图像识别中的优势

AI大模型在图像识别中展现出了显著的优势，这些优势主要源于其强大的计算能力、深度学习算法以及大规模的数据处理能力。以下是对AI大模型在图像识别中优势的介绍：一、高效性与准确性处理速

发表于 10-23 15:01 •600次阅读

手机识别不了GATT_SERVER例程中的属性怎么办？

下载GATT_SERVER代码，在电脑上用bluetooth le explorer可以正确识别服务和属性，但在手机上用BLE调试助手识别的服务和属性不正确。修改GATT_SERVER中的蓝牙名称

发表于 07-19 08:08

人脸识别模型训练流程

人脸识别模型训练流程是计算机视觉领域中的一项重要技术。本文将详细介绍人脸识别模型的训练流程，包括数据准备、模型选择、

发表于 07-04 09:19 •935次阅读

人脸识别模型训练失败原因有哪些

人脸识别模型训练失败的原因有很多，以下是一些常见的原因及其解决方案：数据集质量问题数据集是训练人脸识别模型的基础。如果数据集存在质量问题，将直接影响

发表于 07-04 09:17 •600次阅读

人脸识别模型训练是什么意思

人脸识别模型训练是指通过大量的人脸数据，使用机器学习或深度学习算法，训练出一个能够识别和分类人脸的模型。这个模型可以应用于各种场景，如安防监

发表于 07-04 09:16 •575次阅读

Transformer模型在语音识别和语音生成中的应用优势

随着人工智能技术的飞速发展，语音识别和语音生成作为人机交互的重要组成部分，正逐渐渗透到我们生活的各个方面。而Transformer模型，自其诞生以来，凭借其独特的自注意力机制和并行计算能力，在

发表于 07-03 18:24 •1083次阅读

开发者手机 AI - 目标识别 demo

Lite的API接口实现主要功能； Mindspore Lite为Openharmony AI推理框架，为上层应用提供统一的AI推理接口，可以完成在手机等端侧设备中的模型推理过程； Neural

发表于 04-11 16:14

苹果ReALM模型在实体识别测试中超越OpenAI GPT-4.0

“我们的模型在识别各种类型实体方面都有显著提升，即使是小尺寸模型，在屏幕实体识别准确性上也已超过原有的系统5%以上。在与GPT-3.5和GPT-4.0的比较中，小型

发表于 04-02 11:23 •452次阅读

谷歌模型怎么用手机打开

要使用手机打开谷歌模型，首先需要明确一点：谷歌模型本身是在计算机上运行的程序或算法，而不是可以直接在手机上打开的应用程序。然而，你可以通过手机

发表于 03-01 16:23 •617次阅读

谷歌模型怎么用手机打开网页

请注意，谷歌模型本身是一个计算机程序，它并不能直接在手机浏览器上运行。但是，你可以使用手机上的谷歌浏览器来访问和浏览网页，这些网页可能是由谷歌或其他网站提供的，并使用了各种模型和技术。

发表于 03-01 16:19 •626次阅读

谷歌模型怎么用手机打开文件

要用手机打开谷歌模型文件，首先需要确定该文件的具体类型和格式。谷歌模型文件可能是以各种格式存在的，比如.pb（Protocol Buffers）、.h5（Keras/TensorFlow

发表于 02-29 18:17 •1456次阅读

谷歌模型软件怎么用手机下载

要在手机上下载谷歌模型软件，您可以遵循以下步骤。

发表于 02-29 18:16 •1025次阅读

用过手机大模型，感觉传统手机有点反人类了……

手机模型

脑极体
发布于 :2024年01月19日 22:37:19

2024国内各手机品牌大语言模型进展

关注国产手机最新消息：2023年下半年至2024年1月，AI大模型席卷手机圈，vivo、OPPO、荣耀、华为、小米等国产手机厂商相继将大模型

发表于 01-18 10:24 •1420次阅读

重塑翻译与识别技术：开源语音识别模型Whisper的编译优化与部署

模型介绍Whisper模型是一个由OpenAI团队开发的通用语音识别模型。它的训练基于大量不同的音频数据集，是一个多任务模型，可以执行语音

发表于 01-06 08:33 •3633次阅读

搜索历史

手机识别模型案例

评论

AI大模型在图像识别中的优势

手机识别不了GATT_SERVER例程中的属性怎么办？

人脸识别模型训练流程

人脸识别模型训练失败原因有哪些

人脸识别模型训练是什么意思

Transformer模型在语音识别和语音生成中的应用优势

开发者手机 AI - 目标识别 demo

苹果ReALM模型在实体识别测试中超越OpenAI GPT-4.0

谷歌模型怎么用手机打开

谷歌模型怎么用手机打开网页

谷歌模型怎么用手机打开文件

谷歌模型软件怎么用手机下载

用过手机大模型，感觉传统手机有点反人类了……

2024国内各手机品牌大语言模型进展

重塑翻译与识别技术：开源语音识别模型Whisper的编译优化与部署