计算机视觉、计算机图像学和图像处理详解-德赢Vwin官网网

计算机视觉：Computer Vision

一门让计算机从图像中提取有用信息并加以分析的科学。这些信息后续可以用于辅助一些决策或者任务，比如医学图像分析、工程测量、自动驾驶、机器人学等等。

计算机图像学：Computer Graphics

通过使用数学模型和计算机算法来生成图像。

图像处理：Image Process

图像数字化：

空间采样、量化、与连通性策略是将图像做数字化表达过程中涉及到的重要概念。

量化：将每个像素点在色彩通道内的亮度按照区间从连续分布转化为离散分布的过程。

四连通与八连通：像素点计算领域的划分标准。

四连通：像素四条边相连的区域

八连通：比四连通多四个角。

距离：

欧式距离 (Euclidean) - 两点之间的直线距离

曼哈顿距离 (City Block) - 沿着方格线行走的两点间距（即仅水平和竖直四个方向移动）

切比雪夫距离距离 (Chess Board) - 沿着方格线及对角行走的两点间距（即水平、竖直、以及对角八个方向移动）

一张图片中往往有前景(foreground)和背景(background)：

确定前景和背景的连通性策略，通常有：

背景四连通、前景八连通

背景八连通、前景四连通

一般有递归算法、顺序标记法。

递归算法消耗性能大：遍历图像中所有的像素点，遇到未标记区域编号的点即递归用当前的区域编号标记与之相连的所有像素点。

顺序标记法：运用与像素区域连通性问题

图像数据的收集和处理：

借助语义化分割对 UI 图像进行处理，得到轮廓、结构、上下文等特征。

借助超级像素的方法来降低特征的数量，合并像素达到降低干扰因素的效果。

采用 OpenCV 进行测量、计算，然后用规则尝试提取有用的特征数据，结果并不理想，它更加擅长测量和计算：需要大量的阈值约束才能达到比较好的效果：

用机器视觉的模型和算法来解决。这边介绍 2 个模型：

MaskRCNN

2017年，Kaiming He等人提出了Mask R-CNN，是一种目标检测和实例分割的算法

Mask R-CNN（Mask Region-based Convolutional Neural Network）是一种用于目标检测和实例分割的深度学习模型，它是 Faster R-CNN 的扩展，同时可以生成目标的二进制掩码（mask），因此可以实现精确的实例分割。

1、骨干网络：Mask R-CNN通常使用骨干网络（如 ResNet）来提取图像特征。这些特征用于目标检测和分割任务。

2、区域建议网络（RPN）：RPN 用于生成候选区域，它是 Faster R-CNN 中的组件，用于确定可能包含目标的图像区域。

3、目标检测：Mask R-CNN 使用区域建议来检测图像中的目标对象，通常通过分类和回归来确定每个目标的位置和类别。

4、实例分割：除了目标检测，Mask R-CNN 还生成每个检测到的目标的精确二进制掩码。这允许对目标进行精确的像素级分割。

5、多任务学习：Mask R-CNN 采用多任务学习的方法，通过同时训练目标检测和实例分割任务，从而提高模型的性能。

6、ROI Pooling / ROI Align：用于从特征图中提取每个候选区域的特征，以供后续任务使用。

7、损失函数：Mask R-CNN 使用多个损失函数，包括分类损失、回归损失和分割损失，来训练模型。

Yolo V3

2016年，Joseph Redmon等人提出的 YOLO 是一种单阶段的目标检测算法，突破性地实现了实时目标检测。

实例分割（instance segmentation）是机器视觉研究中比较重要、复杂和具有挑战性的领域之一。在机器人，自动驾驶，监视等领域均有应用。

来源：大前端视野

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
211

文章
28379

浏览量
206908
图像处理

图像处理

+关注

关注
27

文章
1289

浏览量
56720
计算机

计算机

+关注

关注
19

文章
7488

浏览量
87847

原文标题：计算机视觉、计算机图像学、图像处理等你会不会？

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

计算机图形图像处理最新应用分析

计算机图形图像处理最新应用分析图形图像处理是研究计算机除了图形图像的原理、方法和技术的科学。它是计算机

发表于 09-23 14:56

机器视觉与计算机视觉的关系简述

。计算机视觉是一门独立的学科，有着30年左右的历史，集图像处理、模式识别、人工智能技术为一体，着重服务于一幅或多幅图像的

发表于 05-13 14:57

图像处理与计算机视觉相关的书籍有哪些

图像处理与计算机视觉相关的书籍

发表于 05-20 13:58

用于计算机视觉训练的图像数据集介绍

用于计算机视觉训练的图像数据集

发表于 02-26 07:35

基于OpenCV的计算机视觉技术实现

基于OpenCV的计算机视觉技术实现OpencV是用来实现计算机视觉相关技术的开放源码工作库，是计算机视

发表于 11-23 21:06 •0次下载

计算机图形学总览:图像和图像的概念辨析

计算机图形学和计算机视觉是同一过程的两个方向。计算机图形学将抽象的语义信息转化成图形，计算机视觉

发表于 08-21 09:10 •6577次阅读

基于计算机视觉的自动搜索图像语义分割架构

在计算机视觉中，这适用于图像分类和密集图像预测。

发表于 01-17 17:31 •3321次阅读

基于计算机的图像处理方法

图像是由像素点组成的矩阵，矩阵的每个点记录着图像的RGB值。数字图像处理即根据用户需求，使用计算机技术对

发表于 03-13 16:32 •4769次阅读

计算机视觉要学什么_计算机视觉好找工作吗

学习计算机视觉需要具备的知识储备有：图像处理的知识。图像处理大致包括的内容：光学成像基础、颜色、

发表于 07-30 16:57 •6148次阅读

基于计算机视觉的多维图像智能

利用摄像机和其他数据源，计算机视觉可以收集有关公司运营最重要方面的重要信息，这些信息包括构成流程主干的人员、产品、资产和文档的组合。当企业收集数字图像并应用深度学习算法，通过对机器眼睛“所见”的反应来准确识别和分类对象时，

发表于 08-04 10:39 •2952次阅读

用于计算机视觉训练的图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类

发表于 12-31 09:33 •2340次阅读

用于计算机视觉训练的图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类

发表于 02-12 16:13 •1393次阅读

机器学习和计算机视觉的前20个图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类

发表于 01-28 07:40 •5次下载

计算机视觉的十大算法

随着科技的不断发展，计算机视觉领域也取得了长足的进步。本文将介绍计算机视觉领域的十大算法，包括它们的基本原理、应用场景和优缺点。这些算法在图像

发表于 02-19 13:26 •1231次阅读

计算机视觉和图像处理的区别和联系

计算机视觉和图像处理是两个密切相关但又有明显区别的领域。 1. 基本概念 1.1 计算机视觉

发表于 07-09 09:16 •1280次阅读