图像分割的背景知识-德赢Vwin官网网

导读

一个很好的入门小短文，内容很全，适合上手。

在这篇文章中，我们将进入使用深度学习进行图像分割的世界。我们将讨论：

图像分割是什么以及图像分割的两种主要类型

图像分割结构

图像分割中使用的损失函数

你可以使用的框架

就让我们一探究竟吧。

什么是图像分割？

顾名思义，这是将图像分割为多个部分的过程。在这个过程中，图像中的每个像素都与一个对象类型相关联。图像分割主要有两种类型：语义分割和实例分割。

在语义分割中，所有相同类型的对象都使用一个类标签进行标记，而在实例分割中，相似的对象使用各自的标签。

图像分割结构

图像分割的基本结构包括编码器和解码器。

编码器通过滤波器从图像中提取特征。解码器负责生成最终输出，该输出通常是包含对象轮廓的分割掩码。大多数架构都有这种架构或它的变体。

让我们来看几个例子。

U-Net

U-Net是一种卷积神经网络，最初是为分割生物医学图像而开发的。当它被可视化的时候，它的架构看起来像字母U，因此被命名为U-Net。其体系结构由两部分组成，左侧为收缩路径，右侧为扩展路径。收缩路径的目的是获取上下文，而扩展路径的作用是帮助精确定位。

U-Net是由右侧的扩张路径和左侧的收缩路径组成的。收缩路径由两个3乘3的卷积组成。卷积之后是一个ReLU和一个2x2的最大池计算用于下采样。

你可以在这里找到U-Net的完整实现：https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/。

FastFCN —Fast Fully-connected network

在这个架构中，使用一个联合金字塔上采样(JPU)模块来替换膨胀卷积，因为它们消耗大量的内存和时间。在应用JPU进行上采样时，其核心部分采用全连接网络。JPU将低分辨率的feature map采样到高分辨率feature map。

如果你想动手实现一些代码，看这里：https://github.com/wuhuikai/FastFCN。

Gated-SCNN

这个架构由一个 two-stream CNN架构组成。在该模型中，使用一个单独的分支来处理图像的形状信息。利用形状流来处理边界信息。

实现参考代码：https://github.com/nv-tlabs/gscnn

DeepLab

在这种架构中，上采样滤波器的卷积用于涉及密集预测的任务。多尺度的目标分割是通过空间金字塔池实现的。最后，利用DCNNs来改进目标边界的定位。通过对滤波器插入零进行上采样或对输入特征图进行稀疏采样来实现卷积。

实现参考代码：https://github.com/fregu856/deeplabv3，https://github.com/sthalles/deeplab_v3

Mask R-CNN

在这个架构中，使用边界框和语义分割将每个像素划分为一组类别，对对象进行分类和局部化。对每个感兴趣的区域得到一个分割掩码，生成一个类标签和一个边界框作为最终输出。该架构是Faster R-CNN的扩展。Faster R-CNN由regions proposer和深度卷积网络和利局部检测器组成。

这里是COCO测试集中的一张图像的结果：

图像分割损失函数

语义分割模型在训练过程中通常使用一个简单的交叉分类熵损失函数。但是，如果你对获取图像的细粒度信息感兴趣，那么你需要用到稍微高级一点的损失函数。

我们来看看其中的几个。

Focal Loss

这种损失是对标准交叉熵的改进。这是通过改变它的形状来实现的，这样分配给分类良好的样本的损失就降低了。最终，这确保了没有类别不平衡。在这个损失函数中，交叉熵损失被缩放，随着对正确类的置信度的增加，缩放因子衰减为零。在训练时，比例因子会自动降低简单样本的权重，并聚焦于困难样本。

Dice loss

这个损失是通过计算smooth dice coefficient得到的。这种损失是最常用的分割损失。

Intersection over Union (IoU)-balanced Loss

IoU平衡分类损失的目的是增加高IoU样本的梯度，降低低IoU样本的梯度。这样提高了机器学习模型的定位精度。

Boundary loss

边界损失的一种变体应用于分割高度不平衡的任务。这种损失的形式是空间等高线上的距离度量，而不是区域。这种方法解决了高度不平衡的分割任务中区域损失的问题。

Weighted cross-entropy

在交叉熵的一种变体中，所有正样本都用一定的系数进行加权。它用于类别不平衡的场景。

Lovász-Softmax loss

该损失是对基于子模块损失凸Lovasz扩展的神经网络平均IoU损失的直接优化。

其他值得一提的损失包括：

TopK loss，其目的是确保网络在训练过程中聚焦于困难样本上。

距离惩罚交叉熵损失，引导网络难以分割的边界地区。

敏感性-特异性(SS)损失，计算特异性和敏感性的均方差的加权和。

Hausdorff distance(HD) loss，估计了卷积神经网络的Hausdorff距离。

这只是在图像分割中使用的几个损失函数。想了解更多内容，看这里：https://github.com/JunMa11/SegLoss。

图像分割数据集

从哪里可以得到一些数据集来开始？让我们来看几个例子。

Common Objects in COntext — Coco Dataset

COCO是一个大型物体检测、分割和图像描述数据集。数据集包含91个类。它有25万个人标注了关键点。它的大小是37.57 GiB。它包含80个物体类别。它遵循Apache 2.0许可，下载链接：http://cocodataset.org/#download。

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有9963个图像和20个不同的类。训练/验证集是一个2GB的tar文件。数据集下载：http://host.robots.ox.ac.uk/pascal/VOC/voc2012/。

The Cityscapes Dataset

此数据集包含城市场景的图像。它可以用来评估城市场景中视觉算法的性能。数据集下载：https://www.cityscapes-dataset.com/downloads/。

The Cambridge-driving Labeled Video Database — CamVid

这是一个基于运动的分割和识别数据集。它包含32个语义类。数据集下载：http://mi.eng.cam.ac.uk/research/projects/VideoRec/CamVid/。

图像分割框架

现在你已经有了数据集，让我们介绍一些工具/框架，你可以使用它们来开始。

FastAI library- 给定一幅图像，该库能够创建该图像中对象的mask。

Sefexa Image Segmentation Tool - Sefexa是一个免费的工具，可以用于半自动图像分割，图像分析，创建ground truth

Deepmask- Deepmask由Facebook Research开发，是Deepmask和SharpMask的Torch实现。

MultiPath- 这是来源于A MultiPath Network for Object Detection的物体检测网络的Torch实现。

OpenCV- 这是一个开源的计算机视觉库，有超过2500个优化算法。

MIScnn- 这是一个医学图像分割开源库。它使用最先进的卷积神经网络和深度学习模型建立管道，只需几行代码。

Fritz- Fritz提供多种计算机视觉工具，包括用于移动设备的图像分割工具。

总结

本文为你提供了一些图像分割的背景知识，并为你提供了一些工具和框架，可以用于入门。

我们讨论了:

什么是图像分割，

图像分割架构，

图像分割损失，

图像分割工具和框架。

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4771

浏览量
100709
图像分割

图像分割

+关注

关注
4

文章
182

浏览量
17995
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24688

原文标题：图像分割2020总结：结构，损失函数，数据集和框架

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

语义分割25种损失函数综述和展望

本综述提供了对25种用于图像分割的损失函数的全面且统一的回顾。我们提供了一种新颖的分类法，并详细审查了这些损失函数如何在图像分割中被定制和利用，强调了它们的重要特征和应用，并进行了系统

发表于 10-22 08:04 •468次阅读

画面分割器怎么连接

器的基本原理画面分割器的工作原理是通过数字信号处理技术，将多个视频信号源（如摄像头、DVR等）的图像数据进行处理，然后在一个监视器上以分割的形式显示出来。这些分割可以是1画面、4画面

发表于 10-17 09:29 •295次阅读

DSP教学实验箱_数字图像处理操作_案例分享:5-13 灰度图像二值化

比较的分割效果。如果物体同背景的差别表现不在灰度值上（比如纹理不同），可以将这个差别特征转换为灰度的差别，然后利用阈值选取技术来分割该图像。动态调节阈值实现

发表于 07-25 15:03

图像语义分割的实用性是什么

图像语义分割是一种重要的计算机视觉任务，它旨在将图像中的每个像素分配到相应的语义类别中。这项技术在许多领域都有广泛的应用，如自动驾驶、医学图像分析、机器人导航等。一、

发表于 07-17 09:56 •414次阅读

图像分割和语义分割的区别与联系

、亮度等。图像分割的目的是将图像中感兴趣的部分与背景分离，以便进行进一步的处理和分析。 1.1 图像分割

发表于 07-17 09:55 •900次阅读

图像分割与目标检测的区别是什么

图像分割与目标检测是计算机视觉领域的两个重要任务，它们在许多应用场景中都发挥着关键作用。然而，尽管它们在某些方面有相似之处，但它们的目标、方法和应用场景有很大的不同。本文将介绍图像分割

发表于 07-17 09:53 •1271次阅读

图像分割与语义分割中的CNN模型综述

图像分割与语义分割是计算机视觉领域的重要任务，旨在将图像划分为多个具有特定语义含义的区域或对象。卷积神经网络（CNN）作为深度学习的一种核心模型，在

发表于 07-09 11:51 •823次阅读

机器人视觉技术中常见的图像分割方法

机器人视觉技术中的图像分割方法是一个广泛且深入的研究领域。图像分割是将图像划分为多个区域或对象的过程，这些区域或对象具有某种共同的特征，如颜

发表于 07-09 09:31 •650次阅读

机器人视觉技术中图像分割方法有哪些

机器人视觉技术是人工智能领域的一个重要分支，它涉及到图像处理、模式识别、机器学习等多个学科。图像分割是机器人视觉技术中的一个重要环节，它的目标是从一幅图像中将目标物体与

发表于 07-04 11:34 •912次阅读

常见的医学图像读取方式和预处理方法

基于深度学习做医学图像数据分析，例如病灶检测、肿瘤或者器官分割等任务，第一步就是要对数据有一个大概的认识。但是我刚刚入门医学图像分割的时候，很迷茫不知道自己该干啥，不知道需要准备哪些

发表于 04-19 11:43 •829次阅读

改进棉花根系图像分割方法

棉花是锦葵科棉属植物，棉花生产的纤维是我国各类衣服、家具布和工业用布的材料，目前我国的棉花产量也非常高，主要以新疆地区为主。根系是植物组成的重要部分，其生长发育至关重要。根系图像分割是根系表型分析

发表于 01-18 16:18 •294次阅读

机器视觉的图像目标识别方法操作要点

通过加强图像分割，能够提高机器视觉的图像目标识别的自动化水平，使得图像目标识别效果更加显著。图像分割

发表于 01-15 12:17 •432次阅读

什么是分割？图像分割知识点总结

尽管FCN意义重大，在当时来讲效果也相当惊人，但是FCN本身仍然有许多局限。

发表于 01-13 15:53 •2102次阅读

SegRefiner:通过扩散模型实现高精度图像分割

一类常见的 Refinement 方法是 Model-Specific 的，其通过在已有分割模型中引入一些新模块，从而为预测 Mask 补充了更多额外信息，从而增强了已有模型对于细节的感知能力。

发表于 12-28 11:24 •1537次阅读

【爱芯派 Pro 开发板试用体验】+ 图像分割和填充的Demo测试

可以框选图片中一辆车，然后删除它，然后用背景进行填充。完整的测试视频发到B站上了，可以访问https://www.bilibili.com/video/BV1kN4y1z7vL/观看。图像分割

发表于 12-26 11:22

搜索历史

图像分割的背景知识

评论

语义分割25种损失函数综述和展望

画面分割器怎么连接

DSP教学实验箱_数字图像处理操作_案例分享:5-13 灰度图像二值化

图像语义分割的实用性是什么

图像分割和语义分割的区别与联系

图像分割与目标检测的区别是什么

图像分割与语义分割中的CNN模型综述

机器人视觉技术中常见的图像分割方法

机器人视觉技术中图像分割方法有哪些

常见的医学图像读取方式和预处理方法

改进棉花根系图像分割方法

机器视觉的图像目标识别方法操作要点

什么是分割？图像分割知识点总结

SegRefiner:通过扩散模型实现高精度图像分割

【爱芯派 Pro 开发板试用体验】+ 图像分割和填充的Demo测试