PyTorch中nn.Conv2d与nn.ConvTranspose2d函数的用法-德赢Vwin官网网

1. 通道数问题

描述一个像素点，如果是灰度，那么只需要一个数值来描述它，就是单通道。如果有RGB三种颜色来描述它，就是三通道。最初输入的图片样本的 channels ，取决于图片类型；
卷积操作完成后输出的 out_channels ，取决于卷积核的数量。此时的 out_channels 也会作为下一次卷积时的卷积核的 in_channels；
卷积核中的 in_channels ，上面已经说了，就是上一次卷积的 out_channels ，如果是第一次做卷积，就是样本图片的 channels 。

举个例子，假设现有一个为 6×6×3的图片样本，使用 3×3×3 的卷积核（filter）进行卷积操作。此时输入图片的 channels 为 3，而卷积核中的 in_channels 与需要进行卷积操作的数据的 channels 一致（就是图片样本，为3）。接下来进行卷积操作，卷积核中的27个数字与分别与样本对应相乘后，再进行求和，得到第一个结果。依次进行，最终得到 4×4的结果。由于只有一个卷积核，所以最终得到的结果为 4×4×1，out_channels 为 1。如下图所示：

在实际应用中，都会使用多个卷积核。这里如果再加一个卷积核，就会得到 4×4×2的结果。如下图所示：

2. nn.Conv2d

class torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True)

nn.Conv2d的功能是：对由多个输入平面组成的输入信号进行二维卷积。输入信号的形式为：

(N,C_{in},H,W)

（1）参数说明

**N：**表示batch size（批处理参数）

C_{in} ：表示channel个数

**H，W：**分别表示特征图的高和宽。

**stride(步长)：**步长，默认为1，可以设为1个int型数或者一个(int, int)型的tuple。

**kernel_size：**卷积核的宽度和长度，单个整数或由两个整数构成的list/tuple。如为单个整数，则表示在各个空间维度的相同长度。

**padding(补0)：**控制zero-padding的数目，padding是在卷积之前补0。

**dilation(扩张)：**控制kernel点（卷积核点）的间距; 可以在此github地址查看:Dilated convolution animations

**groups(卷积核个数)：**通常来说，卷积个数唯一，但是对某些情况，可以设置范围在1 —— in_channels中数目的卷积核：

（2）图像尺寸

经过一次卷积之后，生成的图的大小：

(original_size - (kernal_size - 1)) / stride

3. nn.ConvTranspose2d

nn.ConvTranspose2d的功能是进行反卷积操作

（1）输入格式

nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1)

（2）参数的含义

in_channels(int) – 输入信号的通道数
out_channels(int) – 卷积产生的通道数
kerner_size(int or tuple) - 卷积核的大小
stride(int or tuple,optional) - 卷积步长，即要将输入扩大的倍数。
padding(int or tuple, optional) - 输入的每一条边补充0的层数，高宽都增加2*padding
output_padding(int or tuple, optional) - 输出边补充0的层数，高宽都增加padding
groups(int, optional) – 从输入通道到输出通道的阻塞连接数
bias(bool, optional) - 如果bias=True，添加偏置
dilation(int or tuple, optional) – 卷积核元素之间的间距

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

函数

函数

+关注

关注
3

文章
4327

浏览量
62567
python

python

+关注

关注
56

文章
4792

浏览量
84623
pytorch

pytorch

+关注

关注
2

文章
807

浏览量
13196

搜索历史

PyTorch中nn.Conv2d与nn.ConvTranspose2d函数的用法

1. 通道数问题

2. nn.Conv2d

（1）参数说明

（2）图像尺寸

3. nn.ConvTranspose2d

（1）输入格式

（2）参数的含义

评论

[基于GD32F350RB的音频识别器] 3. CMSIS-NN神经网络配置解析

如何利用PyTorch API构建CNN?

Canny边缘检测器的详细介绍以及Pytorch实现

如何在PyTorch上学习和创建网络模型呢？

一层卷积能做啥？一层卷积可以做超分吗？

长虹NN5099K彩电电路图

松下NN-5508 NN-5558 NN-6508 NN-7

松下NN-5508JPQ NN-5558JPQ微波炉电路图

松下NN-5550 NN-5540电脑式微波炉电路图

松下NN-6808 NN-6858 NN-7808 NN-7

松下NN-9559 NN-9850微波炉电路图

PyTorch中 torch.nn与torch.nn.functional的区别

如何对图片进行卷积计算

0参数量+0训练，3D点云分析方法Point-NN刷新多项SOTA

NN1-XXXXXH6 系列 NN1-XXXXXH6 系列