1 超干货解读胶囊网络-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超干货解读胶囊网络

智能生物识别说 来源:快商通AI 作者:快商通AI 2021-09-27 17:54 次阅读

The pooling operation used in convolutional neural networks is a big mistake and the fact that it works so well is a disaster. ——Hinton

先引用深度学习三巨头之一Geoffrey Hinton(杰弗里·辛顿)的名人名言作为开端.

CNN是现在十分火热的模型,首先我们都知道,通过pooling层能够学到部分高阶特征,比如对于人脸而言可以激活识别到鼻子 ,嘴巴 ,眼睛 等。

大神们看到CNN模型的强大开始进行人性本质的思索,那么它有什么搞不懂的时候咩?

答:确实有。

具体来说,pooling并不能够学到这些特征具体是从哪一层特征学到的,也就意味着会损失高阶特征之间的相互空间关系,空间层级信息无法获取到。也就是混乱的 并不能够表征一张人脸。这就是pooling层存在的缺陷。

好吧,简言之就是脸盲。

我们接着来看,计算机得到图像的过程是一层一层,从图像的内部表示到整体图像表示。但是人对图像的认识恰恰相反!

科普时间到:

人脑对图像的认识关键的点在于图像位置姿态的认识,也就是即便图像进行了旋转,平移人脑依然可以认识图像,而计算机却不行。因此提出胶囊网络CapsNet。

那么我们来正经地看看到底什么是胶囊(总之不是吃的那个小药丸 )

一:胶囊定义

胶囊(Capsule)是一个,包含多个神经元的特征载体。每个神经元可以表示图像中出现的特定实体的各种属性,比如姿态(位置,大小,方向),纹理,变形等。

胶囊以向量的形式封装特征的各种属性表示。数值就是这个属性表示存在的概率,会随着特征的空间变化而变化,向量的长度保持不变的话,整个胶囊表征的高层特征就保持一致,这就是Hinton提出的活动等变性,这个不变性的意义高于pooling的不变性。

o4YBAGCwqwSAB74wAACgPqYm2fA307.png

听懂以上概念后,大神小伙伴们就接着来看它的运算过程吧。

二:胶囊卷积运算过程

1. 输入向量的矩阵乘法

2. 输入向量的标量加权

3. 加权输入向量之和

4. 向量到向量的非线性变换

总之就是先这样,再那样就好啦~

好了,回归干货:

u1、u2、u3就是来自下层的3个胶囊 ,向量的长度编码了下层胶囊相应特征的概率。

那么

w1j、w2j、w3j 就能够编码高层特征和低层特征之间的空间关系。

o4YBAGCwq0CAJfjwAAB2VSAqs9w212.png

神经网络是通过反向传播来学习参数,而胶囊网络是通过“动态路由”算法来进行更新。

低层胶囊需要决定它的输出是向哪个高层胶囊输出。通过学习cici才能够激活是向哪个方向的胶囊进行映射。

所以对于动态路由算法就是ujuj服从的某个分布,每层胶囊会相对聚集,那么接下来学习的低层胶囊向哪个高层胶囊映射,就是通过这种预测更接近的胶囊聚集来判断的。

接下来向量到向量的非线性变换就是用了一个新颖的非线性激活函数,接收一个向量,然后在不改变方向的前提下,压缩它的长度到1以下。就是squash(∙):

pIYBAGCwq2OALvVmAABDqyQ6DFs635.png

为了清晰地让大家理解,整来了一张图,更形象的描述整个学习过程:⬇️

pIYBAGCwq5aAMXp_AAHnhdbGC9w615.png

怎么样,是不是看着一下子就通透了起来呀^ ^

三:动态路由算法

好了我们继续往下肝⬇️

pIYBAGCwq7aAWpxRAACclfVoehQ556.png

从上述算法过程就能够明白,输入为低层所有的胶囊线性变换的输出$hat{u}_{j|i}$以及路由迭代次数$r$和层$l$ 。定义了一个零时变量$b_{ij}$初始化为0,在迭代过程中会更新,$c_i leftarrow softmax(b_i)$就是低层胶囊所有的权重。

举个简单的小例子⬇️

权重分配过程:$b_{ij }$初始化为0,第一次迭代,假设有3个低层胶囊,2个高层胶囊,那么$c_{ij}$都会等于0.5,所有的权重$c_{ij}$都相等。

随着迭代才会使得低层胶囊可以根据这个权重指向对应的高层胶囊。$s_j leftarrow sum_i c_{ij} hat{mathbf{u}}_{j|i}$ 就是对每一个胶囊做一个线性组合,然后通过$squash$函数得到传递方向不变的权重向量。最后更行相应的权重$b_{ij}$。

(嗯!大神们是不是觉得很简单(o^^o))

高层胶囊$j$的当前输出和从低层胶囊 $i$出接收的输入做点积,再加上上一轮的权重$b_{ij}$,得到更新的$b_{ij}$。点积可以表征胶囊之间的相似性,其实也就是将低层胶囊的特征学习过来,这就与$CNN$的学习效果一致。

pIYBAGCwq9mAX-mxAAAXnbwcpM805.jpeg

明显从上图就可以看出,$hat{u}{1|1}$和上面黑色的向量不相似,$hat{u}{2|1}$就和上面黑色的向量是相似的,那么路由权重$c_{11}$会降低,而$c_{12}$会增大。从而低层胶囊的学习就能有最优的匹配。

综上!一篇简单的科普教学文就结束啦,谁用谁知道!

所以————

听懂掌声!

那下篇我们来简单聊聊「相似三连」:DNN、RNN、CNN里的RNN吧!(递归神经网络)

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100709
  • 函数
    +关注

    关注

    3

    文章

    4327

    浏览量

    62569
  • 神经元
    +关注

    关注

    1

    文章

    363

    浏览量

    18449
  • 动态路由
    +关注

    关注

    0

    文章

    16

    浏览量

    23117
收藏 人收藏

    评论

    相关推荐

    基于恩智浦 MCX N947 MCU 通过 NPU 实现 AI 咖啡胶囊识别方案

    本方案充分利用了恩智浦(NXP)高性能微控制器(MCU)MCX N947 集成的神经网络处理单元(NPU)的强大性能,旨在开发一款具有真正智能化识别能力的 AI 咖啡胶囊识别的咖啡机。 通过
    的头像 发表于 12-18 13:43 83次阅读
    基于恩智浦 MCX N947 MCU 通过 NPU 实现 AI 咖啡<b class='flag-5'>胶囊</b>识别方案

    六类网络面板怎么接线

    六类网络面板的接线步骤如下: 一、准备工具和材料 六类网线 网络面板(带有六类模块) 剥线刀 打线刀(或压线钳) 剪刀
    的头像 发表于 11-26 09:34 352次阅读

    网和无类间路由是什么?

    ​一、 网概述   网是将多个连续的网络地址组合成一个增加的网络地址的技术。常用于减少路由器的路由表大小,网络的可扩展性。通过合并连续的
    的头像 发表于 08-14 17:06 249次阅读
    <b class='flag-5'>超</b>网和无类间路由是什么?

    六类有没有百兆

    关于六类网线是否支持百兆网络的问题,我们可以从以下几个方面进行清晰、归纳的解答: 一、六类网线的标准与性能 标准定义:六类网线(通常表示为CAT6A)是六类网线(CAT6)的升级
    的头像 发表于 07-15 10:26 690次阅读

    卷积神经网络与循环神经网络的区别

    网络结构,分别适用于不同的应用场景。本文将从基本概念、结构组成、工作原理及应用领域等方面对这两种神经网络进行深入解读
    的头像 发表于 07-03 16:12 3186次阅读

    胶囊字符机器视觉检测识别方案定制

    目前实验来看,可以检测出胶囊上有无印字 一个工位采用三个相机拍摄 视野:35mm*26.25mm 像素精度:35mm/640pix=0.055mm/pix 问题:胶囊颜色太多,会存在不能完全兼容情况
    的头像 发表于 06-10 18:29 461次阅读
    <b class='flag-5'>胶囊</b>字符机器视觉检测识别方案定制

    六类非屏蔽双绞线在网络中的地位

    六类非屏蔽双绞线(UTP CAT6e)是一种宽带线,也称为网线,是网络连接中重要的连接线。它是六类非屏蔽双绞线的改进版,其最高传输频率达500MHz,是六类线的两倍,主要用于万兆(10G)网络
    的头像 发表于 06-07 10:30 731次阅读

    矢量网络分析仪的关键技术指标解读

    的发展提供了有力支持。而矢量网络分析仪的关键技术指标,则是衡量其性能优劣的重要标准。本文将对矢量网络分析仪的关键技术指标进行详细解读,以期为读者提供更深入的了解。
    的头像 发表于 05-13 17:26 693次阅读

    一图看懂2024华为智能充电网络开启充新纪元

    一图看懂2024华为智能充电网络开启充新纪元
    的头像 发表于 04-29 10:27 606次阅读
    一图看懂2024华为智能充电<b class='flag-5'>网络</b>开启<b class='flag-5'>超</b>充新纪元

    融合架构解决方案

    随着信息技术的发展,企业对数据中心的依赖日益增强,对存储、计算和网络资源的需求也在不断增长。融合架构作为一种新兴的IT基础设施解决方案,正逐渐成为企业数据中心建设的首选。本文将详细介绍融合架构
    的头像 发表于 04-10 14:57 633次阅读

    生医应用的磁控胶囊机器人,实现多模态响应与多功能集成

    胶囊机器人可以通过口服方式抵达胃肠道病灶区域实施医疗功能,为实现胃肠道疾病无痛无创诊疗和提高患者依从性提供了重要途径。
    的头像 发表于 03-14 15:36 1112次阅读
    生医应用的磁控<b class='flag-5'>胶囊</b>机器人,实现多模态响应与多功能集成

    EMC技术:基础概念到应用的解读

    EMC技术:基础概念到应用的解读?|深圳比创达电子
    的头像 发表于 03-11 11:55 575次阅读
    EMC技术:基础概念到应用的<b class='flag-5'>解读</b>?

    COMSOL Multiphysics在材料与表面仿真中的应用

    随着科技的飞速发展,材料和表面作为新兴研究领域,吸引了广泛关注。它们通过人工设计的结构,能够在特定条件下表现出特殊的物理性质,为光电子领域带来革命性的变革。COMSOL Multiphysics
    发表于 02-20 09:20

    基于微流控技术的灭火微胶囊研究

    直径500微米的胶囊有多大魔力?12月28日,在中国科学技术大学先进技术研究院微流体应用研究中心里,副主任黄芳胜向我们展示了微胶囊的“过人之处”。
    的头像 发表于 01-02 09:25 854次阅读

    如何为10G网络选择合适的六类网线

    如何为10G网络选择合适的六类网线 在选择适合10G网络六类网线时,有几个重要的方面需要考虑,包括带宽需求、电缆长度、和电缆构造。本文将从这些方面详细解析如何选择合适的
    的头像 发表于 12-27 10:56 1780次阅读