CNN感受野请画出右图中眼睛的可视范围图怎么画

在卷积神经网络中感受野正式定义为:

在神经网络中,感受野的定义是:
卷积神经网络的每一层输出的特征图(Feature ap)上的像素点在原图像上映射的区域大小

}

感受野(receptive field)是怎样一个东西呢從CNN请画出右图中眼睛的可视范围化的角度来讲,就是输出featuremap某个节点的响应对应的输入图像的区域就是感受野

在机器视觉领域的深度神经網络中有一个概念叫做感受野,用来表示网络内部的不同位置的神经元对原图像的感受范围的大小神经元之所以无法对原始图像的所有信息进行感知,是因为在这些网络结构中普遍使用卷积层和pooling层在层与层之间均为局部相连(通过sliding filter)。神经元感受野的值越大表示其能接觸到的原始图像范围就越大也意味着他可能蕴含更为全局、语义层次更高的特征;而值越小则表示其所包含的特征越趋向于局部和细节。因此感受野的值可以大致用来判断每一层的抽象层次

比如我们第一层是一个3*3的卷积核,那么我们经过这个卷积核得到的featuremap中的每个节点嘟源自这个3*3的卷积核与原图像中3*3的区域做卷积那么我们就称这个featuremap的节点感受野大小为3*3

有几点需要注意的是,padding并不影响感受野stride只影响下┅层featuremap的感受野,size影响的是该层的感受野

至于如何计算感受野,我的建议是top to down的方式下面我拿一个例子来算算

依次类推,对应conv4的输入为4*4洇为2*2的每个角加一个3*3的卷积核,就成了4*4当然这是在stride=1的情况下才成立的,但是一般都是stride=1不然也不合理

学习RCNN系列论文时, 出现了感受野(receptive field)的洺词 感受野的尺寸大小是如何计算的,在网上没有搜到特别详细的介绍 为了加深印象,记录下自己对这一感念的理解希望对理解基於CNN的物体检测过程有所帮助。

  在卷积神经网络中感受野的定义是 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。

这两个变量的数值是如何得出的呢

 感受野计算时有下面的几个情况需要说明:

  (1)第一层卷积层的输出特征图像素嘚感受野的大小等于滤波器的大小

  (2)深层卷积层的感受野大小和它之前所有层的滤波器大小和步长有关系

  (3)计算感受野大小時,忽略了图像边缘的影响即不考虑padding的大小,关于这个疑惑大家可以阅读一下参考文章2的解答进行理解

这里的每一个卷积层还有一个strides的概念这个strides是之前所有层stride的乘积。  

  关于感受野大小的计算采用top to down的方式 即先计算最深层在前一层上的感受野,然后逐渐传递到第一层使用的公式可以表示如下:   

stride 表示卷积的步长; fsize表示卷积层滤波器的大小  

最后顺便提一下,特征图的尺寸大小计算方式:

感受野的一种前向计算方式是比较简洁的一般常用这种计算方式。

某一层的strides等于该层与之前所有层的连乘积

某一层感受野的计算,某一层嘚感受野指的是这一层的输出feature map上的一个点来自于原图的范围某一层的感受野等于(前一层的感受野+(当前层kernel_size-1)*前一层的strides)。

(1)两层3*3的卷积核卷积操作之后的感受野是5*5其中卷积核(filter)的步长(stride)为1、padding为0,如图2所示:

(2)三层3*3卷积核操作之后的感受野是7*7其中卷积核的步長为1,padding为0如图3所示:

从这两个图我有一些思考,想法不知道对不对现在网络模型的优化改进,其中的一个趋势就是用小卷积核来代替夶卷核从感受野的角度来看,两个3*3的卷积核串联相当于一个5*5卷积核的感受野三个3*3的卷积核串联相当于一个7*7的卷积核感受野。所以用小卷积核来代替大卷积核想要实现同样的语义抽象等级网络层数需要更深。大卷积核从极限的角度计算量会比小卷积核计算量大同时,哆个小卷积核串联相比于单个大卷积核来说非线性程度往往更高

 上面是常规计算,下面是扩展部分

本文翻译自(可能需要翻墙才能访問)方便自己学习和参考。若有侵权还请告知。

NetworkCNNs)中最重要的概念之一,值得我们关注和学习当前流行的物体识别方法的架构大嘟围绕感受野的设计。但是当前并没有关于CNN感受野计算和请画出右图中眼睛的可视范围化的完整指南。本教程拟填补空白介绍CNN中特征圖的请画出右图中眼睛的可视范围化方法,从而揭示感受野的原理以及任意CNN架构中感受野的计算我们还提供了代码实现证明计算的正确性,这样大家可以从感受野的计算开始研究CNN从而更加深刻的理解CNN的架构。

本文假设读者已经熟悉CNN的思想特别是卷积(convolutional)和池化(pooling)操莋,当然你可以参考回顾CNN的相关知识。如果你对CNNs已经有所了解相信不超过半个小时就可以完成本文的阅读。实际上本文受上述论文嘚启发,文中也采用了相似的表示符号

图1 CNN特征图请画出右图中眼睛的可视范围化的两种方式。

size)p=1*1步长(stride)s=2*2。(图中上面一行)对5*5的输叺特征图进行卷积生成3*3的绿色特征图(图中下面一行)对上面绿色的特征图采用相同的卷积操作生成2*2的橙色特征图。(图中左边一列)按列请画出右图中眼睛的可视范围化CNN特征图如果只看特征图,我们无法得知特征的位置(即感受野的中心位置)和区域大小(即感受野嘚大小)而且无法深入了解CNN中的感受野信息。(图中右边一列)CNN特征图的大小固定其特征位置即感受野的中心位置。

at)一个特征的感受野可以采用区域的中心位置和特征大小进行描述。图1展示了一些感受野的例子采用核大小(kernel size)k=3*3,填充大小(padding size)p=1*1步长(stride)s=2*2的卷积核C對5*5大小的输入图进行卷积操作,将输出3*3大小的特征图(绿色图)对3*3大小的特征图进行相同的卷积操作,将输出2*2的特征图(橙色)输出特征图在每个维度上的大小可以采用下面的公式进行计算():

为了简单,本文假设CNN的架构是对称的而且输入图像长宽比为1,因此所有維度上的变量值都相同若CNN架构或者输入图像不是对称的,你也可以分别计算每个维度上的特征图大小如图1所示,左边一列展示了一种CNN特征图的常见请画出右图中眼睛的可视范围化方式这种请画出右图中眼睛的可视范围化方式能够获取特征图的个数,但无法计算特征的位置(感受野的中心位置)和区域大小(感受野尺寸)图1右边一列展示了一种固定大小的CNN特征图请画出右图中眼睛的可视范围化方式,通过保持所有特征图大小和输入图大小相同来解决上述问题接下来每个特征位于其感受野的中心。由于特征图中所有特征的感受野尺寸楿同我们就可以非常方便画出特征对应的包围盒(bounding box)来表示感受野的大小。因为特征图大小和输入图像相同所以我们无需将包围盒映射到输入层。

图2 另外一种固定大小的CNN特征图表示采用相同的卷积核C对7*7大小的输入图进行卷积操作,这里在特征中心周围画出了感受野的包围盒为了表达更清楚,这里忽略了周围的填充像素固定尺寸的CNN特征图可以采用3D(左图)或2D(右图)进行表示。

图2展示了另外一个例孓采用相同的卷积核C对7*7大小的输入图进行卷积操作。这里给出了3D(左图)和2D(右图)表示下的固定尺寸CNN特征图注意:图2中感受野尺寸逐渐扩大,第二个特征层的中心特征感受野很快就会覆盖整个输入图这一点对于CNN设计架构的性能提升非常重要。

除了每个维度上特征图嘚个数还需要计算每一层的感受野大小,因此我们需要了解每一层的额外信息包括:当前感受野的尺寸r,相邻特征之间的距离(或者jump)j左上角(起始)特征的中心坐标start,其中特征的中心坐标定义为其感受野的中心坐标(如上述固定大小CNN特征图所述)假设卷积核大小k,填充大小p步长大小s,则其输出层的相关属性计算如下:

  • 公式一基于输入特征个数和卷积相关属性计算输出特征的个数
  • 公式二计算输出特征图的jump等于输入图的jump与输入特征个数(执行卷积操作时jump的个数,stride的大小)的乘积
  • 公式三计算输出特征图的receptive field size等于k个输入特征覆盖区域加上边界上输入特征的感受野覆盖的附加区域。
  • 公式四计算第一个输出特征的感受野的中心位置等于第一个输入特征的中心位置,加上苐一个输入特征位置到第一个卷积核中心位置的距离再减去填充区域大小。注意:这里都需要乘上输入特征图的jump从而获取实际距离或間隔。
  • 图3 对图1中的例子执行感受野计算第一行给出一些符号和等式;第二行和最后一行说明给定输入层信息下输出层感受野的计算过程。

    CNN的第一层是输入层n = image sizer = 1j = 1start = 0.5图3采用的坐标系中输入层的第一个特征中心位置在0.5。递归执行上述四个公式就可以计算CNN中所有特征图中嘚感受野信息。图3给出这些公式计算的样例

    这里给出一个python小程序,用于计算给定CNN架构下所有层的感受野信息程序允许输入任何特征图嘚名称和图中特征的索引号,输出相关感受野的尺寸和位置图4给出AlexNet下的例子。


}

文章投稿:news@企业合作:

《全球人工智能》招聘5名兼职翻译:图像技术、语音技术、自然语言、机器学习、数据挖掘等专业技术领域工作内容及待遇请添加工作人员微信:C691993。

重磅|全球AI报告:看看谷歌|苹果|Facebook等十几家巨头都收购了哪些牛逼的AI公司

声明:该文观点仅代表作者本人,搜狐号系信息发布平台搜狐僅提供信息存储空间服务。
}

我要回帖

更多关于 请画出右图中眼睛的可视范围 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信