Skip to content

卷积神经网络

早期笔记,非常浅显

记录学习过程中的相关名词和关键点

1.CNN工作机理

CNN一般用来处理图像识别

把图像的像素(pixel)作为输入,经过以下几个层就行判别:

  • 卷积计算层
  • 激励层
  • 池化(pool):取区域平均或最大

其中,卷积计算层是核心,主要完成的工作就是卷积计算,工作过程:

  1. 对图像像素数据(像素矩阵)局部地与滤波矩阵(也叫滤波器,其实就是一个固定的权重矩阵)作内积(逐个元素相乘再求和得到这个局部区域的输出) ——这就是“卷积神经网络”中“卷积”的由来
  2. 滤波器的作用非常重要:
    1. 对像素矩阵进行特征提取,并且不同的滤波器就是一种不同的特征提取方式

2.CNN的两大优势

局部感知野

  1. 是什么?

    每个神经元其实没有必要对全局图像进行感知,只需要对局部进行感知,然后在更高层将局部的信息综合起来就得到了全局的信息。

  2. 做什么?

    减少模型参数,方便训练

参数共享

  1. 是什么?

    在局部连接中,每个神经元都对应一定数量的权重,若每个神经元对应的权重都不同,那么总的权重参数数量就会非常多,因此可以把这些神经元的权重设置为同一个权重矩阵,权重矩阵计算的实质其实就是特征提取,不同的权重矩阵代表不同的特征提取方式。

    这其中隐含的原理是:图像的一部分的统计特性与其他部分是一样的。这也意味着我们在这一部分学习的特征也能用在另一部分上,所以对于这个图像上的所有位置,我们都能使用同样的学习特征。

    通过参数共享,可以大大减少CNN模型的参数体量。

  2. 做什么?

    减少模型参数,方便训练