卷积神经网络
早期笔记,非常浅显
记录学习过程中的相关名词和关键点
1.CNN工作机理
CNN一般用来处理图像识别
把图像的像素(pixel)作为输入,经过以下几个层就行判别:
- 卷积计算层
- 激励层
- 池化(pool):取区域平均或最大
其中,卷积计算层是核心,主要完成的工作就是卷积计算,工作过程:
- 对图像像素数据(像素矩阵)局部地与滤波矩阵(也叫滤波器,其实就是一个固定的权重矩阵)作内积(逐个元素相乘再求和得到这个局部区域的输出) ——这就是“卷积神经网络”中“卷积”的由来
- 滤波器的作用非常重要:
- 对像素矩阵进行特征提取,并且不同的滤波器就是一种不同的特征提取方式
2.CNN的两大优势
局部感知野
是什么?
每个神经元其实没有必要对全局图像进行感知,只需要对局部进行感知,然后在更高层将局部的信息综合起来就得到了全局的信息。
做什么?
减少模型参数,方便训练
参数共享
是什么?
在局部连接中,每个神经元都对应一定数量的权重,若每个神经元对应的权重都不同,那么总的权重参数数量就会非常多,因此可以把这些神经元的权重设置为同一个权重矩阵,权重矩阵计算的实质其实就是特征提取,不同的权重矩阵代表不同的特征提取方式。
这其中隐含的原理是:图像的一部分的统计特性与其他部分是一样的。这也意味着我们在这一部分学习的特征也能用在另一部分上,所以对于这个图像上的所有位置,我们都能使用同样的学习特征。
通过参数共享,可以大大减少CNN模型的参数体量。
做什么?
减少模型参数,方便训练