深度卷积神经网络(一)

深度卷积神经网络(deep convolutional neural networks ,CNNs):

1、解决了什么问题:

CNN是目前图像领域特征提取最好的方式,将复杂问题简化,把大量参数降维成少量参数,再做处理。它可以保留图像特征,当图像做翻转,旋转或者变换位置时,它也能有效的识别出来是类似的图像。 CNN可以自动从大数据中学习特征,并把结果向同类型未知数据泛化。 卷积神经网络的各层中的神经元是3维排列的:宽度、高度、深度。深度指的是激活数据体的三个维度,而不是整个网的深度。

2、卷积神经网络通常由这几个部分组成: 1)输入层 2)卷积层:负责提取图像中的局部特征,会用到激活函数,还会用到很多参数,即神经元的权值w和偏差b。它是构建卷积神经网络的核心层,产生了网络中大部分的计算量。 3)ReLU层:实际应用中,卷积层和ReLU会被共同称之为卷积层,所以卷积层经过卷积操作也是要经过激活函数的。 4)池化层:用来大幅降低参数量级(降维),进行固定不变的函数操作。 5)全连接层:类似传统神经网络的部分,用来输出想要的结果。 卷积层和全连接层中的参数会随着梯度下降被训练,这样卷积神经网络计算出的分类评分就能和训练集中的每个图像的标签吻合了。

具体解释: 1)卷积:提取特征:使用一个过滤器(卷积核)来过滤图像的各个小区域,从而得到这些小区域的特征值。在具体应用中,往往有多个卷积核,每个卷积核代表了一种图像模式,如果缪戈图像块与此卷积核卷积出的值大,则认为此图像十分接近于此卷积核。 总结:卷积层的通过卷积的过滤提取图片中的局部特征 2)池化层: 池化层简单的说就是下采样,可以降低数据的维度.简单的说就是把像素高的图片,变成像素低的图片,也不影响我们判断图片中的内容。这么做可以有效的避免过拟合。 3)全连接层: 经过卷积层和池化层处理过的数据输入到全连接层,由全连接层输出结果。

典型的CNN并非只是上面提到的三层结构,而是多层结构。 例如LeNet-5结构为:卷积层-池化层-卷积层-池化层-卷积层-全连接层。

3、感受野: 在处理图像这样的高维度输入时**,每个神经元只与输入数据的一个局部区域连接,该连接的空间大小叫做神经元的感受野(receptive field),他的尺寸是一个超参数(其实就是滤波器的空间尺寸)。在深度方向上,这个连接的大小总是和输入量的深度相等。** ![在这 上图展现的是卷积神经网络的一部分,其中红色的为输入数据。假设输入数据体尺寸为[32x32x3](比如CIFAR-10的RGB图像),如果感受野(或滤波器尺寸)是5x5,那么卷积层中的每个神经元会有输入数据体中[5x5x3]区域的权重,共5x5x3=75个权重(还要加一个偏差参数)。注意这个连接在深度维度上的大小必须为3,和输入数据体的深度一致。

4、神经元的空间排列: 有3个超参数控制着输出数据体的尺寸:深度,步长,和零填充。

5、CNN实际应用: 1、图片分类、检索 2、目标定位监测 3、目标分割 4、人脸识别 5、骨骼识别

经验分享 程序员 微信小程序 职场和发展