从图像识别走进卷积神经网络

从图像识别走进卷积神经网络

    引入 图像分类 3D张量(宽-高-通道) 通道解释 : RGB 三个颜色 拉直成一个向量 为什么引入卷积? 直接将图片当成全连接网络的输入会产生至少 O(10e9) 的空间复杂度,参数过多,很容易产生过拟合 CNN(卷积神经网络) 基本过程如下: 卷积层 神经元角度的理解: 先划分为小立方体(感受野) 神经元仅需关心一个感受野(作为一个神经元的输入) 仅人为定义( 根据问题而改变) 不同感受野可以重叠 多个神经元还可以对应一个感受野 感受野的大小不是固定的,通道数也不是固定,形状也不是固定的 经典 卷积核:高和宽(不必考虑高) 多个神经元(64个)守备一个感受野 步数:向不同方向移动,移动的这几步,人为决定 填充:感受野超出图像范围,需要补值,一般看作0,或整个图像的平均值,或图像的边界值 参数共享:不同位置的神经元,权重相同 过滤器:可以认为是参数共享时的一组参数 过滤器角度的理解: 通过多层过滤器,得到下一层的输入,通道数为过滤器数量,(过滤器高度必须与图片的高度相等),通过一层层卷积,可以使过滤器在某一层覆盖完整的图像范围
    池化层(最大池化) 通道数不变,使图像变小,(减少运算量) Flatten 压平成一个向量,作为全连接层的输入 通过softmax,得到图像分类的结果 如图所示
    全连接层与卷积层的关系
    卷积神经网络的应用 可以识别缩小后的图像,不能识别放大、缩小、旋转后的图像 图像,语音,自然语言处理
    resnet(残差网络) 残差块
    1x1卷积
经验分享 程序员 微信小程序 职场和发展