快捷搜索: 王者荣耀 脱发

CV语义分割模型小抄(1)

前言

写完 之后,我们知道,backbone加上分类头就可以做分类任务了,那么如果backbone加上一些目标检测和图像分割头,其实也可以做目标检测和实例分割任务。 该文用来记录一些常见的图像分割方法。图像风格包括实例分割和语义分割。

卷积操作后大小计算

图像处理常见操作:


论文

DeepLab V1

2014 CVPR VGG 结构更改, 加上条件随机场

FCN

2015 CVPR

    论文: 基于Vgg16的结构,把全连接层换成1*1卷积

输出channel: 物体类别加上背景类。高宽与原图像一致(一般而言都是一样的)。

DeepLab V2

2016 CVPR ResNet结构更改, ASPP结构(taros spatial pyramid pooling)

DeepLab V3

2017 CVPR

    结构还是参照resnet, 不过也可以使用像mobileNetV3-large这样的网络 提出了两种结构cascaded model和ASPP model, 不过后者结构好一点。 引入Multi-grid 改进ASPP结构 移除CRF

UNet

unet后续实现的版本可能与上图有所出入,例如pytorch官方的代码。但大致结构一致。

该网络的base版本经常用于训练样本比较少的情况,并且也常用于扩散学习。后续还有UNet++等改进版本,并嵌入resnet等backbone。

    论文: 视频讲解:

另外UNet在医疗领域用的挺多

经验分享 程序员 微信小程序 职场和发展