CV语义分割模型小抄(1)
前言
写完 之后,我们知道,backbone加上分类头就可以做分类任务了,那么如果backbone加上一些目标检测和图像分割头,其实也可以做目标检测和实例分割任务。 该文用来记录一些常见的图像分割方法。图像风格包括实例分割和语义分割。
卷积操作后大小计算
图像处理常见操作:
论文
DeepLab V1
2014 CVPR VGG 结构更改, 加上条件随机场
FCN
2015 CVPR
-
论文: 基于Vgg16的结构,把全连接层换成1*1卷积
输出channel: 物体类别加上背景类。高宽与原图像一致(一般而言都是一样的)。
DeepLab V2
2016 CVPR ResNet结构更改, ASPP结构(taros spatial pyramid pooling)
DeepLab V3
2017 CVPR
-
结构还是参照resnet, 不过也可以使用像mobileNetV3-large这样的网络 提出了两种结构cascaded model和ASPP model, 不过后者结构好一点。 引入Multi-grid 改进ASPP结构 移除CRF
UNet
unet后续实现的版本可能与上图有所出入,例如pytorch官方的代码。但大致结构一致。该网络的base版本经常用于训练样本比较少的情况,并且也常用于扩散学习。后续还有UNet++等改进版本,并嵌入resnet等backbone。
-
论文: 视频讲解:
另外UNet在医疗领域用的挺多