DeepLab-v2

2021-10-06 19:01:30 作者：互联网

DeepLab-v2（79.7 mIOU）

参考文章：https://blog.csdn.net/qq_14845119/article/details/102942576（图像分割之 deeplab v1,v2,v3,v3+系列解读）

论文地址：https://arxiv.org/abs/1606.00915（DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs）

DeepLab-v2相比v1版本的不同点有两个：①baseline用更先进的ResNet来代替v1版本的Vgg16；②在muti-scale机制方面，使用ASPP

一、模型结构

将DCNNs应用于语义分割有三个挑战：

1、由于堆叠下采样层和池化层所造成的输出特征图的分辨率太低的问题

2、多尺度目标

3、以对象目标为中心的分类器需要的空间变换不变性，本质上限制了DCNN的空间精度

对应上面三个挑战，DeepLab-v2三个主要部分分别对应解决三个挑战：

1、全卷积+空洞卷积

2、ASPP

3、全连接CRF

（其中1、3部分与v1版本相同，下面不再赘述，详见v1笔记）

（一）全卷积+空洞卷积（跟v1版本的一样的）

作者将ResNet101修改为全卷积的形式（将原来的全连接层都去掉）应用到本文模型，并用空洞卷积的方式修改其中的卷积层，来降低传统卷积池化层所造成分辨率过低。最终输出scores map。通过设置空洞卷积的rate，可以随意控制输出的特征的分辨率，高分辨率可以使得最后的分割图更准确，但是会增加计算量使得效率降低。作者通过一系列实验，达到了good efficiency/accuracy trade-off，即使用空洞卷积使得输出的scores map（插值之前的）是原图尺寸的1/8。