其他分享
首页 > 其他分享> > Mask R-CNN 论文学习

Mask R-CNN 论文学习

作者:互联网

论文基本信息

论文概要

解决问题

本文在Faster RCNN上进行了改进,提出了Mask RCNN用来解决分割的问题。同时该模型也可以用于目标检测、关键点检测等其他的计算机视觉任务,并且实验证明,该模型具有较好的效果。

Introduction

Mask R-CNN

整体框架

对Faster RCNN进行了调整,同样也是一个two-stage的框架。
backbone之后

RoIAlign

本部分引自https://zhuanlan.zhihu.com/p/402224313

RoIAlign对性能的提升

在这里插入图片描述

Head Architecture–Mask 分支

Mask RCNN同Faster RCNN一样都是通过backbone 来提取特征,然后在通过RPN提取proposal,再将每个RoI送入head中,head负责分类,回归,和预测mask图。
在这里插入图片描述

损失函数

本文定义了多任务的算是函数:
L = L cls + L box + L mask
其中前两项同Faster RCNN相同,第三项L mask为平均二元交叉熵损失,对于一个属于第k类的RoI,Lmask只是k类的gt map与他算损失,其他类的都不影响。

实验

实例分割

在COCO的实例分割的数据集上取得了较好的效果。
在这里插入图片描述
与FCIS的效果比较
在这里插入图片描述

目标检测

在目标检测数据集上也取得了较好的效果。
在这里插入图片描述

关键点检测

在这里插入图片描述
在这里插入图片描述

消融实验

在这里插入图片描述

参考:

https://zhuanlan.zhihu.com/p/402224313(很好的作者。还有配套的视频讲解!)

小白记录学习,主要是加强自己对论文的理解,如有错误,欢迎批评指正。

标签:bin,RoI,Faster,mask,论文,Mask,CNN,RCNN
来源: https://blog.csdn.net/weixin_43179892/article/details/120331937