其他分享
首页 > 其他分享> > Few-shot Object Detecion via Feature Reweighting论文解读

Few-shot Object Detecion via Feature Reweighting论文解读

作者:互联网

Few-shot Object Detecion via Feature Reweighting

最近入坑小样本检测,所以会更新一些论文解读,调研一下

本文使用元学习的方法进行训练,基础框架为单阶段目标检测框架(作者提供的代码使用的是yolov2)

建议先了解小样本学习的形式化定义,这里不细讲,由于我最近要写中文论文,所以尽量避免使用英文,base类一律翻译为基础类,novel类一律翻译为新颖类

论文主要提出了两个模块:元学习器和特征重加权模块

该方法在多数数据集和多种设置下取得了很好的效果,同时良好的迁移性(从一个数据集迁移到另一个数据集)
主要贡献(此处为论文中翻译而来)

整体架构

在这里插入图片描述

论文方法框架如图所示,假设有 N 个新颖类需要检测,那么重加权模块需要输入N个类的支持集图片(每个类一张),然后将其转换为N个重加权向量,每个向量负责从对应类别中检测新颖类目标。整个训练过程分为两步:

特征重加权

作者将整个模型分为三部分:

学习策略

论文介绍了具体的元学习学习策略(就是将一个大任务,拆成多个小任务,每个小任务抽取一部分支持集,一个查询样本训练,然后不断重复)。论文奖整个训练过程分为两个部分:

检测损失函数

作者发现使用简单的二值交叉熵会导致多余的结果(例如,把火车检测成公交车或者汽车),这是因为一个区域应该只有属于 N N N个类中的一个目标物是真正的正样本

作者设计了softmax层解决这个问题。将分类得分 c c c进行进一步计算,抑制错误类的得分,得到第 i i i类的真正得分 c ^ i = e c i Σ j = 1 N e c j \widehat c_i = \frac{e^{c_i}}{\Sigma^N_{j=1}e^{c_j}} c i​=Σj=1N​ecj​eci​​。
训练过程分类得分的最终损失函数为:
L c = − Σ i = 1 N 1 ( ⋅ , i ) l o g ( c ^ i ) \mathcal L_c = -\Sigma^N_{i=1}{\mathbb 1(\cdot, i)log(\widehat c_i)} Lc​=−Σi=1N​1(⋅,i)log(c i​)
其中 1 ( ⋅ , i ) \mathbb 1(\cdot, i) 1(⋅,i)是指示函数,当前目标框真正属于当前类别时等于1,否则为0。
其余loss与YOLOv2大致相同,只是去掉了一些负样本的损失。

重加权模块输入

输入时将RGB图像加入一个维度mask维度,该维度在有目标物的部分为1,其余为0。如果一张图片有多个目标,只选择其中一个。

实验

数据集

基准

实验效果

消融实验

标签:加权,via,shot,模块,训练,Reweighting,样本,新颖,mathcal
来源: https://blog.csdn.net/weixin_44340538/article/details/122224110