其他分享
首页 > 其他分享> > 【YOLO】深度学习-物体检测-YOLO系列(网易云课程笔记)

【YOLO】深度学习-物体检测-YOLO系列(网易云课程笔记)

作者:互联网

第一章 YOLO系列概述

1.深度学习经典检测方法

在这里插入图片描述

(1) tow-stage(两阶段):Faster-rcnn Mask-rcnn系列:增加了区域建议网络(RPN),即预选框
特点

(2) one-stage(单阶段):YOLO系列
特点

回归任务:
首先,输入一张图片,经过一个CNN,提取出一个高维的特征,最后面一层不再接softmax进行分类,而是预测出4个坐标值,由[x,y,w,h]组成,那么如何来计算这四个值呢?
对于每一张图片,我们有一个grounding truth,grounding truth就是给定的框的实际数据,我们要做的就是使神经网络预测出来的框不断地拟合给定的输入,即不断接近真正的框。我们用L2欧式距离计算差异值,预测出来的框和grounding truth越接近,loss值越小,利用SGD对CNN的参数不断调节,让loss达到收敛的预期效果。这一过程就可以称之为回归过程。
https://blog.csdn.net/weixin_44987948/article/details/109165215

2.指标分析

1)mAP指标:综合衡量检测效果
2)IOU:交集和并集的比值
3)准确率:TP/(TP+FP)
4)召回率:TP/(TP+FN)

第二章 YOLOv1

在这里插入图片描述

1. 核心思想

将输入图像划分为SxS的网格,每个网格的中心点产生两种候选框,对置信度高的中心点(或者设置一定的阈值)对应的两个候选框进行筛选(选择IOU大的),进行微调,得到其的(x,y,w,h)。
在这里插入图片描述

2. 网络架构

在这里插入图片描述
最终输出为:14701=77*30
在这里插入图片描述

3. 损失函数

理解算法主要关注以下部分:
网络架构最终输出值(全连层),以及损失函数怎么定义。
在这里插入图片描述

3.1 位置误差(x,y,w,h)

预测位置与真实位置之间的差值,损失函数越小越好
为什么w,h添加根号?(使损失函数对较小物体比较敏感,但是在v1版本没有根本解决这个问题)
在这里插入图片描述

3.2 置信度误差

基于置信度计算当前网格的候选框是背景还是前景
在这里插入图片描述

3.3 分类误差

预测该类别的概率和真实该类别的概率之差(交叉熵)
在这里插入图片描述

3.4 NMS非极大抑制

3.5 YOLOv1存在问题

第三章 YOLOv2

在这里插入图片描述

1. YOLOv2-Batch Normalization

什么是Dropout:主要运用在全连接层,杀死一部分的神经元,防止网络过于拟合
什么是Batch Normalization:对每层卷积层进行归一化

2. YOLOv2-更大的分辨率

3. YOLOv2(DarkNet19)-网络结构

4. YOLOv2聚类提取先验框(anchor)

利用聚类中心点的w和h作为先验框尺寸
在这里插入图片描述

5. YOLOv2-Anchor Box

6. YOLOv2-Directed Location Prediction(定向位置预测)

7. YOLOv2-Fine-Grained Features

8. YOLOv2-Multi-Scale

感受野的认识

1. 感受野

第四章 YOLOv3(DarkNet53)

这张图讲道理真的过分了!!! 我不是针对谁,在座的各位都是。。。。
在这里插入图片描述

1. 多scale

2. scale变换经典方法

3. 残差连接-为了更好的特征

4. 核心网络架构

5. 先验框设计

6. softmax层替代

第五章 YOLOv4

1. 整体介绍(Optimal Speed and Accuracy of Object Detection)

2. V4的贡献

3. Bog of freebies(BOF,免费包)

3.1 Mosiac data augmentation

在这里插入图片描述
在上述数据处理的方法中,作者参考CutMix然后四张拼接成一张进行训练(相当于间接增加了batch size)

3.2 其他数据增强方法

3.3 Self-adversarial-training(SAT)

在这里插入图片描述

3.4 DropBlock

3.5 标签平滑(label smoothing)

3.6 IOU损失

GIOU损失

4. Bog of specials (BOS,特价包)

4.1 SPPNet(Spatial Pyramid Pooling)

4.2 CSPNet(Cross Stage Partial Network)

4.2 CBAM(将关注点放在更加重要的地方)

在这里插入图片描述

4.3 PAN(Path Aggregation Network)

4.4 Mish(也许就是明日之星)

4.5 eliminate grid sensitivity

5. 整体网络架构

在这里插入图片描述

YOLOv5

1. Focus模块

2. BottleneckCSP

3. PAN流程

在这里插入图片描述

标签:网易,YOLOv2,卷积,检测,IOU,YOLO,网络,笔记,特征
来源: https://blog.csdn.net/qq_44703886/article/details/114883226