首页 > TAG信息列表 > 置信度

谈谈YOLO

前言   当我们谈起计算机视觉时,首先想到的就是图像分类,没错,图像分类是计算机视觉最基本的任务之一,但是在图像分类的基础上,还有更复杂和有意思的任务,如目标检测,物体定位,图像分割等,见图1所示。其中目标检测是一件比较实际的且具有挑战性的计算机视觉任务,其可以看成图像分类与定位

YOLO添加Focal loss

将YOLOv3及以上的网络中的BCE loss更改为Focal loss loss函数分为三部分,位置损失、置信度损失、类别损失,此处只需要将置信度损失更换为Focal loss,具体原理请仔细理解置信度损失的含义。 YOLOX链接:https://link.zhihu.com/?target=https%3A//github.com/Megvii-BaseDetection/

YOLO_V1总结

前文链接:图像分类和目标检测中的正负样本划分以及架构理解 在前文中,我们对目标检测有了基本的认识。本文是在前文的基础上,梳理下YOLOv1算法,v1是理解v2-v5的基础。 本节将不再详细介绍v1的论文理解,而是只梳理算法的关键部分。部分细节,请参考:【精读AI论文】YOLO V1目标检测,看我就

[半监督学习] AggMatch: Aggregating Pseudo Labels for Semi-Supervised Learning

受立体匹配(Stereo Matching)中代价聚合(cost aggregation)和 Transformers中 self-attention 的启发, 提出一个聚合模块, 它通过考虑实例之间的相似性来聚合标记和未标记数据的初始伪标签. 为了扩大当前 mini-batch之外的聚合候选者, 利用一个队列来记忆训练期间先前 batch

[半监督学习] Democratic Co-Learning

提出了民主协同学习(Democratic Co-Learning), 一种新的单视图半监督技术, 可用于没有两个独立和冗余特征集的应用, 并且适用于少量标记数据. 在民主协同学习中, 使用一组不同的学习算法在标记数据集上分别训练一组分类器. 使用加权投票组合输出概念, 以预测未标记示例的标

Out-of-distribution Detection系列专栏(二)

目录 前言 A baseline for detecting misclassified and out-of-distribution examples in neural networks ID与OOD OOD研究中常用的数据集以及实验构造方式 OOD实验的基本设置 Max-Softmax方法的主要思想 评价指标 AUROC与AUPR的计算方法 前言 这是OOD检测专栏的第二篇文章,也

The Φ Accrual Failure Detector机制学习总结

背景 众所周知,故障检测(failure detector)是分布式系统的基础模块,用于探测各种服务、节点、进程等状态。在分布式环境下应用需要调整故障检测以适用于不同的QOS需求,而传统的故障探测算法只能提供bool结果对探测进行决断。传统的探测方法主要通过周期心跳HeartBeat和超时时间Timeout

Apriori与FP-Growth算法对比

源代码:仓库地址 数据挖掘常用算法对比测试 Usage git clone git@github.com:JackHCC/Apriori-and-FP_Growth.git cd Apriori-and-FP_Growth Apriori python Apriori.py FP-Growth python FP_Growth.py DataSet设置 data_set = [ [‘牛奶’, ‘鸡蛋’, ‘面包’, ‘薯片’]

(转)YOLOv5的置信度阀值与iou阀值

conf_thres   Confidence Threshold,置信度阈值。   只显示预测概率超过conf_thres的预测结果。   想让YOLO只标记可能性高的地方,就把这个参数提高。 iou_thres Intersect over Union Threshold,交并比阈值。 IOU值:预测框大小∩真实框大小 / 预测框大小∪真实框大小。(预测

细粒度:NTS-Net论文笔记——Learning to Navigate for Fine-grained Classification

细粒度:NTS-Net论文笔记——Learning to Navigate for Fine-grained Classification 综述主要思想网络结构网络流程NavigatorTeacherScrutinizer 损失与优化总结 NTS-Net源码笔记:https://blog.csdn.net/qq_50001789/article/details/121260644 综述 论文题目:《Learning

Attribute-aware Pedestrian Detection in a Crow

APD,citypersons的SOTA,主要解决重叠目标的问题 普通NMS流程: 对于最后输出的所有框 (1)找到预测置信度最大的框M (2)计算其他同类框和M的IOU (3)将IOU大于阈值N_t的框的置信度置0 普通NMS的问题: 两(多)个同类物体的IOU特别大的时候,其中一个人的预测框会在最后被NMS掉 那么,有

yolo论文

一、yolov1 1、引言 目前的检测系统通过重新使用(reprupose)分类器来执行形式检测。为了检测一个目标,这些系统为该目标取一个分类器,并在test image的不同locations 和scales上来评估它。像可变形部件模型(DPM)这样的系统使用滑动窗口的方法,分类器在整个图像上均匀间隔的位置运行。

跟李沐学AI–锚框代码解析–3

跟李沐学AI–锚框代码解析–3 非极大值抑制预测边界框 当存在许多锚框时,可能会输出许多相似的具有明显重带你的预测边界框,围绕同一目标,为了简化输出,使用给非极大值抑制(non-maximum suppression, NMS)合并对应目标为同一类的类似的预测边界框其工作原理如下: 基础概念:对于一个预

Yolo V1原理及应用

YOLO的CNN网络将输入的图片分割成网格,每个单元格负责去检测那些中心点落在该格子内的目标,如图所示,可以看到车这个目标的中心落在右下角一个单元格内,那么该单元格负责预测这个车。每个单元格会预测B个边界框(bounding box)以及边界框的置信度(confidence score) 所谓置信度其实包

yolov3 论文笔记

原始论文中废话太多,文章主要参考csdn以及知乎上等博主的优秀博文总结得到 参考: https://blog.csdn.net/qq_37541097/article/details/81214953 https://zhuanlan.zhihu.com/p/76802514 https://zhuanlan.zhihu.com/p/337383661 backbone yolo v3的backbone 使用的是darknet53

Apriori 算法原理以及python实现详解

Apriori 算法原理以及python实现 ​ Apriori算法是第一个关联规则挖掘算法,也是最经典的算法。它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过程由连接(类 矩阵运算)与剪枝(去掉那些没必要的中间结果)组成。该算法中项集的概念即为项的集合。包含K个项的集合为k项

计算机视觉 | 面试题:04、NMS详细工作机制及代码实现

问题 看到一句话:NMS都不懂,还做什么Detection ! 虎躯一震……懂是大概懂,但代码能写出来吗??? 在目标检测网络中,产生 proposal 后使用分类分支给出每个框的每类置信度,使用回归分支修正框的位置,最终会使用 NMS 方法去除同个类别当中 IOU 重叠度较高且 scores 即置信度较低的那些检

YOLOv1

YOLOv1 作者:Joseph Redmon CVPR'16 paper:YOLOv1 亮点 将目标检测当作是一个回归任务,使用一个网络预测类别和bounding box 网络结构 传统的目标检测方法先生成候选框,然后在候选框的基础上进行分类,修正边框,去重复框等操作,速度慢。 本文将目标检测视为回归任务,通过一次处理图片,即得

利用Apr算法做关联性分析:以对公众号推送的文章类型组合做出优化

背景 1.订阅号推送一条图文消息时可一次性组合推送最多8篇文章,如下图,其中1篇头条和最多7篇次条。 2.在推送文章时,需要考虑到文章类型的多样性,因此,每天的推送排版,都要考虑不同的文章类型之间的契合性。要是陈列不当,次条的阅读量就很惨淡。当然,要是选择恰当,头条和次条就能相互促

《YOLO算法笔记》(草稿)

检测算法回顾 5、6年前的检测算法大体如下: 手动涉及特征时应该考虑的因素: 1、尺度不变性 2、光照不变性 3、旋转不变性 这一步骤称为特征工程,最重要的一个算法称为sift,(回顾SIFT讲解)体现了上述所有的观点。 在分类的过程中,经典的工具有SVM、NN。 由于每一个步骤都会存在

啤酒与尿布的故事

这是一个很老但很有意思的故事 我们去沃尔玛超市会发现一个很有趣的现象:货架上啤酒与尿布竟然放在一起售卖,这看似两者毫不相关的东西,为什么会放在一起售卖呢? 原来,在美国,妇女们经常会嘱咐她们的丈夫下班以后给孩子买一点尿布回来,而丈夫在买完尿布后,大都会顺手买回一瓶自己爱喝的

YOLOv3: An Incremental Improvement

摘要 在论文YOLO v3中作者借鉴了很多好的方案融合到了YOLO里面,并且分享了很多经验(尝试),从结果来说结果也是不错的在保持速度优势的前提下,提升了预测精度,尤其是加强了对小物体的识别能力。 论文地址:YOLOv3: An Incremental Improvement 网络结构 backbone:Darknet-53,如图1。

3d 人脸重建论文解读

Accurate 3D Face Reconstruction with Weakly-Supervised Learning:From Single Image to Image Set 解读 最近看到一篇<<Accurate 3D Face Reconstruction with Weakly-Supervised Learning:From Single Image to Image Set>>很不错的3d face重建文章,做个简单笔记。 这篇文

FreeAnchor:令anchor自由匹配标签的策略

前言 本文将要介绍一种为训练样本分配标签的策略,这种策略称作 FreeAnchor,注意不是 anchor free 哦!FreeAnchor 是用于 anchor-based 体系下的策略,那么它到底free在哪里呢?anchor还能玩起freestyle? 是这样的,FreeAnchor 指的是在训练过程中让anchor能够根据模型当前的表现来自由匹配

YOLO v1介绍

YOLO v1算法介绍  YOLO v1是将整个图片作为网络的输入,直接在输出层对BBox的位置和类别进行回归。实现方法分为如下步骤: 一幅图像首先被分为 S × S