认识PASCAL VOC数据集(目标检测)
作者:互联网
数据集详解(只介绍目标检测中):
目标检测主要用Annotations保存标签数据、ImageSets保存具体数据集的索引、JPEGImages保存图片。其他为分割。有20个类别
Annotations:
文件保存位置:VOC2012/Annotations的xml文件
保存信息:
1、物体name:如fperson;
2、size:width,height,depth
3、bbox: xmin、xmax、ymin、ymax
ImageSets:
包括 Action,Layout,Main,Segmentation 四个文件夹。
Action:存放的是人的动作(例如running、jumping等等)
Layout:存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分
Main:存放的是图像物体识别的数据,总共分为20类。
Segmentation:存放的是可用于分割的数据。
ImageSets/Main/ 文件夹以 , {class}_trainval.txt ,{class}_val.txt 的格式命名。 train.txt, val.txt 例外
1、 {class}_train.txt 保存类别为 class 的训练集的所有索引,每一个 class 的 train 数据都有 5717 个。
2、{class}_val.txt 保存类别为 class 的验证集的所有索引,每一个 class 的val数据都有 5823 个
3、{class}_trainval.txt 保存类别为 class 的训练验证集的所有索引,每一个 class 的val数据都有11540 个
每个文件内容:
其中1表示正样本,-1表示负样本
VOC2012/ImageSets/Main/train.txt 保存了所有训练集的文件名,ImageSets/Main/val.txt 保存了所有验证集的文件名从 VOC2012/JPEGImages/ 找到文件名对应的图片文件,VOC2012/Annotations找到文件名对应的标签文件
JPEGImages:
需要解码获得图像数据
参考:
PASCAL VOC 2012 数据集详解_wenxueliu的博客-CSDN博客_voc2012数据集
标签:ImageSets,Main,val,VOC,检测,PASCAL,txt,数据,class 来源: https://blog.csdn.net/qq_53029963/article/details/121480325