其他分享
首页 > 其他分享> > YOLO3输出张量解码过程

YOLO3输出张量解码过程

作者:互联网

理解yolo3输出张量解码过程

  1. Yolo网络输出是一个元组,包含三个张量,代表三个不同尺度,大小是1x255x13x13,1x255x26x26,1x255x52x52。255表示每个格点输出三个预测框,每个预测框包含85个元素,共255个元素。

  2. Yolo3解码过程包括五个阶段:缩小先验框、生成网格、生成预测框、非极大值抑制、显示预测框
    在这里插入图片描述

  3. 解码过程包含的尺寸变换:
    1 :原图尺寸变换为416x416
    2 :为了在特征图上确定预测框的大小和位置,将先验框缩小(416/13、416/26、416/52)倍
    3 :在特征图上生成网格,根据输出张量,确定预测框的位置和大小;然后将坐标和宽高信息,放大(416/13、416/26、416/52)倍,在原图中显示;最后,将原图恢复至原来的大小

在这里插入图片描述

标签:原图,预测,输出,解码,张量,416,YOLO3
来源: https://blog.csdn.net/Tomlove_zhy/article/details/115256090