m12
作者:互联网
rcnn=region proposals(候选区域) + CNN
1、用Selective Search(选择性搜索)产生候选区域,是基于像素相似性进行的分割
1️⃣用论文《Efficient Graph-Based Image Segmentation》得到初始分割区域 R,每个元素是小子图
定义:边的权重是两个节点的像素差
定义:子图C的图内距离INC(C)为该图的最小生成树(=最小连通子图)中所有边的最大权值,如果只有1个节点,则图内距离=0
定义:两个图之间的距离DIF(Ci,Cj)是连接两个图的所有边中的最小权值,没有边连的话就是无穷大
定义:如果子图之间的距离大于图内的距离,则两个图有边界,D(Ci,Cj)=True
该图的每个像素作为1个子图,对于有边界的两个子图,如果他俩的距离小于一个参数,则把两个子图合并,不断迭代,最终图片被分割为几个大的子图
效果:其中同一个颜色是一个子图
2️⃣ 计算每个子图与子图之间的相似度,放到相似度集合里面:
相似度分为颜色相似度、纹理相似度、大小相似度、形状交叠相似度,最终的相似度是这四个值取不同的权重相加
颜色相似度:每个颜色通道分为25个bins(范围),总共有75个bins,一个图对应75维向量,每维度是该范围内(bin)的像素点个数,然后向量归一化
对于两个向量,遍历每一个维度,将所有较小的元素相加,例如(1,10)和(2,4)=>1+4=5
纹理相似度:每个颜色通道分为10个bins,图里共3*10=30个bins,每个bin有8个方向,计算该方向的偏导数,所以一个图对应240维度向量,每个维度是个导数,然后向量归一化
对于两个向量,(与上面一样)....
大小相似度:子图面积越小,相似度越大
形状交叠相似度
3️⃣将最大相似度的两个子图合并生成新子图放到 R 里面(原来的子图不丢弃),再计算两两相似度,再合并...,直到只剩1张子图。最终得到的 R 是原来的小子图+新的更大的子图
2、把步骤1产生的所有候选区域 R 缩放(或裁剪等等)为同一尺寸
标签:每个,子图,m12,向量,相似,维度,bins 来源: https://www.cnblogs.com/pjishu/p/16637746.html