其他分享
首页 > 其他分享> > Unfold与fold介绍

Unfold与fold介绍

作者:互联网

Unfold+fold


作者:elfin   参考资料来源:pytorch官网


目录


Top---Bottom

1、nn.Unfold

nn.Unfold是pytorch实现的一个layer,那么这个layer是干嘛的呢?

torch.nn.Unfold(kernel_size: Union[T, Tuple[T, ...]], 
                dilation: Union[T, Tuple[T, ...]] = 1, 
                padding: Union[T, Tuple[T, ...]] = 0, 
                stride: Union[T, Tuple[T, ...]] = 1)

这里有四个参数,与我们熟知的卷积操作很相似,那么与卷积有什么区别?

实际上nn.Unfold就是卷积操作的第一步。

​ 对于输入特征图shape=[N,C,H,W],我们的Conv2d是怎么工作的?

nn.Unfold就是将输入的特征图“reshape”到卷积乘法所需要的形状,只是很多元素在特征图中是重叠出现的,所以叫unfold,即我们要先平铺。


Top---Bottom

2、nn.Fold

pytorch接口:

torch.nn.Fold(output_size, kernel_size, dilation=1, padding=0, stride=1)

对于\(shape=(N, C \times \prod(\text{kernel_size}), L)\)的输入,nn.Fold计算得到输出\(shape=(N, C, output\_size[0], output\_size[1])\)。

那么pytorch是怎么处理这个过程的呢?输入和输出的shape明显很难直观对应起来,我们查询源码,可以追溯到torch._C._nn.col2im函数,巧了,我们并不能在源码中找到其代码块。下面是参考程序员修练之路的博客给出的代码,我们对其进行验证:

def col2im(input, output_size, block_size):
    p, q = block_size
    sx = output_size[0] - p + 1
    sy = output_size[1] - q + 1
    result = np.zeros(output_size)
    weight = np.zeros(output_size)  # weight记录每个单元格的数字重复加了多少遍
    col = 0
    # 沿着行移动,所以先保持列(i)不动,沿着行(j)走
    for i in range(sy):
        for j in range(sx):
            result[j:j + p, i:i + q] += input[:, col].reshape(block_size, order='F')
            weight[j:j + p, i:i + q] += np.ones(block_size)
            col += 1
    return result / weight

这个Fold与上面的结果是差距较大的,待下次再研究吧 ……


Top---Bottom

完!

标签:nn,text,介绍,fold,shape,Unfold,output,size
来源: https://www.cnblogs.com/dan-baishucaizi/p/14993100.html