首页 > TAG信息列表 > Shifted

Swin Transformer V1 总结

Swin Transformer V1 总结 **原始摘要 ** 本文介绍了一种名为 Swin Transformer 的新视觉 Transformer,它能够作为计算机视觉的通用主干。将 Transformer¹ 从语言适应到视觉的挑战来自两个领域之间的差异,例如视觉实体的规模变化很大,以及与文本中的单词相比,图像中像素的高分辨率。