其他分享
首页 > 其他分享> > transforms常用函数简介

transforms常用函数简介

作者:互联网

transforms的使用

简单介绍一个 transforms 的功能

transforms 主要用于对图片的变换。



下面是常用的函数

toTensor( )

from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image

"""
1. transforms 该如何使用
2. 为什么需要Tensor数据类型
"""

img_path = "dataset/train/ants_image/0013035.jpg"
img = Image.open(img_path)

writer = SummaryWriter("logs")

# ToTensor() 的使用
trans_totensor = transforms.ToTensor()        # 返回一个ToTensor 对象
img_tensor = trans_totensor(img)              # 将传入的图片转换成Tensor类型的图片并返回
writer.add_image("Tensor_img", img_tensor)

writer.close()

由输出结果可知图片转换为了tensor类型
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KnJ6osyp-1643363400527)(C:\Users\14158\AppData\Roaming\Typora\typora-user-images\image-20220120205316788.png)]

在网站上显示出来



Normalize( )

归一化

归一化目的就是将不同尺度上的评判结果统一到一个尺度上,从而可以作比较,作计算

比如想买入10吨铁矿,用的人民币和美元肯定不同,那么这10吨铁矿的价值到底是多少,就需要一个统一的标准来衡量,全世界那么多国家,都要用自己国家的货币去买,到底该付多少,就很迷茫。这时,规定用美元统一结算,各国按照本国货币对比美元的汇率,再加上10吨铁矿的美元价值,就可以算出自己应付多少本国货币。

归一化公式:output[channel] = (input[channel] - mean[channel]) / std[channel]

from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image

"""
1. transforms 该如何使用
2. 为什么需要Tensor数据类型
"""

img_path = "dataset/train/ants_image/0013035.jpg"
img = Image.open(img_path)

writer = SummaryWriter("logs")

# ToTensor() 的使用
trans_totensor = transforms.ToTensor()        # 返回一个ToTensor 对象
img_tensor = trans_totensor(img)              # 将传入的图片转换成Tensor类型的图片并返回
writer.add_image("Tensor_img", img_tensor)

"""
 Normalize() 的使用
 公式: output[channel] = (input[channel] - mean[channel]) / std[channel]
 传入均值和标准差,对图像进行归一化
"""
print(img_tensor)
trans_norm = transforms.Normalize([0, 2, 1], [7, 6, 6])
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize", img_norm)

writer.close()

在这里插入图片描述



Resize( )

from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image

"""
1. transforms 该如何使用
2. 为什么需要Tensor数据类型
"""

img_path = "dataset/train/ants_image/0013035.jpg"
img = Image.open(img_path)

writer = SummaryWriter("logs")

# ToTensor() 的使用
trans_totensor = transforms.ToTensor()        # 返回一个ToTensor 对象
img_tensor = trans_totensor(img)              # 将传入的图片转换成Tensor类型的图片并返回
writer.add_image("Tensor_img", img_tensor)

"""
 Normalize() 的使用
 公式: output[channel] = (input[channel] - mean[channel]) / std[channel]
 传入均值和标准差,对图像进行归一化
"""
print(img_tensor)
trans_norm = transforms.Normalize([0, 2, 1], [7, 6, 6])
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize", img_norm)

"""
 Resize()
"""
print(img.size)
trans_resize = transforms.Resize((512, 512))

# img(PIL类型) --resize()--> img_resize(PIL类型)
img_resize = trans_resize(img)

# img_resize(PIL类型) --totensor()--> img_resize(tensor类型)
img_resize = trans_totensor(img_resize)

writer.add_image("Resize", img_resize, 0)
print(img_resize)


writer.close()

在这里插入图片描述
在这里插入图片描述



Compose()

一般用Compose把多个步骤整合到一起

from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image

"""
1. transforms 该如何使用
2. 为什么需要Tensor数据类型
"""
img_path = "dataset/train/ants_image/0013035.jpg"
img = Image.open(img_path)

writer = SummaryWriter("logs")

# ToTensor() 的使用
trans_totensor = transforms.ToTensor()        # 返回一个ToTensor 对象
img_tensor = trans_totensor(img)              # 将传入的图片转换成Tensor类型的图片并返回
writer.add_image("Tensor_img", img_tensor)


"""
 Compose(),将多个步骤整合到一起,参数需要是一个列表
 再Python中,列表的表现形式: [数据1, 数据2, 数据3······]
 在Compose()中,数据需要是transforms类型,所以得到Compose([transforms参数1, transforms参数2])
 要注意前面的输出和后面的输入是否匹配,否则就会报错
"""
trans_resize_2 = transforms.Resize(1024)

# 先对图片进行Resize()变换,再进行ToTensor()变换
# PIL类型 --Resize()--> PIL类型 --ToTensor()--> tensor类型
# 要注意前面的输出和后面的输入是否匹配,否则就会报错
trans_compose = transforms.Compose([trans_resize_2, trans_totensor])
img_resize_2 = trans_compose(img)
writer.add_image("Resize", img_resize_2, 1)


writer.close()

RandomCrop()

随机裁剪

from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image

"""
1. transforms 该如何使用
2. 为什么需要Tensor数据类型
"""
img_path = "dataset/train/ants_image/0013035.jpg"
img = Image.open(img_path)

writer = SummaryWriter("logs")

# ToTensor() 的使用
trans_totensor = transforms.ToTensor()        # 返回一个ToTensor 对象
img_tensor = trans_totensor(img)              # 将传入的图片转换成Tensor类型的图片并返回
writer.add_image("Tensor_img", img_tensor)


"""
 Compose(),将多个步骤整合到一起,参数需要是一个列表
 再Python中,列表的表现形式: [数据1, 数据2, 数据3······]
 在Compose()中,数据需要是transforms类型,所以得到Compose([transforms参数1, transforms参数2])
 要注意前面的输出和后面的输入是否匹配,否则就会报错
"""
trans_resize_2 = transforms.Resize(1024)

# 先对图片进行Resize()变换,再进行ToTensor()变换
# PIL类型 --Resize()--> PIL类型 --ToTensor()--> tensor类型
# 要注意前面的输出和后面的输入是否匹配,否则就会报错
trans_compose = transforms.Compose([trans_resize_2, trans_totensor])
img_resize_2 = trans_compose(img)
writer.add_image("Resize", img_resize_2, 1)


"""
 RandomCrop()
 随机裁剪
"""
trans_random = transforms.RandomCrop(512)
trans_compose_2 = transforms.Compose([trans_random, trans_totensor])
for i in range(10):
    img_crop = trans_compose_2(img)
    writer.add_image("RandomCrop", img_crop, i)


writer.close()

也可指定高和宽进行裁剪。

标签:函数,img,简介,writer,ToTensor,transforms,trans,resize
来源: https://blog.csdn.net/weixin_45468845/article/details/122734609