在 PyTorch 的 torchvision 库中,transforms 模块提供了一系列用于预处理图像和进行数据增强的工具。这些变换可以对数据进行标准化、裁剪、旋转等操作,是构建深度学习模型中图像处理流程的重要部分。
主要功能
-
数据类型转换:
ToTensor:将 PIL 图像或 NumPy 数组转换为 FloatTensor,并在 0 到 1 之间缩放图像数据。ToPILImage:将 tensor 或数组转换回 PIL 图像。
-
图像尺寸调整:
Resize:调整图像的大小。CenterCrop、RandomCrop、RandomResizedCrop:进行中心裁剪或随机裁剪,以及调整大小和裁剪的组合。Pad:对图像边缘进行填充。
-
图像变换:
RandomHorizontalFlip、RandomVerticalFlip:随机水平或垂直翻转图像。RandomRotation:随机旋转图像一定角度。RandomAffine