news 2026/4/18 1:25:12

简述:torchvision

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
简述:torchvision

简述:torchvision

一、Torchvision 是什么
Torchvision 是 PyTorch 官方配套的计算机视觉专用库,专门处理图像任务。
作用:提供常用数据集、图像预处理、经典模型、可视化工具
核心内容:
内置数据集:MNIST、CIFAR、ImageNet、COCO 等
经典模型:ResNet、VGG、U-Net、FasterRCNN 等(直接用预训练权重)
图像变换:裁剪、归一化、翻转、增强
工具:图像读取、显示、保存

二、3 个简单实用例子
例子 1:图像预处理(最常用)

fromtorchvisionimporttransformsfromPILimportImage# 定义一套图像预处理流程transform=transforms.Compose([transforms.Resize((224,224)),# 改尺寸transforms.ToTensor(),# 转张量transforms.Normalize(mean=[0.5],std=[0.5])# 归一化])# 加载并处理图片img=Image.open("test.jpg")img_tensor=transform(img)print(img_tensor.shape)# 输出: torch.Size([3, 224, 224])

例子 2:直接用预训练模型 ResNet

fromtorchvisionimportmodels# 加载训练好的ResNet18model=models.resnet18(pretrained=True)model.eval()# 设为推理模式# 输入一张图importtorch x=torch.randn(1,3,224,224)# 1张图,3通道out=model(x)print(out.shape)# 输出分类结果

例子 3:加载官方数据集(CIFAR10)

fromtorchvisionimportdatasets,transformsfromtorch.utils.dataimportDataLoader transform=transforms.ToTensor()# 自动下载加载CIFAR10dataset=datasets.CIFAR10(root="./data",train=True,download=True,transform=transform)# 批量加载loader=DataLoader(dataset,batch_size=32,shuffle=True)# 取一批数据images,labels=next(iter(loader))print(images.shape)# torch.Size([32, 3, 32, 32])

三、一句话总结
Torchvision 是 PyTorch 视觉必备工具包,负责图像预处理、模型、数据集,让图像分类 / 检测 / 分割开箱即用,非常适合做变化检测、影像识别等任务。

本blog地址:https://blog.csdn.net/hsg77

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 1:20:34

从零开始:用R语言maps包快速绘制欧洲国家地图(含标签添加技巧)

从零开始:用R语言maps包快速绘制欧洲国家地图(含标签添加技巧) 欧洲大陆丰富的地理特征和文化多样性使其成为数据可视化的绝佳对象。对于R语言初学者来说,maps包提供了一个简单而强大的工具集,能够快速创建专业级的地图…

作者头像 李华
网站建设 2026/4/18 1:09:12

从零构建垃圾分类识别系统:基于8万张图片与TensorFlow的实战指南

1. 项目背景与数据集介绍 垃圾分类识别系统听起来高大上,但其实离我们日常生活特别近。去年我帮小区物业做了一套这样的系统,从零开始折腾了两个月,踩了不少坑,也积累了不少实战经验。这次就用8万张图片的数据集为例,…

作者头像 李华
网站建设 2026/4/18 1:08:43

从DeepPS到工业实践:剖析基于DCNN的停车位检测算法演进与挑战

1. 停车位检测技术的现实挑战与需求 想象一下,你正开车进入一个陌生的地下停车场,昏暗的灯光下,地面反光严重,部分车位线已经模糊不清。这时候如果依赖传统计算机视觉算法,很可能连最基本的车位线都识别不出来。这正是…

作者头像 李华