ResNet18保姆级教程：没GPU也能跑，3步搞定图像分类-编程阁

ResNet18保姆级教程：没GPU也能跑，3步搞定图像分类

1. 为什么选择ResNet18入门AI？

当你第一次接触AI图像分类时，可能会被各种复杂的网络结构和硬件要求吓退。ResNet18作为轻量级神经网络中的"小钢炮"，特别适合初学者快速上手实践。它就像摄影爱好者入门时的"微单相机"——体积小巧但功能齐全，不需要专业级设备也能拍出不错的效果。

ResNet18的核心优势在于：

轻量高效：仅1800万参数，是原版ResNet的1/10大小
硬件友好：4GB内存即可运行，甚至可以用CPU完成推理
结构经典：包含残差连接等核心设计，是理解现代CNN的最佳切入点
效果可靠：在ImageNet上达到69%的Top-1准确率，足以应对常见分类任务

特别适合以下场景： - 学习CNN基础原理 - 快速验证图像分类想法 - 在资源受限环境中部署模型

2. 三步搞定ResNet18图像分类

2.1 环境准备：零配置起步

传统深度学习环境搭建需要安装CUDA、PyTorch等依赖，容易让新手崩溃。我们采用更简单的方式——使用预配置的Colab环境（无需GPU也能运行）：

# 安装必要库（Colab已预装PyTorch） !pip install torchvision pillow

如果使用本地环境，只需确保安装Python 3.6+，然后执行：

pip install torch torchvision pillow

2.2 加载预训练模型：一键调用

PyTorch官方提供了预训练的ResNet18模型，直接加载即可：

import torch from torchvision import models # 加载预训练模型（自动下载权重） model = models.resnet18(pretrained=True) model.eval() # 设置为评估模式 # 如果没有GPU，强制使用CPU device = torch.device("cuda" if torch.cuda.is_available() else "cpu") model = model.to(device)

💡 提示
首次运行会自动下载约45MB的模型权重文件，国内用户可能需要耐心等待下载完成

2.3 图像分类实战：从输入到结果

下面用3行代码完成图像分类：

from PIL import Image from torchvision import transforms # 1. 加载测试图片（替换为你的图片路径） img = Image.open("test.jpg") # 2. 图像预处理 preprocess = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) ]) input_tensor = preprocess(img).unsqueeze(0).to(device) # 3. 执行预测 with torch.no_grad(): output = model(input_tensor) # 打印Top-5预测结果 _, indices = torch.topk(output, 5) print("预测结果：", [(i, idx.item()) for i, idx in enumerate(indices[0])])

3. 关键参数与常见问题

3.1 必须知道的3个参数

输入尺寸：224x224像素（必须保持一致）
归一化参数：
mean=[0.485, 0.456, 0.406]
std=[0.229, 0.224, 0.225]
输出维度：1000类（ImageNet类别）

3.2 新手常踩的坑

图像格式错误：确保输入为RGB格式（PNG/JPG）
忘记归一化：必须使用相同的mean/std参数
维度不匹配：输入需要是4D张量（batch维度不能少）
模式混淆：训练时用model.train()，推理时用model.eval()

3.3 CPU环境优化技巧

如果只有CPU，可以通过这些方法加速：

# 方法1：启用多线程 torch.set_num_threads(4) # 方法2：使用更小的batch size input_batch = input_tensor[:1] # 只处理1张图片 # 方法3：简化预处理（牺牲少量精度） simple_preprocess = transforms.Compose([ transforms.Resize(224), transforms.ToTensor() ])

4. 进阶：自定义图像分类

想用ResNet18识别自己的图片类别？只需微调最后一层：

import torch.nn as nn # 假设我们有10个新类别 num_classes = 10 # 冻结所有层（保留预训练特征） for param in model.parameters(): param.requires_grad = False # 替换最后一层 model.fc = nn.Linear(model.fc.in_features, num_classes) # 现在可以训练新分类器了 # 需要准备自己的数据集（建议至少每类100张图片）