ResNet18二分类保姆教程：预装环境镜像，打开即用-编程阁

ResNet18二分类保姆教程：预装环境镜像，打开即用

1. 为什么选择ResNet18做医学图像分类

作为一名医学学生，你可能经常需要分析大量X光片。传统方法需要人工逐张检查，耗时耗力。而深度学习中的ResNet18模型，就像一位经验丰富的"AI医生助手"，能帮你快速完成初步分类。

ResNet18特别适合医学图像分类的三大原因：

轻量高效：相比更复杂的模型，它只有18层结构，在保持不错准确率的同时，对计算资源要求更低
迁移学习友好：即使你的数据集不大（比如几百张X光片），也能通过微调预训练模型获得不错效果
结构稳定：特有的残差连接设计，让模型在训练时不容易出现梯度消失问题

对于电脑配置不高的同学，使用预装环境的云端镜像是最佳选择。CSDN星图平台提供的ResNet18镜像已经配置好所有依赖，你只需要准备数据就能开始训练。

2. 准备工作：数据整理与上传

在开始训练前，我们需要整理X光片数据。假设你要区分肺炎和正常胸片，建议按以下结构组织：

xray_dataset/ ├── train/ │ ├── normal/ │ │ ├── normal_001.jpg │ │ └── ... │ └── pneumonia/ │ ├── pneumonia_001.jpg │ └── ... └── val/ ├── normal/ └── pneumonia/

数据准备小技巧：

样本均衡：每个类别的训练样本数尽量接近（如各300张）
合理划分：建议训练集:验证集=8:2
统一格式：将所有图片转为JPG格式，尺寸建议调整为224x224（ResNet的标准输入尺寸）

准备好数据后，通过CSDN星图平台的文件上传功能将整个xray_dataset文件夹上传到云端。

3. 三步启动ResNet18训练

3.1 一键部署镜像

在CSDN星图平台找到"ResNet18二分类"镜像，点击"立即部署"。系统会自动为你分配GPU资源（通常需要3-5分钟）。

部署成功后，你会看到一个JupyterLab界面，所有环境已经配置完成，不需要自己安装任何软件包。

3.2 运行训练代码

新建一个Python笔记本，粘贴以下代码（我已添加详细注释）：

import torch import torchvision from torchvision import transforms, datasets from torch.utils.data import DataLoader # 1. 数据预处理 transform = transforms.Compose([ transforms.Resize(256), # 先放大到256x256 transforms.CenterCrop(224), # 再中心裁剪到224x224 transforms.ToTensor(), # 转为张量 transforms.Normalize( # 标准化(使用ImageNet的均值方差) mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225] ) ]) # 2. 加载数据集 train_data = datasets.ImageFolder( 'xray_dataset/train', transform=transform ) val_data = datasets.ImageFolder( 'xray_dataset/val', transform=transform ) # 3. 创建数据加载器 train_loader = DataLoader(train_data, batch_size=32, shuffle=True) val_loader = DataLoader(val_data, batch_size=32) # 4. 加载预训练模型 model = torchvision.models.resnet18(pretrained=True) # 5. 修改最后一层（适应二分类） num_features = model.fc.in_features model.fc = torch.nn.Linear(num_features, 2) # 输出2个类别 # 6. 定义损失函数和优化器 criterion = torch.nn.CrossEntropyLoss() optimizer = torch.optim.Adam(model.parameters(), lr=0.001) # 7. 训练函数 def train_model(model, criterion, optimizer, num_epochs=10): for epoch in range(num_epochs): model.train() running_loss = 0.0 for inputs, labels in train_loader: optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() # 每个epoch结束后验证 model.eval() correct = 0 total = 0 with torch.no_grad(): for inputs, labels in val_loader: outputs = model(inputs) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print(f'Epoch {epoch+1}/{num_epochs}, Loss: {running_loss/len(train_loader):.4f}, Val Acc: {100*correct/total:.2f}%') # 8. 开始训练（10个epoch） train_model(model, criterion, optimizer, num_epochs=10)

3.3 保存与使用模型

训练完成后，添加以下代码保存模型：

# 保存模型权重 torch.save(model.state_dict(), 'xray_resnet18.pth') # 后续使用时加载模型 loaded_model = torchvision.models.resnet18(pretrained=False) loaded_model.fc = torch.nn.Linear(loaded_model.fc.in_features, 2) loaded_model.load_state_dict(torch.load('xray_resnet18.pth')) loaded_model.eval()

4. 关键参数调优指南

想让模型表现更好？试试调整这些参数：

学习率(lr)：
默认0.001，如果验证集准确率波动大，尝试减小到0.0001
如果训练速度太慢，可以增大到0.005（但不要超过0.01）
批量大小(batch_size)：
GPU内存不足时，从32减小到16或8
大batch可能让训练更稳定，但会占用更多显存
训练轮数(num_epochs)：
观察验证集准确率，当连续3轮不再提升时就该停止了
医学图像通常需要15-20轮才能收敛
数据增强：在transform中添加更多增强操作，提高模型泛化能力：

transform = transforms.Compose([ transforms.RandomHorizontalFlip(), # 随机水平翻转 transforms.RandomRotation(10), # 随机旋转±10度 transforms.ColorJitter(brightness=0.1, contrast=0.1), # 亮度对比度微调 transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ])

5. 常见问题与解决方案

Q1: 训练时出现CUDA内存不足错误怎么办？

A1：尝试以下方法： - 减小batch_size（32→16→8） - 在代码开头添加torch.cuda.empty_cache()- 使用更小的图片尺寸（224→192）

Q2: 验证准确率一直上不去可能是什么原因？

A2：检查这些方面： - 数据集是否标注正确？随机查看一些样本 - 两类样本数量是否均衡？差异不要超过1:3 - 学习率是否合适？尝试用0.0001重新训练

Q3: 如何用训练好的模型预测新图片？

A3：使用以下预测代码：

from PIL import Image def predict(image_path): img = Image.open(image_path) img_tensor = transform(img).unsqueeze(0) # 增加batch维度 with torch.no_grad(): output = model(img_tensor) _, predicted = torch.max(output, 1) return '肺炎' if predicted.item() == 1 else '正常' # 使用示例 print(predict('new_xray.jpg'))