Windows 10下配置LabelImg与YOLOv5全流程-编程阁

Windows 10下配置LabelImg与YOLOv5全流程

在目标检测的实际项目中，从零搭建一个完整可用的训练环境往往是初学者面临的最大障碍。明明代码开源、文档齐全，却总卡在环境配置、依赖冲突或标注格式不匹配上——这种“看得见跑不通”的窘境，几乎成了AI入门者的共同记忆。

我曾在一个工业质检项目中连续三天被torch和torchvision的版本问题折磨得焦头烂额，最终发现只是因为PyQt5和CUDA驱动之间存在隐式依赖冲突。正因如此，本文将基于Miniconda-Python3.10镜像环境，带你一步步打通从图像标注到模型推理的全链路，避开那些文档里不会写但实战中必踩的坑。

整个流程围绕三个核心环节展开：用LabelImg构建高质量数据集、借助YOLOv5实现高效训练、并通过端到端测试验证效果。所有操作均在 Windows 10 系统下验证通过，尤其适合没有Linux经验的新手。

环境准备：为什么选择 Miniconda 而不是直接安装 Python？

很多人图省事直接下载Python官网安装包，结果很快就会遇到pip install报错、包版本混乱、不同项目间依赖冲突等问题。而 Miniconda 的优势在于它提供了真正的环境隔离能力。

我们选用的是Miniconda + Python 3.10组合，原因很实际：YOLOv5 官方推荐使用 Python ≥3.7 且 <3.12 的版本，而 PyTorch 对 Python 3.10 的支持最为稳定（尤其是Windows平台）。如果你跳过这一步随便选个版本，后期极有可能遭遇无法安装GPU版torch的尴尬。

下载与安装

前往 Miniconda官方页面下载Windows 64-bit版本。安装时务必勾选“Add Anaconda to my PATH environment variable”选项——虽然安装程序会警告你不建议这么做，但在Windows环境下，不加PATH会导致后续命令调用异常麻烦。

安装完成后，打开Anaconda Prompt（不要用CMD或PowerShell），执行：

conda --version python --version

正常输出应类似：

conda 23.1.0 Python 3.10.9

如果提示“’conda’ 不是内部或外部命令”，说明PATH未正确配置，需要手动添加C:\Users\你的用户名\Miniconda3\Scripts到系统环境变量中。

配置国内镜像源：让依赖安装不再“龟速”

默认的 conda 和 pip 源位于国外服务器，安装大型库如 PyTorch 可能要等十几分钟甚至超时失败。换成清华镜像后，同样的操作通常能在2分钟内完成。

Conda 清华源设置

运行以下命令生成.condarc文件：

conda config --set show_channel_urls yes

然后在用户目录（C:\Users\你的用户名\）下找到并编辑.condarc，写入如下内容：

channels: - defaults show_channel_urls: true default_channels: - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2 custom_channels: conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

保存后清除缓存：

conda clean -i

⚠️ 注意：这里只保留了最常用的几个 channel。过多的自定义源反而可能导致依赖解析失败。

Pip 清华源设置

在C:\Users\你的用户名\创建文件夹pip，并在其中新建pip.ini文件，内容如下：

[global] timeout = 6000 index-url = https://pypi.tuna.tsinghua.edu.cn/simple trusted-host = pypi.tuna.tsinghua.edu.cn

这个小改动能让后续所有pip install命令自动走国内源，体验丝滑下载。

创建独立虚拟环境

接下来创建一个专用于YOLO项目的虚拟环境：

conda create -n yolo_env python=3.10

激活环境：

conda activate yolo_env

你可以通过conda env list查看当前所有环境，绿色星号表示当前激活的环境。

图像标注实战：用 LabelImg 打造你的第一份数据集

再强大的模型也离不开高质量的数据。LabelImg 是目前最流行的开源图像标注工具之一，轻量、直观、支持YOLO格式输出。

安装与启动

先克隆项目：

git clone https://github.com/tzutalin/labelImg.git cd labelImg

确保已激活yolo_env环境，安装依赖：

conda install pyqt=5 lxml -c conda-forge

注意这里指定了-c conda-forge，因为某些系统下默认源可能缺少兼容版本。

编译资源文件：

pyrcc5 -o libs/resources.py resources.qrc

启动GUI：

python labelimg.py

首次运行可能会弹出“Predefined classes not found”警告。别慌，这是正常的。你需要在data/predefined_classes.txt中定义自己的类别，例如：

cat dog

每行一个类名，顺序将决定后续训练时的 class_id 映射关系。

💡 小技巧：可以先把常见物体列出来，后期训练前再删减。避免中途修改类别导致标注文件批量重做。

提升标注效率的关键技巧

LabelImg 的快捷键设计非常人性化，掌握之后效率翻倍：

Ctrl+u：加载整批图片
w：画框（按住拖动）
d/a：切换下一张/上一张
del：删除选中框
Ctrl+s：保存（一定要养成频繁保存的习惯）
Space：标记为“已验证”，防止重复处理

强烈建议开启Auto Save Mode（菜单 File → Auto Save mode），这样每次切换图片都会自动保存，避免意外崩溃丢失进度。

输出格式陷阱：必须切换为 YOLO 格式！

LabelImg 默认保存为 PASCAL VOC 的.xml格式，但 YOLOv5 只认 YOLO 格式的.txt文件。

解决方法很简单：启动软件后，点击菜单栏Change Save Format → YOLO。

此时每张图片对应生成一个同名.txt文件，内容为：

<class_id> <x_center> <y_center> <width> <height>

所有数值都是相对于图像宽高的归一化比例（范围0~1）。比如一张640×480的图中，中心点坐标(320,240)会表示为0.5 0.5。

🛠 工程建议：标注时尽量保证每个目标都被完整框住，且边界贴近物体边缘。对于密集小目标（如远处车辆），可适当放大视图精细标注。

部署 YOLOv5：不只是 git clone 那么简单

Ultralytics 提供的 YOLOv5 实现确实是业内标杆——代码清晰、文档完善、社区活跃。但直接pip install -r requirements.txt往往会在Windows上碰壁，特别是当你想启用GPU加速时。

克隆项目并进入环境

git clone https://github.com/ultralytics/yolov5.git cd yolov5 conda activate yolo_env

安装基础依赖

pip install -r requirements.txt

这一步会安装torch,torchvision,numpy,matplotlib等核心库。但请注意：默认安装的是CPU版本的PyTorch！

如果你想利用NVIDIA显卡进行高速训练，必须手动替换为CUDA版本。

启用GPU支持：绕开版本地狱

首先确认你的CUDA版本：

nvidia-smi

在输出中找到 “CUDA Version: xx.x” 字段（注意这不是Driver支持的最高版本，而是当前可用版本）。

假设显示为CUDA Version: 11.7，则需前往 PyTorch官方whl镜像站下载对应文件：

torch-1.xx.x+cu117-cp310-cp310-win_amd64.whl
torchvision-0.xx.x+cu117-cp310-cp310-win_amd64.whl

下载后本地安装：

pip install torch-1.13.1+cu117-cp310-cp310-win_amd64.whl pip install torchvision-0.14.1+cu117-cp310-cp310-win_amd64.whl

安装完成后验证：

import torch print(torch.__version__) print(torch.cuda.is_available()) # 应返回 True

若返回False，可能是以下原因之一：
- 显卡驱动过旧（建议≥470）
- CUDA版本与PyTorch不匹配
- 安装了错误的whl包（检查是否带+cuXXX）

🔍 经验之谈：Windows下PyTorch对CUDA的支持不如Linux稳定。如果多次尝试失败，可考虑降级至CUDA 11.3 + PyTorch 1.10组合，这是目前最稳定的搭配。

训练与推理：让模型真正“看见”世界

万事俱备，现在开始真正的AI之旅。

数据组织规范

YOLOv5 对数据结构有明确要求，请严格按照如下方式组织：

dataset/ ├── images/ │ ├── train/ ← 训练集图片 │ └── val/ ← 验证集图片 └── labels/ ├── train/ ← 对应的YOLO格式标注文件 └── val/

注意：图片和标签文件名必须一致（仅扩展名不同），且路径中不要包含中文或空格。

编写 YAML 配置文件

在yolov5/data/目录下创建mydata.yaml：

# mydata.yaml train: ../dataset/images/train val: ../dataset/images/val nc: 2 names: ['cat', 'dog']

字段说明：
-train/val：训练和验证集图片路径（相对路径即可）
-nc：类别数量
-names：类别名称列表，顺序必须与标注中的 class_id 一致

⚠️ 常见错误：把names写成['dog', 'cat']但标注时猫是0类狗是1类，会导致模型学错类别。

开始训练

运行命令：

python train.py \ --img 640 \ --batch 16 \ --epochs 50 \ --data data/mydata.yaml \ --weights yolov5s.pt \ --project runs/train

参数解释：
---img：输入尺寸，越大越准但更耗显存
---batch：批次大小，根据显存调整（GTX 1660 Ti 建议≤16）
---weights：初始权重，用预训练模型可显著加快收敛
---project：结果保存路径

首次运行会自动下载yolov5s.pt（约14MB），训练过程中可在控制台实时查看mAP、损失等指标。

训练结束后，最佳模型保存在runs/train/exp/weights/best.pt。

可视化训练过程

YOLOv5 自动生成 TensorBoard 日志，可通过以下命令查看：

tensorboard --logdir runs/train

浏览器访问http://localhost:6006即可看到损失曲线、学习率变化、预测效果图等丰富信息。

模型推理：看看你的AI学会了什么

训练完成后的终极考验：让它识别新图片。

准备几张测试图放入inference/images/，运行：

python detect.py \ --source inference/images/ \ --weights runs/train/exp/weights/best.pt \ --conf 0.4 \ --name result_v1

参数说明：
---source：输入源，支持图片、视频、摄像头甚至网络流
---conf：置信度阈值，低于此值的检测结果会被过滤
---name：输出文件夹名称

运行完毕后，结果保存在runs/detect/result_v1/，每张图都带有彩色边界框和类别标签。

试着换些复杂场景测试一下：遮挡、光照变化、尺度差异……你会发现模型的表现远非完美，而这正是持续优化的动力所在。

这套从标注到推理的完整流程，不仅适用于猫狗识别，稍作调整就能迁移到行人检测、车牌识别、缺陷定位等各种实际场景。关键在于理解每个环节的设计逻辑，而不是死记命令。

比如你知道为什么LabelImg要切换为YOLO格式吗？因为原始VOC格式使用绝对像素坐标，不利于多尺度训练；而归一化后的相对坐标能更好适应不同分辨率输入。

又比如你明白为什么要用Miniconda管理环境吗？一旦你同时开发多个项目（一个用TensorFlow 2.8，另一个用PyTorch 1.13），就知道隔离环境有多重要。

最后想说：动手永远比观望更有收获。哪怕一开始什么都不懂，只要敢运行第一行命令，就已经走在成为AI工程师的路上了。

Windows 10下配置LabelImg与YOLOv5全流程