在Windows系统上配置YOLOv5的训练环境,需要完成一系列步骤以确保模型能够正确运行和训练。以下是保姆级教程,帮助您从零开始搭建YOLOv5的训练环境。
YOLOv5基于Python开发,因此首先需要安装Python。推荐版本为3.8或更高版本(注意:不要使用Python 3.10及以上版本,因为部分依赖库可能不兼容)。
YOLOv5的代码托管在GitHub上,因此需要安装Git来克隆代码仓库。
git --version
验证安装是否成功。如果您计划使用GPU加速训练,则需要安装NVIDIA CUDA和cuDNN:
注意:YOLOv5官方推荐的CUDA版本为11.3或11.6,请根据自己的显卡型号选择合适的版本。
打开命令提示符,运行以下命令将YOLOv5代码克隆到本地:
git clone https://github.com/ultralytics/yolov5.git
cd yolov5
为了防止不同项目之间的依赖冲突,建议创建一个独立的Python虚拟环境。
python -m venv yolov5_env
激活虚拟环境:
.\yolov5_env\Scripts\Activate
yolov5_env\Scripts\activate
进入YOLOv5目录后,运行以下命令安装所需的依赖库:
pip install -r requirements.txt
如果遇到某些依赖安装失败,可以尝试单独安装这些库,例如:
pip install torch==1.10.0+cu113 torchvision==0.11.1+cu113 torchaudio===0.10.0+cu113 -f https://download.pytorch.org/whl/cu113/torch_stable.html
上述命令会安装PyTorch及其相关库,确保与CUDA版本兼容。
YOLOv5支持多种格式的数据集,但最常用的是COCO格式。以下是准备数据集的步骤:
确保数据集按照以下结构组织:
dataset/
├── images/
│ ├── train/
│ └── val/
└── labels/
├── train/
└── val/
创建一个.yaml
文件描述数据集路径和类别信息。例如:
train: ../dataset/images/train
val: ../dataset/images/val
nc: 3 # 类别数量
names: ['cat', 'dog', 'bird'] # 类别名称
运行以下命令开始训练:
python train.py --img 640 --batch 16 --epochs 50 --data dataset.yaml --weights yolov5s.pt
参数说明:
--img
:输入图像尺寸(如640x640)。--batch
:批量大小。--epochs
:训练轮数。--data
:数据集配置文件路径。--weights
:预训练权重文件路径(可选yolov5s.pt
、yolov5m.pt
等)。训练过程中,YOLOv5会在终端输出损失曲线和其他指标。此外,还可以通过TensorBoard可视化训练结果:
tensorboard --logdir runs/train
如果出现CUDA out of memory
错误,可能是显存不足。可以通过减少批量大小(--batch
)或降低输入分辨率(--img
)解决问题。
如果某些依赖无法安装,可以尝试升级pip
并重新安装:
pip install --upgrade pip
pip install -r requirements.txt
确保GPU驱动和CUDA版本匹配。如果仍然较慢,可以检查是否启用了GPU加速:
nvidia-smi