测试目的
在语义分割基准模型 Deeplab V3+中,测试不同骨架网络和数据集的影响
具体来说,测试三个数据集:Cityscapes、Pascal VOC 2012和Camvid,输入尺寸如下:
测试四个骨架网络:MobileNet V2、Xception-65、ResNet-50和ResNet-101;训练 batch size 均设置为 16. 训练时分别训练 40k/30k/6k 个iteration,采用单尺度进行测试;
测试环境
安装步骤
1.安装 anaconda 环境并且在命令行中输入命令安装;
bash Anaconda3-5.0.1-Linux-x86_64.sh
gedit ~/.bashrc
export PATH=$PATH:/home/omnisky/anaconda3/bin
2.配置 python 环境,安装 pytorch;
conda create -n torch11 python=3.9
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
3.下载数据集并进行必要路径配置;
Cityscapes Dataset – Semantic Understanding of Urban Street Scenes
(cityscapes-dataset.com)
4.克隆 GitHub 语义分割开源项目 git@github.com:zhizhangxian/sssegmentation.git.并且配置相关环境
pip install -r requirements.txt
5.运行训练和测试代码
bash job.sh
bash test.sh
测试结果
各个数据集和不同骨架网络的 Deeplab V3 Plus 性能(mIOU(%))
测试结论
1.在数据集 Pascal VOC 上 Xception 取得了比 ResNet 更好的表现;
2.在数据集 Cityscapes 上,ResNet 系列的分割性能比较好,以 ResNet-101 最佳;
3.Camvids 数据集存在较大的过拟合问题。所以性能和其他 SOTA 结果相比存在不足;