Shortcuts

注意

您正在阅读 MMSelfSup 0.x 版本的文档,而 MMSelfSup 0.x 版本将会在 2022 年末 开始逐步停止维护。我们建议您及时升级到 MMSelfSup 1.0.0rc 版本,享受由 OpenMMLab 2.0 带来的更多新特性和更佳的性能表现。阅读 MMSelfSup 1.0.0rc 的 发版日志, 代码文档 获取更多信息。

准备数据集

MMSelfSup 支持多个数据集。请遵循相应的数据准备指南。建议将您的数据集根目录软链接到 $MMSELFSUP/data。如果您的文件夹结构不同,您可能需要更改配置文件中的相应路径。

mmselfsup
├── mmselfsup
├── tools
├── configs
├── docs
├── data
│   ├── imagenet
│   │   ├── meta
│   │   ├── train
│   │   ├── val
│   ├── places205
│   │   ├── meta
│   │   ├── train
│   │   ├── val
│   ├── inaturalist2018
│   │   ├── meta
│   │   ├── train
│   │   ├── val
│   ├── VOCdevkit
│   │   ├── VOC2007
│   ├── cifar
│   │   ├── cifar-10-batches-py

准备 ImageNet 数据集

对于 ImageNet,它有多个版本,但最常用的是 ILSVRC 2012。可以通过以下步骤得到:

  1. 注册账号并登录 下载页面

  2. 找到 ILSVRC2012 的下载链接,下载以下两个文件

    • ILSVRC2012_img_train.tar (~138GB)

    • ILSVRC2012_img_val.tar (~6.3GB)

  3. 解压下载的文件

  4. 使用这个 脚本 下载元数据

准备 Places205 数据集

对于 Places205,您需要:

  1. 注册账号并登录 下载页面

  2. 下载 Places205 经过缩放的图片以及训练集和验证集的图片列表

  3. 解压下载的文件

准备 iNaturalist2018 数据集

对于 iNaturalist2018,您需要:

  1. 下载页面 下载训练集和验证集图像及标注

  2. 解压下载的文件

  3. 使用脚本 tools/data_converters/convert_inaturalist.py 将原来的 json 标注格式转换为列表格式

准备 PASCAL VOC 数据集

假设您通常将数据集存储在 $YOUR_DATA_ROOT 中。下面的命令会自动将 PASCAL VOC 2007 下载到 $YOUR_DATA_ROOT 中,准备好所需的文件,在 $MMSELFSUP 下创建一个文件夹 data,并制作一个软链接 VOCdevkit

bash tools/data_converters/prepare_voc07_cls.sh $YOUR_DATA_ROOT

准备 CIFAR10 数据集

如果没有找到 CIFAR10 系统将会自动下载。此外,由 MMSelfSup 实现的 dataset 也会自动将 CIFAR10 转换为适当的格式。

准备检测和分割数据集

检测

您可以参考 mmdet 来准备 COCO,VOC2007 和 VOC2012 检测数据集。

分割

您可以参考 mmseg 来准备 VOC2012AUG 和 Cityscapes 分割数据集。

Read the Docs v: 0.x
Versions
latest
stable
1.x
dev-1.x
0.x
Downloads
On Read the Docs
Project Home
Builds

Free document hosting provided by Read the Docs.