
DOTA 数据集:http://captain.whu.edu.cn/DOTAweb/index.html
COCO 数据集:http://cocodataset.org/#download
COCO API:https://github.com/cocodataset/cocoapi
API make 报错,安装 Cython 即可
1 | conda install cython |
COCO 数据集简介
COCO 数据集包含 instance,keypoint 和 caption 等部分,本文只介绍 instance 相关内容
COCO 数据集的组织方式
coco
├── annos.txt (optional)
├── annotations
├── classes.txt (optional)
└── images
annotations 文件夹放数据集的标注文件(json格式),images 文件夹放数据集的所有图片,(annos.txt 放数据集的原始标注文件,class.txt 放标注的类别名称,每行一个类别,不含背景)
COCO 的数据标注格式
COCO 数据集以 json 文件格式存储数据集的标注信息,标注的格式可以参考 官网 和这个 知乎专栏,在这里就不重复了。
确定了标注的格式以后,分析 DOTA 数据集的标注格式,可以提取其中的信息然后以 json 格式存储下来就可以了
格式转换脚本
1 | import json |
检查转换结果
这里需要用到 COCO API,具体用法参考 repo 里的 demo 文件,读取转换完成的数据集并显示标注结果,观察标注是否有误
完