Ubuntu 16.04系统Microsoft Common Objects in Context(COCO)数据集在Python环境中的使用

Microsoft Common Objects in Context(简写COCO)数据集是微软团队提供的一个可以用来进行图像识别,分割,注解等开发工作的数据集。

其官方说明网址:http://mscoco.org/

该数据集主要有的特点如下:

(1)Object segmentation
(2)Recognition in Context
(3)Multiple objects per image
(4)More than 300,000 images
(5)More than 2 Million instances
(6)80 object categories
(7)5 captions per image
(8)Keypoints on 100,000 people

为了更好的介绍这个数据集,微软在ECCV Workshops里发表这篇文章:Microsoft COCO: Common Objects in Context。从这篇文章中,我们了解了这个数据集以物体识别为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的标定。图像包括91类目标,328,000张图片和2,500,000个标签。

下面,我们以2014年的数据集合,来简单介绍一下这个数据集在Python环境中的使用。

首先是去下载需要的数据集,下载地址为http://mscoco.org/dataset/#download,页面内容如下所示:

对于我们此次的测试来说,只需要下载2014 Training images [80K/13GB]2014 Train/Val object instances [158MB]即可。

建议使用aria2去下载,执行命令如下:

下载完成后,解压缩到当前目录

接下来,去下载源代码COCO API的源代码

参考https://github.com/pdollar/coco/blob/master/PythonAPI/pycocoDemo.ipynb里面的例子。

我们写如下的测试例子:

执行脚本的代码如下:

发布者

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注