原创投稿 行业报告 AI展会 数据标注
投稿发布
您的当前位置:主页 > 数据下载 > 图像识别 > 正文

微软COCO图像数据集2014

发布:可思数据 时间:2019-08-18
数据类型:图形图像 热度
★★★★★

文件类型: .zip              文件大小:25 GB

授权方式: 公共开源     发布时间:2019-08-18

数据来源:微软Microsoft COCO             界面语言:英文

数据介绍:
Common Object in Context (COCO) 是一个由微软维护的图像数据集,可进行对象识别、图像分割和图片中字幕识别等机器视觉任务的数据集,包括:超过30万 幅图像、超过 200万 个实例、80多类对象等。


COCO简介:

COCO数据集是微软团队获取的一个可以用来图像recognition+segmentation+captioning 数据集,其官方说明网址:http://mscoco.org/。

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

  可思数据sykv.com,sykv.cn

该数据集主要有的特点如下:(1)Object segmentation(2)Recognition in Context(3)Multiple objects per image(4)More than 300,000 images(5)More than 2 Million instances(6)80 object categories(7)5 captions per image(8)Keypoints on 100,000 people 可思数据sykv.com,sykv.cn

  可思数据sykv.com,sykv.cn

为了更好的介绍这个数据集,微软在ECCV Workshops里发表这篇文章:Microsoft COCO: Common Objects in Context。从这篇文章中,我们了解了这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。 可思数据-人工智能资讯平台sykv.com

  可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

该数据集主要解决3个问题:目标检测,目标之间的上下文关系,目标的2维上的精确定位。数据集的对比示意图:

可思数据-www.sykv.cn,sykv.com

可思数据sykv.com,sykv.cn

 

可思数据-人工智能资讯平台sykv.com

数据集分类:

Image Classification: 可思数据sykv.com,sykv.cn

分类需要二进制的标签来确定目标是否在图像中。早期数据集主要是位于空白背景下的单一目标,如MNIST手写数据库,COIL household objects。在机器学习领域的著名数据集有CIFAR-10 and CIFAR-100,在32*32影像上分别提供10和100类。最近最著名的分类数据集即ImageNet,22,000类,每类500-1000影像。

内容来自可思数据sykv.com

Object Detection:

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

经典的情况下通过bounding box确定目标位置,期初主要用于人脸检测与行人检测,数据集如Caltech Pedestrian Dataset包含350,000个bounding box标签。PASCAL VOC数据包括20个目标超过11,000图像,超过27,000目标bounding box。最近还有ImageNet数据下获取的detection数据集,200类,400,000张图像,350,000个bounding box。由于一些目标之间有着强烈的关系而非独立存在,在特定场景下检测某种目标是是否有意义的,因此精确的位置信息比bounding box更加重要。

可思数据-AI,sykv.com智能驾驶,人脸识别,区块链,大数据

Semantic scene labeling:

可思数据sykv.com

这类问题需要pixel级别的标签,其中个别目标很难定义,如街道和草地。数据集主要包括室内场景和室外场景的,一些数据集包括深度信息。其中,SUN dataset包括908个场景类,3,819个常规目标类(person, chair, car)和语义场景类(wall, sky, floor),每类的数目具有较大的差别(这点COCO数据进行改进,保证每一类数据足够)。

本文来自可思数据(sykv.com),转载请联系本站及注明出处

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

Other vision datasets: 可思数据sykv.com,sykv.cn

一些数据集如Middlebury datasets,包含立体相对,多视角立体像对和光流;同时还有Berkeley Segmentation Data Set (BSDS500),可以评价segmentation和edge detection算法。

可思数据sykv.com,sykv.cn

  内容来自可思数据sykv.com

COCO展示:

该数据集标记流程如下: 本文来自可思数据(sykv.com),转载请联系本站及注明出处

可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

 

可思数据sykv.com

COCO数据集有91类,虽然比ImageNet和SUN类别少,但是每一类的图像多,这有利于获得更多的每类中位于某种特定场景的能力,对比PASCAL VOC,其有更多类和图像。

本文来自可思数据(sykv.com),转载请联系本站及注明出处

COCO数据集分两部分发布,前部分于2014年发布,后部分于2015年,2014年版本:82,783 training, 40,504 validation, and 40,775 testing images,有270k的segmented people和886k的segmented object;2015年版本:165,482 train, 81,208 val, and 81,434 test images。

可思数据sykv.com,sykv.cn

其性能对比和一些例子:

可思数据sykv.com

可思数据sykv.com

可思数据-AI,sykv.com人工智能,深度学习,机器学习,神经网络

  本文来自可思数据(sykv.com),转载请联系本站及注明出处

可思数据-数据挖掘,智慧医疗,机器视觉,机器人sykv.com

 

 
下载地址:

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。
转发量:


人工智能交流群扫码邀请
人工智能交流群扫码邀请

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目分类

Copyright©2005-2020 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注行业联盟

人工智能资讯   人工智能资讯   人工智能资讯   人工智能资讯

扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
关闭
扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部