计算机视觉使计算机能够理解图像和视频的内容,目标是能够像人类视觉系统一样自动完成任务。计算机视觉任务包括图像采集、处理和分析。图像数据有不同的形式,例如视频序列、多相机成像或来自医学扫描仪的多维数据。本文将介绍一些适合机器学习训练的数据集。(1)Labelme:由麻省理工学院计算机科学与人工智能实验室(CSAIL)共同创建的大规模数据集,包含187,240张图像、62,197张标注图像和658,992个标记对象。(2)ImageNet:新算法的实际图像数据集,按照WordNet层次结构组织,其中层次结构中的每个节点由数百或数千张图像描述。(3)LSUN:具有许多辅助任务(房间布局估计、显着性预测等)的场景理解。(4)MSCOCO:COCO是一个大规模的目标检测、分割和标注数据集,包含超过20万张标注图像。可用于对象分割、上下文识别等。(5)ColumbiaUniversityImageLibrary:COIL100数据集包含100个不同的物体,从各个角度在360°成像。(6)视觉基因组:是一个旨在将结构化图像概念与语言联系起来的数据集和知识库。该数据集是一个详细的视觉知识库,包含108,077个图像说明。(7)LegoBricks:包含16种不同乐高积木的约12,700张图片,按文件夹分类,并使用Blender进行计算机渲染。(8)GoogleOpenImages:在CreativeCommons的支持下,900万张图片的URL“已经用跨越6,000多个类别的标签进行了注释”。OpenImage数据集中的注释图像。左:KevinKrejci的“GhostArch”。右图:JB的一些银器。两张图片均在CCBY2.0许可下使用。(9)Youtube-8M:由数百万个YouTube视频ID组成的大规模标注数据集,包含超过3800个视觉实体的标注。(10)LabeledFacesintheWild:包含13000张带标签的人脸图像,旨在开发人脸识别相关应用。(11)StanfordDogDataset:包含20,580张图像和120个犬种,每个类别大约有150张图像。(12)Places:基于场景的数据库,包含205个场景类别和250万张带有类别标签的图像。(13)CelebFaces:一个包含超过200,000张名人图像的人脸数据集,每张图像都标注了40个属性。CelebFaces数据集中的示例图像(14)Flowers:英国常见的花卉图像数据集,由102个不同类别组成。每个花卉类别由40到258张具有不同姿势和光线变化的图像组成。(15)植物图像分析:涵盖超过100万张植物图像的数据集集合。您可以从11种植物中进行选择。(16)HomeObjects:包含家中随机物体的数据集,主要来自厨房、卫生间和客厅,分为训练数据集和测试数据集。(17)CIFAR-10:由60,000张32×32彩色图像组成的大型图像数据集,分为10类。数据集分为五个训练批次和一个测试批次,每个批次包含10,000张图像。(18)CompCars:收录了163个汽车品牌,共计1716款车型。每个车型都标有五个属性,包括最高速度、排量、门数、座位数和车型。(19)IndoorSceneRecognitionDataset:这是一个非常独特的数据集。这个数据集很有用,因为大多数场景识别模型在户外表现更好。包含67个室内类别,共15620张图像。(20)VisualQA:VQA数据集包含265,016张图像的开放式问题。这些问题需要理解视觉和语言。对于每张图片,至少有3个问题,每个问题至少有10个答案。
