数据挖掘-机器学习-深度学习常用数据集
0.0 数据源
大的数据收录网站
-
: 保罗万象的数据集搜集网,什么类型的数据都有
0.1 普通数据集
即被交付给的原始数据集
0.2 公开数据集
0.2.1 离散和连续型普通数据集
-
:一个公开的用于机器学习的数据集,包含几乎所有类别数据,适用于多种机器学习任务 政府公开数据集
0.2.2 图像数据集
图像分类
目标检测
目标跟踪
语义分割
-
:分割任务中VOC2012的trainval包含07-11年的所有对应图片, test只包含08-11。trainval有 2913张图片共6929个物体 :该数据集包含images_base和annotations_base分别对应这文件夹leftImg8bit(5,030 items, totalling 11.6 GB,factually 5000 items)和gtFine(30,030 items, totalling 1.1 GB)。里面都包含三个文件夹:train、val、test。总共5000张精细释,2975张训练图,500张验证图和1525张测试图。在leftImg8bit/train下有18个子文件夹对应德国的16个城市,法国一个城市和瑞士一个城市 :城市街道分割 :移动机器人及自动驾驶研究的最受欢迎的数据集之一,包含7481张训练集,7518张测试集,总计80.256种标签。该网站也列出了历年的分割结果以及对应的方法。 :场景理解的新的数据集包括各种物体(比如人、汽车等)、场景(天空、路面等),150个类别,22210张图。 : 包含2688张图片,33个labels,包括Awning(棚) balcony(阳台) bird(鸟) boat(船) bridge(桥)Building(建筑)等每一类都有百张左右。 :包含从现有公共数据集中选择的715个图像,具有大约320×240像素,包含label种类:天空,树,道路,草,水,建筑物,山脉和前景物体. :240个图像,可识别9个object class。 :人体图像是从microsoft coco训练集和验证集中裁剪的。定义了19个人体部件或衣服标签,它们是帽子、头发、太阳镜、上衣、衣服、外套、袜子、裤子、手套、围巾、裙子、连体裤、脸、右臂、左臂、右腿、左腿、右脚、右脚鞋、左鞋,以及背景标签。数据集中共有50462张图像,其中包括19081张全身图像、13672张上身图像、403张下身图像、3386张头部丢失的图像、2778张后视图图像和21028张有遮挡的图像。 :25,000个高分辨率图像(分为18,000个用于训练,2,000个用于验证,5,000个用于测试).152个物体类别,100个特定于实例的注释类别。一个多样化的街道级图像数据集,具有像素精确和特定于实例的人类注释,用于理解世界各地的街景。 :MIT场景解析基准(SceneParse150)为场景解析算法提供标准的训练和评估平台。 该基准测试的数据来自ADE20K数据集。 :COCO 2019 图像分割挑战赛。COCO数据集非常全面,可以从其下载各类图像任务数据集。 :2006年发布的数据集,包含人、自行车、汽车三类,合计超过2000张。 :衣服分割图片,2098张高分辨率街头时尚照片,共59个标签。 :百度提供的场景解析数据集,开放数据集累计提供146,997帧图像数据,总计34类,包含像素级标注和姿态信息,以及对应静态背景深度图像下载。
图像融合
-
:数据量大,包含34427张图像和对应的matting结果图,但是数据标注不够精细 : 目前已知的最精细的数据集,但是数据量太少,只有27张。 :包含2000张图像,精度和数量都适中,由于此数据集有很多明显的标注错误,需要进一步人工校正。
超分辨率
人脸数据集
-
: 提取码 dvyn celaba 年龄和表情数图像据集 :包含了 171 young (n = 58), middle-aged (n = 56), and older (n = 57) ,不同表情的图片数据集。
上一篇:
通过多线程提高代码的执行效率例子
下一篇:
对ArrayList中某一元素进行排序