遥感目标检测数据集
目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。
目前,基于遥感影像的目标检测是遥感图像处理领域的重要研究方向。传统的目标检测识别方法难以适应海量数据,其所依赖的特征表达式通过人工设计的,这样非常不好,并且强烈依赖于专业知识和数据本身的特征,而且很难从海量的数据中学习出一个有效的分类器以充分挖掘数据之间的关联。而深度学习强大的高级(更具抽象和语义意义)特征表示和学习的能力可以为影像中的目标提取提供有效的框架。相关研究包括车辆检测,船舶检测,农作物检测,建筑物等地物检测。
# 01 LEVIR数据集
LEVIR数据集由大量 800 × 600 像素和0.2m〜1.0m /像素的高分辨率Google Earth图像和超过22k的图像组成。LEVIR数据集涵盖了人类居住环境的大多数类型地面特征,例如城市,乡村,山区和海洋。数据集中未考虑冰川,沙漠和戈壁等极端陆地环境。数据集中有3种目标类型:飞机,轮船(包括近海轮船和向海轮船)和油罐。所有图像总共标记了11k个独立边界框,包括4,724架飞机,3,025艘船和3,279个油罐。每个图像的平均目标数量为0.5。 数据集下载地址:
http://levir.buaa.edu.cn/Code.htm (opens new window)
论文地址:
https://ieeexplore.ieee.org/document/8106808 (opens new window)
# 02 DOTA数据集
DOTA是用于航空图像中目标检测的大规模数据集。它可以用于开发和评估航空影像中的物体检测。对于DOTA数据集,它包含来自不同传感器和平台的2806个航拍图像。每个图像的大小在大约800×800到4000×4000像素的范围内,并且包含各种比例,方向和形状的对象。这些DOTA图像由航空影像解释专家分类为15个常见对象类别。完全注释的DOTA图像包含188、282个实例,每个实例都由任意(8自由度)四边形标记。 数据集下载地址:
https://captain-whu.github.io/DOTA/index.html (opens new window)
论文地址:
https://arxiv.org/abs/1711.10398 (opens new window)
# 03 RSOD数据集
RSOD是一个开放的目标检测数据集,用于遥感图像中的目标检测。数据集包含飞机,油箱,运动场和立交桥,以PASCAL VOC数据集的格式进行标注。 数据集包括4个文件夹,每个文件夹包含一种对象: 1.飞机数据集,446幅图像中的4993架飞机 2.操场,189副图像中的191个操场。 3.立交桥,176副图像中的180座立交桥。 4.油箱,165副图像中的1586个 油箱。
数据集下载地址:
https://github.com/RSIA-LIESMARS-WHU/RSOD-Dataset- (opens new window)
论文地址:
https://arxiv.org/abs/1909.00133?context=cs.CV (opens new window)
# 04 ITCVD数据集
ITCVD数据集图像是从飞机平台拍摄的,图像拍摄由飞机在荷兰Enschede上方空高约330m的高度飞行,以天底视图和斜视图拍摄图像。斜视角的倾斜角度为45度。天底图像的地面采样距离(GSD)为10厘米。
数据集包含用于训练的135张图像和用于测试的23543张图像,其余的38张图像和5545辆车辆用于测试。数据集中的每辆车都使用一个边界框手动标注,该边界框表示为(x,y,w,h),其中(x,y)是该框左上角的坐标,而(w,h )分别是边界框的宽度和高度。 数据集下载地址:
https://eostore.itc.utwente.nl:5001/fsdownload/zZYfgbB2X/ITCVD (opens new window)
论文地址:
https://arxiv.org/abs/1801.07339 (opens new window)
# 05 xView数据集
xView是最大的公开可用的开销图像集之一。它包含来自世界各地复杂场景的图像,并用超过一百万个边界框进行注释,这些边界框代表60种对象类别的不同范围。与其他架空图像数据集相比,xView图像具有高分辨率,多光谱特性,并带有更多种类的对象标记。DIUx xView挑战赛的重点是加快四个计算机视觉领域的进展:降低检测的最小分辨率;提高学习效率;启用更多对象类的发现;改进对细粒度类的检测。DIUx xView挑战紧随挑战的脚步,例如上下文中的通用对象(COCO),并试图建立SpaceNet和世界功能图(FMoW),以将计算机视觉应用于来自太空可用图像,以便我们以新的方式理解视觉世界并解决一系列重要的问题。 数据集下载地址:http://xviewdataset.org/ (opens new window)
论文地址:https://arxiv.org/abs/1802.07856 (opens new window)
# 06 HRRSD 数据集
HRRSD 数据集是2019年中国科学院大学发布的数据集,HRRSD包含从Google Earth和Baidu地图获取的21761幅图像,空间分辨率从0.15-m到1.2-m。HRRSD中有55740个目标的实例,每个类别4k左右。HRRSD包含13类目标。13个类别分别是:飞机、棒球场、篮球场、桥梁、十字路口、田径场、港口、停车场、船、存储罐、丁字路口、网球场、汽车。 数据库的亮点是,各个类别之间样本量较均衡,每个类别都有大约4000个样本。 数据集下载链接:
https://github.com/CrazyStoneonRoad/TGRS-HRRSD-Dataset (opens new window)
论文地址:
https://ieeexplore.ieee.org/abstract/document/8676107 (opens new window)
# 07 OpenSARship数据集
OpenSAR是由上海交通大学高级传感技术中心(AST)开发的开放式SAR图像管理和处理平台,用于SAR图像的读取,处理,可视化和算法测试。SAR图像管理和算法测试是OpenSAR的主要任务。 OpenSAR支持导入各种SAR数据源,例如TerraSAR-X,RADARSAT 1/2,COSMO-SkyMed等。用户可以通过该平台搜索和查看SAR图像数据。OpenSAR支持注册各种算法,例如图像去噪,场景分类,目标检测,目标识别,变化检测等。用户可以通过该平台搜索,配置和执行这些算法,并且完整的测试报告也将提供给用户。 数据集下载地址:
http://opensar.sjtu.edu.cn/ (opens new window)
论文地址:
https://ieeexplore.ieee.org/abstract/document/8067489/ (opens new window)
# 08 SDD数据
SDD是斯坦福无人机数据集,该数据集主要用于目标检测、目标跟踪或轨迹预测等任务,收集各种类型的目标(不仅仅有行人,还有骑自行车者、滑板手、汽车、公共汽车和高尔夫球车)的图像和视频。在上面的图片中,行人被贴上了粉红色的标签,骑自行车的人为红色,滑板手为橙色,汽车为绿色。
数据集下载地址:
https://cvgl.stanford.edu/projects/uav_data/ (opens new window)
# 09 VEDAI数据集
VEDAI是一个用于航空图像车辆检测的数据集,可作为基准测试无约束环境下自动目标识别算法的工具。数据库中包含的车辆,除了体积小,还表现出不同的变化,如多方向、灯光/阴影变化、反射或闭塞。此外,每幅图像都有几个光谱波段和分辨率。同时给出了一套精确的实验方案,保证了不同人的实验结果能够得到正确的再现和比较。我们还给出了一些基线算法在该数据集上的性能,这些算法的不同设置,以说明任务的困难,并提供基线比较。