遥感场景分类数据集
# 场景识别数据(场景分类)
场景识别通常指对图像整体的常见语义分析和理解,是计算机视觉领域标志性任务之一,在对象识别的基础上,场景识别能够结合上下文信息,从而实现场景主要内容的精确识别。2006年以来,神经网络的学习习能力不断得到提升,训练上的困难不断被克服,以卷积神经网络(CNN)为主的高效率深度学习模型被越来越多的运用到遥感影像应用中。卷积神经网络是当下场景识别的主要手段,而一定规模的遥感影像样本数据集是模型训练的基础。因此,近年来众多科研机构、专家学者研制并发布了基于各类场景的遥感影像样本数据集。收集遥感影像样本数据集中场景识别领域的数据集,调研其数据并作分析。
# 1.UC Merced 场景识别数据集
2010年10月,加利福尼亚加州大学默塞德分校计算机视觉实验室发布UC Merced数据集。
# 数据来源
数据集影像来源于美国国家地质调查局(USGS)国家地图城市地区影像集合(National Map Urban Area Imagery)中的大影像的手动提取,图像用于全国各地的城市地区。
# 数据集介绍
数据类别:共21类,包含农业区域、飞机、棒球场、海滩、建筑群、丛林、密集住宅、森林、高速公路、高尔夫球场、港口、交叉路口、中心住宅、移动住房公园、立交桥、停车场、河流、跑道、稀疏住宅、储油罐和网球场。
图像尺寸:256×256像元。
像素分辨率:1英尺。
数据集规模:每类100张影像样本,共2100张影像。
# 下载地址
http://weegee.vision.ucmerced.edu/datasets/landuse.html (opens new window)
# 主要应用
UC Merced数据集作为经典的常见识别数据集,经常运用于算法验证、模型预训练的应用中。如Yi Yang&Shawn Newsam利用该数据集,评估了视觉词袋(Bag-of-visual-words,BOVW)方法和空间拓展用于高分辨率正影像中的土地利用。CastelluccioMarco等利用卷积神经网络对高分辨率遥感影像进行土地利用分类。
# 2.WHU-RS19 场景识别数据集
2011年,武汉大学发布WHU-RS19场景识别数据集。
# 数据来源
WHU-RS19场景识别数据集影像来源于谷歌卫星影像上获取的遥感影像。
# 数据集介绍
数据类别:19个场景类。
图像尺寸:600×600像素。
数据集规模:共计1005张,其中每个类别有50张。
研究区域:中国的城市地区。
图 WHU-RS19场景识别数据集示例图
# 下载地址
http://www.captain-whu.com/repository.html (opens new window)
# 主要应用
WHU-RS19数据集作为经典的常见识别数据集,经常运用于算法验证、模型预训练的应用中。如Gui-Song Xia,Jingwen Hu,Fan Hu等利用该数据集,对现有的航空场景分类技术以及最近广泛使用的深度学习方法进行了综合评述。
# 3.SIRI-WHU 的Google 图像数据集
2016年,武汉大学测绘遥感信息工程国家重点实验室发布了SIRI-WHU的Google图像数据集。
# 数据来源
该数据集是从Google Earth(Google Inc.)获取的,主要覆盖中国的城市地区,场景图像数据集由武汉大学的RS_IDEA Group(SIRI-WHU)设计。
# 数据集介绍
数据类别:主要包含以下12类:农业,商业广告,港口,闲置的土地,产业,草地,立交桥,公园,池塘,住宅,河,水。
图像尺寸:200 × 200像素。
像素分辨率:2m。
数据集规模:12类Google图像数据集,每个类别都有200张图片。
研究区域:中国的城市地区。
图 SIRI-WHU的Google图像数据集示例图
# 下载地址
http://www.lmars.whu.edu.cn/prof_web/zhongyanfei/e-code.html (opens new window)
# 主要应用
SIRI-WHU 的Google 图像数据集作为经典的常见识别数据集,经常运用于算法验证、模型预训练的应用中。
# 4.RSI-CB数据集
# 数据来源
该数据集是基于众源数据,如开放式街道地图(OSM)数据,可以利用感兴趣点、OSM矢量数据或其他众源数据对遥感影像中的地物进行有效的标注,构建了一个全球范围内的大规模遥感图像分类基准。由于不同的dcnn需要不同的图像大小,该基准有256×256和128×128两个子数据集。
# 数据集介绍
数据类别:前者包含6个类别,35个子类别。后者包含6个类别,45个子类。根据国家土地利用分类标准和ImageNet分级机制,建立了严格的对象分类体系。这6类是农用地、建设用地和设施、交通运输和设施、水利设施、林地和其他用地。
图像尺寸:256×256和128×128像素。
像素分辨率:0.3-3 m。
数据集规模:前者包含35个类别和24000多幅图像。后者包含45个类别和36000多幅图像。
研究区域:全球范围。
图 RSI-CB数据集示例图
# 下载地址
https://github.com/lehaifeng/RSI-CB (opens new window)
# 5.BigEarthNet数据集
# 数据来源
BigEarthNet是一个新的大型Sentinel-2标杆数据集,由590326幅Sentinel-2图像块组成。为了建立BigEarthNet数据集,最初选择了在2017年6月至2018年5月期间在欧洲10个国家(奥地利、比利时、芬兰、爱尔兰、科索沃、立陶宛、卢森堡、葡萄牙、塞尔维亚、瑞士)获取的125幅Sentinel-2图像。所有的图像块都是由Sentinel-2level 2A产品生成和格式化工具(sen2cor)进行大气校正的。然后,将它们分为590326个不重叠的图像块。每个图像块由2018年(CLC 2018)CORINE土地覆盖数据库提供的多个土地覆盖等级(即多个标签)进行注释。
# 数据集介绍
数据类别:根据土地覆盖等级,划分为40多类。
图像尺寸:10米波段120×120像素;ii)20米波段60×60像素;iii)60米波段20×20像。
像素分辨率:10-60 m。
数据集规模:590326幅图像
研究区域:全球范围。
图 BigEarthNet数据集示例图
# 下载地址
http://bigearth.net/ (opens new window)
# 论文地址
https://arxiv.org/abs/1902.06148 (opens new window)
欢迎大家补充其他场景分类数据集!!!