📌 前言

随着深度学习技术的飞速发展,遥感图像分析已成为计算机视觉领域的重要研究方向。从城市规划到环境监测,从农业管理到灾害评估,遥感AI正在改变我们观察和理解地球的方式。然而,高质量的数据集是训练优秀模型的基础。

本文系统整理了500+个遥感深度学习数据集,涵盖分类、检测、分割、变化检测等多个任务类型,为研究人员和工程师提供一站式的数据集查询指南。


📚 目录

  1. 数据集分类体系
  2. 重点卫星数据源
  3. 经典基准数据集
  4. Kaggle竞赛数据集
  5. 专业应用数据集
  6. 数据获取平台

🗂️ 数据集分类体系

按任务类型分类

任务类型 数据集数量 典型应用 代表数据集
图像分类 50+ 土地利用分类、场景识别 UC Merced, EuroSAT, PatternNet
目标检测 100+ 船舶检测、飞机检测、车辆检测 xView, DOTA, FAIR1M
语义分割 80+ 建筑物提取、道路提取 SpaceNet, Inria, FLAIR
变化检测 40+ 城市扩张、灾害评估 LEVIR-CD, OSCD, S2Looking
实例分割 30+ 建筑物实例分割 iSAID, xView2
时序分析 25+ 作物监测、动态变化 BreizhCrops, TimeSen2Crop

按卫星平台分类

  • Sentinel系列(欧空局):高时间分辨率,免费开放
  • Landsat系列(美国):长时序数据,45年历史
  • Planet:高空间分辨率(3-5米)
  • Maxar/DigitalGlobe:超高分辨率(0.3-0.5米)
  • SAR卫星:全天候成像能力

🛰️ 重点卫星数据源

1. Sentinel-2(光学遥感)

数据特点:

  • 空间分辨率:10-60米
  • 重访周期:5天
  • 光谱波段:13个波段
  • 覆盖范围:全球陆地

核心数据集:

Sen4AgriNet
  • 简介: 多年度、多国家农作物分类基准数据集
  • 规模: 覆盖多个国家的Sentinel-2时间序列
  • 任务: 作物分类与分割
  • 链接: GitHub
BigEarthNet
  • 简介: 大规模多标签遥感图像分类数据集
  • 规模: 590,326张Sentinel-2图像块
  • 类别: 43个土地覆盖类别
  • 特点: 多标签、多光谱、大规模
SEN12MS
  • 简介: Sentinel-1/2多光谱融合数据集
  • 规模: 包含SAR和光学数据的配准数据
  • 应用: 数据融合、深度学习
  • 工具: SEN12MS toolbox

Sentinel-2专题数据集精选:

🌾 农业监测
├── TimeSen2Crop - 100万标注样本的作物分类时间序列
├── AgriSen-COG - 多国多时相农业数据集
└── EuroCropsML - 少样本作物分类基准

🏗️ 建筑物检测
├── Open-Sentinel-Map - 结合OpenStreetMap的语义标签
├── UKFields - 230万英国农田边界
└── Fields of The World - 全球农田实例分割

🌊 水体与海洋
├── Earth Surface Water Dataset - 水体特征深度学习
├── Ship-S2-AIS - 1.3万丹麦海域船舶检测
└── MARIDA - 海洋垃圾检测

🔥 灾害监测
├── Sen2Fire - 野火检测基准数据集
├── CanadaFireSat - 加拿大野火时间序列
└── California Wildfire GeoImaging Dataset

2. Sentinel-1(SAR雷达)

优势: 全天候、全天时成像,穿透云层

代表数据集:

  • mmflood - SAR洪水检测
  • Sentinel-1 for Science Amazonas - 亚马逊森林损失时间序列
  • OpenEarthMap-SAR - 全天候土地覆盖制图(2025年IEEE GRSS数据融合竞赛)

3. Landsat(长时序数据)

历史价值:

  • 数据时间跨度:1972年至今(45年+)
  • 空间分辨率:15-60米
  • 免费开放政策

推荐数据集:

  • Landsat 8 on AWS - 云优化GeoTIFF格式
  • LandsatSCD - 变化检测数据集,8468对图像
  • AI2-S2-NAIP - Landsat与Sentinel、NAIP对齐数据

4. Planet(商业高分影像)

特点:

  • 超高时间分辨率(每日更新)
  • 3-5米空间分辨率
  • 全球覆盖

开放数据集:

  • NICFI热带森林数据 - 挪威国际气候与森林倡议支持
  • RapidAI4EO - 欧洲50万位置的密集时间序列
  • FloodPlanet - 多传感器洪水检测数据集

🏆 经典基准数据集

场景分类任务

UC Merced Land Use Dataset
  • 简介: 最早的遥感场景分类数据集之一
  • 规模: 21类,每类100张图像(共2100张)
  • 分辨率: 256×256像素,0.3米分辨率
  • 类别: 农田、飞机、建筑、森林等
  • 准确率: Vision Transformer可达98.49%
  • 链接: 官网
EuroSAT
  • 简介: Sentinel-2土地利用分类数据集
  • 规模: 10类,27,000张标注图像
  • 版本: RGB版本 + 13波段版本
  • 类别: 年度作物、永久作物、工业、住宅等
  • 准确率: CNN可达98.57%
  • 特色: PyTorch和TorchGeo内置支持
  • 链接: GitHub
PatternNet
  • 规模: 38类,每类800张图像
  • 应用: 遥感图像检索基准
  • 论文: arXiv
Million-AID
  • 规模: 百万级实例,51个场景类别
  • 特点: 层次化类别组织
  • 预训练模型: ViTAE-Transformer

目标检测任务

DOTA(Oriented Object Detection)
  • 简介: 大规模航空图像旋转目标检测基准
  • 规模: 2806张图像,188,282个实例
  • 类别: 15类(飞机、船舶、桥梁、车辆等)
  • 标注: 旋转边界框(OBB)
  • 特色: 多尺度、多方向目标
  • 工具: DOTA_devkit
  • 预训练模型: MMRotate
xView1: Objects in Context
  • 简介: 超大规模细粒度目标检测
  • 规模: 1,400 km²,100万+目标
  • 类别: 60个类别,8个类型本体
  • 分辨率: 0.3米
  • 标注: 水平边界框
  • 链接: 官网
FAIR1M
  • 简介: 细粒度航空图像旋转目标识别
  • 规模: 超过100万实例
  • 特点: 细粒度分类(如不同型号飞机)
  • 论文: arXiv
AI-TOD(Tiny Object Detection)
  • 特点: 专注于小目标检测
  • 平均目标大小: 12.8像素
  • 版本: v1 和 v2(重新标注)
  • 挑战: 小目标、弱目标检测

语义分割任务

SpaceNet系列

SpaceNet是一系列竞赛,提供了多个城市的高分辨率卫星图像和标注:

  • SpaceNet 1-2: 建筑物分割
  • SpaceNet 3: 道路网络提取
  • SpaceNet 4: 非垂直角度建筑物
  • SpaceNet 5: 道路网络提取(改进版)
  • SpaceNet 6: 多传感器建筑物分割
  • SpaceNet 7: 多时相城市发展变化检测
  • SpaceNet 8: 洪水检测多类分割

官网: spacenet.ai

Inria Aerial Image Labeling
  • 任务: 建筑物/非建筑物二分类分割
  • 分辨率: 0.3米
  • 规模: 38个6000×6000像素patch
  • 覆盖: 奥斯汀、芝加哥、维也纳、因斯布鲁克等
  • 链接: 官网
FLAIR(法国IGN)
  • FLAIR #1: 77,412个高分辨率patch(512×512,0.2米)
  • 类别: 19个语义类别
  • FLAIR #2: 增加Sentinel-2时间序列,支持多模态分割
  • 特色: 领域适应挑战
  • 链接: GitHub
Five Billion Pixels
  • 简介: 50亿像素级大规模语义分割
  • 来源: 高分二号(GF-2)4米影像
  • 覆盖: 中国
  • 类别: 24个土地覆盖类别
  • 扩展: 包含跨域适应到Sentinel-2和PlanetScope
  • 链接: 项目页面

变化检测任务

LEVIR-CD
  • 简介: 建筑物变化检测基准数据集
  • 规模: 637对双时相图像(256×256)
  • 时间跨度: 5-14年
  • 应用: 建筑物变化检测
  • 扩展: LEVIR-CC(变化描述数据集)
  • 链接: 官网
OSCD (Onera Satellite Change Detection)
  • 来源: Sentinel-2
  • 规模: 24对多光谱图像
  • 时间范围: 2015-2018年
  • 应用: 城市变化检测
  • 扩展: OSCD + additional Dates
S2Looking
  • 特点: 卫星侧视角建筑物变化检测
  • 规模: 5000对图像
  • 论文: arXiv
  • 链接: GitHub
xView2: Building Damage Assessment
  • 任务: 灾害后建筑物损伤评估
  • 标注: 精确分割掩码 + 四级损伤标签
  • 分辨率: 0.3米
  • 应用: 灾害响应
  • 基线方案: xView2_baseline

实例分割任务

iSAID
  • 简介: 大规模航空图像实例分割
  • 基于: DOTA数据集
  • 类别: 15类目标
  • 标注: 像素级实例分割
  • 链接: 官网

🏅 Kaggle竞赛数据集

Kaggle平台托管了超过200个卫星图像数据集,以下是最具影响力的竞赛:

1. Planet: Understanding the Amazon from Space

任务: 多标签图像分类

数据:

  • 来源:Planet Dove卫星
  • 分辨率:3-5米GeoTIFF
  • 类别:12类(多云、原始林、水路等)

亮点:

  • 🥇 第一名:11个自定义CNN集成
  • 应用:监测亚马逊雨林人类活动

学习资源:

# FastAI多标签分类示例
- Multi-Label Classification of Satellite Photos
- Understanding the Amazon Rainforest with VGG-19
- 使用fast.ai的Planet-Amazon-Kaggle

链接: Kaggle竞赛页

2. DSTL Satellite Imagery Feature Detection

任务: 10类地物分割

数据:

  • 来源:WorldView-3
  • 规模:45张图像(1km×1km)
  • 波段:3波段RGB + 16波段多光谱

类别: 建筑物、道路、树木、农作物、水道、车辆等

获奖方案:

  • 🥇 第一名:40+模型,针对特定目标调优
  • 🥈 第二名:ZF_UNET_224
  • 🥉 第三名:全色锐化 + 反射率指数

链接: Kaggle竞赛页

3. Airbus Ship Detection Challenge

任务: 船舶检测与分割

挑战:

  • 数据集存在问题,引发争议
  • 需要处理不平衡数据

解决方案精选:

- ResNeXt50分类器 + U-Net分割 (139/884名)
- Mask R-CNN + U-Net组合
- YOLOv4船舶检测

经验总结: Lessons Learned

链接: Kaggle竞赛页

4. Understanding Clouds from Satellite Images

任务: 云组织模式分类

数据: 气象卫星云图

方案:

  • 🥉 第三名:GitHub方案
  • 多个U-Net变体解决方案

5. Airbus Aircraft Detection Dataset

规模: 100个民用机场,3000+标注商用飞机

应用案例:

# YOLOv5检测示例
- Detecting Aircrafts on Airbus Pleiades Imagery
- Faster R-CNN with ResNet-50 Backbone

6. Ships in Satellite Imagery(San Francisco Bay)

规模: 4000张80×80 RGB图像 分辨率: 3米 类别: 船/非船二分类

项目:

7. Planesnet Classification

规模:

  • 飞机类:8,000张
  • 非飞机类:24,000张 尺寸: 20×20 RGB

项目:

8. DeepGlobe Land Cover Classification

任务: 7类语义分割

类别: 城市、农业、牧场、森林、水体、荒地、未知

方案:

- U-Net语义分割
- DeepLab v3+解决方案
- 注意力机制U-Net

链接: Kaggle数据集

Kaggle其他热门数据集

数据集 任务 特点
Dubai Segmentation 6类分割 72张迪拜卫星图像
Massachusetts Roads/Buildings 分割 建筑物与道路提取
Swimming Pool Detection 目标检测 3750张住宅区图像
HRSC2016 船舶检测 旋转目标检测
Next Day Wildfire Spread 时序预测 野火蔓延预测

🎯 专业应用数据集

🚢 海洋与船舶

xView3: Dark Vessel Detection
  • 任务: SAR图像暗船检测(非法捕鱼)
  • 规模: 43,200,000 km² Sentinel-1影像
  • 标注: 人工+算法标注
  • 应用: IUU(非法、未报告、不受管制)捕鱼检测
  • 链接: 官网
SAR Ship Detection Dataset (SSDD)
  • 来源: 多源SAR数据
  • 特点: 全天候船舶检测
  • GitHub: Official-SSDD
LEVIR-Ship
  • 特点: 中等分辨率下的小船检测
  • 标注: 边界框
  • 托管: Scale Nucleus平台

✈️ 航空目标

RarePlanes
  • 特色: 真实+合成飞机数据
  • 来源: AWS开放数据计划
  • 应用:
    • 合成数据预训练
    • 10%真实数据微调
    • 模型剪枝和量化
  • 论文: arXiv
SAR Aircraft Detection
  • 规模: 2966个224×224切片,7835架飞机
  • 来源: SAR图像
  • 链接: GitHub

🏗️ 建筑物与基础设施

Microsoft Building Footprints
  • 覆盖: 美国50个州、澳大利亚、加拿大、乌干达-坦桑尼亚、肯尼亚-尼日利亚
  • 格式: GeoJSON
  • 方法: 语义分割生成
  • 全球版: GlobalMLBuildingFootprints
Google Open Buildings
BONAI
  • 任务: 斜视角航空图像建筑物足迹提取
  • 特点: 处理非垂直视角挑战
  • 链接: GitHub

🌾 农业与环境

SICKLE
  • 全称: 多传感器卫星影像关键作物参数数据集
  • 传感器: Landsat-8, Sentinel-1, Sentinel-2
  • 特点: 多分辨率时间序列
  • 链接: GitHub
CropNet
  • 规模: TB级多模态数据集
  • 任务: 气候变化感知作物产量预测
  • 特色: 结合气候数据
TreeSatAI
  • 任务: 树种分类
  • 数据: Sentinel-1 + Sentinel-2
  • 链接: Zenodo

🔥 灾害监测

xView2: Building Damage Assessment
  • 应用: 灾后建筑物损伤评估
  • 标注: 四级损伤光谱
  • 分辨率: 0.3米
  • AWS方案: SageMaker Geospatial
FireRisk
  • 任务: 火灾风险评估
  • 方法: 监督学习 + 自监督学习基准
Satellite Burned Area Dataset
  • 规模: 73次Sentinel-1/2采集
  • 应用: 森林野火分割
  • 链接: Zenodo

☁️ 云检测

CloudSEN12Plus
  • 规模: 目前最大的Sentinel-2云检测数据集
  • 链接: HuggingFace
38-Cloud
  • 规模: 38张Landsat 8图像
  • 标注: 像素级人工标注
  • 扩展: 95-Cloud数据集
Azavea Cloud Dataset
  • 应用: 训练云检测模型
  • 模型: cloud-model

🌍 多模态与高光谱

HySpecNet-11k
  • 规模: 大规模高光谱基准数据集
  • 应用: 高光谱图像分析
  • 链接: 官网
SEN12MS
  • 特点: Sentinel-1/2地理参考多光谱数据集
  • 应用: 数据融合、深度学习
  • 工具: SEN12MS toolbox

🌐 数据获取平台

主要数据中心

1. Radiant MLHub
  • 网址: mlhub.earth
  • 特点: 数据集 + 预训练模型
  • 托管: AI for Earth项目支持
  • 格式: STAC标准
2. AWS Registry of Open Data
  • 网址: registry.opendata.aws
  • 特色数据:
    • Sentinel-2 L2A COGs
    • Landsat 8 Collection 2
    • NAIP航空影像
    • Maxar Open Data(灾害影像)
3. Microsoft Planetary Computer
  • 网址: planetarycomputer.microsoft.com
  • 特点:
    • Dask-Gateway支持的JupyterHub
    • 可扩展地理空间分析
    • STAC API接口
  • 数据目录: 包含Sentinel、Landsat、NAIP等
4. Google Earth Engine (GEE)
  • 网址: developers.google.com/earth-engine
  • 特点:
    • 云端大规模处理
    • 多种影像和气候数据集
    • 经典算法支持
  • 深度学习流程:
    1. GEE导出tfrecords
    2. GPU平台训练
    3. 上传推理结果回GEE

GEE资源:

- awesome-google-earth-engine
- Awesome-GEE by giswqs
- awesome-earth-engine-apps
- wxee: GEE到xarray,支持PyTorch/TensorFlow

竞赛平台

Codalab
  • 各类遥感挑战赛
  • 示例:目标检测、洪水检测、云覆盖检测
DrivenData
  • 社会公益导向竞赛
  • 示例:藻华检测、洪水制图、建筑物分割
AI4EO
  • 欧洲遥感AI平台
  • 示例:Sentinel增强农业应用

声明: 本文内容整理自GitHub开源项目,原始资源链接:https://github.com/satellite-image-deep-learning/datasets

更多推荐