遥感图像深度学习数据集完全指南:2024-2025最新汇总
随着深度学习技术的飞速发展,遥感图像分析已成为计算机视觉领域的重要研究方向。从城市规划到环境监测,从农业管理到灾害评估,遥感AI正在改变我们观察和理解地球的方式。然而,高质量的数据集是训练优秀模型的基础。本文基于 satellite-image-deep-learning 开源项目,系统整理了500+个遥感深度学习数据集,涵盖分类、检测、分割、变化检测等多个任务类型,为研究人员和工程师提供一站式的
📌 前言
随着深度学习技术的飞速发展,遥感图像分析已成为计算机视觉领域的重要研究方向。从城市规划到环境监测,从农业管理到灾害评估,遥感AI正在改变我们观察和理解地球的方式。然而,高质量的数据集是训练优秀模型的基础。
本文系统整理了500+个遥感深度学习数据集,涵盖分类、检测、分割、变化检测等多个任务类型,为研究人员和工程师提供一站式的数据集查询指南。
📚 目录
🗂️ 数据集分类体系
按任务类型分类
| 任务类型 | 数据集数量 | 典型应用 | 代表数据集 |
|---|---|---|---|
| 图像分类 | 50+ | 土地利用分类、场景识别 | UC Merced, EuroSAT, PatternNet |
| 目标检测 | 100+ | 船舶检测、飞机检测、车辆检测 | xView, DOTA, FAIR1M |
| 语义分割 | 80+ | 建筑物提取、道路提取 | SpaceNet, Inria, FLAIR |
| 变化检测 | 40+ | 城市扩张、灾害评估 | LEVIR-CD, OSCD, S2Looking |
| 实例分割 | 30+ | 建筑物实例分割 | iSAID, xView2 |
| 时序分析 | 25+ | 作物监测、动态变化 | BreizhCrops, TimeSen2Crop |
按卫星平台分类
- Sentinel系列(欧空局):高时间分辨率,免费开放
- Landsat系列(美国):长时序数据,45年历史
- Planet:高空间分辨率(3-5米)
- Maxar/DigitalGlobe:超高分辨率(0.3-0.5米)
- SAR卫星:全天候成像能力
🛰️ 重点卫星数据源
1. Sentinel-2(光学遥感)
数据特点:
- 空间分辨率:10-60米
- 重访周期:5天
- 光谱波段:13个波段
- 覆盖范围:全球陆地
核心数据集:
Sen4AgriNet
- 简介: 多年度、多国家农作物分类基准数据集
- 规模: 覆盖多个国家的Sentinel-2时间序列
- 任务: 作物分类与分割
- 链接: GitHub
BigEarthNet
- 简介: 大规模多标签遥感图像分类数据集
- 规模: 590,326张Sentinel-2图像块
- 类别: 43个土地覆盖类别
- 特点: 多标签、多光谱、大规模
SEN12MS
- 简介: Sentinel-1/2多光谱融合数据集
- 规模: 包含SAR和光学数据的配准数据
- 应用: 数据融合、深度学习
- 工具: SEN12MS toolbox
Sentinel-2专题数据集精选:
🌾 农业监测
├── TimeSen2Crop - 100万标注样本的作物分类时间序列
├── AgriSen-COG - 多国多时相农业数据集
└── EuroCropsML - 少样本作物分类基准
🏗️ 建筑物检测
├── Open-Sentinel-Map - 结合OpenStreetMap的语义标签
├── UKFields - 230万英国农田边界
└── Fields of The World - 全球农田实例分割
🌊 水体与海洋
├── Earth Surface Water Dataset - 水体特征深度学习
├── Ship-S2-AIS - 1.3万丹麦海域船舶检测
└── MARIDA - 海洋垃圾检测
🔥 灾害监测
├── Sen2Fire - 野火检测基准数据集
├── CanadaFireSat - 加拿大野火时间序列
└── California Wildfire GeoImaging Dataset
2. Sentinel-1(SAR雷达)
优势: 全天候、全天时成像,穿透云层
代表数据集:
- mmflood - SAR洪水检测
- Sentinel-1 for Science Amazonas - 亚马逊森林损失时间序列
- OpenEarthMap-SAR - 全天候土地覆盖制图(2025年IEEE GRSS数据融合竞赛)
3. Landsat(长时序数据)
历史价值:
- 数据时间跨度:1972年至今(45年+)
- 空间分辨率:15-60米
- 免费开放政策
推荐数据集:
- Landsat 8 on AWS - 云优化GeoTIFF格式
- LandsatSCD - 变化检测数据集,8468对图像
- AI2-S2-NAIP - Landsat与Sentinel、NAIP对齐数据
4. Planet(商业高分影像)
特点:
- 超高时间分辨率(每日更新)
- 3-5米空间分辨率
- 全球覆盖
开放数据集:
- NICFI热带森林数据 - 挪威国际气候与森林倡议支持
- RapidAI4EO - 欧洲50万位置的密集时间序列
- FloodPlanet - 多传感器洪水检测数据集
🏆 经典基准数据集
场景分类任务
UC Merced Land Use Dataset
- 简介: 最早的遥感场景分类数据集之一
- 规模: 21类,每类100张图像(共2100张)
- 分辨率: 256×256像素,0.3米分辨率
- 类别: 农田、飞机、建筑、森林等
- 准确率: Vision Transformer可达98.49%
- 链接: 官网
EuroSAT
- 简介: Sentinel-2土地利用分类数据集
- 规模: 10类,27,000张标注图像
- 版本: RGB版本 + 13波段版本
- 类别: 年度作物、永久作物、工业、住宅等
- 准确率: CNN可达98.57%
- 特色: PyTorch和TorchGeo内置支持
- 链接: GitHub
PatternNet
- 规模: 38类,每类800张图像
- 应用: 遥感图像检索基准
- 论文: arXiv
Million-AID
- 规模: 百万级实例,51个场景类别
- 特点: 层次化类别组织
- 预训练模型: ViTAE-Transformer
目标检测任务
DOTA(Oriented Object Detection)
- 简介: 大规模航空图像旋转目标检测基准
- 规模: 2806张图像,188,282个实例
- 类别: 15类(飞机、船舶、桥梁、车辆等)
- 标注: 旋转边界框(OBB)
- 特色: 多尺度、多方向目标
- 工具: DOTA_devkit
- 预训练模型: MMRotate
xView1: Objects in Context
- 简介: 超大规模细粒度目标检测
- 规模: 1,400 km²,100万+目标
- 类别: 60个类别,8个类型本体
- 分辨率: 0.3米
- 标注: 水平边界框
- 链接: 官网
FAIR1M
- 简介: 细粒度航空图像旋转目标识别
- 规模: 超过100万实例
- 特点: 细粒度分类(如不同型号飞机)
- 论文: arXiv
AI-TOD(Tiny Object Detection)
- 特点: 专注于小目标检测
- 平均目标大小: 12.8像素
- 版本: v1 和 v2(重新标注)
- 挑战: 小目标、弱目标检测
语义分割任务
SpaceNet系列
SpaceNet是一系列竞赛,提供了多个城市的高分辨率卫星图像和标注:
- SpaceNet 1-2: 建筑物分割
- SpaceNet 3: 道路网络提取
- SpaceNet 4: 非垂直角度建筑物
- SpaceNet 5: 道路网络提取(改进版)
- SpaceNet 6: 多传感器建筑物分割
- SpaceNet 7: 多时相城市发展变化检测
- SpaceNet 8: 洪水检测多类分割
官网: spacenet.ai
Inria Aerial Image Labeling
- 任务: 建筑物/非建筑物二分类分割
- 分辨率: 0.3米
- 规模: 38个6000×6000像素patch
- 覆盖: 奥斯汀、芝加哥、维也纳、因斯布鲁克等
- 链接: 官网
FLAIR(法国IGN)
- FLAIR #1: 77,412个高分辨率patch(512×512,0.2米)
- 类别: 19个语义类别
- FLAIR #2: 增加Sentinel-2时间序列,支持多模态分割
- 特色: 领域适应挑战
- 链接: GitHub
Five Billion Pixels
- 简介: 50亿像素级大规模语义分割
- 来源: 高分二号(GF-2)4米影像
- 覆盖: 中国
- 类别: 24个土地覆盖类别
- 扩展: 包含跨域适应到Sentinel-2和PlanetScope
- 链接: 项目页面
变化检测任务
LEVIR-CD
- 简介: 建筑物变化检测基准数据集
- 规模: 637对双时相图像(256×256)
- 时间跨度: 5-14年
- 应用: 建筑物变化检测
- 扩展: LEVIR-CC(变化描述数据集)
- 链接: 官网
OSCD (Onera Satellite Change Detection)
- 来源: Sentinel-2
- 规模: 24对多光谱图像
- 时间范围: 2015-2018年
- 应用: 城市变化检测
- 扩展: OSCD + additional Dates
S2Looking
xView2: Building Damage Assessment
- 任务: 灾害后建筑物损伤评估
- 标注: 精确分割掩码 + 四级损伤标签
- 分辨率: 0.3米
- 应用: 灾害响应
- 基线方案: xView2_baseline
实例分割任务
iSAID
- 简介: 大规模航空图像实例分割
- 基于: DOTA数据集
- 类别: 15类目标
- 标注: 像素级实例分割
- 链接: 官网
🏅 Kaggle竞赛数据集
Kaggle平台托管了超过200个卫星图像数据集,以下是最具影响力的竞赛:
1. Planet: Understanding the Amazon from Space
任务: 多标签图像分类
数据:
- 来源:Planet Dove卫星
- 分辨率:3-5米GeoTIFF
- 类别:12类(多云、原始林、水路等)
亮点:
- 🥇 第一名:11个自定义CNN集成
- 应用:监测亚马逊雨林人类活动
学习资源:
# FastAI多标签分类示例
- Multi-Label Classification of Satellite Photos
- Understanding the Amazon Rainforest with VGG-19
- 使用fast.ai的Planet-Amazon-Kaggle
链接: Kaggle竞赛页
2. DSTL Satellite Imagery Feature Detection
任务: 10类地物分割
数据:
- 来源:WorldView-3
- 规模:45张图像(1km×1km)
- 波段:3波段RGB + 16波段多光谱
类别: 建筑物、道路、树木、农作物、水道、车辆等
获奖方案:
- 🥇 第一名:40+模型,针对特定目标调优
- 🥈 第二名:ZF_UNET_224
- 🥉 第三名:全色锐化 + 反射率指数
链接: Kaggle竞赛页
3. Airbus Ship Detection Challenge
任务: 船舶检测与分割
挑战:
- 数据集存在问题,引发争议
- 需要处理不平衡数据
解决方案精选:
- ResNeXt50分类器 + U-Net分割 (139/884名)
- Mask R-CNN + U-Net组合
- YOLOv4船舶检测
经验总结: Lessons Learned
链接: Kaggle竞赛页
4. Understanding Clouds from Satellite Images
任务: 云组织模式分类
数据: 气象卫星云图
方案:
- 🥉 第三名:GitHub方案
- 多个U-Net变体解决方案
5. Airbus Aircraft Detection Dataset
规模: 100个民用机场,3000+标注商用飞机
应用案例:
# YOLOv5检测示例
- Detecting Aircrafts on Airbus Pleiades Imagery
- Faster R-CNN with ResNet-50 Backbone
6. Ships in Satellite Imagery(San Francisco Bay)
规模: 4000张80×80 RGB图像 分辨率: 3米 类别: 船/非船二分类
项目:
- shipsnet-detector
- CNN分类器示例
7. Planesnet Classification
规模:
- 飞机类:8,000张
- 非飞机类:24,000张 尺寸: 20×20 RGB
项目:
- planesnet-detector
- AWS SageMaker应用
8. DeepGlobe Land Cover Classification
任务: 7类语义分割
类别: 城市、农业、牧场、森林、水体、荒地、未知
方案:
- U-Net语义分割
- DeepLab v3+解决方案
- 注意力机制U-Net
链接: Kaggle数据集
Kaggle其他热门数据集
| 数据集 | 任务 | 特点 |
|---|---|---|
| Dubai Segmentation | 6类分割 | 72张迪拜卫星图像 |
| Massachusetts Roads/Buildings | 分割 | 建筑物与道路提取 |
| Swimming Pool Detection | 目标检测 | 3750张住宅区图像 |
| HRSC2016 | 船舶检测 | 旋转目标检测 |
| Next Day Wildfire Spread | 时序预测 | 野火蔓延预测 |
🎯 专业应用数据集
🚢 海洋与船舶
xView3: Dark Vessel Detection
- 任务: SAR图像暗船检测(非法捕鱼)
- 规模: 43,200,000 km² Sentinel-1影像
- 标注: 人工+算法标注
- 应用: IUU(非法、未报告、不受管制)捕鱼检测
- 链接: 官网
SAR Ship Detection Dataset (SSDD)
- 来源: 多源SAR数据
- 特点: 全天候船舶检测
- GitHub: Official-SSDD
LEVIR-Ship
- 特点: 中等分辨率下的小船检测
- 标注: 边界框
- 托管: Scale Nucleus平台
✈️ 航空目标
RarePlanes
- 特色: 真实+合成飞机数据
- 来源: AWS开放数据计划
- 应用:
- 合成数据预训练
- 10%真实数据微调
- 模型剪枝和量化
- 论文: arXiv
SAR Aircraft Detection
- 规模: 2966个224×224切片,7835架飞机
- 来源: SAR图像
- 链接: GitHub
🏗️ 建筑物与基础设施
Microsoft Building Footprints
- 覆盖: 美国50个州、澳大利亚、加拿大、乌干达-坦桑尼亚、肯尼亚-尼日利亚
- 格式: GeoJSON
- 方法: 语义分割生成
- 全球版: GlobalMLBuildingFootprints
Google Open Buildings
- 覆盖: 非洲大陆64%
- 应用: 社会公益应用
- 博客: Mapping Africa's Buildings
BONAI
- 任务: 斜视角航空图像建筑物足迹提取
- 特点: 处理非垂直视角挑战
- 链接: GitHub
🌾 农业与环境
SICKLE
- 全称: 多传感器卫星影像关键作物参数数据集
- 传感器: Landsat-8, Sentinel-1, Sentinel-2
- 特点: 多分辨率时间序列
- 链接: GitHub
CropNet
- 规模: TB级多模态数据集
- 任务: 气候变化感知作物产量预测
- 特色: 结合气候数据
TreeSatAI
- 任务: 树种分类
- 数据: Sentinel-1 + Sentinel-2
- 链接: Zenodo
🔥 灾害监测
xView2: Building Damage Assessment
- 应用: 灾后建筑物损伤评估
- 标注: 四级损伤光谱
- 分辨率: 0.3米
- AWS方案: SageMaker Geospatial
FireRisk
- 任务: 火灾风险评估
- 方法: 监督学习 + 自监督学习基准
Satellite Burned Area Dataset
- 规模: 73次Sentinel-1/2采集
- 应用: 森林野火分割
- 链接: Zenodo
☁️ 云检测
CloudSEN12Plus
- 规模: 目前最大的Sentinel-2云检测数据集
- 链接: HuggingFace
38-Cloud
- 规模: 38张Landsat 8图像
- 标注: 像素级人工标注
- 扩展: 95-Cloud数据集
Azavea Cloud Dataset
- 应用: 训练云检测模型
- 模型: cloud-model
🌍 多模态与高光谱
HySpecNet-11k
- 规模: 大规模高光谱基准数据集
- 应用: 高光谱图像分析
- 链接: 官网
SEN12MS
- 特点: Sentinel-1/2地理参考多光谱数据集
- 应用: 数据融合、深度学习
- 工具: SEN12MS toolbox
🌐 数据获取平台
主要数据中心
1. Radiant MLHub
- 网址: mlhub.earth
- 特点: 数据集 + 预训练模型
- 托管: AI for Earth项目支持
- 格式: STAC标准
2. AWS Registry of Open Data
- 网址: registry.opendata.aws
- 特色数据:
- Sentinel-2 L2A COGs
- Landsat 8 Collection 2
- NAIP航空影像
- Maxar Open Data(灾害影像)
3. Microsoft Planetary Computer
- 网址: planetarycomputer.microsoft.com
- 特点:
- Dask-Gateway支持的JupyterHub
- 可扩展地理空间分析
- STAC API接口
- 数据目录: 包含Sentinel、Landsat、NAIP等
4. Google Earth Engine (GEE)
- 网址: developers.google.com/earth-engine
- 特点:
- 云端大规模处理
- 多种影像和气候数据集
- 经典算法支持
- 深度学习流程:
- GEE导出tfrecords
- GPU平台训练
- 上传推理结果回GEE
GEE资源:
- awesome-google-earth-engine
- Awesome-GEE by giswqs
- awesome-earth-engine-apps
- wxee: GEE到xarray,支持PyTorch/TensorFlow
竞赛平台
Codalab
- 各类遥感挑战赛
- 示例:目标检测、洪水检测、云覆盖检测
DrivenData
- 社会公益导向竞赛
- 示例:藻华检测、洪水制图、建筑物分割
AI4EO
- 欧洲遥感AI平台
- 示例:Sentinel增强农业应用
声明: 本文内容整理自GitHub开源项目,原始资源链接:https://github.com/satellite-image-deep-learning/datasets
更多推荐


所有评论(0)