【计算机科学与应用】基于改进的YOLOv10的焚烧目标检测算法

本文针对焚烧场景目标检测中的背景干扰、目标形变及光照突变问题，提出改进YOLOv10的增强检测模型。通过引入Gather-and-Distribute机制优化特征融合路径，采用DCNv4可变形卷积增强几何表征能力，并设计Wise-Outer-MPDIoU损失函数优化边界框回归。实验表明，该方法在自建数据集上实现85.7%的mAP（提升2.1%），推理速度达359FPS，有效平衡了检测精度与实时性要

2501_92218442

894人浏览 · 2025-10-27 09:13:32

2501_92218442 · 2025-10-27 09:13:32 发布

导读：

针对复杂焚烧场景下目标检测易受背景干扰、目标形变及光照突变影响的问题，本研究提出一种基于YOLOv10的增强检测模型。通过引入Gather-and-Distribute机制重构多尺度特征融合路径，以可变形卷积(DCNv4)提升对非刚性目标的几何表征能力，并采用Wise-Outer-MPDIoU损失函数实现基于目标几何属性的边界框优化。在自建焚烧数据集上的实验表明，所提出方法在保持高推理速度(359 FPS)的同时，平均精度(mAP)达到85.7%，较基线模型提升2.1%，显著增强了对焚烧目标的鲁棒感知与定位性能，具有良好的学术价值与工程应用潜力。

作者信息：

李林峰, 蒋玲凤, 田淼, 冷震北：重庆对外经贸学院数学与计算机科学学院，重庆

论文详情

本文以YOLOv10为基线，针对秸秆焚烧场景提出三项改进：

1) 在C2f模块中使用DCNv4替换CBS卷积，提升形变目标的定位能力；

2) 加入Gather-and-Distribute机制，加强多尺度信息融合，抑制复杂背景、弱光及浑浊干扰，提高检测精度；

3) 采用Wise-Outer-MPDIoU损失函数，结合缩放因子与点距离惩罚，增强模型在目标尺度多变和背景复杂场景中的适应性。

实验选用YOLOv10架构(见图1)。

尽管YOLOv10已在众多通用检测任务中表现优异，但面对焚烧场景时，复杂地形、多变天气及人为扰动使其误检、漏检频发；若单纯堆叠模块提升精度，又会带来参数量激增、推理耗时增加的新问题。为此，本文提出轻量化改进方案(见图2)：在骨干C2f中嵌入DCNv4可变形卷积提升形变目标感知，于Neck引入FAM + IFM双模块精炼多尺度特征，并用Wise-Outer-MPDIoU替换原损失，兼顾精度与速度。

受焚烧场景复杂背景及目标形变影响，原始YOLOv10的C2f模块难以灵活捕捉几何变化。为此，本文把C2f中的常规卷积升级为DCNv4可变形卷积(见图3)，使卷积核具备自适应采样能力，从而显著提升对形变目标的感知精度。

为验证GD注意力模块的有效性，以YOLOv10为基线进行对照实验。表1结果显示：引入GD后，mAP达85.7%，较基线提升2.1%，而SE、CBAM、Biformer的提升均低于1.5%；同时GD仅带来2.52 M额外参数与28.6 G FLOPs，兼顾精度与实时性，更契合焚烧检测场景。

为验证所提模块的有效性，在YOLOv10基线上展开消融实验(实验参数与表1完全一致)。结果显示：融合DCNv4、GD注意力及Wise-Outer-MPDIoU后，参数量与计算量均小幅下降，mAP提升2.1 pct，满足焚烧检测对精度与实时性的双重要求。

实验表明(表3)，改进后的YOLOv10在焚烧检测任务中表现优异：在统一参数与数据集下，其mAP达到87.3%，较YOLOv8-M提升3.7 pct，显著优于Faster-RCNN、SSD等常用模型，验证了本方法的有效性。

本研究基于YOLOv10M提出面向焚烧场景的目标检测框架：一方面将DCNv4可变形卷积融入主干网络，增强模型对形变及非刚性目标的建模能力；另一方面嵌入GD注意力模块，通过自适应捕获相似特征，强化网络对关键区域相关性的判别。其次，将YOLOv10M颈部原有的PAFPN升级为带权双向特征金字塔BiFPN，利用跨尺度双向信息流动和自适应加权融合机制，在不显著增加计算量的前提下提升多尺度表达能力。最后，在预测端采用Wise-Outer-MPDIoU损失，兼顾高、低质量样本的梯度贡献，使边界框回归在训练初期即可快速收敛并保持稳定，从而增强模型泛化性能，显著抑制焚烧场景中的误检与漏检现象。