导读:

针对复杂焚烧场景下目标检测易受背景干扰、目标形变及光照突变影响的问题,本研究提出一种基于YOLOv10的增强检测模型。通过引入Gather-and-Distribute机制重构多尺度特征融合路径,以可变形卷积(DCNv4)提升对非刚性目标的几何表征能力,并采用Wise-Outer-MPDIoU损失函数实现基于目标几何属性的边界框优化。在自建焚烧数据集上的实验表明,所提出方法在保持高推理速度(359 FPS)的同时,平均精度(mAP)达到85.7%,较基线模型提升2.1%,显著增强了对焚烧目标的鲁棒感知与定位性能,具有良好的学术价值与工程应用潜力。

作者信息:

李林峰蒋玲凤田 淼冷震北:重庆对外经贸学院数学与计算机科学学院,重庆

论文详情

本文以YOLOv10为基线,针对秸秆焚烧场景提出三项改进:

1) 在C2f模块中使用DCNv4替换CBS卷积,提升形变目标的定位能力;

2) 加入Gather-and-Distribute机制,加强多尺度信息融合,抑制复杂背景、弱光及浑浊干扰,提高检测精度;

3) 采用Wise-Outer-MPDIoU损失函数,结合缩放因子与点距离惩罚,增强模型在目标尺度多变和背景复杂场景中的适应性。

实验选用YOLOv10架构(见图1)。

尽管YOLOv10已在众多通用检测任务中表现优异,但面对焚烧场景时,复杂地形、多变天气及人为扰动使其误检、漏检频发;若单纯堆叠模块提升精度,又会带来参数量激增、推理耗时增加的新问题。为此,本文提出轻量化改进方案(见图2):在骨干C2f中嵌入DCNv4可变形卷积提升形变目标感知,于Neck引入FAM + IFM双模块精炼多尺度特征,并用Wise-Outer-MPDIoU替换原损失,兼顾精度与速度。

受焚烧场景复杂背景及目标形变影响,原始YOLOv10的C2f模块难以灵活捕捉几何变化。为此,本文把C2f中的常规卷积升级为DCNv4可变形卷积(见图3),使卷积核具备自适应采样能力,从而显著提升对形变目标的感知精度。

为验证GD注意力模块的有效性,以YOLOv10为基线进行对照实验。表1结果显示:引入GD后,mAP达85.7%,较基线提升2.1%,而SE、CBAM、Biformer的提升均低于1.5%;同时GD仅带来2.52 M额外参数与28.6 G FLOPs,兼顾精度与实时性,更契合焚烧检测场景。

为验证所提模块的有效性,在YOLOv10基线上展开消融实验(实验参数与表1完全一致)。结果显示:融合DCNv4、GD注意力及Wise-Outer-MPDIoU后,参数量与计算量均小幅下降,mAP提升2.1 pct,满足焚烧检测对精度与实时性的双重要求。

实验表明(表3),改进后的YOLOv10在焚烧检测任务中表现优异:在统一参数与数据集下,其mAP达到87.3%,较YOLOv8-M提升3.7 pct,显著优于Faster-RCNN、SSD等常用模型,验证了本方法的有效性。

本研究基于YOLOv10M提出面向焚烧场景的目标检测框架:一方面将DCNv4可变形卷积融入主干网络,增强模型对形变及非刚性目标的建模能力;另一方面嵌入GD注意力模块,通过自适应捕获相似特征,强化网络对关键区域相关性的判别。其次,将YOLOv10M颈部原有的PAFPN升级为带权双向特征金字塔BiFPN,利用跨尺度双向信息流动和自适应加权融合机制,在不显著增加计算量的前提下提升多尺度表达能力。最后,在预测端采用Wise-Outer-MPDIoU损失,兼顾高、低质量样本的梯度贡献,使边界框回归在训练初期即可快速收敛并保持稳定,从而增强模型泛化性能,显著抑制焚烧场景中的误检与漏检现象。

基金项目:

重庆对外经贸学院校级科研项目(KYZK2024015)、重庆对外经贸学院校级科研项目(KYZK2024003)。

原文链接:https://doi.org/10.12677/csa.2025.1510249

更多推荐