1. CenterNet 的引言

CenterNet,全称为 CenterNet: Objects as Points,是计算机视觉领域中一个高效的 anchor-free 物体检测(Object Detection)模型。它由 Xingyi Zhou、Dequan Wang 和 Philipp Krähenbühl 在 2019 年提出,并在 arXiv 上发布。 CenterNet 的核心创新在于将物体视为关键点(keypoints),具体是物体的中心点,通过热图(heatmap)预测中心位置,然后回归物体的宽度、高度和偏移,从而生成边界框。这避免了传统模型如 YOLO 或 SSD 中对锚框(anchor boxes)的依赖,简化了设计并提高了泛化能力。

与其他检测器不同,CenterNet 将检测转化为关键点估计问题,类似于人体姿态估计,使用单一 CNN 端到端处理。在 MS COCO 数据集上,CenterNet 的平均精度(AP)达到 42.1%(ResNet-101 骨干),在速度上也表现出色(~28 FPS)。 到 2025 年,CenterNet 的变体如 CenterNet2 已被提出,进一步集成 Transformer,提升了在密集场景下的性能。
The architecture of CenterNet. | Download Scientific Diagram

CenterNet 的名称源于其对物体“中心”(center)的强调,它标志着从锚框向关键点范式的转变,在自动驾驶、安防监控和医疗图像分析等领域广泛应用。

2. CenterNet 的背景和发展

CenterNet 的提出是为了解决 anchor-based 检测器的局限性。在 CenterNet 之前,两阶段模型如 Faster R-CNN 使用 RPN 生成锚框,但计算重;单阶段模型如 SSD 依赖大量锚框,导致参数敏感和冗余。 作者观察到,物体可以简化为中心点,这简化了问题并避免了 IoU 匹配复杂。

论文《CenterNet: Objects as Points》于 2019 年发布,灵感来源于关键点检测如 Hourglass 和 DLA(Deep Layer Aggregation)。 发展历史上,CenterNet 开启了 anchor-free 时代的浪潮,直接影响了后续模型如 FCOS 和 YOLOv5 的变体。 到 2025 年,CenterNet 的扩展如 CenterNet2 通过双级设计,提升了小物体检测,并在 NeurIPS 上获奖。

Architecture of CenterNet. | Download Scientific Diagram
CenterNet 的影响延伸到 3D 检测和多模态任务,推动了高效 AI 的发展。

3. CenterNet 的核心组件和架构

CenterNet 的架构灵活,可使用 ResNet、DLA 或 Hourglass 作为骨干。输入图像缩放到 512x512。

  • 骨干网络:提取特征图(e.g., 128x128xC)。

  • 热图预测(Heatmaps):预测每个类别的中心点热图,使用高斯核生成 ground truth。

  • 偏移预测(Offsets):修正下采样导致的中心点偏移(2 通道)。

  • 尺寸预测(Sizes):回归物体宽度和高度(2 通道)。

整体流程:图像 → 骨干 → 热图/偏移/尺寸 → 峰值提取 → 边界框(x,y,w,h = center + offset, size)。无 NMS,直接取热图峰值。

ISTD-CenterNet overall network architecture | Download ...

在推理中,热图 softmax 后取 top-K 峰值。

4. CenterNet 的数学公式和理论基础

CenterNet 的损失函数是多任务损失:

L = L k + λ s i z e L s i z e + λ o f f L o f f L = L_{k} + \lambda_{size} L_{size} + \lambda_{off} L_{off} L=Lk+λsizeLsize+λoffLoff

  • L k L_k Lk:热图损失,使用 Focal Loss 变体:

L k = − 1 N ∑ c = 1 C ∑ x y { ( 1 − p c x y ) α log ⁡ ( p c x y ) y c x y = 1 ( 1 − y c x y ) β p c x y α log ⁡ ( 1 − p c x y ) o t h e r w i s e L_k = \frac{-1}{N} \sum_{c=1}^C \sum_{xy} \begin{cases} (1 - p_{cxy})^\alpha \log(p_{cxy}) & y_{cxy}=1 \\ (1 - y_{cxy})^\beta p_{cxy}^\alpha \log(1 - p_{cxy}) & otherwise \end{cases} Lk=N1c=1Cxy{(1pcxy)αlog(pcxy)(1ycxy)βpcxyαlog(1pcxy)ycxy=1otherwise

α=2, β=4, y 是高斯热图。

  • L o f f L_{off} Loff:偏移 L1 损失,仅正中心计算。

  • L s i z e L_{size} Lsize:尺寸 L1 损失。

理论基础:中心点比角点更易定位,避免锚框偏差。

he structure of CenterNet. The CenterNet includes three ...

5. CenterNet 与其他模型的比较

CenterNet 是单阶段 anchor-free 检测器,与 CornerNet 和 YOLO 比较。

  • 相似点:实时、端到端。

  • 差异点

    • CenterNet 使用中心点;CornerNet 使用角点对;YOLO 使用网格。
    • 速度:CenterNet ~28 FPS;CornerNet 4 FPS;YOLOv1 45 FPS。
    • AP (COCO):CenterNet 42.1%;CornerNet 42.1%;YOLOv1 ~20%。

表格比较:

方面 CenterNet CornerNet YOLOv1
关键点 中心 角点对 无(网格)
AP (COCO) 42.1% 42.1% ~20%
机制 热图 + 回归 热图 + 嵌入 回归

CenterNet 在速度和精度平衡好。

Architecture of CenterNet | Download Scientific Diagram

6. CenterNet 的优势、局限性和改进

优势

  • 无锚框:简化,提升泛化。
  • 高效:单一网络,快。
  • 多任务:易扩展姿态/分割。

局限性

  • 小物体:热图分辨限。
  • 密集:中心重叠问题。
  • 骨干依赖:需深网络。

改进:CenterNet2 添加级联。

7. CenterNet 的应用

CenterNet 用于实时监控、无人机和医疗检测。在工业中,用于缺陷;在研究中,用于多模态。

8. CenterNet 的结论和未来影响

CenterNet 革新 anchor-free 检测,推动关键点方法。到 2025 年,其在 3D 中的扩展将继续影响 AI。

更多推荐