Depth from Camera Motion and Object Detection
1 摘要
本文旨在解决在考虑相机运动情况下的物体深度估计问题。使用DBox网络和ODMD数据集来估计深度信息。
2 简介
目前的自动驾驶车辆和机器人需要感知周围环境的三维信息,这需要依赖RGBD摄像头和雷达传感器。本文主要使用未标定相机运动和物体检测的边框来估计深度。优势之一是物体检测边框只有四个参数,相比于图像分割可以节约算力;优势之二是运动信息可以在大多数硬件平台上测量。
创新点:
一、推导出未校准运动和基于检测的深度估计的分析模型和相应的解。
二、建立RNN预测运动和边框的深度信息。
三、提出ODMD数据集,数据集包括边框信息,相机运动和深度信息的距离。
3 相关工作

其中包括包围框中心点坐标、宽度、高度、观测物体相对于相机的位置。
4.1.2 Camera Model
为了从二维检测中推断出三维信息,本文使用针孔相机模型将对象的边界框图像点与三维相机帧坐标联系起来。包围框与物体深度成反比。
4.1.3 Depth from Optical Expansion & Detection
在一个理想的模型中,我们可以使用观察值之间的z轴运动和边界框尺度的相应变化来找到对象的深度。接下来就是公式推导。
4.1.4 Depth from Motion Parallax & Detection
如果存在x轴或y轴相机运动,我们可以使用边界框位置的相应变化(例如,图2中的框1到框3)来解决对象深度。为了简洁起见,我们在补充材料中提供了这个推导和比较结果。

4.1.5 Using all Observations to Improve Depth.
无论是相机运动检测或者是物体检测都存在误差,通过对所有物体进行深度检测会使得评估更具有鲁棒性。
4.2 Depth from Motion and Detection Network
4.2.1 Normalized Network Input
对于物体检测边框标准化和相机位置标准化。loss是真实深度减预测深度。
4.2.2 Network Architecture
LSTM的变形
5 销蚀实验

fAbs (13) 仅仅进行归一化处理,fRel (14)进行归一化和无量纲处理,Zn (9)不进行处理。
DBoxNS 标准数据集。DBoxp数据集带有误差 。DBoxAbs使用归一化处理的loss。

泛化性对比实验。
更多推荐


所有评论(0)