0 引言
在移动机器人系统中,要进行目标探测和定位,对于自身位姿的估计非常重要。传统的位姿估计方法有GPS、IMU、轮速传感器和声纳定位系统等里程计技术。近年来,相机系统变得更加便宜,分辨率和帧率也更高,计算机的性能有了显著提高,实时的图像处理成为可能。一种新的位姿估计方法因此而产生,即视觉里程计(vision odometry,VO)。VO仅利用单个或多个相机所获取的图像流估计智能体位姿[]。它的成本较低,能够在水下和空中等GPS失效的环境中工作,其局部漂移率小于轮速传感器和低精度的IMU,它所获得的数据能够很方便的和其他基于视觉的算法融合,省去了传感器之间的标定。
从连续的图像序列中估计相机自运动的思想最早由Moravec等人2l提出。他利用一个可滑动的相机获取视觉信息完成了机器人的室内导航。1987年,Matthies等人]设计了从特征提取、特征匹配与跟踪到运动估计的理论框架,该框架至今仍为大多数VO系统所遵循。绝大多数早期的VO系统主要应用于行星探测[2·],其中最典型的当属美国NASA的火星探测项目。VO在火星探测器中用于在轮速传感器失效时测量6个自由度参数。VO这个术语是由Nister等人[]在2004年创造的。他们设计了一种实时的VO系统,真正意义上实现了机器人室外运动导航,同时还提出了两类VO的实现途径和流程,即单目视觉和立体视觉的方法,这为后来VO的研究奠定了新的基础。
与VO紧密相关的一个领域是基于视觉的同时定位与地图构建技术(visual simultaneous localization and mapping,V.SLAMy6]。V-SLAM在一个未知的环境中对机器人进行自定位并实时重建环境的三维结构。它的目标是获得对机器人运动轨迹的全局一致性估计,这意味着机器人必须能够识别曾经到过的地方,这个过程被称为闭环检测。而VO是增量式的重构路径,它只关心轨迹的局部一致性。从实时性和环境适应性的角度出发,专注于局部运动估计的VO更具有实用价值,更适用于大范围运动的移动机器人。
过去曾经出现过一些有关VO的综述文献9.],尤其是Scaramuzza等人l-]的两篇文章系统的介绍了VO在2012年以前的发展状况。但是,近几年VO技术取得了很大的进步,随着大量高性能VO系统的涌现,这些文献已经不能反映最新的VO技术的发展。本文在综述过程中,侧重结合了一些先进的VO系统。文章首先介绍了VO的概况,包括VO问题的数学描述及其分类:然后重点综述了特征模块、帧间位姿估计和减少漂移等VO的关键技术。针对近几年来出现的基于深度学习的VO,简述了它的发展动态并分析了它的优势和不足。考虑到算法评价对于VO发展的重要性,文章还介绍了三个常用的VO公共数据集。最后总结了VO目前存在的问题,展望了它的发展趋势。
1 视觉里程计概况
1.1视觉里程计问题数学描述
摄像机模型是将三维世界投影到二维图像平面的函数。有很多摄像机模型,如透视投影模型、全方向摄像机模型、球形模型等,其中最基本也是最常用的是透视投影模型。在透视投影中,远的目标要比近的目标看起来小一些,这个性质与人类视觉以及大多数摄像机是相符的。透视投影的几何关系如图1所示。其中C点称为摄像机光心,由点c与x、y、=轴组成的直角坐标系称为摄像机坐标系。x、y轴与图像的u、v轴平行,:轴为摄像机光轴,它与图像平面垂直。光轴与图像平面的交点(cu,cv)即为图像坐标系的原点。图中点P=[X,Y,z]T为三维世界中的一点,点p=[u,v]T是它在图像平面上的投影。
暂无评论内容