0 引言
对于自主移动机器人,在导航定位方面涉及三个方面的问题:
1)我在哪里(whereamI);
2)我要去哪里(whereamIgoing);
3)我要怎么去(Howshouldigetthere)[1]。
其中第一个是定位问题,第二个是任务规划问题,第三个为路径规划问题。同时定位与地图构建(Simultaneous Localization and Mapping SLAM)问题描述为:一个机器人在一个陌生的环境中运动,通过自身携带的传感器对周围环境进行感知,然后绘制陌生环境的地图,同时定位自己在地图中的位置[2]。利用SLAM方法可以解决自主移动机器人的定位与建图问题。使用相机作为传感器的SLAM方法被称为视觉SLAM(VSLAM)。相比于传统的惯性器件(Inertial Measurement Units IMU)和激光雷达(Laser Scanner)等传感器,相机具有体积小、质量小和价格低等突出的优点,因此,VSLAM成为近年来SLAM算法研究的热点。
RGB-D相机是新兴的视觉传感器,它可以同时获取周围环境的RGB图像和每个像素的深度(Depth)信息。相比于单目相机和双目立体相机利用算法计算空间点的三维坐标,RGB-D相机获取空间点的3D信息更加直接方便,深度信息通过红外结构光(Structured Light)或飞时(Time-of -flight,TOF)原理测得,和激光雷达有些相似。所以,有时候RGB-D相机又被称为伪激光雷达(fake_laser)。由于RGB-D相机能相对容易地获取RGB图像上每一个像素的深度数据,并且RGB-D相机价格相对便宜,近年来RGB-D SLAM技术得到快速发展。
1 RGB-D SLAM介绍
RGB-D SLAM使用RGB-D深度相机作为传感器实现同时定位与地图构建。经过十多年的研究,虽然不同的研究团队使用的具体VSLAM算法有所区别,但是这些VSLAM算法都可以归为前端和后端两部分,RGB-D SLAM作为VSLAM的一个分支,当然也不例外。本节首先介绍目前使用的主流RGB-D相机的种类并做出对比,然后简要介绍RGB-D SLAM算法流程,最后介绍RGB-DSLAM的标志性成果。
1.1 RGB-D相机介绍
微软公司于2010年推出的Kinect相机是世界上首款RGB-D相机,Kinect相机是微软公司针对Microsoft Xbox 360发布的一款由PrimeSense公司开发的体感设备。它由RGB相机、3D深度传感器、麦克风阵列和机动倾斜马达等组成[3](图1)。Kinect相机中间部位是一款RGB彩色镜头,图像分辨率为640×480,最大帧率为30Hz。两边分别为红外发射和接收装置,组成Kinect的深度传感器。其深度传感器的分辨率为320×240,帧率同样为30Hz。RGB-D相机采集的图像数据如图2所示[4]。随后华硕也发布了其体感控制设备Xtion ProLive,它在外观上和Kinect相似,但比Kinect尺寸略小,RGB和深度传感器的配置和Kinect相差无几。华硕Xtion ProLive相机如图3所示。Xtion ProLive和Kinect参数对比如表1所示。
暂无评论内容