0 引 言
随着移动机器人与无人平台在各类应用场景的不断进阶与探索,对移动载体定位能力的要求也越来越高。日益升级的智能驾驶应用,尤其是更先进的无人驾驶,为保证安全,需求定位精度达到厘米级,现有的定位输入源主要 是 基 于 全 球 定 位 系 统 ( global positioning system,GPS) 等卫星定位手段,而传统的 GPS 定位导航精度只有5 ~ 10 m,当前提高定位精度的方案大体上分为两类。一类是对卫星信号定位输入源进行升级,如升级为更高精度的实时差分定位( real time kinematic,RTK) ,或者将进行辅 助 推 算 导 航 定 位的低成本微机电系统 ( microelectromechanical system,MEMS) 惯导设备升级为更高精度级别的惯导,虽然此类方式可以在大多数的使用场景下提高定位精度,但是在 GPS 信号容易丢失的场景下,如停车场、交错高架路以及室内环境等,仍存在缺陷且成本较高,而惯导的推算定位本身就存在初始化和累计误差问题; 另一类是研究学者基于第一类缺陷提出的引入新的实现自主定位源的方法,如使用激光雷达、毫米波雷达、摄像头等感知传感器,因此基于各类传感器的自主定位方案开始受到科研人员的广泛关注,尤其是基于激光雷达和深度相机的自主定位,近年来已成为热点方案,本文主要阐述基于多线激光雷达的自主定位方案。
同 步 定 位 与 绘 图 ( simultaneous localization and mapping,SLAM) 作为一种在未知环境中进行姿态估计与定位的技术,广泛应用于移动机器人和无人驾驶等领域。SLAM 相关概念最早由 Cheeseman 等于 1986 年在 IEEE 机器人与自动化会议被提出,该技术通过传感器采集信息,生成无人平台所探索环境的地图并对其进行定位,实现无人平台的自主移动[1]。从该技术的定义可知,该技术由地图构建和定位两部分组成。地图构建是把通过传感器采集的序贯激光雷达点云或视觉特征从各帧局部坐标系投影至全局坐标系,之后完成地图拼接和定位,即获取移动载体在所建地图中的位置和姿态信息。一方面获取传感器采集的各帧数据对应的局部坐标系的位置和姿态是构建地图的关键,即建图包含了定位问题; 另一方面构建准确的地图又是精确定位的前提,因此,定位与建图两者是高度耦合的,可作为一个问题寻找解决方案。在线实时的SLAM 技术作为自主定位领域的核心正在被广泛研究。
目前 2D 激光 SLAM 技术发展已较为成熟,既可用于民用服务如扫地机器人,也可用于工业现场,如 KUKA Navigation Solution[2]。基于激光点云的 3D SLAM 技术利用三维激光传感器( 一般是多线激光雷达,也有少部分是用自制的单线激光雷达组合) 获取三维空间点数据,之后再通过相邻点云帧之间的扫描匹配进行位姿估计,并建立完整的点云地图,与 2D 激光 SLAM 具有相通的技术原理。三维激光雷达通过光学测距可以直接采集到海量具有角度和距离精准信息的点,这些点的合集被称为点云,可以反映出真实环境中的几何信息。由于其建图直观,测距精度极高且不容易受到光照变化和视角变化的影响,是室外大型环境的地图构建应用中必不可少的传感器。得益于 DARPA( 美国国防部先进研究项目局地面挑战赛) [3-4]的推动,美国 Velodyne 公司的多线激光雷达开始用于无人汽车 SLAM[5],移动机器人的定位与建图问题由室内逐渐转为室外,地图构建也由二维拓展到三维,范围成倍扩大,但多线雷达成本较高。随着多线激光雷达的量产化和普及化以及嵌入式处理器功耗降低、计算能力的增强,基于多线激光雷达的 SLAM 技术正在快速发展。由于基于多线激光雷达的三维 SLAM 方法在帧间匹配方面有着更丰富的匹配方式及更好的鲁棒性,并可以同图像信息、物理模型等信息进行融合[6]使定位精度得到提升,因而具有巨大的发展潜力。
关于 SLAM 的相关工作前人已有总结,尤其是基于视觉的 SLAM 综述出现较多,但基于激光的 SLAM 总结工作比较少,且主要是基于 2D 激光,涉及 3D 激光雷达SLAM 算法的介绍不多。在本文中,我们将系统的介绍和分析三维激光 SLAM 技术,并对选取的代表性算法进行性能比较及客观评价。这项工作为我们之后对三维激光 SLAM 技术进行更深入的研究做下了铺垫,也希望本文能够为其他对 3D 激光雷达 SLAM 技术感兴趣的研究人员提供些许帮助。
1 3D 激光雷达 SLAM 方案
依赖激光雷达建立地图的激光 SLAM 方案按求解方式可以分为基于滤波器和基于图优化两类,基于滤波器的方法源于贝叶斯估计理论,是早期解决 SLAM 问题的方法,在室内或小范围场景应用中具有不错的效果,但由于只考虑移动载体的当前位姿状态和当前环境观测信息,且不具有回环检测能力,存在线性化以及更新效率低等问题[7-8],在程序运行中还会随着场景的增大占用成倍增加的计算资源,这使得它在室外大型场景中的表现效果比较差,现阶段基于滤波器的激光 SLAM 方案主要应用在二维室内小范围场景。
基于图优化的 SLAM 方案考虑了移动载体历程中全部的位姿状态和环境观测信息,用节点和边形成的图来表示一系列的移动机器人位姿和约束,建立和维护关联数据,可独立出前端实现并行计算,是一种更为高效和普适的优化方法。相较于早期基于滤波器的 SLAM 方法,通常可以得出全局一致性更好的地图,且随着求解方法的不断发展,在相同计算量的前提下,图优化 SLAM 的求解速度也已经超过滤波器方法,是目前 SLAM 领域内的主流方法,也是三维激光 SLAM 采取的主要方案,Hauke 等[9]研究了图优化方法为什么较滤波器方法能取得更优的效果。
Lu 等[10]于上世纪九十年代首次提出基于图优化的2D SLAM 算法,他们用带约束的位姿网络实现了数据关联,具备图优化的原型。Gutmann 等[11]于 1999 年正式提出了图优化框架,该框架与目前主流的图优化框架大致相同,具备前端扫描匹配、全局优化以及闭环检测模块,但由于当时技术发展和认知局限,没有认识到系统的稀疏性,并未实现实时 SLAM。之后,国内外诸多研究学者也不断探索,为图优化 SLAM 方法的发展做出了巨大贡献,图优化 SLAM 方案框架的各个模块也在逐步完善。
基于二维激光的 SLAM 算法相对成熟,Santos 等[12]对 5 种具有代表性的基于单线激光雷达的 2D 激 光SLAM 算法进行了测试评估和总结,结果表明 Gmapping和 KartoSLAM 算法在定位和建图的准确性和效率上要更加优越。之后 Google 开源的 Cartographer 算法[13]采用目前主流的基于图优化的激光 SLAM算法框架,提出了分支定界的方法解决子地图的构建以及与全局地图的匹配问题,实现了闭环检测和较好效果的全局优化,是目前较为先进和成熟的二维激光 SLAM技术的代表。
二维激光雷达在确定高度的水平面上通过测量旋转扫描的激光信号与其回波的时间差、相位差确定环境中目标的距离和角度,并依据这两类数据在水平面上建立二维极坐标系来表示所感知的环境信息,可视为一种单线程的三维激光雷达。相比于只能感知环境中单个平面信息、适用于室内几何结构实现小型区域地图构建的二维激光雷达,三维激光雷达可以进一步获取高程上更丰富的信息,对于室外大型场景也有更好的感知效果。激光雷达根据线数可分为单线、4 /8 线以及 16 /32 /64 /128线 3 类,随着线束的增多,激光雷达能够感知环境的信息更丰富,所得的数据量也相应更大,设备的成本也成倍增加,因此基于激光的 SLAM 算法需要在线束上有所考量,要达到更好的实时性就需要处理减少每帧的输入数据量,而较少的初始数据量因为线束稀疏又不能很好的反映环境信息,目前的 3D 激光雷达 SLAM 算法研究多基于16 /32 /64 线激光雷达,而面向无人驾驶的应用则追求更高精度的 128 线,如图 1 所示。3D 激光雷达 SLAM 技术基于多线激光雷达,沿用并发展了基于图优化的 SLAM算法框架,并将其应用于无人驾驶等领域解决大型场景的定位与建图问题。
文章目录
- 0 引 言
- 1 3D激光雷达SLAM方案
- 1.1 图优化方法
- 1.2 图优化SLAM方案框架
- 1)扫描匹配
- 2)闭环检测
- 3)后端图优化
- 4)地图表示
- 2 研究热点及发展趋势
- 2.1 激光惯性里程计
- 2.2 场景识别
- 2.3 后端优化
- 2.4 动态物体
- 2.5 结合深度学习
- 3 算法评估测试
- 3.1 数据集
- 3.2 算法性能评估标准
- 1)KITTI官方标准[72-73]:
- 2)精度指标:
- 3)算法耗时和处理帧率:
- 3.3 算法性能评估实验
- 1)KITTI官方标准
- 2) 精度指标
- 3)算法耗时和处理帧率
- 4 技术应用趋势分析
- 5 结 论
暂无评论内容