中国上海交通大学的研究人员介绍了TransLO:一种基于窗口的点云遮蔽变换器框架,用于大规模LiDAR里程计
《中国上海交通大学研究团队推出TransLO:基于窗口的大规模LiDAR里程计点云遮蔽变换器框架》
上海交通大学和中国矿业大学的研究人员开发了TransLO。这种LiDAR测距航位网结合了基于窗口的掩码点变换器、自注意和帧间掩码注意。它能有效处理稀疏的点云,利用二进制掩码排除无效和动态点。
这种方法讨论了常见的LiDAR测距航位方法,包括迭代最近点(ICP)变种和广泛使用的LOAM,该方法提取特征进行运动估计。它强调了LOAM的变种,加入地面分割来提高性能。TransLO是第一个基于变换器的LiDAR测距航位网,该研究结合了CNN和变换器进行全局特征嵌入,提高了异常值拒绝和3D场景理解的能力。通过消融研究评估了诸如投影感知掩码、基于窗口的掩码自注意(WMSA)和帧间掩码注意(MCFA)等组件,以展示TransLO的效果。
LiDAR测距航位对于诸如SLAM、机器人导航和自动驾驶等应用至关重要,传统上依赖ICP或基于特征的方法。基于学习的方法,尤其是CNN,很难捕捉点云中的远程依赖关系和全局特征。TransLO使用基于窗口的掩码点变换器、自注意和帧间掩码注意,以高效地处理点云并预测姿态估计。
- “山姆·奥尔特曼被开除,不再担任OpenAI的首席执行官”
- LastMile AI发布了AiConfig:一个开源的基于配置驱动、源代码控制友好的AI应用开发框架
- 亚马逊研究人员提出KD-Boost:一种新的知识蒸馏算法,专为实时语义匹配而设计
TransLO使用基于窗口的掩码点变换器高效处理点云,包括2D投影、捕捉远程依赖关系的局部变换器和预测姿态估计的MCFA。点云被投影到圆柱面上,采用基于步长的采样层和WMSA进行特征编码。CNN扩大了感受野,并且投影感知掩码解决点云稀疏性问题。姿态扭曲操作有助于迭代细化。消融研究确认了组件的有效性,并且TransLO在KITTI测距航位数据集上表现优于现有方法。
在KITTI测距航位数据集上的实验结果显示,TransLO具有平均旋转RMSE为0.500°/100m和平移RMSE为0.993%的卓越性能。TransLO在大多数评估序列上的表现超过了最近的基于学习的方法,甚至超过了LOAM。消融研究强调了WMSA和二进制掩码的重要性,后者用于过滤异常值。MCFA模块通过建立帧之间的软对应关系改善了平移和旋转误差,在模型的成功中发挥了关键作用。
TransLO框架引入了一个投影步骤,可能导致信息丢失,可能会影响测距航位的准确性。该研究需要对TransLO的计算复杂性进行详细分析,以便全面了解其与其他方法的效率对比。评估仅限于KITTI测距航位数据集,对于该方法在多样化场景中的普适性的问题提出了疑问。缺乏与非变换器方法的比较限制了对TransLO相对优势和劣势的理解。
提出的TransLO网络是一种端到端的基于窗口的掩码点变换器,用于LiDAR测距航位,集成了CNN和变换器,以增强全局特征嵌入和异常值拒绝,实现了在KITTI测距航位数据集上的最先进性能。关键组件包括用于远程依赖关系的WMSA和用于帧关联和姿态预测的MCFA。消融研究证实了WMSA的重要性、用于过滤异常值的二进制掩码,以及MCFA在建立软对应关系方面的关键作用。TransLO在大规模定位和导航中表现出卓越的准确性、效率和全局特征聚焦能力。