溧水区住房建设局网站google网站搜索
回环检测的关键:如何有效的检测出相机经过同一个地方。如果成功的检测到可以为后端的位姿图提供更多有效数据,得到全局一致的估计。
回环检测提供了当前数据和所有历史数据的关联,还可以用回环检测进行重定位。
具体方法:
一:基于外观的,和前端和后端的估计无关,仅仅根据两幅图像的相似度确定回环检测关系。
核心问题:如何计算图像间的相似性。
计算准确率和召回率。准确率是算法提取到的所有回环中是真实回环的概率;召回率是真实回环中被正确检测出的概率。SLAM中,对准确率的要求更高,召回率相对宽容点。
二:词袋模型
先介绍词袋(Bags of Words,BOW)的做法,用图像上有哪几种特征来描述一幅图像。
当相机发生少量运动,只要物体在视野中,仍然保证描述向量不发生变化。
该方法分为两个步骤:
步骤一:字典的生成方式;
字典由单词组成,单词代表一个概念,与特征点不同,单词是某一类特征的组合。所以,字典生成问题类似于一个聚类问题。
例如,对N张图像提取了特征点,想找出一个有k个单词的字典,即有N个数据,想要归成k个类,①使用K-means方法可以把提取到的特征点聚类成一个含有k的单词的字典,然后思考如何根据图像中的某个特征点查找字典中相应的单词。
②使用k叉数来表达字典。当有N个特征点,希望构建一个深度为d,每次分叉为k的树,做法如下:
在根节点,用K-means把所有样本聚成k类,这样的到了第一层
对第一层的每个节点,把属于该节点的样本再聚成k类,得到下一层。
以此类推,最后得到叶子层。叶子层就是Words.
最终在叶子层构建了单词,而树结构中的中间节点仅供快速查找时使用,这样一个k分支、深度为d的树可以容纳k^d个单词。
代码feature_training.cpp对十张图片训练了一个小的字典
步骤二:根据字典计算两幅图像的相似性。
根据TF-IDF计算图像的相似性,书295页进行了详细介绍。
总结:增加字典规模(需要更多的图片进行训练),图像的相似性更明显。
检测到回环后还需要验证,一个方法是建立回环的缓存机制:认为单次检测到的回环并不足以构成良好的约束,而在一段时间内一直检测到回环,才是正确的回环。另一个方法是空间上的一致性检测:对回环检测到的两个帧进行特征匹配,估计相机的运动,然后把运动放到之前的位姿图中,检查与之前的估计是否有很大的出入。