基本信息

项目 内容
论文标题 Grounding Image Matching in 3D with MASt3R
作者
作者单位 NAVER LABS Europe(欧洲Naver实验室)
时间 2024.6
发表会议/期刊
全称

方法概览

特点 文章性质
输入 单张 RGB 图像
输出
所属领域 一个 3D 点、一个置信度值和一个局部特征。

创新点

  1. 在 DUSt3R 前额外加一个 network 输出稠密的 local features,并添加 matching loss 来训练。最后引入一种快速相互匹配方案,能够将匹配速度提高几个数量级。

网络架构


如何匹配?

背景知识

匹配方法通常被归结为一个三步流程,首先提取稀疏且可重复的关键点,然后用局部不变特征描述它们,最后通过比较它们在特征空间中的距离来配对离散的关键点集。SIFT在 COLMAP等 3D 重建流程中的成功。
基于关键点的方法通过将匹配简化为关键点袋(BoK)问题,丢弃了对应任务的全局几何上下文信息。这使得它们在具有重复模式或低纹理区域的情况下特别容易出错,而这些区域实际上对于局部描述符来说是不适定的。解决此问题的一种方法是在配对步骤中引入全局优化策略,通常利用一些关于匹配的先验知识。如SuperGlue。
但是,如果关键点及其描述符尚未编码足够的信息,则在匹配过程中利用全局上下文可能为时已晚。因此,另一个方向是考虑密集的整体匹配,即完全避免关键点,并一次匹配整个图像。如LoFTR将图像视为一个整体,并且得到的对应集是密集的。