SFM

SFM是什么？和MVS的对比？

运动恢复结构（SfM）问题是从二维（2D）图像的集合中恢复静止场景的三维（3D）结构的问题

3D点阵可以通过MeshLab来重建稀疏的Mesh。也可以通过PMVS（Patch-based Multi-view Stereo）来重建Dense的Mesh

SfM 涉及三个主要阶段：

提取图像中的特征（例如，兴趣点、线条等）并在图像之间匹配这些特征
1. SIFT，SURF来提取并匹配，也可以用最新的AKAZE（SIFT的改进版，2010）来匹配。
2. 误匹配会造成较大的Error，所以要对匹配进行筛选，目前流行的方法是RANSAC（Random Sample Consensus）。2D的误匹配点可以应用3D的Geometric特征来进行排除。
相机运动估计–外参（使用提取的特征）
使用估计的外参特征恢复 3D 结构（通过最小化所谓的重投影误差）

该技术旨在优化称为total reprojection error的成本函数

增量式（incremental/sequential）：
- 优–对错误的匹配点有较强鲁棒性，总体精度更高
- 劣运行时间长，drift: error随着camera registration(相机校准)逐步积累
全局式（global）：
- 优–避免了drift的问题（更反映了图像的全局性), 速度快（只需解决两个global synchronization(global SfM算法中的全局同步操作)+一次BA
  (光束平差法)）
- 劣–对错误的匹配点鲁棒性较差，且错误难以修正 (error会沿着pipeline累积）
混合式（hybrid）：
- 全局估计摄像机旋转矩阵，增量估计摄像机中心
层次式（hierarchical）：
- 执行顺序上采用了层次式的聚类策略（clustering）。其先生成一棵聚类二叉树（binary cluster tree），然后算法自底向上进行处理:算法的每次迭代合并具有最小距离的两个clusters，每个cluster可以是一张图片，也可以是一个合并之后的cluster。
基于语义的(Semantic)