avatar
文章
148
标签
25
分类
10
主页
博文
  • 分类
  • 时间轴
  • 标签
生活
  • 树洞
  • 作品与鉴赏
关于笔者
LogoThis is a 部落格 of outbreak_sen
主页
博文
  • 分类
  • 时间轴
  • 标签
生活
  • 树洞
  • 作品与鉴赏
关于笔者

This is a 部落格 of outbreak_sen

MASt3R-SLAM
发表于2025-12-03|论文阅读
阅读MASt3R-SLAM的代码,重点关注检索、回环部分 通过MASt3R_ViTLarge_BaseDecoder_512_catmlpdpt_metric_retrieval_trainingfree生成特征进行检索,track成功进行全局因子图优化,track失败则回环检测,检测成功则再因子图优化,优化成功就可以继续,但是如果失败就直接continue,不添加到keyframe?MASt3R-SLAM 系统中的 RetrievalDatabase 并非传统的词袋模型,而是一个基于深度学习特征的高效图像检索系统复杂度相对于图像数量是准线性的(nearly linear),非常适合大规模场景 VGGT-LONG的论文和代码,重点关注里面回环检测相关的技术 VGGT-Long 的流程遵循:“Chunk it → Loop it → Align it” 的三阶段设计。回环匹配(Loop it)是在 chunk...
Label软件调研和使用
发表于2025-12-03|论文阅读
Label软件调研和使用 注释 2D 人体姿势的任务涉及在图像中识别和标记人体上的关键点。 首先进行一个人体数据集格式的调研 有几个人体数据集比如coco17点,coco-wholebody133点,Halpe136点,然后对应每种数据集格式有不同的model权重,和不同的config文件,即用什么估计,估计出来几个点,然后经过我的调研,17个点就足以描述项目了,腰部的旋转就是脖子和腰部的夹角角度嘛,所以我现在要找一个做coco数据集标注的软件,其实市面上大多数还是coco数据集的,然后只不过一开始我觉得骨架不一致给吓倒了。 PoseAnnotation(真难用) https://github.com/MiraPurkrabek/PoseAnnotator 该工具主要针对 COCO 样式的注释实现,因此需要其文件结构。每个数据集应有 3 个子文件夹 annotations、val2017 和可选的 train2017 但我们为我们的用例创建了一些自定义姿势格式。如果您使用 option --pose-format coco_with_thumbs...
MVS框架开源整理
发表于2025-12-03|论文阅读
MVS框架开源整理 可视化程度比较好的meshlab,更适合OS X平台的MVE,以及能够配套使用的完整库OpenMVG和OpenMVS Incremental 方向的论文: 要追溯重建思想的话就到Marr的奠基理论,以及分层重建思想了最早最著名的奠基工作,没记错的话是偶像男神Marc Pollefeys’ research page 自标定算法开始成熟后,摆脱人肉重建的曙光出现,全自动的创世机器有望完成,后续跟进了很多研究,可以看一下引用这篇文章的研究 后面就是完全开源、稳定的Bundler(Modeling the World from Internet Photo Collections ,Prof. Noah Snavely)。Bundler即使到了现在依然有做baseline的精度和鲁棒性,作为最早开源的代码之一,对SfM的发展起到了至关重要的作用,后续的很多伟大工作无不受其影响; 后续出现的诸如VisualSFM(Towards Linear-Time Incremental Structure from Motion, ChangChang Wu) , ...
基于3r的slam方法总结
发表于2025-12-03|论文阅读
基于3r的slam方法总结 vggt-long 特点 值 foundation model vggt loop detecting 通过dino然后用一个 aggregating module进行场景识别 主要方法 滑窗,滑窗区域有重叠区域,滑窗帧直接做vggt,重叠帧是一个密集匹配,直接做SIM(3)拼接 是否提取特征并匹配 none Hier-SLAM++ 特点 值 foundation model dust3r loop detecting none 主要方法 两帧输入到dust3r可以获得初始的pose和pointmap,然后他不做匹配,而是用之前3dgs的方法,在渲染过程中使用最小化渲染损失进行几何矫正优化SE3参数 额外的特点 用大语言模型+ 3D...
无图形安装matalb笔记
发表于2025-12-03|论文阅读
无图形安装matalb笔记 Linux MATLAB R2024a v24.1最新版! 百度网盘链接:https://pan.baidu.com/s/17ERtLgm950phpjnMRaDugg?pwd=1kcw 提取码:1kcw 秘钥:21471-07182-41807-00726-32378-34241-61866-60308-44209-03650-51035-48216-24734-36781-57695-35731-64525-44540-57877-31100-06573-50736-60034-42697-39512-63953 Linux MATLAB R2023a update5 百度网盘链接:https://pan.baidu.com/s/1SXlkE7t7EYLEnmrw5j_J4g?pwd=le0n 提取码:le0n 安装步骤:https://mp.weixin.qq.com/s/9TjL87maMNsEfuHBJJA_Hw Linux MATLAB R2023b...
深度图误差
发表于2025-12-03|论文阅读
1. MAE (Mean Absolute Error) MAE=1N∑i∣dipred−digt∣\text{MAE} = \frac{1}{N}\sum_i |d_i^{pred} - d_i^{gt}| 表示预测深度和真实深度的平均绝对误差。 数值越小越好。 单位和深度本身一致(比如米)。 2. RMSE (Root Mean Square Error) RMSE=1N∑i(dipred−digt)2\text{RMSE} = \sqrt{\frac{1}{N}\sum_i (d_i^{pred} - d_i^{gt})^2} 衡量误差的均方根,更关注大误差。 和 MAE 类似,但对大偏差更敏感。 3. AbsRel (Absolute Relative Error) AbsRel=1N∑i∣dipred−digt∣digt\text{AbsRel} = \frac{1}{N}\sum_i \frac{|d_i^{pred} - d_i^{gt}|}{d_i^{gt}} 相对误差(相对于真实深度归一化)。 可以衡量预测偏离真实值的相对程度。 4....
论文阅读_AA-MVSNet
发表于2025-12-03|论文阅读
AA-RMVSNet (Adaptive Aggregation Recurrent Multi-view Stereo Network) 基本信息 项目 内容 论文标题 Adaptive Aggregation Recurrent Multi-view Stereo Network 作者 Zizhuang Wei, Qingtian Zhu, Chen Min, Yisong Chen, Guoping Wang* 作者单位 Peking University(北京大学) 时间 2021 发表会议/期刊 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 场景的点云图,每个视角的法线和深度图 所属领域 MVS 摘要精简 本文提出一种基于长短期记忆(LSTM)的递归多视图立体网络 ...
论文阅读_3D-C2FT
发表于2025-12-03|论文阅读
3D-C2FT 基本信息 项目 内容 论文标题 Hunyuan3D 作者 Hunyuan3D Team (腾讯团队) 作者单位 腾讯 (Tencent) 时间 2025 发表会议/期刊 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 Mesh 所属领域 MeshMVS 3D-C2FT: Coarse-to-fine Transformer for Multi-view 3D Reconstruction 论文总结 方法名称:3D-C2FT (3D Coarse-to-fine Transformer) 作者:Leslie Ching Ow Tiong, Dick Sigmund, Andrew Beng Jin Teoh 第一单位:韩国科学技术研究院 (Korea Institute of Science and Technology) 发表年份与会议/期刊:2022年,发表于国际计算机视觉会议 (ICCV) 或其他计算机视觉顶会...
论文阅读_CDS-MVSNet
发表于2025-12-03|论文阅读
CDS-MVSNet(Curvature-Guided Dynamic Scale Networks for Multi-view Stereo) 基本信息 项目 内容 论文标题 CDS-MVSNet(Curvature-Guided Dynamic Scale Networks for Multi-view Stereo) 作者 Khang Truong Giang, Soohwan Song, Sungho Jo 作者单位 韩国科学技术院(KAIST) 时间 2022 发表会议/期刊 ICLR 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 场景的点云图,每个视角的法线和深度图 所属领域 MVS 摘要精简 本文提出一种基于曲率引导动态尺度特征提取的多视图立体网络 CDS-MVSNet,核心是曲率引导动态尺度特征网络(CDSFNet)。**CDSFNet ...
论文阅读_CIDER
发表于2025-12-03|论文阅读
CIDER(Correlation cost volume and Inverse DEpth Regression)其实是抄CwcNet这个stereo网络 基本信息 项目 内容 论文标题 CIDER(Correlation cost volume and Inverse DEpth Regression) 作者 Qingshan Xu、Wenbing Tao 作者单位 Huazhong University of Science and Technology(华中科技大学) 时间 2019 发表会议/期刊 方法概览 特点 文章性质 输入 多视角 输出 参考视角深度图 所属领域 MVS 1. 摘要精简 提出一种基于相关代价体和逆深度回归的多视图立体匹配(MVS)方法 CIDER,解决现有方法的可扩展性和精度瓶颈。该方法通过平均分组相关相似度度量构建轻量级代价体,大幅降低内存消耗和计算负担;采用级联 3D U-Net 对代价体进行正则化,聚合更多上下文信息;将 MVS...
1…678…15
avatar
outbreak_sen
an interesting man
文章
148
标签
25
分类
10
Follow Me
公告
This is my Blog
最新文章
无标题2025-12-08
无标题2025-12-08
论文阅读_MoGe 22025-12-03
论文阅读_变分自编码器VAE2025-12-03
学习笔记_SFM2025-12-03
分类
  • swift2
  • 传统图形学1
  • 嵌入式1
  • 深度学习6
  • 相机驱动开发1
  • 编译1
  • 论文阅读125
  • 这个一个测试11
标签
SFM 硬触发 mindNLP 实习 证券投资 python LLVM 相机驱动 Hexo-butterfly nodejs 这也是一个测试 算子 深度学习 GAN生成对抗模型 Muilt View Stereo mindspore实习 Hexo QT colmap huggingface siwft shell Mindspore 深度相机 大恒
归档
  • 十二月 2025 115
  • 八月 2025 1
  • 七月 2025 3
  • 六月 2025 8
  • 三月 2025 4
  • 二月 2025 16
  • 十二月 2024 1
网站信息
文章数目 :
148
本站访客数 :
本站总浏览量 :
最后更新时间 :
©2019 - 2025 By outbreak_sen
框架 Hexo|主题 Butterfly