avatar
文章
148
标签
25
分类
10
主页
博文
  • 分类
  • 时间轴
  • 标签
生活
  • 树洞
  • 作品与鉴赏
关于笔者
LogoThis is a 部落格 of outbreak_sen
主页
博文
  • 分类
  • 时间轴
  • 标签
生活
  • 树洞
  • 作品与鉴赏
关于笔者

This is a 部落格 of outbreak_sen

论文阅读_MASt3R-SFM
发表于2025-12-03|论文阅读
基本信息 项目 内容 论文标题 MUSt3R: Multi-view Network for Stereo 3D Reconstructio 作者 作者单位 NAVER LABS Europe(欧洲Naver实验室) 时间 2024.6 发表会议/期刊 全称 方法概览 特点 文章性质 输入 单张 RGB 图像 输出 所属领域 一个 3D 点、一个置信度值和一个局部特征。 创新点 在 DUSt3R 前额外加一个 network 输出稠密的 local features,并添加 matching loss 来训练。最后引入一种快速相互匹配方案,能够将匹配速度提高几个数量级。 网络架构 如何匹配? 背景知识 匹配方法通常被归结为一个三步流程,首先提取稀疏且可重复的关键点,然后用局部不变特征描述它们,最后通过比较它们在特征空间中的距离来配对离散的关键点集。SIFT在 COLMAP等 3D...
论文阅读_MASt3R
发表于2025-12-03|论文阅读
基本信息 项目 内容 论文标题 Grounding Image Matching in 3D with MASt3R 作者 作者单位 NAVER LABS Europe(欧洲Naver实验室) 时间 2024.6 发表会议/期刊 全称 方法概览 特点 文章性质 输入 单张 RGB 图像 输出 所属领域 一个 3D 点、一个置信度值和一个局部特征。 创新点 在 DUSt3R 前额外加一个 network 输出稠密的 local features,并添加 matching loss 来训练。最后引入一种快速相互匹配方案,能够将匹配速度提高几个数量级。 网络架构 如何匹配? 背景知识 匹配方法通常被归结为一个三步流程,首先提取稀疏且可重复的关键点,然后用局部不变特征描述它们,最后通过比较它们在特征空间中的距离来配对离散的关键点集。SIFT在 COLMAP等 3D...
论文阅读_MASt3R-Slam
发表于2025-12-03|论文阅读
基本信息 项目 内容 论文标题 MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors 作者 Riku Murai, Eric Dexheimer, Andrew J. Davison 作者单位 Imperial College London(帝国理工) 时间 2024.6 发表会议/期刊 全称 方法概览 特点 文章性质 输入 图像对 输出 三维信息,图像位姿 所属领域 SLAM视觉同步定位和映射Visual simultaneous localisation and...
论文阅读_MoSca
发表于2025-12-03|论文阅读
基本信息 项目 内容 论文标题 MoSca: Dynamic Gaussian Fusion from Casual Videos via 4D Motion Scaffolds 作者 Jiahui Lei1 Yijia Weng2 Adam W. Harley2 Leonidas Guibas2 Kostas Daniilidis1,3 作者单位 宾夕法尼亚大学 斯坦福大学 Archimedes, Athena RC 时间 20241129axiv 发表会议/期刊 方法概览 特点 文章性质 输入 无位姿单目视频 输出 可渲染的动态场景,表示为一组动态高斯分布,并在相机参数未知的情况下恢复其焦距和位姿。 所属领域 4D重建 一句话总结做了什么 MoSca 从任意单目视频中重建可渲染的动态场景。核心思想是将2D视频输入提升为一种新颖的4D动态场景表示形式命名为运动骨架(Motion Scaffolds,...
论文阅读_MoGe
发表于2025-12-03|论文阅读
基本信息 项目 内容 论文标题 MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervisio 作者 Ruicheng Wang1⋆ Sicheng Xu2 Cassie Dai3⋆ Jianfeng Xiang4⋆ Yu Deng2 Xin Tong2 Jiaolong Yang2† 作者单位 USTC Microsoft Research Tsinghua University 时间 2025 发表会议/期刊 方法概览 特点 文章性质 输入 单张 RGB 图像 输出 具有未知尺度的仿射不变点图 所属领域 MGE:Monocular geometry...
论文阅读_MoVieS
发表于2025-12-03|论文阅读
基本信息 项目 内容 论文标题 MoVieS: Motion-Aware 4D Dynamic View Synthesis in One Second一秒钟内实现运动感知 4D 动态视图合成 作者 Chenguo Lin1∗, Yuchen Lin1,3∗, Panwang Pan2†,Yifan Yu2, Honglei Yan2, Katerina Fragkiadaki3, Yadong Mu∗:平等贡献;†:项目负责人;‡:通讯作者。 作者单位 北京大学、字节跳动、卡内基梅隆大学 时间 20250714axiv 发表会议/期刊 方法概览 特点 文章性质 输入 单目视频 输出 4D 动态新颖视图: 所属领域 新视角生成 一句话总结做了什么 设计了前馈模型可在一秒钟内从单目视频中合成动态高斯然后合成4D 动态新颖视图,首次允许对外观、几何形状和运动进行统一建模 摘要 引言 创新点 在VGGT基础上,MoVieS,这是第一个前馈框架,它联合对外观、几何形状和运动进行建模,以从单目视频中感知 4D...
论文阅读_Probe3D
发表于2025-12-03|论文阅读
Probe3D 探究2D的大模型能不能利用在3D的任务中,用于depth,normal,match任务 比较模型 DeIT MAE DINO CLIP SAM StableDiffusion DINO v2 都是ViT-B构型,StableDiffution是UNet 监督方法不一样, StableDiffusion,DINO v2两个方法最好 DPT head是什么 DUSt3R CROCO是一个MAE的结构,利用了多视角信息来猜Mask的内容 相对位姿估计,直接用三维点最小而成不行,因为离群点噪声太大,所以现在都用ransec+pnp MVS的时候相对位姿直接用最小二乘就可以了,因为图足够多了 FlowMap 利用光流做deep SFM TransFormer Bert Bert是将文章分割出空格,然后预测空格中文字,是一个无监督的 ViT 把图片分割成16*16方块 MAE 2021年arxiv,Masked Autoencoders Are Scalabel Vison Learners,何凯明 *是同等贡献的意思 十字号是project...
论文阅读_ResNet
发表于2025-12-03|论文阅读
基本信息 项目 内容 论文标题 Deep Residual Learning for Image Recognition 作者 Kaiming He(何恺明)、Xiangyu Zhang、Shaoqing Ren、Jian Sun(微软亚洲研究院) 作者单位 微软亚洲研究院 时间 2016 发表会议/期刊 方法概览 特点 文章性质 输入 单张 RGB 图像 输出 分类、分割 所属领域 视觉 Transformer 创新点 网络越深,性能越好当网络超过一定深度(如 20 层以上),继续加深反而导致性能下降,这被称为 网络退化(Degradation Problem)。梯度在反向传播时逐层衰减,提出 残差学习(Residual Learning) 和 跳跃连接(Skip Connection),解决了深度网络训练难题。 残差结果 瓶颈结构(Bottleneck)用于 ResNet-50 及以上 Batch Normalization(BN) 是 ResNet 成功的关键组成部分之一,它与 残差连接...
论文阅读_SAM
发表于2025-12-03|论文阅读
基本信息 项目 内容 论文标题 End-to-End Object Detection with Transformers 作者 作者单位 Facebook AI 时间 2023 发表会议/期刊 论文别名 Segment Anything ModelCV 领域的 GPT-3”因为它首次实现了零样本泛化的图像分割无需任何微调,SAM 就能对任何图像中的任何物体进行分割,只要你给它一个提示(point, box, text, or mask)。 方法概览 特点 文章性质 输入 输出 所属领域 目标检测 创新点 给定一张图像和一个提示(prompt),SAM 输出一个精确的分割掩码(mask)。- 提示可以是: 一个点(是前景还是背景),一个边界框(bounding box),一段文本描述,已有掩码(用于细化) 网络架构 图像编码器使用 **Vision Transformer **(ViT) 在 SA-1B 数据集 上预训练(使用 DINO 和 MAE...
论文阅读_Slam3R
发表于2025-12-03|论文阅读
基本信息 项目 内容 论文标题 VGGT-SLAM: Dense RGB SLAM Optimized on the SL(4) Manifold 作者 陈宝权 作者单位 北京大学陈宝权团队联合香港大学 时间 2025 发表会议/期刊 CVPR Highlight 方法概览 特点 文章性质 输入 图片序列(SLAM定义可传入激光IMU等各种机器人传感 **输出 一个环境的几何/语义地图(Map):点云,稀疏的点云ORBSLAM,稠密的点云LSDSLAM,高斯场景 一条智能体的运动轨迹(Trajectory)图片位姿 片位姿 片位姿 所属领域 SLAM(Simultaneous Localization and Mapping, 背景 问题 说明 dense slam 现有密集SLAM方法在精度、完整性、效率中至少存在一项缺陷;单目SLAM系统常效率低下,如NICER-SLAM速度远低于1...
1234…15
avatar
outbreak_sen
an interesting man
文章
148
标签
25
分类
10
Follow Me
公告
This is my Blog
最新文章
无标题2025-12-08
无标题2025-12-08
论文阅读_MoGe 22025-12-03
论文阅读_变分自编码器VAE2025-12-03
学习笔记_SFM2025-12-03
分类
  • swift2
  • 传统图形学1
  • 嵌入式1
  • 深度学习6
  • 相机驱动开发1
  • 编译1
  • 论文阅读125
  • 这个一个测试11
标签
SFM 硬触发 mindNLP 实习 证券投资 python LLVM 相机驱动 Hexo-butterfly nodejs 这也是一个测试 算子 深度学习 GAN生成对抗模型 Muilt View Stereo mindspore实习 Hexo QT colmap huggingface siwft shell Mindspore 深度相机 大恒
归档
  • 十二月 2025 115
  • 八月 2025 1
  • 七月 2025 3
  • 六月 2025 8
  • 三月 2025 4
  • 二月 2025 16
  • 十二月 2024 1
网站信息
文章数目 :
148
本站访客数 :
本站总浏览量 :
最后更新时间 :
©2019 - 2025 By outbreak_sen
框架 Hexo|主题 Butterfly