论文阅读_TransformerFusion
TransformerFusion 基本信息 项目 内容 论文标题 TransformerFusion:Monocular RGB Scene Reconstruction using Transformers 作者 Aljaz Bozic, Pablo Palafox, Justus Thies, Angela Dai, Matthias Niessner 作者单位 Technical University of Munich (TUM) 时间 2021 发表会议/期刊 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 Mesh 所属领域 MeshMVS 摘要精简 本文提出 TransformerFusion,一种基于 Transformer 的单目 RGB 视频 3D 场景重建方法。该方法将视频帧通过 Transformer 网络融合为体素特征网格,以隐式表示场景;核心是利用 Transformer 的注意力机制,为每个 3D ...
论文阅读_UCSNet
UCSNet 基本信息 项目 内容 论文标题 UCSNet (Uncertainty-aware Cascaded Stereo Network) 作者 Shuo Cheng, Zexiang Xu, Shilin Zhu, Zhuwen Li, Li Erran Li, Ravi Ramamoorthi, Hao Su 作者单位 University of California San Diego 时间 2020 发表会议/期刊 方法概览 特点 文章性质 输入 多视角 输出 参考视角深度图 所属领域 MVS 1. 摘要精简 提出一种不确定性感知的级联立体匹配网络 UCS-Net,用于多视图图像的 3D 重建。该方法摒弃传统固定深度假设的代价体,提出自适应薄体积(ATV),其深度假设随空间位置变化,适配前一阶段的像素级深度预测不确定性。UCS-Net 包含三阶段级联架构:第一阶段用小型标准平面扫描代价体预测低分辨率深度;后两阶段通过 ATV 逐步细化,以更高分辨率和精度优化深度。ATV ...
论文阅读_Uni-MVSNet
UniMVSNet 基本信息 项目 内容 论文标题 Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference 作者 YRui Peng, Rongjie Wang, Zhenyu Wang, Yawen Lai, Ronggang Wang 作者单位 北京大学电子与计算机工程学院 时间 2022 发表会议/期刊 方法概览 特点 文章性质 输入 多视角 输出 参考视角深度图 所属领域 MVS 1. 摘要精简 本文提出 UniMVSNet,通过统一深度表征和统一焦点损失,解决现有 MVS 方法中回归与分类的固有缺陷。**统一表征(Unification)兼具分类对代价体的直接约束能力和回归的亚像素深度预测能力;统一焦点损失(UFL)能更合理地解决样本不平衡问题,**适配连续标签。基于粗到精框架,该方法在 DTU 和 Tanks and Temples...
论文阅读_VGGT-SLAM
基本信息 项目 内容 论文标题 VGGT-SLAM: Dense RGB SLAM Optimized on the SL(4) Manifold 作者 Dominic Maggio Hyungtae Lim Luca Carlone 作者单位 MIT 时间 2025 发表会议/期刊 方法概览 特点 文章性质 输入 图片序列(SLAM定义可传入激光IMU等各种机器人传感 **输出 一个环境的几何/语义地图(Map):点云,稀疏的点云ORBSLAM,稠密的点云LSDSLAM,高斯场景 一条智能体的运动轨迹(Trajectory)图片位姿 片位姿 片位姿 所属领域 SLAM(Simultaneous Localization and...
论文阅读_VisMVSNet
Vis-MVSNet 基本信息 项目 内容 论文标题 Vis-MVSNet (Visibility-aware Multi-view Stereo Network) 作者 Lingyang Zhang, Yao Yao, Shiwei Li, Zixin Luo, Jian Fang 作者单位 The Hong Kong University of Science and Technology 时间 2020 发表会议/期刊 CVPR 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 场景的点云图,每个视角的法线和深度图 所属领域 MVS 1. 摘要精简 提出一种可见性感知的多视图立体匹配网络 Vis-MVSNet,解决现有方法未显式考虑像素级可见性导致遮挡区域代价聚合错误的问题。该网络通过匹配不确定性估计显式推断并融合像素级遮挡信息,成对深度图与不确定性图联合推断,不确定性图作为权重指导多视图代价体融合,抑制遮挡像素的不利影响。结合分组相关和粗到精策略进一步提升重建质量,在...
论文阅读_One-2-3-45
One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization 基本信息 项目 内容 论文标题 One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization 作者 Minghua Liu (UC San Diego), Chao Xu (UCLA), Haian Jin (Cornell/ZJU), Linghao Chen (UC San Diego/ZJU), Mukund Varma T (IIT Madras), Zexiang Xu (Adobe), Hao Su (UC San Diego) 作者单位 UC San Diego(第一单位) 时间 2023(根据引用和内容推断) 发表会议/期刊 暂未明确标注,应属预印本或待发表论文 方法概览 特点 文章性质 输入 单张RGB图像 输出 带纹理的三角网格...
论文阅读_iB-MVSNet
IB-MVSNet 基本信息 项目 内容 论文标题 IB-MVS (Iterative Algorithm for Deep Multi-View Stereo based on Binary Decisions) 作者 Christian Sormann, Mattia Rossi, Andreas Kuhn, Friedrich Fraundorfer 作者单位 Graz University of Technology (奥地利格拉茨技术大学,Institute of Computer Graphics and Vision) 时间 2021 发表会议/期刊 方法概览 特点 文章性质 输入 校正图像对 输出 视差图 所属领域 双目stereo 摘要 本文提出 ...
PP-LCNet
PP-LCNet PP-LCNet《A lightweight CPU convolutional Neural...
使用OBS上传大文件并再modelArts服务器上访问
使用OBS上传大文件并再modelArts服务器上访问 背景 我需要在华为服务器上跑代码,数据集达45G,单次只能从本地上传100M,然后听说大文件通过OBS很方便,这里记录如何使用OBS来上传,看要求这里应该是只需要一个OBS的URL。 在Notebook中可以通过调用ModelArts的Moxing接口或者SDK接口与OBS交互,将Notebook中的文件上传至OBS,或者下载OBS中的文件至Notebook中。MoXing是ModelArts自研的分布式训练加速框架,MoXing提供了一套文件对象API,可以用来读写OBS文件。 首先学习OBS的基本概念 使用华为云的对象存储服务就是OBS,你需要把本地的文件拷贝到OBS中,然后在notebook里访问OBS 首先需要在华为云的OBS里创建一个帐号再创建一个筒,这个桶里有桶名称,账户AK,密码SK,和地址,这个地址是提供OBS服务的地址,也叫做Endpoint? 然后再在本地使用obsutil或者其他的obs...
SMPL骨骼蒙皮算法
骨骼蒙皮算法 smpl是指2015 马普的一篇文章“SMPL: a skinned multi-person linear model" 人体可以理解为是一个基础模型和在该模型基础上进行形变的总和,在形变基础上进行PCA,得到刻画形状的低维参数——形状参数(shape);同时,使用运动树表示人体的姿势,即运动树每个关节点和父节点的旋转关系,该关系可以表示为三维向量,最终每个关节点的局部旋转向量构成了smpl模型的姿势参数(pose)。 basicModel 官方的basicModel_m_lbs_10_207_0_v1.0.0.pkl包含了[‘v_template’, ‘weights’, ‘posedirs’, ‘pose’, ‘trans’, ‘shapedirs’, ‘betas’, ‘J’] v_template:smpl的基础模型,是一个T-pose,产生的mesh是在T-Pose基础上形变而来 weights:6890 * 24 混合权重矩阵,即关节点对顶点的影响权重 (第几个顶点受哪些关节点的影响且权重分别为多少)...
