This is a 部落格 of outbreak_sen

发表于2025-12-03|论文阅读

Hi3DGen 基本信息项目内容论文标题 High-fidelity 3D Geometry Generation from Images via Normal Bridging 作者 Chongjie Ye, Yushuang Wu, Ziteng Lu, Jiahao Chang, Xiaoyang Guo, Jiaqing Zhou, Hao Zhao, Xiaoguang Han 作者单位 The Chinese University of Hong Kong, Shenzhen（香港中文大学深圳校区）时间 2025 发表会议/期刊方法概览特点文章性质输入标定之后的多视角图像输出 Mesh 所属领域 MeshMVS 1....

论文阅读_Hunyuan3D

发表于2025-12-03|论文阅读

Hunyuan3D 2.0 基本信息项目内容论文标题 Hunyuan3D 作者 Hunyuan3D Team (腾讯团队) 作者单位腾讯 (Tencent) 时间 2025 发表会议/期刊方法概览特点文章性质输入标定之后的多视角图像输出 Mesh 所属领域 MeshMVS 摘要精简 Hunyuan3D 2.0 是一个用于生成高分辨率带纹理3D资产的大规模3D合成系统。系统包含两个基础组件：用于形状生成的大规模模型 Hunyuan3D-DiT，以及用于纹理合成的大规模模型 Hunyuan3D-Paint。形状生成模型基于可扩展的、基于流的扩散Transformer，旨在生成与给定条件图像对齐的几何形状；纹理合成模型则利用强几何和扩散先验，为生成或手工制作的网格生成高分辨率和生动的纹理贴图。此外，团队还构建了多功能、用户友好的生产平台 Hunyuan3D-Studio。实验表明，Hunyuan3D 2.0...

论文阅读_Hunyuan3D2

发表于2025-12-03|论文阅读

Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation 基本信息项目内容论文标题 Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation 作者 Zibo Zhao, Zeqiang Lai, Qingxiang Lin, Yunfei Zhao, Haolin Liu, Shuhui Yang, Yifei Feng, Mingxin Yang, Sheng Zhang, Xianghui Yang, Huiwen Shi, Sicong Liu, Junta Wu 等 (Hunyuan3D Team) 第一单位 Tencent (腾讯) 时间 2025 (根据参考文献及报告内容推断) 发表会议/期刊技术报告 (Tech Report)，可能为 arXiv...

论文阅读_DInstantMesh

发表于2025-12-03|论文阅读

InstantMesh: Efficient 3D Mesh Generation from a Single Image with Sparse-view Large Reconstruction Models 基本信息项目内容论文标题 InstantMesh: Efficient 3D Mesh Generation from a Single Image with Sparse-view Large Reconstruction Models 作者 Jiale Xu, Weihao Cheng, Yiming Gao, Xintao Wang, Shenghua Gao, Ying Shan 作者单位 1. ARC Lab, Tencent PCG; 2. ShanghaiTech University 时间 2024 (ICLR 2024) 发表会议/期刊 International Conference on Learning Representations (ICLR)...

论文阅读_IterMVSNet

发表于2025-12-03|论文阅读

IterMVS 基本信息项目内容论文标题 IterMVS: Iterative Probability Estimation for Efficient Multi-View Stereo 作者 Fangjinhua Wang(又是你), Silvano Galliani, Christoph Vogel, Marc Pollefeys 作者单位 ETH Zurich 时间 2021 发表会议/期刊 CVPR 方法概览特点文章性质输入标定之后的多视角图像输出场景的点云图，每个视角的法线和深度图所属领域 MVS 摘要精简本文提出 IterMVS，一种高效的高分辨率多视图立体（MVS）数据驱动方法。核心是基于 GRU 的概率估计器，其隐藏态编码像素级深度概率分布，通过多轮迭代注入多尺度匹配信息，逐步优化分布并推断深度与置信度。该方法创新结合分类与回归策略，兼顾多模态分布鲁棒性与亚像素精度。在 DTU、Tanks&Temples 和 ETH3D 数据集上验证表明，IterMVS...

论文阅读_LRM

发表于2025-12-03|论文阅读

LRM: Large Reconstruction Model for Single Image to 3D 基本信息项目内容论文标题 LRM: Large Reconstruction Model for Single Image to 3D 作者 Yicong Hong, Kai Zhang, Jiuxiang Gu, Sai Bi, Yang Zhou, Difan Liu, Feng Liu, Kalyan Sunkavalli, Trung Bui, Hao Tan 第一作者单位 Adobe Research (Yicong Hong 同时隶属 Australian National University) 时间 2024 (根据引用文献推断，应为 CVPR 2024) 发表会议/期刊预计为 CVPR 2024 方法概览特点描述输入单张 RGB 图像 (背景已移除) 输出 3D 形状 (以 NeRF / Triplane 形式呈现，可快速提取为 Mesh) 核心目标从单张图像快速 (5秒内)...

论文阅读_LucidDreamer

发表于2025-12-03|论文阅读

LucidDreamer: Domain-free Generation of 3D Gaussian Splatting Scenes 基本信息项目内容论文标题 LucidDreamer: Domain-free Generation of 3D Gaussian Splatting Scenes 作者 Jaeyoung Chung, Suyoung Lee, Hyeongjin Nam, Jaerin Lee, Kyoung Mu Lee 作者单位 ASRI, Department of ECE, Seoul National University, Seoul, Korea 时间 2023 (推断) 发表会议/期刊未明确说明（可能是计算机视觉顶会，如 ICCV/CVPR）方法概览特点文章性质输入文本、RGB图像、RGBD图像输出 3D高斯喷洒场景（3D Gaussian Splatting Scenes）所属领域 3D场景生成摘要精简 LucidDreamer...

论文阅读_MVDream

发表于2025-12-03|论文阅读

MVDream: Multi-view Diffusion for 3D Generation 基本信息项目内容论文标题 MVDream: Multi-view Diffusion for 3D Generation 作者 Yichun Shi, Peng Wang, Jianglong Ye, Long Mai, Kejie Li, Xiao Yang 作者单位 ByteDance (USA), University of California, San Diego 时间 2023（推断）发表会议/期刊未明确说明（应为计算机视觉/图形学顶会）方法概览特点文章性质输入自然语言文本提示（支持少样本图像输入用于个性化生成）输出多视角一致的 3D 模型（NeRF 参数化，可导出网格），支持任意视角渲染所属领域文本驱动三维物体生成（多视角扩散蒸馏，兼顾通用性与一致性）摘要精简 MVDream 的核心任务不是直接生成可用的 3D 模型文件（例如 OBJ/GLTF/PLY 等），而是：从文本 +...

论文阅读_MVSAnywhere

发表于2025-12-03|论文阅读

MVSAnywhere (Multi-View Stereo Anywhere) 基本信息项目内容论文标题 MVSAnywhere (Multi-View Stereo Anywhere) 作者 Sergio Izquierdo, Mohamed Sayed, Michael Firman, Guillermo Garcia-Hernando, Daniyar Turmukhambetov, Javier Civera, Oisin Mac Aodha, Gabriel Brostow, Jamie Watson 作者单位 Niantic 时间 2025 发表会议/期刊 TiPami 方法概览特点文章性质输入标定之后的多视角图像输出场景的点云图所属领域 MVS 摘要精简 MVSA 提出了一种零样本、通用型多视角立体视觉方法，旨在解决传统MVS方法在跨域、跨场景（室内/室外）泛化能力差的问题。它结合了单目与多视角线索，采用自适应代价体解决尺度相关问题，结合 Transformer...

论文阅读_MVSFormer

发表于2025-12-03|论文阅读

MVSFormer 基本信息项目内容论文标题 MVSFormer: Multi-View Stereo by Learning Robust Image Features and Temperature-based Depth 作者 Chenjie Cao, Xinlin Ren, Yanwei Fu 作者单位复旦大学数据科学学院时间 2023 发表会议/期刊 CVPR 方法概览特点文章性质输入多视角输出参考视角深度图所属领域 MVS 摘要本文提出 MVSFormer，一种基于预训练 Vision Transformer（ViT）增强的多视图立体（MVS）方法。核心创新包括：利用 ViT 的长距离依赖建模能力提升反射和无纹理区域的特征表示；提出高效多尺度训练策略，适配不同输入分辨率；通过温度调节策略统一分类式（鲁棒但精度有限）和回归式（精度高但置信度不可靠）深度预测的优势。MVSFormer 包含两种变体：微调分层 ViT（Twins）的完整版，以及冻结自监督...