avatar
文章
205
标签
71
分类
15
主页
博文
  • 分类
  • 时间轴
  • 标签
生活
  • 树洞
  • 作品与鉴赏
关于笔者
LogoThis is a 部落格 of outbreak_sen论文阅读_ThreeStudio
主页
博文
  • 分类
  • 时间轴
  • 标签
生活
  • 树洞
  • 作品与鉴赏
关于笔者

论文阅读_ThreeStudio

发表于2025-12-03|更新于2026-03-09|论文阅读
|浏览量:

ThreeStudio

threestudio是今年3D AIGC领域内很好的开源项目,以统一的框架集成实现了**| ProlificDreamer | DreamFusion | Magic3D | SJC | Latent-NeRF | Fantasia3D | TextMesh | | Zero-1-to-3 | Magic123 | HiFA | SDI |
| InstructNeRF2NeRF | Control4D |**项目,覆盖了text prompts, single images和few-shot images为condition的3D 生成。深度学习框架用的是pytorch lighting

文章作者: outbreak_sen
文章链接: http://outbreak-sen.github.io/2025/12/03/%E8%AE%BA%E6%96%87%E9%98%85%E8%AF%BB_ThreeStudio/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 This is a 部落格 of outbreak_sen!
Mesh三维重建
赞助
  • 微信
    微信
  • 支付宝
    支付宝
上一篇
论文阅读_SwinTransformer
SwinTransformer 基本信息 项目 内容 论文标题 作者 作者单位 微软亚洲研究院(MSRA) 时间 2021 发表会议/期刊 论文别名 Shifted WindowTransformer 方法概览 特点 文章性质 输入 输出 所属领域 创新点 对于高分辨率图像,patch序列会非常长,导致计算量和内存消耗巨大,难以应用于目标检测、分割等需要处理高分辨率输入的任务。解决早期视觉Transformer(如ViT)在处理高分辨率图像时计算复杂度极高的问题 Swin Transformer = 分层Patch划分 + 窗口内自注意力 + 移位窗口连接 + Patch Merging下采样。 分层(Hierarchical)结构通过逐步合并patch来构建一个类似CNN的金字塔结构,从而生成多尺度的特征图。 Patch Partition:输入图像首先被分割成不重叠的 4x4 patch(或其他大小),每个 4x4 patch...
下一篇
论文阅读_VGG
基本信息 项目 内容 论文标题 Very Deep Convolutional Networks for Large-Scale Image Recognition_ 作者 作者单位 牛津大学 Visual Geometry Group(VGG) 时间 2014 发表会议/期刊 方法概览 特点 文章性质 输入 单张 RGB 图像 输出 分类、分割 所属领域 视觉 Transformer 创新点 证明了网络深度对性能的重要性,提出了结构简洁、可复用的“小卷积核堆叠”设计范式。AlexNet(8 层)卷积核大(11×11, 5×5),难以扩展 所有卷积层都使用 3×3 卷积核,步长为 1,填充为 1 多个 3×3 卷积堆叠可以模拟大感受野,减少参数,增加非线性(更多 ReLU): 两个 3×3 卷积 ≈ 一个 5×5 卷积(感受野 5×5) 三个 3×3 卷积 ≈ 一个 7×7 卷积(感受野 7×7) VGG 探索了从 11 层到 19 层的多种网络结构。 使用 ReLU 和 Dropout,-...
相关推荐
2025-12-03
论文阅读_MeshMVS
MeshMVS 基本信息 项目 内容 论文标题 MeshMVS(Multi-View Stereo Guided Mesh Reconstruction) 作者 Rakesh Shrestha, Zhiwen Fan, Qingkun Su, Zuozhuo Dai, Siyu Zhu, Ping Tan 作者单位 西蒙弗雷泽大学(Simon Fraser University) 时间 2021 发表会议/期刊 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 Mesh 所属领域 MeshMVS 一、...
2025-12-03
论文阅读_MeshRCNN
MeshRCNN 基本信息 项目 内容 论文标题 Mesh R-CNN 作者 Georgia Gkioxari、Jitendra Malik、Justin Johnson 作者单位 Facebook AI Research (FAIR) 时间 2020 发表会议/期刊 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 Mesh 所属领域 MeshMVS Mesh R-CNN 论文总结 基本信息 方法名称:Mesh R-CNN 作者:Georgia Gkioxari, Jitendra Malik, Justin Johnson 第一单位:Facebook AI Research (FAIR) 发表年份:2019年(推测,文中未明确,引文最新至2019) 发表会议/期刊:应为CVPR或ICCV(文中未明确,但引用格式符合顶会风格) 摘要精简 本文提出 Mesh R-CNN 系统,将 2D 目标感知与 3D 形状预测相结合。该系统基于 Mask R-CNN 扩展,新增 mesh 预测分支,通过...
2025-12-03
论文阅读_Pixel2Mesh++
Pixel2Mesh++ 基本信息 项目 内容 论文标题 Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images 作者 Chao Wen, Yinda Zhang, Chenjie Cao, Zhuwen Li, Xiangyang Xue, Yanwei Fu 作者单位 Fudan University(复旦大学,Shanghai Key Lab of Intelligent Information Processing, School of Computer Science) 时间 2021 发表会议/期刊 IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 Mesh 所属领域 MeshMVS 一、 摘要精简 本文提出一种基于图卷积神经网络的框架,从少量多视角 RGB...
2025-12-03
论文阅读_Pixel2Mesh
Pixel2Mesh 基本信息 项目 内容 论文标题 Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images 作者 Nanyang Wang、Yinda Zhang、Zhuwen Li、Yanwei Fu、Wei Liu、Yu-Gang Jiang(前三位为同等贡献作者,Yu-Gang Jiang 为通讯作者) 作者单位 Fudan University(复旦大学,Shanghai Key Lab of Intelligent Information Processing, School of Computer Science) 时间 2018 发表会议/期刊 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 Mesh 所属领域 MeshMVS 一、...
2025-12-03
论文阅读_TransformerFusion
TransformerFusion 基本信息 项目 内容 论文标题 TransformerFusion:Monocular RGB Scene Reconstruction using Transformers 作者 Aljaz Bozic, Pablo Palafox, Justus Thies, Angela Dai, Matthias Niessner 作者单位 Technical University of Munich (TUM) 时间 2021 发表会议/期刊 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 Mesh 所属领域 MeshMVS 摘要精简 本文提出 TransformerFusion,一种基于 Transformer 的单目 RGB 视频 3D 场景重建方法。该方法将视频帧通过 Transformer 网络融合为体素特征网格,以隐式表示场景;核心是利用 Transformer 的注意力机制,为每个 3D ...
2025-12-03
论文阅读_CLAY和Hunyuan3D2.0串讲
论文阅读_CLAY和Hunyuan3D2.0串讲 论文:Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation 论文:CLAY: A Controllable Large-scale Generative Model for Creating High-quality 3D Assets 两个的思路基本一致,现在只通过hunyuan3D 2.0进行讲解 Hunyuan3D 2.0 系统包含 两个基础模型,原因geometry 和 appearance 解耦更稳定。: 1️⃣ Hunyuan3D-DiT生成 几何形状(mesh) 2️⃣ Hunyuan3D-Paint生成 texture map Shape生成模块Hunyuan3D-DiT Shape生成包含两个部分: 1ShapeVAE + Diffusion Transformer ShapeVAE(核心) ShapeVAE作用: 12mesh → latent tokenslatent tokens...
avatar
outbreak_sen
an interesting man
文章
205
标签
71
分类
15
Follow Me
公告
This is my Blog
目录
  1. ThreeStudio
最新文章
Hydra 与 OmegaConf 入门教程2026-03-23
SSH密钥认证2026-03-23
论文阅读_Concerto2026-03-23
论文阅读_FUSER2026-03-23
论文阅读_MC-MVSNe2026-03-23
©2019 - 2026 By outbreak_sen
框架 Hexo|主题 Butterfly