This is a 部落格 of outbreak_sen

发表于2025-12-03|论文阅读

One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization 基本信息项目内容论文标题 One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization 作者 Minghua Liu (UC San Diego), Chao Xu (UCLA), Haian Jin (Cornell/ZJU), Linghao Chen (UC San Diego/ZJU), Mukund Varma T (IIT Madras), Zexiang Xu (Adobe), Hao Su (UC San Diego) 作者单位 UC San Diego（第一单位）时间 2023（根据引用和内容推断）发表会议/期刊暂未明确标注，应属预印本或待发表论文方法概览特点文章性质输入单张RGB图像输出带纹理的三角网格...

论文阅读_iB-MVSNet

发表于2025-12-03|论文阅读

IB-MVSNet 基本信息项目内容论文标题 IB-MVS (Iterative Algorithm for Deep Multi-View Stereo based on Binary Decisions) 作者 Christian Sormann, Mattia Rossi, Andreas Kuhn, Friedrich Fraundorfer 作者单位 Graz University of Technology (奥地利格拉茨技术大学，Institute of Computer Graphics and Vision) 时间 2021 发表会议/期刊方法概览特点文章性质输入校正图像对输出视差图所属领域双目stereo 摘要本文提出 ...

PP-LCNet

发表于2025-12-03|论文阅读

PP-LCNet PP-LCNet《A lightweight CPU convolutional Neural...

使用OBS上传大文件并再modelArts服务器上访问

发表于2025-08-06|论文阅读

使用OBS上传大文件并再modelArts服务器上访问背景我需要在华为服务器上跑代码，数据集达45G，单次只能从本地上传100M，然后听说大文件通过OBS很方便，这里记录如何使用OBS来上传，看要求这里应该是只需要一个OBS的URL。在Notebook中可以通过调用ModelArts的Moxing接口或者SDK接口与OBS交互，将Notebook中的文件上传至OBS，或者下载OBS中的文件至Notebook中。MoXing是ModelArts自研的分布式训练加速框架，MoXing提供了一套文件对象API，可以用来读写OBS文件。首先学习OBS的基本概念使用华为云的对象存储服务就是OBS，你需要把本地的文件拷贝到OBS中，然后在notebook里访问OBS 首先需要在华为云的OBS里创建一个帐号再创建一个筒，这个桶里有桶名称，账户AK，密码SK，和地址，这个地址是提供OBS服务的地址，也叫做Endpoint？然后再在本地使用obsutil或者其他的obs...

SMPL骨骼蒙皮算法

发表于2025-07-02|论文阅读

骨骼蒙皮算法 smpl是指2015 马普的一篇文章“SMPL: a skinned multi-person linear model" 人体可以理解为是一个基础模型和在该模型基础上进行形变的总和，在形变基础上进行PCA，得到刻画形状的低维参数——形状参数（shape）；同时，使用运动树表示人体的姿势，即运动树每个关节点和父节点的旋转关系，该关系可以表示为三维向量，最终每个关节点的局部旋转向量构成了smpl模型的姿势参数(pose)。 basicModel 官方的basicModel_m_lbs_10_207_0_v1.0.0.pkl包含了[‘v_template’, ‘weights’, ‘posedirs’, ‘pose’, ‘trans’, ‘shapedirs’, ‘betas’, ‘J’] v_template：smpl的基础模型，是一个T-pose，产生的mesh是在T-Pose基础上形变而来 weights：6890 * 24 混合权重矩阵，即关节点对顶点的影响权重 (第几个顶点受哪些关节点的影响且权重分别为多少)...

SMPL

发表于2025-07-01|论文阅读

SMPL 基础知识顶点（vertex）：动画模型可以看成多个小三角形组成，每三个顶点组成一个三角形，每个小三角形就可以看成一个顶点。骨骼点：骨架关节，比如膝盖骨骼蒙皮（Rig）：建立骨骼点和顶点的关联关系。每个骨骼点会关联许多顶点，并且每一个顶点权重不一样。通过这种关联关系，就可以通过控制骨骼点的旋转向量来控制整个人运动。顶点权重(vertex weights)：用于变形网格mesh，通过骨骼计算当前顶点 BlendShape：控制动画角色运动有两种，一种是上面说的利用Rig，还有一种是利用BlendShape。比如：生成一种笑脸和正常脸，那么通过BlendShape就可以自动生成二者过渡的动画。这种方式相比于利用Rig，可以不定义骨骼点，比较方便。蒙皮函数（SF，Skinning Function）：是计算机图形学中用于将骨骼动画（Skeletal...

SMPLify-从二维坐标到人体SMPL和三维坐标

发表于2025-07-01|论文阅读

...

MonSter

发表于2025-06-20|论文阅读

MonSter 华中科技大学2025 上台之后首先讲清楚自己为什么要做单目深度估计+立体匹配的方式做立体匹配立体匹配是什么? 立体匹配从校正的立体图像中估计视差图，随后可以将其转换为公制深度。是从相似性匹配中得出差异的，假设两张图像中都有可见的对应关系。方法大致可分为基于成本筛选的方法和基于迭代优化（局部成本）的方法。立体匹配效果差在哪? 立体匹配从图像对应中恢复深度。现有方法难以处理匹配线索有限的病态区域，例如遮挡、无纹理区域、重复/薄结构以及像素表示较低的远处对象。单目深度估计是什么? 与立体匹配不同，单目深度估计直接从单个图像中恢复 3D，不会遇到不匹配的挑战。单目深度估计的效果差在哪？虽然单眼深度为立体结构提供了互补的结构信息，但预训练模型通常会产生具有比例和偏移模糊性的相对深度。即使在全局缩放和移位对齐之后，大量错误仍然存在红线表示的是理想情况下的视差匹配。蓝色点表示的是实际从单目深度估计得到的视差值。离红线越近的蓝色点，表示该位置的视差估计越准确；而离红线越远的蓝色点，则表示视差估计的误差越大。 (a) No...

FoundationStereo

发表于2025-06-20|论文阅读

FoundationStereo NVIDIA 2025 摘要（有本事别微调刷榜，我就是要做zero-shot）通过每个域的微调，深度立体匹配在基准数据集上取得了巨大进步。然而，实现强大的零镜头泛化（其他计算机视觉任务中基础模型的标志）对于立体匹配来说仍然具有挑战性。为此，我们首先构建了一个大规模（1M 立体对）合成训练数据集，具有较大的多样性和高照片级真实感，然后是一个自动自我管理管道来去除模棱两可的样本。然后，我们设计了许多网络架构组件来增强可扩展性，包括一个侧调功能主干，它适应了视觉基础模型中丰富的单目先验，以减轻 sim-to-real 的差距，以及用于有效成本量过滤的远程上下文推理。引言近半个世纪前第一个立体匹配算法出现，我们已经走过了漫长的道路。，最近的立体算法可以取得惊人的结果，几乎使最具挑战性的基准测试饱和。然而，对目标域的数据集进行微调仍然是获得竞争结果的首选方法。鉴于通过scaling...

MobileNet

发表于2025-06-02|论文阅读

MobileNet MobileNets: V1:《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 》2017 MobileNet V2:《MobileNetV2:Inverted Residuals and Linear Bottlenecks》 MobileNet V3:《searching For MobileNet V3》 MobileNet V3 2016年6月，谷歌提出了MobileNetV1，由于各种原因当时没有挂上arxiv，一直到2017年4月才提交。好巧不巧，谷歌的另一团队，同时提出了Xception。所有才有了两个结构都是基于深度可分离卷积的相似争论谷歌在2019年5月份推出了最新的MobileNetV3 https://zhuanlan.zhihu.com/p/70703846 摘要有更小的体积，更少的计算量，更高的精度。在轻量级神经网络中拥有极大的优势。创新点 MobileNet...