论文阅读_One-2-3-45
One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization 基本信息 项目 内容 论文标题 One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization 作者 Minghua Liu (UC San Diego), Chao Xu (UCLA), Haian Jin (Cornell/ZJU), Linghao Chen (UC San Diego/ZJU), Mukund Varma T (IIT Madras), Zexiang Xu (Adobe), Hao Su (UC San Diego) 作者单位 UC San Diego(第一单位) 时间 2023(根据引用和内容推断) 发表会议/期刊 暂未明确标注,应属预印本或待发表论文 方法概览 特点 文章性质 输入 单张RGB图像 输出 带纹理的三角网格...
论文阅读_iB-MVSNet
IB-MVSNet 基本信息 项目 内容 论文标题 IB-MVS (Iterative Algorithm for Deep Multi-View Stereo based on Binary Decisions) 作者 Christian Sormann, Mattia Rossi, Andreas Kuhn, Friedrich Fraundorfer 作者单位 Graz University of Technology (奥地利格拉茨技术大学,Institute of Computer Graphics and Vision) 时间 2021 发表会议/期刊 方法概览 特点 文章性质 输入 校正图像对 输出 视差图 所属领域 双目stereo 摘要 本文提出 ...
PP-LCNet
PP-LCNet PP-LCNet《A lightweight CPU convolutional Neural...
使用OBS上传大文件并再modelArts服务器上访问
使用OBS上传大文件并再modelArts服务器上访问 背景 我需要在华为服务器上跑代码,数据集达45G,单次只能从本地上传100M,然后听说大文件通过OBS很方便,这里记录如何使用OBS来上传,看要求这里应该是只需要一个OBS的URL。 在Notebook中可以通过调用ModelArts的Moxing接口或者SDK接口与OBS交互,将Notebook中的文件上传至OBS,或者下载OBS中的文件至Notebook中。MoXing是ModelArts自研的分布式训练加速框架,MoXing提供了一套文件对象API,可以用来读写OBS文件。 首先学习OBS的基本概念 使用华为云的对象存储服务就是OBS,你需要把本地的文件拷贝到OBS中,然后在notebook里访问OBS 首先需要在华为云的OBS里创建一个帐号再创建一个筒,这个桶里有桶名称,账户AK,密码SK,和地址,这个地址是提供OBS服务的地址,也叫做Endpoint? 然后再在本地使用obsutil或者其他的obs...
SMPL骨骼蒙皮算法
骨骼蒙皮算法 smpl是指2015 马普的一篇文章“SMPL: a skinned multi-person linear model" 人体可以理解为是一个基础模型和在该模型基础上进行形变的总和,在形变基础上进行PCA,得到刻画形状的低维参数——形状参数(shape);同时,使用运动树表示人体的姿势,即运动树每个关节点和父节点的旋转关系,该关系可以表示为三维向量,最终每个关节点的局部旋转向量构成了smpl模型的姿势参数(pose)。 basicModel 官方的basicModel_m_lbs_10_207_0_v1.0.0.pkl包含了[‘v_template’, ‘weights’, ‘posedirs’, ‘pose’, ‘trans’, ‘shapedirs’, ‘betas’, ‘J’] v_template:smpl的基础模型,是一个T-pose,产生的mesh是在T-Pose基础上形变而来 weights:6890 * 24 混合权重矩阵,即关节点对顶点的影响权重 (第几个顶点受哪些关节点的影响且权重分别为多少)...
SMPL
SMPL 基础知识 顶点(vertex):动画模型可以看成多个小三角形组成,每三个顶点组成一个三角形,每个小三角形就可以看成一个顶点。 骨骼点:骨架关节,比如膝盖 骨骼蒙皮(Rig):建立骨骼点和顶点的关联关系。每个骨骼点会关联许多顶点,并且每一个顶点权重不一样。通过这种关联关系,就可以通过控制骨骼点的旋转向量来控制整个人运动。 顶点权重(vertex weights):用于变形网格mesh,通过骨骼计算当前顶点 BlendShape:控制动画角色运动有两种,一种是上面说的利用Rig,还有一种是利用BlendShape。比如:生成一种笑脸和正常脸,那么通过BlendShape就可以自动生成二者过渡的动画。这种方式相比于利用Rig,可以不定义骨骼点,比较方便。 蒙皮函数(SF,Skinning Function):是计算机图形学中用于将骨骼动画(Skeletal...
MonSter
MonSter 华中科技大学2025 上台之后首先讲清楚自己为什么要做单目深度估计+立体匹配的方式做立体匹配 立体匹配是什么? 立体匹配从校正的立体图像中估计视差图,随后可以将其转换为公制深度。是从相似性匹配中得出差异的,假设两张图像中都有可见的对应关系。 方法大致可分为基于成本筛选的方法和基于迭代优化(局部成本)的方法。 立体匹配效果差在哪? 立体匹配从图像对应中恢复深度。现有方法难以处理匹配线索有限的病态区域,例如遮挡、无纹理区域、重复/薄结构以及像素表示较低的远处对象。 单目深度估计是什么? 与立体匹配不同,单目深度估计直接从单个图像中恢复 3D,不会遇到不匹配的挑战。 单目深度估计的效果差在哪? 虽然单眼深度为立体结构提供了互补的结构信息,但预训练模型通常会产生具有比例和偏移模糊性的相对深度。 即使在全局缩放和移位对齐之后,大量错误仍然存在 红线表示的是理想情况下的视差匹配。蓝色点表示的是实际从单目深度估计得到的视差值。离红线越近的蓝色点,表示该位置的视差估计越准确;而离红线越远的蓝色点,则表示视差估计的误差越大。 (a) No...
FoundationStereo
FoundationStereo NVIDIA 2025 摘要(有本事别微调刷榜,我就是要做zero-shot) 通过每个域的微调,深度立体匹配在基准数据集上取得了巨大进步。然而,实现强大的零镜头泛化(其他计算机视觉任务中基础模型的标志)对于立体匹配来说仍然具有挑战性。为此,我们首先构建了一个大规模(1M 立体对)合成训练数据集,具有较大的多样性和高照片级真实感,然后是一个自动自我管理管道来去除模棱两可的样本。然后,我们设计了许多网络架构组件来增强可扩展性,包括一个侧调功能主干,它适应了视觉基础模型中丰富的单目先验,以减轻 sim-to-real 的差距,以及用于有效成本量过滤的远程上下文推理。 引言 近半个世纪前第一个立体匹配算法出现,我们已经走过了漫长的道路。,最近的立体算法可以取得惊人的结果,几乎使最具挑战性的基准测试饱和。然而,对目标域的数据集进行微调仍然是获得竞争结果的首选方法。鉴于通过scaling...
MobileNet
MobileNet MobileNets: V1:《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 》2017 MobileNet V2:《MobileNetV2:Inverted Residuals and Linear Bottlenecks》 MobileNet V3:《searching For MobileNet V3》 MobileNet V3 2016年6月,谷歌提出了MobileNetV1,由于各种原因当时没有挂上arxiv,一直到2017年4月才提交。好巧不巧,谷歌的另一团队,同时提出了Xception。所有才有了两个结构都是基于深度可分离卷积的相似争论 谷歌在2019年5月份推出了最新的MobileNetV3 https://zhuanlan.zhihu.com/p/70703846 摘要 有更小的体积,更少的计算量,更高的精度。在轻量级神经网络中拥有极大的优势。 创新点 MobileNet...
