论文阅读_iB-MVSNet
IB-MVSNet 基本信息 项目 内容 论文标题 IB-MVS (Iterative Algorithm for Deep Multi-View Stereo based on Binary Decisions) 作者 Christian Sormann, Mattia Rossi, Andreas Kuhn, Friedrich Fraundorfer 作者单位 Graz University of Technology (奥地利格拉茨技术大学,Institute of Computer Graphics and Vision) 时间 2021 发表会议/期刊 方法概览 特点 文章性质 输入 校正图像对 输出 视差图 所属领域 双目stereo 摘要 本文提出 ...
GAN笔记
GAN笔记 简介 GAN的思想来自零和博弈理论,由两个部分组成,一个是生成器Generator,随机接收一个随机噪声来生成图像。一个是鉴别器Discriminator,判断一张图像是不是“真实的”,输入是一张图像,输出是该图像为真实图像的概率,介于0-1之间,概率值越小认为生成图像不真实的可能性越大。生成器的目标是通过生成接近真实的图像来欺骗判别器,而判别器的目标是尽量辨别出生成器生成的假图像和真实图像的区别。 自编码器(Auto-Encoder)以及变分自编码器(Variational Auto-Encoder)都是典型的生成器。输入通过Encoder编码成code,然后code通过Decoder重建原图,其中自编码器中的Decoder就是生成器,code可随机取值,产生不同的输出。 自编码器是一种能够通过无监督学习,对输入数据进行特征提取,学习到数据的抽象表示,称为编码过程,编码结果往往维度远小于输入数据,自编码器可以用于降维和特征提取, 变分自编码器(Variational auto-encoder,VAE)是一类重要的生成模型(generative...
论文阅读_DiffMVS
基本信息 项目 内容 论文标题 Lightweight and Accurate Multi-View Stereo with Confidence-Aware Diffusion Model 作者 Fangjinhua Wang(patchmatchNet作者,IterMVS), Qingshan Xu(ACMH作者), Yew-Soon Ong 作者单位 ETH 时间 20250906 发表会议/期刊 TiPami 方法概览 特点 文章性质 输入 标定之后的多视角图像 输出 场景的点云图 所属领域 MVS 背景 创新点 首个将Diffusion引入到MVS的工作 网络架构 构建一个图像集 。(与视觉 SLAM 中常见的做法类似)我们将一张图像设为关键帧,当其与上一帧关键帧之间的视差(我们使用 Lucas-Kanade...
论文阅读_GwcMVSNet
GP-MVSNet 基本信息 项目 内容 论文标题 Group-wise Correlation Stereo Network 作者 Xiaoyang Guo、Kai Yang、Wukui Yang、Xiaogang Wang、Hongsheng Li 作者单位 The Chinese University of Hong Kong(香港中文大学)、SenseTime Research(商汤科技研究院) 时间 2019 发表会议/期刊 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 方法概览 特点 文章性质 输入 校正图像对 输出 视差图 所属领域 双目stereo 1. 摘要精简 本文提出分组相关立体网络(GwcNet),用于校正图像对的视差估计(进而推导深度)。核心是通过分组相关(Group-wise...
PP-LCNet
PP-LCNet PP-LCNet《A lightweight CPU convolutional Neural...
使用OBS上传大文件并再modelArts服务器上访问
使用OBS上传大文件并再modelArts服务器上访问 背景 我需要在华为服务器上跑代码,数据集达45G,单次只能从本地上传100M,然后听说大文件通过OBS很方便,这里记录如何使用OBS来上传,看要求这里应该是只需要一个OBS的URL。 在Notebook中可以通过调用ModelArts的Moxing接口或者SDK接口与OBS交互,将Notebook中的文件上传至OBS,或者下载OBS中的文件至Notebook中。MoXing是ModelArts自研的分布式训练加速框架,MoXing提供了一套文件对象API,可以用来读写OBS文件。 首先学习OBS的基本概念 使用华为云的对象存储服务就是OBS,你需要把本地的文件拷贝到OBS中,然后在notebook里访问OBS 首先需要在华为云的OBS里创建一个帐号再创建一个筒,这个桶里有桶名称,账户AK,密码SK,和地址,这个地址是提供OBS服务的地址,也叫做Endpoint? 然后再在本地使用obsutil或者其他的obs...
SMPL骨骼蒙皮算法
骨骼蒙皮算法 smpl是指2015 马普的一篇文章“SMPL: a skinned multi-person linear model" 人体可以理解为是一个基础模型和在该模型基础上进行形变的总和,在形变基础上进行PCA,得到刻画形状的低维参数——形状参数(shape);同时,使用运动树表示人体的姿势,即运动树每个关节点和父节点的旋转关系,该关系可以表示为三维向量,最终每个关节点的局部旋转向量构成了smpl模型的姿势参数(pose)。 basicModel 官方的basicModel_m_lbs_10_207_0_v1.0.0.pkl包含了[‘v_template’, ‘weights’, ‘posedirs’, ‘pose’, ‘trans’, ‘shapedirs’, ‘betas’, ‘J’] v_template:smpl的基础模型,是一个T-pose,产生的mesh是在T-Pose基础上形变而来 weights:6890 * 24 混合权重矩阵,即关节点对顶点的影响权重 (第几个顶点受哪些关节点的影响且权重分别为多少)...
SMPL
SMPL 基础知识 顶点(vertex):动画模型可以看成多个小三角形组成,每三个顶点组成一个三角形,每个小三角形就可以看成一个顶点。 骨骼点:骨架关节,比如膝盖 骨骼蒙皮(Rig):建立骨骼点和顶点的关联关系。每个骨骼点会关联许多顶点,并且每一个顶点权重不一样。通过这种关联关系,就可以通过控制骨骼点的旋转向量来控制整个人运动。 顶点权重(vertex weights):用于变形网格mesh,通过骨骼计算当前顶点 BlendShape:控制动画角色运动有两种,一种是上面说的利用Rig,还有一种是利用BlendShape。比如:生成一种笑脸和正常脸,那么通过BlendShape就可以自动生成二者过渡的动画。这种方式相比于利用Rig,可以不定义骨骼点,比较方便。 蒙皮函数(SF,Skinning Function):是计算机图形学中用于将骨骼动画(Skeletal...
TMUX使用
TMUX使用 tmux new -s your-session-name 12tmux detachctrl+b d tmux kill-session -t your-session-name tmux attach -t your-session-name
