avatar
文章
148
标签
25
分类
10
主页
博文
  • 分类
  • 时间轴
  • 标签
生活
  • 树洞
  • 作品与鉴赏
关于笔者
LogoThis is a 部落格 of outbreak_sen
主页
博文
  • 分类
  • 时间轴
  • 标签
生活
  • 树洞
  • 作品与鉴赏
关于笔者

This is a 部落格 of outbreak_sen

MonSter
发表于2025-06-20|论文阅读
MonSter 华中科技大学2025 上台之后首先讲清楚自己为什么要做单目深度估计+立体匹配的方式做立体匹配 立体匹配是什么? 立体匹配从校正的立体图像中估计视差图,随后可以将其转换为公制深度。是从相似性匹配中得出差异的,假设两张图像中都有可见的对应关系。 方法大致可分为基于成本筛选的方法和基于迭代优化(局部成本)的方法。 立体匹配效果差在哪? 立体匹配从图像对应中恢复深度。现有方法难以处理匹配线索有限的病态区域,例如遮挡、无纹理区域、重复/薄结构以及像素表示较低的远处对象。 单目深度估计是什么? 与立体匹配不同,单目深度估计直接从单个图像中恢复 3D,不会遇到不匹配的挑战。 单目深度估计的效果差在哪? 虽然单眼深度为立体结构提供了互补的结构信息,但预训练模型通常会产生具有比例和偏移模糊性的相对深度。 即使在全局缩放和移位对齐之后,大量错误仍然存在 红线表示的是理想情况下的视差匹配。蓝色点表示的是实际从单目深度估计得到的视差值。离红线越近的蓝色点,表示该位置的视差估计越准确;而离红线越远的蓝色点,则表示视差估计的误差越大。 (a) No...
FoundationStereo
发表于2025-06-20|论文阅读
FoundationStereo NVIDIA 2025 摘要(有本事别微调刷榜,我就是要做zero-shot) 通过每个域的微调,深度立体匹配在基准数据集上取得了巨大进步。然而,实现强大的零镜头泛化(其他计算机视觉任务中基础模型的标志)对于立体匹配来说仍然具有挑战性。为此,我们首先构建了一个大规模(1M 立体对)合成训练数据集,具有较大的多样性和高照片级真实感,然后是一个自动自我管理管道来去除模棱两可的样本。然后,我们设计了许多网络架构组件来增强可扩展性,包括一个侧调功能主干,它适应了视觉基础模型中丰富的单目先验,以减轻 sim-to-real 的差距,以及用于有效成本量过滤的远程上下文推理。 引言 近半个世纪前第一个立体匹配算法出现,我们已经走过了漫长的道路。,最近的立体算法可以取得惊人的结果,几乎使最具挑战性的基准测试饱和。然而,对目标域的数据集进行微调仍然是获得竞争结果的首选方法。鉴于通过scaling...
MobileNet
发表于2025-06-02|论文阅读
MobileNet MobileNets: V1:《MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 》2017 MobileNet V2:《MobileNetV2:Inverted Residuals and Linear Bottlenecks》 MobileNet V3:《searching For MobileNet V3》 MobileNet V3 2016年6月,谷歌提出了MobileNetV1,由于各种原因当时没有挂上arxiv,一直到2017年4月才提交。好巧不巧,谷歌的另一团队,同时提出了Xception。所有才有了两个结构都是基于深度可分离卷积的相似争论 谷歌在2019年5月份推出了最新的MobileNetV3 https://zhuanlan.zhihu.com/p/70703846 摘要 有更小的体积,更少的计算量,更高的精度。在轻量级神经网络中拥有极大的优势。 创新点 MobileNet...
SuffleNet
发表于2025-06-02|论文阅读
SuffleNet ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices 旷视科技 摘要 MobileNet和SqueezeNet等一样主要是想应用在移动端 创新点 ResNeXt 在非常小的网络中效率会降低,因为密集的 1×1卷积 代价很高 ,基于此作者提出了 pointwise group convolution 以减少 1×1卷积 的计算复杂度 ; 为克制 pointwise group convolution 带来的副作用,提出了 channel shuffle 的操作,用于实现信息在特征通道之间流动 . ShuffleNet与MobileNet的对比,ShuffleNet不仅计算复杂度更低,而且精度更好。 创新点讲解 DeepwiseConvolution(是一种GroupConvolution) (特征图数就是通道数) 分组卷积(Group Convolution) 的概念首先是在 AlexNet 中引入,用于将模型分布到两块 GPU...
李沐-ResNet
发表于2025-06-02|论文阅读
ResNet Deep Residual Learning for Image Recognition 微软研究院的Kaiming...
李沐-TransFormer基础
发表于2025-06-01|论文阅读
李沐-TransFormer基础 Attention Is All You Need 谷歌在2017年的论文 同等贡献很多 代码在tensor2tensor 摘要 序列转换模型都是基于复杂的循环神经网络或卷积神经网络,且都包含一个encoder和一个decoder。表现最好的模型还通过attention机制把encoder和decoder联接起来。 提出了一个新的、简单的网络架构,Transformer....
AlexNet
发表于2025-06-01|论文阅读
李沐-AlexNet和卷积基础 ImageNet Classification With Deep Convolutional Neural Networks 俄罗斯人Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton 2012 在谷歌实习时候见到过这个人,汇报了这个工作。首个真正意义上的深度卷积神经网络 摘要 ImageNet是一个很大的数据集超过1500万张在超过22,000个类别,取其中一部分1000个类 在Imageet上top-1错误率37.5%,top-5错误率17.0%...
swiftUI
发表于2025-03-19|swift
swiftUI OK,我们先学习官方的swiftUI教程 Creating and combining views 创建一个项目 interface中的storyboard可以使用swift或者objective-C进行编写 项目初建 File > New > File (文件 > New > File) 以再次打开模板选择器。在用户界面部分,选择“SwiftUI 视图”,然后单击下一步。将文件命名为 CircleImage.swift,然后单击 Create。 12345678910111213141516171819202122232425262728import SwiftUI// `@main` 属性标识应用程序的入口点。@mainstruct LandmarksApp: App { var body: some Scene { WindowGroup { ContentView() } }}//...
macbook使用方法
发表于2025-03-19
Macbook使用笔记 左右分屏:按住Option键拖移窗口,或将指针放在左上角的绿色图标上 分屏幕:三指往上推然后再在顶部把两个软件单指结合到一起 delete键按:fn+删除键,可以删除光标后面的字符 直接到达桌面:四个指头放大然后手拿开 切换输入法:control空格 删除文件:command+delete Safari新建标签页打开:command+左键 截图大全 全屏截图并保存到剪切板:Control + Command + Shift + 3 选择区域截图并保存到剪切板:按下Control + Command + Shift + 4 全屏截图:com➕shift➕3(ipad标注同步) 矩形截图:com➕shift➕4...
swift笔记
发表于2025-03-19|swift
0326看到了集合 siwft笔记 引言-写给我自己在学习swift成为苹果开发者之前的猜想 怎么学习swift?如何制作并发布一个由swift制作的软件并发布到ios商店,首先我在知乎等渠道已经知道开发者的一些内容,并且知道了swift和c-sharp的选择问题。重点是怎么学?我这里想的是可以先从国内别人整理好的教程先速通一遍,然后在苹果开发者网站学习新的swift特性。 我的目标是什么?我的时间可太宝贵了,做这个事一定事出有因并且有所成就,我的目标很简单,就是完成一个成品软件,在竞争的时候可以展出,可以顶替一个实习经历。 学习链接: apple开发者的官方教程 apple的官方中文教程 菜鸟教程 swift编程语言中文教程 [youtube上一个声音很好听的教学up](https://www.youtube.com/ChaoCode 博主) 如何阅读Apple developer网站 这是主页 首页的讲座、WWDC、开发者你好(其实指向新闻hello)、开发者见面(其实指向events,是苹果最近的闲暇过从)是单独一个网页 顶部探索 和 首页pathway...
1…12131415
avatar
outbreak_sen
an interesting man
文章
148
标签
25
分类
10
Follow Me
公告
This is my Blog
最新文章
无标题2025-12-08
无标题2025-12-08
论文阅读_MoGe 22025-12-03
论文阅读_变分自编码器VAE2025-12-03
学习笔记_SFM2025-12-03
分类
  • swift2
  • 传统图形学1
  • 嵌入式1
  • 深度学习6
  • 相机驱动开发1
  • 编译1
  • 论文阅读125
  • 这个一个测试11
标签
SFM 硬触发 mindNLP 实习 证券投资 python LLVM 相机驱动 Hexo-butterfly nodejs 这也是一个测试 算子 深度学习 GAN生成对抗模型 Muilt View Stereo mindspore实习 Hexo QT colmap huggingface siwft shell Mindspore 深度相机 大恒
归档
  • 十二月 2025 115
  • 八月 2025 1
  • 七月 2025 3
  • 六月 2025 8
  • 三月 2025 4
  • 二月 2025 16
  • 十二月 2024 1
网站信息
文章数目 :
148
本站访客数 :
本站总浏览量 :
最后更新时间 :
©2019 - 2025 By outbreak_sen
框架 Hexo|主题 Butterfly