title: Register相关工作数据集
date: 2026-03-23 13:57:28
tags:

  • 点云配准
    categories:
  • 点云配准

Register相关工作数据集

工作名称 训练数据集 评估数据集 空间属性
Sonata 包含 ScanNet, ScanNet++, S3DIS, ARKitScenes, HM3D, Structured3D, ASE 等。 室内: ScanNet (V2, 200), ScanNet++, S3DIS (Area 5, 6-fold)。室外: nuScenes, Waymo, SemanticKITTI。 室内为主,后期扩展至室外室外LiDAR语义分割。
Concerto ScanNet, ScanNet++, Structured3D, S3DIS, ARKitScenes, HM3D。并引入 RealEstate10K 的视频提升点云。 室内: ScanNet, ScanNet200, ScanNet++, S3DIS。视频点云: RealEstate10K。 核心训练与评估均聚焦于室内场景。
FUSER 3DMatch, ScanNet, ScanNet++, ARKitScenes。 室内: ScanNet (RGB-D 序列), 3DMatch, ArKitScenes。 完全属于室内,侧重于大规模室内扫描的配准。
Register Any Point (RAP) 涵盖 17 个数据集(12 个室外,4 个室内,1 个物体)。 室内: 3DMatch, NSS。室外: ETH, KITTI。跨域基准: 物体、室内、室外、TLS、地图。 室内、室外、物体全覆盖,旨在实现跨域通用配准。
Utonia 室内 (ScanNet等), 室外 (Waymo, SemanticKITTI等), 物体 (PartNet, Cap3D等), 视频提升点云。 室内: ScanNet, ScanNet200, ScanNet++, S3DIS。室外: NuScenes, Waymo, SemanticKITTI。物体: PartNet, ScanObjectNN。 通用型工作,通过对齐粒度实现了室内、室外与物体的统一编码。

Register Any Point 如何构造室外数据集

一连串的点云文件(Scans): 就像相册里的照片,但每一张都是车顶激光雷达在某一瞬间扫描出来的 3D 场景。每一帧的“位姿”(Poses): 这告诉你当时车在哪里、头朝向哪。如果原数据集给的位姿不准,RAP 还会用先进的算法(比如 PIN-SLAM)自己重新算一遍,确保位置精确。去畸变后的原始几何: 因为车在开的时候扫描,点云会“变毛”,RAP 会利用时间戳把这些点“摆正”(Deskewing),还原出真实的形状。

  1. 你应该如何获得“扫描级别”(Scan-level)的数据集?

“扫描级别”意味着每一份数据都是最原始、最薄的一帧。

步骤:选关键帧:车停着不动时的重复帧会被删掉,只保留有代表性的帧。设置参数 F=1 在脚本里设定每一个训练点云只包含 1 帧数据。随机组队: 从这一长串关键帧里,随机抓取 2 到 16 个 扫描帧凑在一起。检查邻居: 脚本会检查这几个帧在空间上是不是靠得够近(距离小于 dmax​),且彼此之间有没有重叠**(哪怕只有 0.5% 的重叠也可以)。生成练习题: 这一组“邻近且有重叠”的单帧扫描,就成了一个“扫描级别”的训练样本。

  1. 你应该如何获得“子图级别”(Submap-level)的数据集?

步骤:设置参数 F>1 比如对于 KITTI,作者设定 Fmax​ 高达 600“多帧合一”: 按照位姿信息,把连续的很多帧(例如几十帧甚至几百帧)强行堆叠在一起,合成一个巨大的、内容非常丰富的点云,这就是“子图”。随机抽样: 同样地,在整段序列中抽出 2 到 16 个 这种合成好的“子图”。筛选标准: 同样要满足空间临近和一定的重叠度。生成练习题: 这一组巨大的子图就构成了一个“子图级别”的样本。