Register相关工作数据集

工作名称	训练数据集	评估数据集	空间属性
Sonata	包含 ScanNet, ScanNet++, S3DIS, ARKitScenes, HM3D, Structured3D, ASE 等。	室内： ScanNet (V2, 200), ScanNet++, S3DIS (Area 5, 6-fold)。室外： nuScenes, Waymo, SemanticKITTI。	以室内为主，后期扩展至室外室外LiDAR语义分割。
Concerto	ScanNet, ScanNet++, Structured3D, S3DIS, ARKitScenes, HM3D。并引入 RealEstate10K 的视频提升点云。	室内： ScanNet, ScanNet200, ScanNet++, S3DIS。视频点云： RealEstate10K。	核心训练与评估均聚焦于室内场景。
FUSER	3DMatch, ScanNet, ScanNet++, ARKitScenes。	室内： ScanNet (RGB-D 序列), 3DMatch, ArKitScenes。	完全属于室内，侧重于大规模室内扫描的配准。
Register Any Point (RAP)	涵盖 17 个数据集（12 个室外，4 个室内，1 个物体）。	室内： 3DMatch, NSS。室外： ETH, KITTI。跨域基准：物体、室内、室外、TLS、地图。	室内、室外、物体全覆盖，旨在实现跨域通用配准。
Utonia	室内 (ScanNet等), 室外 (Waymo, SemanticKITTI等), 物体 (PartNet, Cap3D等), 视频提升点云。	室内： ScanNet, ScanNet200, ScanNet++, S3DIS。室外： NuScenes, Waymo, SemanticKITTI。 E物体： PartNet, ScanObjectNN。	通用型工作，通过对齐粒度实现了室内、室外与物体的统一编码。

Register Any Point 如何构造室外数据集

一连串的点云文件（Scans）： 就像相册里的照片，但每一张都是车顶激光雷达在某一瞬间扫描出来的 3D 场景。每一帧的“位姿”（Poses）： 这告诉你当时车在哪里、头朝向哪。如果原数据集给的位姿不准，RAP 还会用先进的算法（比如 PIN-SLAM）自己重新算一遍，确保位置精确。去畸变后的原始几何： 因为车在开的时候扫描，点云会“变毛”，RAP 会利用时间戳把这些点“摆正”（Deskewing），还原出真实的形状。

你应该如何获得“扫描级别”（Scan-level）的数据集？

“扫描级别”意味着每一份数据都是最原始、最薄的一帧。

步骤：选关键帧：车停着不动时的重复帧会被删掉，只保留有代表性的帧。设置参数 F=1：在脚本里设定每一个训练点云只包含 1 帧数据。随机组队： 从这一长串关键帧里，随机抓取 2 到 16 个 扫描帧凑在一起。检查邻居： 脚本会检查这几个帧在空间上是不是靠得够近（距离小于 dmax），且彼此之间有没有重叠**（哪怕只有 0.5% 的重叠也可以）。生成练习题： 这一组“邻近且有重叠”的单帧扫描，就成了一个“扫描级别”的训练样本。

你应该如何获得“子图级别”（Submap-level）的数据集？

步骤：设置参数 F>1： 比如对于 KITTI，作者设定 Fmax 高达 600。“多帧合一”： 按照位姿信息，把连续的很多帧（例如几十帧甚至几百帧）强行堆叠在一起，合成一个巨大的、内容非常丰富的点云，这就是“子图”。随机抽样： 同样地，在整段序列中抽出 2 到 16 个 这种合成好的“子图”。筛选标准： 同样要满足空间临近和一定的重叠度。生成练习题： 这一组巨大的子图就构成了一个“子图级别”的样本。