以下是一些主流、常用于学术研究和工业应用的 RGB-D 数据集,适合用于 SLAM、3D 重建、场景理解、目标识别等任务。
主流 RGB-D 数据集推荐
名称 | 传感器 | 分辨率/帧率 | 应用方向 | 下载地址 / 说明 |
---|---|---|---|---|
TUM RGB-D | Kinect V1 | 640×480 @ 30Hz | RGB-D SLAM, VIO | TUM 官网 |
ICL-NUIM | 模拟深度相机 | 640×480 @ 30Hz | 轨迹评估, 重建 | 官网 |
NYU Depth V2 | Kinect V1 | 640×480 @ 30Hz | 室内语义分割 | NYU 官网 |
SceneNN | ASUS Xtion | 多分辨率 | 3D 场景重建 | SceneNN 官网 |
SUN3D | Kinect / Asus | 640×480 @ 30Hz | 3D 场景配准 / SfM | SUN3D |
RGB-D Scenes | Kinect | 640×480 | 多物体识别 | 下载 |
ScanNet | 实景数据 + IMU | 640×480 @ 30Hz | 室内语义建图、重建 | ScanNet |
ETH3D | 高精度相机对 | 深度精度高 | 几何精度评估 | ETH3D |
CoRBS | Kinect V2 / RealSense | 高分辨率 | 高质量重建 | CoRBS 官网 |
各数据集内容典型结构(以 TUM 为例)
dataset/├── rgb/│ ├── 1305031102.175304.png├── depth/│ ├── 1305031102.181270.png├── groundtruth.txt└── associations.txt
- RGB 图像:彩色图像(PNG/JPG)
- Depth 图像:每像素表示深度值(以毫米/米存储)
- Groundtruth:轨迹 ground truth(常为 TUM 格式:时间戳+位姿)
- Associations:RGB、深度、轨迹的时间戳对齐文件
应用匹配建议
任务类型 | 推荐数据集 |
---|---|
RGB-D SLAM / VIO | TUM RGB-D, ICL-NUIM |
室内语义分割 | NYU V2, ScanNet |
高质量重建评估 | ETH3D, CoRBS, SceneNN |
多物体识别 | RGB-D Scenes |
配准 / 轨迹拟合 | SUN3D, TUM, ICL-NUIM |
️ 使用工具建议
-
加载 RGB-D 数据:
- PCL 或Open3D
- OpenCV
-
数据集格式转换:
associate.py
(TUM 官方提供)- 自写脚本进行
.txt
→ ROS Bag 转换
-
可与 SLAM 系统集成:
- ORB-SLAM2/3
- DVO-SLAM
- ElasticFusion
- InfiniTAM
- Open3D / PyTorch3D