news 2026/4/16 16:18:27

全球最大规模!空间智能新突破!如视开源室内三维数据集Realsee3D

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
全球最大规模!空间智能新突破!如视开源室内三维数据集Realsee3D

如视宣布,面向学术研究及非商业用途正式开放10000套室内三维数据集 Realsee3D——这或是全球目前最大规模的空间三维数据集,旨在为空间智能领域的研究者、开发者提供高质量数据基础,加速整个行业的技术迭代与应用落地。

Realsee3D

此前,如视发布空间深度推测大模型Argus1.0。作为首个支持全景图输入的空间深度推测大模型,Argus1.0依托如视所积累的千万级三维空间数据库训练而成。而此次开放的 Realsee3D三维数据集,正是从这一海量数据库中精选出的高质量样本。

数据集优势

Realsee3D 是一个大规模多视角RGB-D数据集,旨在推动室内三维感知、重建与场景理解领域的研究。该数据集具有以下优势特征:

No.1

超大规模

- 10,000个独特的室内三维场景

- 95,962个细分房间单元

- 299,073组视点/RGB-D 图像对

No.2

完备标注

为了赋能多任务学习(Multi-task Learning),我们提供了详尽的 ground truth 标注,不仅限于视觉,更延伸至几何与语义:

- 几何层:提供高精度 CAD 图纸与平面图。

- 语义层:包含 2D语义分割与3D检测标签。

No.3

场景多样

为了确保模型在复杂现实环境中的鲁棒性,我们采用了“真实数据+程序化生成”的双引擎策略:

- 采集数据:1,000 个真实场景(捕捉现实物理世界的复杂光照、布局与生活痕迹)

- 合成数据:9,000 个合成场景(基于 100+专业设计师 精心搭配的风格模板,涵盖海量家具模型与装修风格)

数据类型

  • 彩色全景图

  • 深度图

  • 位姿

  • CAD图纸

  • 户型平面图

  • 语义分割标签

  • 3D物体检测标签

彩色全景图

深度图

表面法线

语义分割图

适用方向

一直以来,空间智能领域的研究与应用面临着一个卡脖子难题:高质量的空间数据始终存在巨大缺口。如视凭借在三维空间数据领域的技术积累与资源沉淀,正填补了这一缺口。

本数据集适用于几何重建、多模态学习、具身智能等空间智能核心研究方向。欢迎全球研究者、开发者下载使用 Realsee3D三维数据集,共同探索空间智能研究的未来边界。

获取方式

目前,Realsee3D 数据集已通过官方渠道开放申请,访问如视 GitHub 仓库获取:

https://github.com/realsee-developer/RealSee3D

或点击“阅读原文”,申请获取。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 12:05:46

EmotiVoice情感语音生成在婚礼主持词定制中的应用

EmotiVoice情感语音生成在婚礼主持词定制中的应用 在一场婚礼上,当主持人用新郎父亲那熟悉的嗓音缓缓念出“我把我最珍贵的女儿交到你手上”时,台下宾客悄然落泪——而这位“父亲”其实已离世多年。这不是电影桥段,而是借助EmotiVoice实现的真…

作者头像 李华
网站建设 2026/4/16 10:22:15

EmotiVoice如何生成老年人声音特征?技术细节

EmotiVoice如何生成老年人声音特征?技术细节 在智能语音助手逐渐走进千家万户的今天,我们是否注意到——当系统用清脆年轻的嗓音提醒一位80岁的老人“该吃药了”,那种格格不入的疏离感?这种“代际错位”暴露了一个长期被忽视的问…

作者头像 李华
网站建设 2026/4/16 10:22:17

EmotiVoice语音合成引擎的静音检测与处理机制

EmotiVoice语音合成引擎的静音检测与处理机制 在当前AI语音技术快速演进的背景下,用户对语音合成系统的要求早已超越“能说话”的基础阶段,转向更深层次的情感表达、个性还原和交互自然性。像EmotiVoice这样的高表现力TTS引擎之所以脱颖而出,…

作者头像 李华
网站建设 2026/4/16 11:13:45

PySide6从0开始学习的笔记(七) 控件(Widget)之文字输入类控件

文字输入类控件用于接收用户文本 / 数值输入,是表单、设置界面的核心组件。1. QLineEdit(单行文本框)核心作用:单行文本输入(如用户名、密码、搜索框)。关键特性:密码模式:setEchoMo…

作者头像 李华
网站建设 2026/4/15 11:17:56

贫血模型 vs 充血模型:前端业务逻辑应该写在 Service 层还是 Entity 类中?

贫血模型 vs 充血模型:前端业务逻辑该写在 Service 层还是 Entity 类中? 各位开发者朋友,大家好!今天我们来聊一个看似简单、实则非常关键的话题——贫血模型(Anemic Domain Model)与充血模型(Rich Domain Model)的区别,以及在实际项目中,业务逻辑到底应该放在 Serv…

作者头像 李华
网站建设 2026/4/16 2:44:58

IndexedDB 事务模型:读写锁、版本迁移与游标(Cursor)遍历

IndexedDB 事务模型详解:读写锁、版本迁移与游标遍历 各位开发者朋友,大家好!今天我们来深入探讨一个常被忽视但极其重要的 Web API —— IndexedDB。它是一个浏览器端的 NoSQL 数据库,广泛用于离线应用、缓存数据和本地持久化存储场景。在实际开发中,我们经常遇到的问题…

作者头像 李华