CES国际消费电子展首日,智元机器人正式发布了全球首个大语言模型驱动的开源仿真平台——Genie Sim 3.0。该平台致力于“重塑虚实边界”,通过高保真仿真环境、自然语言驱动的场景生成、大规模开源数据集等突破性能力,为具身智能的研发、训练与评估提供了一套完整闭环的解决方案,有望从根本上提升开发效率,降低对物理硬件的依赖。

Genie Sim 3.0基于NVIDIA Isaac Sim构建,其核心目标是打造逼近物理世界的仿真环境,并以“对话”和“分钟级”的效率进行场景构建。平台涵盖从数字资产生成、场景泛化、数据采集到自动评测的全流程,旨在成为推动具身智能创新应用的关键基础设施。

平台五大创新亮点引领行业变革——

数字孪生级高保真环境:平台创新性地融合三维重建与视觉生成技术,结合物理引擎,实现了视觉逼真与物理精确的统一。通过MetaCam手持3D激光扫描仪,可对真实环境进行毫米级精准复刻;仅凭一段60秒环拍视频,即可快速生成物体的高精度仿真模型,极大提升了场景构建效率。

自然语言驱动场景生成:告别传统复杂编程,开发者只需输入如“生成一份蛋白质丰富的晚餐”这样的自然语言指令,平台即可在几分钟内自动理解并构建出结构化的仿真场景,并可进一步通过对话进行编辑与泛化,快速生成成千上万个训练与测试场景。

开源万小时数据集与高效采集:平台开源了具身智能领域目前最大规模的仿真数据集,涵盖200余项任务、总时长超上万小时,包含多传感器信息与多维度泛化条件。其智能采集工具与独创的错误恢复机制,能将数据采集损耗降至最低。令人瞩目的是,基于该仿真数据训练的模型,已实现“零样本”迁移至真实机器人,任务成功率超过用真实数据训练的效果。

超十万场景勾勒模型能力全景画像:Genie Sim Benchmark 3.0构建了基于超10万仿真场景的多维立体评估体系。它利用大语言模型(LLM)自动生成评测流程,并借助视觉语言模型(VLM)从语义理解、空间推理等多维度进行深度评估,清晰揭示模型能力边界,其仿真与真实世界的评测差异已小于10%。

深度融合真实工业作业场景:基于智元机器人的规模化落地经验,平台首次深度集成了超市上货、物流分拣、电力巡检等真实工业场景的仿真,支持从算法研发到工业应用的全流程仿真验证,实现“零硬件部署,全真实验证”。CES国际消费电子展首日Genie Sim 3.0

智元机器人宣布,将全面开源Genie Sim 3.0平台的核心代码、海量数据集及数字资产,向全球开发者、研究者与产业伙伴开放。这一举措旨在降低研发门槛,汇聚社区智慧,共同加速具身智能技术的创新与发展步伐。