关闭引导
​不用特殊设计优化,中国企业智元斩获WorldArena世界模型总分冠军!
2026-05-30 12:56:43
广州日报新花城

5月29日,智元对外发布消息称,根据具身领域热门榜单WorldArena Track1(世界模型感知与动作响应赛道)最新评测结果揭晓:智元自研的世界模型Genie Envisioner-Sim 2.0(以下简称GE 2.0)凭借优异的综合表现,登顶榜单榜首。

“世界模型感知与动作响应”赛道聚焦具身智能最本质的“认知与行动”能力,是评判通用人形机器人智能化水平的核心标尺。在该赛道评测中,智元团队使用了原生的世界模型GE 2.0,并未针对赛题进行特殊设计优化,仅基于榜单数据进行了基础微调(Finetune)。“轻装上阵”依然拔得头筹,充分印证了GE 2.0强大的通用适配性。面对近期世界模型方向的火热关注和创业浪潮,智元始终保持自己的节奏,从长远第一性原理出发,专注于打磨具身世界模型的坚实技术底座。


在GE 2.0技术报告中,智元团队对模型进行了全面的能力剖析。相比上一代模型,GE 2.0不仅在单点性能上实现了跃升,更演进为一个全功能、高可用的世界模拟器,可构建可试错、可迭代、可进化的虚拟仿真环境,让机器人策略在虚拟场景中自主积累经验、完成动态试错,规避真实场景的试错成本,最终高效迁移至真实物理世界稳定落地,实现从“感知预测”到“仿真进化、自主决策”的闭环升级。

作为世界模拟器,核心在于能否真实反映物理世界。智元团队验证了大量闭环评测结果,证明GE 2.0在多项任务上均与真实世界保持着强相关性。这种相关性不止步于宏观统计意义上的“成功率一致”,团队还进行了逐案(Case-by-case)的rollout结果对比分析,并通过混淆矩阵(Confusion Matrix)提供了严谨的量化佐证,有力地证明了GE 2.0作为策略评测器的可靠性。

2026年是具身智能“部署态”元年,机器人从实验室走向真实场景,规模化部署,真正发挥具身智能生产力,这也对算法提出了更高的要求。不论是WorldArena榜单上的优异表现还是技术报告中的性能论证,都彰显了Genie Envisioner技术路线的潜力。未来,智元表示,其将持续迭代世界模拟器技术体系,打通具身智能技术闭环,推动世界模型真正走进真实场景,为人形机器人规模化落地筑牢核心技术底座。

文/广州日报新花城记者:张露
广州日报新花城编辑:麦晓颖

@新花城 版权所有 转载需经授权