5月9日,上海智元机器人基地。
Reasoning to Action(R2A)赛道线下调试现场,十支从全球331支队伍中杀出重围的战队,正围着自己的人形机器人作最后的冲刺。6月1日,他们将飞往奥地利维也纳,站上ICRA 2026(国际机器人与自动化大会)的舞台,争夺AGIBOT WORLD CHALLENGE的最终冠军。
331支报名队伍,来自20多个国家和地区——海外71支,国内260支。其中有科研机构,有刚成立一年的初创公司,也有高校实验室里临时凑起来的“师门战队”。
在这样一支高手云集的名单里,华南理工大学“Embodied horse”团队,排第六。
华南理工大学团队
这支来自华南理工大学的队伍,来自李巍华教授等多名教授、副教授组成的高校科研团队,该团队长期从事于工业人工智能、装备智能运维、具身智能(汽车智能驾驶、人形机器人)等领域的研究。李巍华教授是华南理工大学机械与汽车工程学院院长、国家重点研发计划“智能机器人”专项首席科学家。
智元:开源数据集与仿真平台,为全球开发者降低门槛
这场世界级比赛的举办方之一是智元机器人。作为国内人形机器人领域的头部企业,智元不仅拿出了自研的G2机器人供线下调试,更向所有参赛团队开放了AGIBOT WORLD开源数据集。
据介绍,Reasoning to Action赛道由去年的Manipulation赛道升级而来,考察维度从“动作执行”拓展至“环境理解—任务规划—动作执行”的全链条,聚焦弥合仿真与真机的差距。参赛团队需基于AGIBOT WORLD开源数据集,训练长程任务的推理与操作一体化模型,并使用Genie Sim 3.0仿真平台进行评测。该平台的Genie Sim Benchmark覆盖五大核心能力:语言指令理解、空间关系认知、原子技能操作、环境扰动适应和零样本跨域迁移。

Genie Sim Benchmark
“我们希望有更多的人参与到物理AI开发的全流程中,把门槛降下来。”智元具身解决方案与生态总监沈咏剑在现场告诉记者,“很多实验室买不起机器人,或者买得起但没人维护。我们把数据集、仿真工具、真机调试机会全部开放,让大家先在线证明自己,再到线下亲手摸到机器人。”
华工“Embodied horse”凭什么?
今年的线下赛题一共有四道,每一道都指向不同的技术难点。比如“爆米花”任务,考察机器人在狭小空间内完成平滑轨迹规划,不能把爆米花抖出来;“包裹分拣”则需要机器人依次完成抓取、旋转、扫码、放置,中间涉及腰部和双臂的大范围协同。
华工团队重点攻克的是长序列、精细操作和高推理要求的任务,例如“桌面整理”:机器人需依次完成合上笔记本电脑、摆正笔盒、将零散物品归位等连续操作。难点在于模型必须理解任务目标、判断操作顺序,并在执行中根据环境变化持续稳定决策。
“长序列任务中,机器人不能只完成眼前一步,还需理解前后动作之间的关系。”华南理工大学机械与汽车工程学院博士陈根介绍,这对任务规划和推理能力提出了更高要求。
团队的第一个突破点,就是提升模型的思维链推理能力。
第二个坑,空间感知。
陈根回忆,第一次到上海进行真机调试时,仿真与真实世界的差异迅速暴露:仿真中物体和环境参数相对稳定,而真实场景里机器人需面对接触力变化、物体形变和安全保护机制等问题。这正是比赛最核心的命题——Sim2Real Gap。尽管智元的Genie Sim 3.0已尽力逼近物理属性,但力反馈、纵深感、视觉干扰等只有在真机上才会暴露。
陈根告诉记者,为提升模型在真实场景的适应能力,团队从数据侧增强空间感知,通过优化训练数据,使模型更好地理解物体位置、空间关系和操作顺序,结合视觉定位与动作策略调整,不断提升执行稳定性。
“Reasoning to Action赛道入围前十的高校很少,基本都是公司。高校团队在算力资源等方面确有劣势,但我们的团队能脱颖而出,离不开李巍华教授的重视和长期技术积累。”陈根说,“过去在实验室,我们已经积累了数据处理、模型训练、接口调试等环节的经验,但本次线下赛面对全新场景和G2机器人平台,对模型迁移和现场调试提出了更高要求。”

华南理工大学团队在调试
谈到决赛,陈根说,团队珍惜ICRA舞台的交流机会,期待与国际研究者深入交流,在决赛中充分展现华南理工大学团队在具身智能领域的技术积累,争取好成绩。
而智元具身解决方案与生态总监沈咏剑在采访中告诉记者,维也纳决赛将面临更大的挑战——不同的光照、完全陌生的现场布局、额外的视觉干扰因素。“他们能不能在短时间内把模型迁移过去?我很期待。”
具身智能的赛道很长,比拼的是将技术落到物理世界的系统工程能力。对华工这群年轻人来说,每一次稳定执行,都是向前一步。
6月1日,维也纳。祝他们好运。
文、图/广州日报新花城记者:陈庆辉
广州日报新花城编辑:李光曼