日前,深圳K11影院的小吃柜台前,只见一台银色的人形机器人在忙碌应付顾客需求。这是越疆人形机器人Atom,它精准识别订单后,毫米级控制力度拿起纸杯,转身对准爆米花机出料口,均匀装填后稳稳递到顾客手中——这不是实验室里的演示,而是全球首个全自主人形机器人在深圳影院商业运营场景的日常。
《机器人参考》记者观察到,Atom无需人工遥控或预设轨迹,从回应顾客语音点单、识别需求,到抓杯、装填、递送,全流程自主完成。即使有好奇的观众故意将装好的爆米花倒掉一半,它也能通过视觉感知迅速识别状态,主动返回机器前补装;当容器被人为移动后,它会自主重新定位,毫无卡顿地继续完成操作。“以前只在科幻片里见过,没想到现在真能‘放手’让机器人干活。”一位刚拿到爆米花的观众感慨道。

这款“硬核打工人”的底气,来自越疆自研的Dobot-VLA(视觉-语言-动作)端到端模型。该模型如同机器人的“超级大脑”,能将自然语言指令转化为结构化推理链,再映射为连续的动作轨迹。配合“大小脑”协同智能系统,Atom实现了从“看懂世界”到“动手执行”的闭环智能,无需编程即可应对复杂动态场景。
现场测试数据显示,Atom单日可连续稳定作业14小时,完成超1000杯爆米花制作,全程零失误。其核心优势在于自主任务规划与实时纠错能力:能将“售卖爆米花”拆解为定位、抓取、盛装、递送等步骤,在执行中持续监测状态,遇到爆米花洒落、容器移位等突发状况时,可迅速诊断问题并动态重规划,无需外部指令即可完成纠错续行。业界分析,随着具身智能技术的持续迭代,未来或许会有更多“Atom”走进生活,重塑服务行业的运营模式。

“机器人的商业化关键,在于能否在真实复杂环境中可靠运行。”越疆公司向广州日报《机器人参考》表示,人形机器人Atom通过影院场景的实战验证,证明了具身智能在商业场景等领域落地的可行性。其搭载的Dobot-VLA模型,通过动作空间建模、推理链分解与强化学习对齐,实现了视觉感知、语言理解与动作生成的深度融合,攻克了行业长期面临的“落地难”问题。
作为全球具身智能第一梯队的中国企业,越疆人形机器人的这一应用突破具有标杆性的意义。当前,人形机器人行业普遍面临自主决策弱、场景适配性差等瓶颈,而Atom在影院的运营,为服务行业智能化提供了可复制的样本。据了解,该技术后续还将拓展至工业生产、餐饮、零售、医疗等更多场景。
文、图/广州日报新花城记者:阮元元
视频/广州日报新花城记者:阮元元
广州日报新花城编辑:何波