当大模型凭借海量互联网文本一路高歌猛进时,一个尴尬的现实摆在具身智能行业面前:物理世界的数据,极度稀缺。4月16日,“觅蜂科技”一站式物理AI数据服务平台在上海张江科学会堂正式亮相,试图为这一“卡脖子”难题给出新的解法。
“数据接下去会跟算力一样,成为一种非常基础的生产资料。”发布会后,觅蜂科技董事长兼CEO姚卯青在接受采访时表示。在他看来,当前行业正面临数据稀缺、标准缺失、供需错配的“数据荒漠”困境,谁能率先解决数据供给,谁就能占据未来AI竞争的制高点。

“又全又好又快”:直击数据三大痛点
发布会现场,最吸引眼球的莫过于首次亮相的MEgo系列采集设备。与印象中笨重、昂贵的专业遥控操作设备不同,MEgo View头戴设备轻量化,可实现行业首创的超300度全景视野,搭配腕部摄像头捕捉手部细节;而MEgo Gripper二指夹爪则能实现毫米级精准捕捉与亚毫秒级全局同步。
“传统采集设备太重、太贵、场景受限,普通人就能用这套设备完成高质量数据采集。”姚卯青向记者解释,这套“以人为核心”的轻量化方案,大幅降低了数据采集的门槛与成本。

这背后是觅蜂与传统数据公司的本质区别。姚卯青将其概括为三个维度:定位上,觅蜂不做“单点数据服务商”,而要打造“平台型供给”基础设施;能力上,实现真机遥操、无本体采集、仿真数据全范式覆盖;生态上,从“卖数据”升级为“建生态、定标准、搭网络”。
一个现实问题是:物理AI数据到底怎么卖?谁来买?
“现阶段主要集中在走在前列的大模型公司、具身智能大厂和创业公司。”姚卯青透露,目前国内市场真机数据价格在每小时几百到一千元人民币不等。他算了一笔账:“100万小时按1000元算,也就是10亿元。你看那些大模型公司,每年AI支出都是千亿规划。”
更令外界意外的是,尽管价格不菲,市场却呈现“供不应求”的状态。“普遍大的需求方都是你有多少我就买多少,你什么时候有我马上要的状态。”姚卯青说。
不担心“养肥”竞争对手,愿做行业“卖铲人”
面对“是否会担心数据平台帮助竞争对手”的尖锐提问,姚卯青回答得很干脆:“完全不担心。”
他进一步解释:“如果有人用了我们的数据训练出更强大的算法,我们非常开心。整个具身智能的应用前景太广阔了,谁先突破并不重要。我们不是为了让智元跑得快一点,而是希望行业里有人比智元更牛。”
这种“卖铲人”的心态,也体现在觅蜂的生态布局上。当天,觅蜂联合多家机构发起“蜂巢数据共创行动”,目标2030年达成百亿小时级数据产能,构建全球最大的物理AI数据流通网络。据悉,该平台已为NVIDIA GR00T系列模型提供了80%的预训练真机数据,AgiBot World开源数据集在Hugging Face累计下载超110万次。
不过,数据生意并非没有挑战。当被问及如何证明数据质量时,姚卯青坦承这是“灵魂拷问”,“很难给出完美答案”。
他的解决思路是构建闭环验证能力:“通过自己的数据做后训练,在仿真或真机上测试效果,至少能部分证明数据的有效性。”目前,觅蜂已建立从任务设计、标准化采集、人工审核到算法验证的全流程质量保障体系,2026年目标实现千万小时级年数据产能。
文、图/广州日报新花城记者:陈庆辉
广州日报新花城编辑:李光曼