2025年2月22日,在2025全球开发者先锋大会"大模型生产力"分论坛上,商汤科技正式发布基于世界模型强化学习的下一代端到端自动驾驶大模型。商汤科技联合创始人、绝影智能汽车事业群总裁王晓刚表示,这项技术突破重构了算法、算力与数据的协同关系,为行业提供低成本、高泛化的解决方案,标志着自动驾驶发展进入"认知智能"新阶段。

技术突破破解行业两大核心瓶颈
针对国内车企普遍存在的数据规模不足、传感器标准不统一等问题,商汤创新采用世界模型生成式仿真技术。该技术可模拟11个摄像头视角的动态驾驶环境,生成符合物理规则与交通法则的高保真视频数据,支持天气、路况、人车交互等元素的精细化编辑。目前,已构建覆盖1024类场景的千万级场景库,通过虚拟环境日均生成相当于百万公里真实驾驶数据,极大降低了对真实数据的依赖。
据介绍,该模型还引入长思维链强化学习框架,使车辆能在仿真环境中探索多样化驾驶策略。面对同一避障场景,模型可生成远超人类经验的解决方案,并通过实时评分筛选最优路径。王晓刚特别指出:"这不仅突破了数据瓶颈,更通过长链推理能力创造出人类未曾接触过的复杂场景应对方案。"
王晓刚介绍,该模型还创新采用三级训练架构:初期通过少量真实数据构建基础模型;中期利用世界模型生成极限场景持续优化决策逻辑;最终通过知识蒸馏将云端大模型轻量化至车载芯片,借助Moe架构动态激活参数,使算力需求降低60%,成功适配中低端硬件平台。
直击行业痛点提出创新方案
面对国内自动驾驶行业数据壁垒与性能天花板的双重挑战,商汤科技展现出独特的技术路径:通过"小样本启动+仿真扩增"机制,仅需少量真实数据即可生成千万级高难度场景库;依托强化学习突破模仿学习上限,推动安全性与决策效率跃升。目前,其"日日新"大模型已在医疗、办公等领域赋能3000余家生态企业,并在去年国内大模型评测中与OpenAI GPT-4并列第一。
据悉,商汤提出"一基两翼"战略架构:以多模态融合的大模型为技术基座,持续提升感知、推理与决策能力。2025年即将推出的"日日新6.0"模型将显著增强跨模态交互与场景理解能力,实现从感知到控制的全链路自动驾驶。结合动态参数激活技术与标准化场景库,L4级自动驾驶系统将加速向20万元级市场渗透。
根据规划,搭载新模型的实车路测成果将于2025年上海车展首次公开亮相,首批合作企业涵盖乘用车与物流领域。"自动驾驶的竞争已从数据规模转向算法创新。世界模型与强化学习的结合,不仅重新定义了技术边界,更为行业揭示了从'功能模块'向'认知智能'跃迁的核心路径。"王晓刚如是说。
文、图/广州日报新花城记者:陈庆辉
广州日报新花城编辑:周裕妩