关闭引导
百度真急了,大模型进入“开源盛世”
2025-02-17 14:53:37
广州日报新花城

图片

作者 | 荣智慧

编辑 | 向   由

唯物的中国芯片产业深度观察

百度忽然来了一个180度转弯。

2月13日,百度宣布聊天机器人“文心一言”于4月1日起免费。2月14日,百度又宣布文心大模型4.5系列陆续推出,6月30日正式开源。

在开源的深度求索(DeepSeek)面向大众之前,百度一直是闭源模型和收费服务的拥护者。

然而,连人工智能领头羊OpenAI也扛不住压力,早一步抛出“免费加开源”消息;一众互联网巨头如英伟达、亚马逊、微软均将深度求索模型集成到自家平台;一堆做“深度求索入口”的应用也趁机捞了一把流量,包括不缺流量的支付宝和微信。

图片

“文心一言”于4月1日起免费,并于2月13日起上线“深度搜索”功能/图源:@文心一言

百度的转变并不是一个孤立事件。

受深度求索的开源“刺激”,全球人工智能大模型竞争技术路线逐渐有开源压倒闭源之势。开源和闭源并没有绝对的优劣之分,只是当市场上出现颠覆者后,原先的主导者失去闭源的盈利护城河,不得不借“开源盛世”来扩张生态。

这场由深度求索引发的效率革命,标志着大模型竞争进入“后暴力计算时代”:模型效率取代绝对性能,成为核心竞争力;同时,全球AI权力秩序被重构,美国“一家独大”霸权遭到削弱。

在后浪推前浪的趋势下,未来的胜出者将是平衡驾驭二者的“变色龙”,既通过开源获取生态势能,也利用闭源实现价值捕获。


01

“顺势而为”

深度求索“以小博大”,颠覆了人工智能大模型玩家的旧格局。

监测网站Similarweb数据显示,2025年1月,深度求索网站的访问量环比增长2257%,单月访问量达2.78亿次,虽然与ChatGPT高达38亿次的访问量还有不小差距,但依然超过了苹果iCloud、Salesforce等大公司网站。

OpenAI最先乱了阵脚,不断开放新功能“挽尊”。

1月31日,放出推理模型o3-mini。2月3日,搜索网页提炼文献的深度研究(Deep Research)上线。2月5日,带有网页搜索功能的ChatGPT面向所有用户开放。

图片

ChatGPT的深入研究

2月13日,CEO萨姆·奥特曼在社交媒体宣布下一代AI大模型路线图,GPT-5大模型基础版将对ChatGPT免费用户无限量开放。ChatGPT的付费订阅者中,Plus版、Pro版订阅者可以解锁更“聪明”的GPT-5。模型功能将包含语音、Canvas(写作、编码工具)、搜索、深度研究等。

几乎同时,百度也打出“免费加开源”牌。先是PC端聊天应用“文心一言”和移动端应用“文小言”将于4月1日起全面免费,文心大模型4.5也将在6月30日开源。

环球同此凉热,巨头也担心“下课”。

OpenAI和百度齐齐从闭源转向开源,原因比较接近:二者都是人工智能模型领域的先行者和主导者,本来可以靠闭源和收费来赚钱。如今深度求索物特别美、价尤其廉、人民群众十分喜欢,他们再唱老调就真的赚不到钱了。

在美国,靠ChatGPT一举成名的OpenAI,最早推出收费模式。2022年11月ChatGPT免费上线,2023年2月便推出20美元/月的Plus会员。2024年5月GPT-4o面世,12月推出200美元/月的Pro版本。

ChatGPT至今有4个收费计划,Team、Enterprise面向企业,Plus、Pro面向个人。Plus可以使用OpenAI全部模型,也可以创建GPTs;Pro用户在Plus的权益之外,还可以使用今年1月刚推出的智能体功能Operator(操作员)。

图片

ChatGPT个人版本中的Plus、Pro收费计划

在中国,百度较早入局人工智能大模型领域。2021年7月推出文心大模型3.0,2023年3月推出聊天机器人“文心一言”。2023年6月,文心大模型升级到3.5版本。10月,文心大模型4.0版本发布。2024年6月,4.0 Turbo发布。

据百度称,2024年文心大模型日均调用量超过15亿次,较2023年增长超30倍。

2023年11月,百度文心一言推出付费会员模式,连续包月价格为49.9元/月,会员可以使用2023年10月发布的、目前仍是百度最新的模型文心一言4.0,此外还有图片生成、网页插件等权益。

中国其他大模型公司也有收费模式。智谱AI的聊天机器人智谱清言,连续包月价格为19元/月,可解锁最新模型的无限次使用、视频生成等功能;月之暗面旗下的Kimi智能助手有打赏功能,但并未绑定使用权益。

总体来看,在人工智能大模型本身就存在开源路线、Meta的开源大模型Llama实力雄厚的情况下,闭源模型并不存在高枕无忧的护城河。

开源的深度求索一问世,“头铁”的OpenAI、百度就不得不“顺势而为”了。


02

开闭之争

开源和闭源的“源”,指的是“源代码”。开放源代码,允许其他开发者使用、传播,技术可以持续改进。“开源”理念源自20世纪90年代开发者社区。

“战争”是埃隆·马斯克挑起来的。2024年2月,作为OpenAI的创始人和最早投资人之一,马斯克起诉OpenAI违背创始协议、追逐商业利益,将AI大模型闭源。OpenAI反唇相讥,称马斯克早就认可其“追逐商业利益”。

3月,马斯克将旗下大模型Grok-1开源,以此证明自己“并非逐利”。一个月后,Meta发布Llama3系列模型,是当时最强大的开源大模型。原本闭源的谷歌也有点坐不住了,2024年2月发布开源模型系列Gemma。

图片

Gemma 2与Llama 3、Grok-1基准测试结果对比

美国的开源模型阵营,对闭源的生成式预训练模型GPT穷追不舍。业界普遍认为闭源模型的能力把开源模型甩开“一年半左右”。

在中国,由于算力受到阻碍,开源还是闭源的讨论很少。2024年,百度创始人、CEO李彦宏多次表示,“模型开源的意义其实不是很大”“开源模型会越来越落后”。

也有一些公司选择开源路线。

金沙江创投主管合伙人朱啸虎的言论“不会投资中国的基座大模型创业公司”曾激起热议,他认为开源大模型随时会颠覆闭源基座模型。阿里云先后开源多个模型;创业公司里,零一万物、百川智能、面壁智能都在打造开源模型。

中国各地方政府支持的实验室或研究所也聚焦开源大模型,包括科技部和北京市政府支持成立的智源研究院,深圳市政府主导的鹏城实验室,上海市政府主导的上海AI实验室,以及粤港澳大湾区数字经济研究院等。

虽然开源模型和闭源模型还有一定差距,但随着技术路线的清晰和开源技术的迭代,开源和闭源的差距将不断缩小、直至拉平。

但坚持“闭源更好”的百度,当时的判断是,开源并不便宜,且技术会越发落后,“开源模型没有商业模式”。这一判断基于三个条件:一是算力和工程能力门槛高,只有科技大厂才有实力主导开源模型;研发成本高,传统开源软件的商业模式“没钱可烧”;三是闭源模型通过程序接口(API)调用,可供企业部署软件。

图片

上海2023世界人工智能大会上百度展示文心大模型(文心一格,文心一言)的核心科技/图源:视觉中国

深度求索“异军突起”,恰恰证明这三个条件并不完全成立。

而且,百度期待的“企业级客户”也兴趣寥寥。因为数据是企业最宝贵的资源,一旦放在大厂平台上,日后是否真正属于自己就不好说了。移动互联网时代的“像素级复制”,曾给中国创业者最沉重的打击。

论中国互联网三巨头BAT,阿里是押注开源的典型代表。2022年11月,阿里发布了中文AI大模型开源社区“魔搭”(Model Scope)。通义千问模型也是开源的。2023年8月以来,阿里云先后开源和更新了数十个参数版本的模型。

图片

魔搭社区的部分模型库

腾讯的“混元大模型”去年选择开源,其公开说法是,经过一年多的探索,在闭源模式下将产品和技术积累到一定程度后,才选择了开源。

2025年初,深度求索第一次令中国企业看到了开源模式的商业价值和影响力、看到了产业格局变化的可能性、看到了生态开放的冲击力——技术民主化的拐点已经到来。

“最后”,百度选择开源。


03

“开源盛世”?

互联网时代,一贯存在“巨头守成”加“新锐破局”的竞争。

由于“新锐”深度求索的颠覆性冲击,巨头OpenAI立刻作出“免费”反应,随即产生了传导效应——GPT-4o免费后,中国AI初创公司的API调用成本下降30%,百度随之失去了收费壁垒。而OpenAI的闭源数据飞轮仍在加速,其日均新增训练数据量动辄是中国企业的5倍以上,技术代差可能进一步拉大。

对于AI企业而言,开源或闭源只是一种发展手段,不是什么“绝对理想”。

要理解开源模型和闭源模型的核心差异,可以从基础条件、技术原理、应用场景、可营利性和局限性等五个维度来观察。

从基础条件看,开源模型以公开数据集、社区贡献数据为数据来源,以分布式的、开发者自有的GPU集群为算力支撑,开发主体是社区协作者,比如GitHub的开发者,需要处理开源协议兼容性,存在一些合规成本。

图片

2023年,GitHub的开发者破亿

闭源模型以专有数据如用户行为日志、私有数据库、清洗后公开数据为数据来源,靠集中式的超算中心为算力支撑,开发主体是企业级团队,需要承担数据隐私、版权诉讼风险等合规成本,像纽约时报就因数据来源跟OpenAI打过官司。

光看成本,还是开源模型省钱。Meta的Llama2训练成本约250万美元,OpenAI的GPT-4依赖微软Azure算力,单次训练成本超1亿美元。

从技术原理看,开源模型的架构多为稠密Transformer(注意力机制深度学习模型)变体,训练方法为公开强化学习框架,靠社区反馈迭代,靠外部审查保障安全,比如抱脸(Hugging Face)的模型扫描。

闭源模型的架构为融合私有架构,像GPT-4是稀疏化MoE(混合专家模型),训练方法为定制化强化学习,靠用户交互数据实时反哺迭代,内置内容过滤机制。

闭源模型在稀疏激活(激活极少比例参数处理每个Token)和多模态对齐(文本—图像—代码联合表征)领域,领先开源模型1.5—2年左右。

从应用场景看,开源模型可以为企业做私有化部署,模型剪裁后进行边缘计算,在手机端运行,可以为社区贡献数据。闭源模型可以为企业提供标准化SaaS服务,在云端进行计算和推理,依赖商业价值导向来处理长尾需求。

像彭博基于开源Llama做了一个金融领域模型,成本降低了70%。Salesforce Einstein GPT直接调用了GPT-4的API,开发CRM(客户关系管理)工具。

从收入差异看,开源模型靠技术服务——模型优化和部署赚钱,但定价受社区生态制约,边际成本会随着用户增长而摊薄(开发者贡献算力),护城河则来自生态规模,像“抱脸”积累了15万个模型。

闭源模型靠订阅费用赚钱,垄断定价权,边际成本则随用户线性增长而上升(云计算资源被消耗),护城河来自技术代差。

开源模型一般5—7年才能盈利,靠开发出售Linux套件的Red Hat就是例子。闭源模型3年内就能实现正向现金流,OpenAI在2023年营收超16亿美元。

图片

OpenAI 2024年的估值和预计收入数据

从局限性看,开源模型的迭代比较慢,有合规风险和安全漏洞,一旦开发者流失就失去了可持续性。闭源模型由于存在技术黑箱,无法修改底层模型,很难针对性优化,数据隐私问题和单点故障也很难解决,还面临高资本的开支压力。

开源模型最大的限制就是生态碎片化。闭源模型则无力克服技术锁死效应。

实际上,开源与闭源并非对立,二者可能构成AI进化的双螺旋结构:开源加速技术民主化,闭源推动商业可持续性。

未来的胜出者将是平衡驾驭二者的“变色龙”,既通过开源获取生态势能,也利用闭源实现价值捕获。

文中配图部分来源于视觉中国,部分来源于网络

值班主编 | 张来

排版 | 菲菲

浏览量:
@新花城 版权所有 转载需经授权