3月17日,大模型“六小虎”之一零一万物正式对外发布了万智企业大模型一站式平台,并宣布可提供企业级DeepSeek部署定制解决方案。零一万物创始人兼CEO李开复在线上发布会上接受包括本报在内的媒体记者采访时表示,2025是AI-First(人工智能优先)应用爆发年,也是大模型商业化的大考年。零一万物将在基于自身企业数据库基础上对DeepSeek-R1进行模型微调,使之符合垂直领域的业务需求。
2024年5月,零一万物对Scaling Law的边际收益递减进行了推演,最终决定放弃原定万亿参数的Yi-X-Large,转而训练更轻量化的MoE(混合专家)模型——Yi-Lightning。
李开复
2025年1月,零一万物否认“将卡和预训练团队卖给了阿里”。并宣布与阿里云成立产业大模型联合实验室,正式聚焦轻量化模型,以产业大模型发力商业落地。
李开复表示:“AI 需要市场,市场也需要 AI,行业亟需实现‘性能x性价比’ 的AI,这是一个双向奔赴的过程。”
作为性能媲美OpenAI顶级模型的国产开源模型,DeepSeek凭借其在MoE(混合专家)模型架构上的突破创新和行业领先的推理能力成为“中国智造”的新旗帜。
然而,在将DeepSeek落地的产业过程中,现有的“DeepSeek Inside”企业解决方案普遍存在着部署难、应用难、定制难等三大核心痛点。当前市场上尚未形成能够系统性解决上述痛点的完整方案。
因此,零一万物推出的万智企业大模型一站式平台主要向企业客户提供企业级DeepSeek部署定制解决方案,涵盖了DeepSeek 模型部署、应用实践以及模型微调工具。在确保数据安全的前提下,上述方案能够将DeepSeek无缝嵌入到企业业务体系,快速支持行业模型定制和应用创建,让原本的开源AI模型真正成为完整、合规且安全的一站式解决方案。
李开复在接受媒体采访时表示,在零一万物过往全球化应用实践中得到验证的其他成熟功能,如多模态文档阅读、高精准度的OCR(光学字符识别)解析、AI写作、AIPPT生成、AI数字人等也都被封装入万智企业大模型服务平台,成为企业客户即插即用的标准化组件。
作为世界第一梯队的通用基座大模型,DeepSeek-R1在数学、代码、自然语言推理等场景下均有优秀表现。但由于DeepSeek-R1本身并不支持Function Call(工具调用),JSON Output(JSON 格式的字符串输出)。这两大企业刚需能力的缺失,使其在落地专业工作场景内进一步受限。
对于期待通过接入DeepSeek-R1实现提效的企业而言,基于DeepSeek-R1进行SFT(监督微调)成为刚需。零一万物率先给出基于 DeepSeek-R1的成熟微调方案,企业能够在万智企业大模型一站式平台上,基于自身企业数据库对 DeepSeek-R1进行模型微调,使之符合垂直领域的业务需求。
李开复介绍,目前零一万物大模型ToB 解决方案已经与多家世界500强企业客户展开合作,涉及能源、零售、游戏、电商、智算等多个领域,与中国领先的餐饮公司百胜中国、创新型亲子家庭服务商孩子王、新型智能算力运营服务厂商图灵新智算、知名内容营销一站式服务商乐淘互娱、数字化营销服务商直客通等都已签约。以大模型技术为代表的AI2.0将重塑各行各业的生产力格局,颠覆现有的企业组织结构和规模。但是目前大模型能力并未在ToB应用上释放出全面潜能,只有进入业务核心系统、快速轻量级大批量部署才能最大程度地为企业降本增效。零一万物会继续坚持“Infra+模型+应用”三位一体布局,以垂直整合的商业模式探索AI ToB 的最佳实践。生成式 AI“长坡厚雪”,零一万物愿与产业内富有远见的头部企业共同探索。
李开复同时表示,尽管零一万物的大模型预训练成本仅有Open AI的3%,但他们不会走“超大基模”烧钱模式。
文、图/广州日报新花城记者:肖欢欢
广州日报新花城编辑:蔡凌跃