1月16日,智谱AI首届技术开放日(Zhipu DevDay)在北京中关村国家自主创新示范区展示中心成功举办。现场,智谱AI团队全面展示了其投身于大模型事业三年多来所积累的技术成果,并发布了新一代基座大模型GLM-4。

智谱方面表示,GLM-4的整体性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。除此之外,GLM-4大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线,用户用简单的提示词指令就能创建属于自己的 GLM 智能体。

“大模型创新研发是一条长征路,一枝独秀不是春,我们希望与人工智能行业所有的参与者、产业链上下游合作伙伴、开发者社区、学术界一同努力,为中国AI新未来贡献绵薄之力。”智谱AI CEO张鹏表示。为推动大模型研发的大进展,促进大模型整个开源生态的大繁荣,2024年,智谱AI也将发起开源开放的大模型开源基金,该计划包括三个“一千”:智谱AI将为大模型开源社区提供一千张卡,助力开源开发;提供1000万元的现金用来支持与大模型相关的开源项目;为优秀的开源开发者提供1000亿免费API tokens。
成立于2019年的智谱AI,是国内最早研发大模型的企业之一,致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司于2020年底开始研发GLM预训练架构,2021年训练完成百亿参数模型GLM-10B,同年利用MoE架构成功训练出收敛的万亿稀疏模型,2022年合作研发了中英双语千亿级超大规模预训练模型GLM-130B。2023年,智谱AI推出了基于千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B,使得研究者和个人开发者进行本地微调和部署成为可能。
文/广州日报·新花城记者 张露
广州日报·新花城编辑:麦晓颖