返回探索

GLM-5

开源界的“架构师”级大模型,让 Agent 真正像人一样思考与执行

💡 GLM-5 是由智谱AI(Z.ai)发布的 744B 参数超大规模开源模型,采用 MIT 协议,支持完全免费商用。它专为“长线程自主工程任务”设计,引入了全新的 Agentic Engineering 流程,使其在处理复杂工程任务时不再只是简单的代码补全,而是能够像资深架构师一样进行“理解-规划-拆分-执行-自检”。在多项 Agent 基准测试中,GLM-5 登顶开源榜首,性能直逼 Claude Opus 4.6 和 GPT-5.2,而 API 成本仅为前者的五分之一,是 2026 年开发者追求性价比与技术自主的首选方案。

"GLM-5 就像是一个不要工资、自带干粮,还能帮你把整栋大楼图纸画好并盖完的“全能架构师”,而你只需要给它准备一间足够大的“机房宿舍”。"

30秒快速判断
这App干嘛的:智谱AI 发布的 744B 参数开源大模型,专为“长线程自主工程任务”设计,具备极强的 Agent 能力。
值不值得关注:非常值得。它是首个在 Agent 基准测试上拿到开源第一的模型,API 价格仅为 Claude Opus 的 1/5,且采用 MIT 协议。
8/10

热度

9/10

实用

138

投票

产品画像
完整分析报告

GLM-5:开源模型第一次让闭源巨头真正紧张了

2026-02-14 | ProductHunt | GitHub | 官网

GLM-5 chat.z.ai 界面

chat.z.ai 的主界面,右下角有 Agent/Chat 模式切换。这是 GLM-5 最直观的使用入口——不需要任何本地部署,打开网页就能体验 "Agentic Engineering" 模式。


30秒快速判断

这玩意干嘛的:智谱AI(Z.ai)发布的 744B 参数开源大模型,MIT 许可证,专门为“长线程自主工程任务”设计——说白了就是让 AI 不只是补全代码,而是像架构师一样先规划、再动手。

值不值得关注:非常值得。这是开源模型第一次在 Intelligence Index 上突破 50 分,在 BrowseComp、MCP-Atlas 等 Agent 基准测试上拿到开源第一。API 价格只有 Claude Opus 的 1/5。如果你对“AI 帮你做工程”这件事感兴趣,GLM-5 是 2026 年 2 月最值得关注的发布之一。


与我有关三问

与我有关吗?

目标用户是谁:用 AI 辅助编程的开发者、想降低 LLM API 成本的团队、关注开源 AI 生态的技术人。

我是吗? 如果你满足以下任一条件,你就是目标用户:

  • 你正在用 Claude/GPT 写代码,但每月 API 账单让你肉疼
  • 你在做需要 AI 自主执行多步骤任务的产品(Agent 应用)
  • 你想在自己的服务器上跑一个“接近 Claude 水平”的模型
  • 你是中国开发者,想用一个没有地缘政治风险的国产模型

什么场景会用到

  • 复杂后端架构设计和重构 -- 用这个
  • 大型代码库的迁移项目 -- 用这个
  • 简单的代码补全和短对话 -- 不需要这个,GLM-4.7 或更轻量的模型就够了
  • 需要图片/音频理解 -- 不适合,GLM-5 只有文本能力

对我有用吗?

维度收益代价
金钱API 成本降低 80%(对比 Claude Opus)自部署需要 1.5TB VRAM 的硬件
时间复杂任务“一次过”的概率更高简单任务反而比小模型慢
自由度MIT 开源,想怎么用就怎么用量化部署需要一定技术功底

ROI 判断:如果你团队每月 API 开销超过 $500,花半天时间把部分任务迁移到 GLM-5 API 上,一个月就能回本。如果你只是个人开发者偶尔用用,直接 chat.z.ai 免费体验就行,不用折腾部署。

喜闻乐见吗?

爽点在哪

  • “结构优先”的工作方式:GLM-5 拿到任务后不会马上开始写代码,而是先理清任务边界、拆分模块、规划系统结构,然后才进入实现。这种“先画蓝图再盖楼”的感觉,用过的人都说比“直接吐代码”靠谱得多。
  • 幻觉率全行业最低:AA-Omniscience 指标 -1 分,比上一代提升 35 分。它学会了“不知道就说不知道”。
  • MIT 开源的自由感:不用担心 Meta 那种“你用户过亿就得重新谈许可”的限制。

用户真实评价

"那些在编码前先规划的模型改变了人们构建软件的方式。更少的试错,更高的一次性正确率。" — Reddit 用户

"它真正的实力在于:极高的性能价格比。" — @fabienr34

"开源模型落后闭源模型一代的时代正在终结。" — VentureBeat


给独立开发者

技术栈

  • 架构:混合专家模型 (MoE),744B 总参数,256 个专家,每 token 激活 8 个(44B 活跃参数)
  • 注意力机制:DeepSeek Sparse Attention,200K token 上下文窗口
  • 训练数据:28.5 万亿 tokens
  • 训练框架:华为昇腾芯片 + MindSpore(完全不依赖 NVIDIA GPU)
  • 后训练:"Slime" 异步强化学习框架 + Deep Thinking 自我批评模式
  • 部署:vLLM / SGLang / Ollama / llama.cpp 全支持

核心功能实现

GLM-5 的 "Agentic Engineering" 不是营销话术,它的架构确实在往“自主工程师”方向设计。接到任务后,模型会走一个“理解 -> 规划 -> 拆分 -> 执行 -> 自检”的流程,而不是直接生成代码。这在多步骤、长时间运行的任务中,效果提升非常明显。

在 BrowseComp(网页信息检索)和 MCP-Atlas(工具调用+多步执行)上排名开源第一,说明它不只是“写代码快”,而是“调工具、跨步骤协调”的能力也到位了。

GLM-5 Benchmark 对比

8 项基准测试对比图:GLM-5(深蓝色)在 BrowseComp、MCP-Atlas、Humanity's Last Exam 上超过所有竞品;在 SWE-bench 上接近 Claude Opus 4.5(80.9% vs 77.8%),但已超过 Gemini 3 Pro 和 GPT-5.2。

开源情况

  • 许可证:MIT License -- 完全免费商用,可以微调、分发、做商业产品
  • 代码仓库github.com/zai-org/GLM-5,470 stars
  • 权重下载:HuggingFace + ModelScope + Ollama
  • 类似开源项目:DeepSeek R1(更便宜但推理能力不如)、Llama 3(Meta License 限制更多)、Qwen、Kimi K2.5(有视觉能力)

自己做类似的东西? 难度:极高。744B MoE 模型需要数千张 GPU 训练几个月,光训练成本就是千万美元级别。但你可以基于开源权重做微调,这个门槛就低多了。

商业模式

  • API 定价:约 $1/百万输入 tokens,约 $3/百万输出 tokens(OpenRouter)
  • 对比 Claude Opus 4.6:便宜约 80%
  • 变现逻辑:开源模型做品牌 + API 收入 + 企业定制方案(港股上市公司,主要靠 to B)

巨头风险

GLM-5 本身就是“巨头”出品(智谱是中国 AI 六小虎之一,港股上市,市值 $19B)。真正的风险是:Claude、GPT 继续降价,开源优势被压缩。但 MIT 开源 + 可自部署这张牌,闭源模型永远打不出来。


给产品经理

痛点分析

  • 解决什么问题:开源 AI 模型“够用但不够强”的尴尬 -- 之前开源模型至少落后闭源一代,GLM-5 第一次把差距缩到“基本持平”
  • 痛点有多痛:高频刚需。每个用 LLM 的团队都在为 API 成本和供应商锁定头疼
  • 从 "Vibe Coding" 到 "Agentic Engineering":不只是写代码片段,而是能自主规划、执行、调试完整的工程任务

用户画像

  • 核心用户:AI 应用开发团队(需要稳定、便宜的推理能力)
  • 次要用户:独立开发者(想本地跑强模型)、中国企业(规避地缘政治风险)
  • 使用场景:Agent 应用后端、大规模代码迁移、复杂文档生成(原生支持 .docx/.pdf/.xlsx)

功能拆解

功能类型说明
Agentic Mode核心自主规划+执行多步任务
Deep Thinking核心自我批评循环,压低幻觉率
200K 上下文核心可以吃进整个代码仓库
文档生成锦上添花直接输出 .docx/.pdf/.xlsx
Chat Mode基础普通对话模式

竞品差异

对比项GLM-5Claude Opus 4.6GPT-5.2DeepSeek R1
定价约 $1/M 输入约 $5/M 输入约 $1.75/M 输入更便宜 96%
开源MIT 开源闭源闭源开源
多模态仅文本文本+视觉全模态仅文本
SWE-bench77.8%80.9%69%更低
Agent 能力开源第一行业顶级一般
上下文200K200K400K128K

可借鉴的点

  1. “先规划后执行”的 Agent 设计模式 -- 不是直接输出结果,而是先展示思考过程,用户信任度更高
  2. Agent/Chat 双模式切换 -- 简单任务用 Chat 省资源,复杂任务切 Agent,用户自主选择
  3. MIT 开源建信任 -- 在 AI 模型信任危机的当下,完全开放权重是最强的信任信号

给科技博主

创始人故事

这是一个典型的“清华教授创业”故事,但结局比大多数精彩得多:

  • 唐杰(Tang Jie):清华大学教授,IEEE/ACM/AAAI 三料 Fellow,2021 年参与打造了 1.75 万亿参数的“悟道”模型
  • 李娟子(Li Juanzi):清华教授,联合创始人
  • 张鹏(Zhang Peng):CEO,清华校友,负责把实验室技术变成生意

2019 年从清华知识工程实验室(KEG)孵化,最初做知识图谱,2020 年看到 GPT-3 发布后果断转向大模型。2026 年 1 月 8 日港股 IPO,成为全球第一个上市的纯基础模型公司。

有意思的是,GLM-5 发布前几周,它的代号 "Pony Alpha" 就在 Reddit 上泄露了,引发了一波猜测热潮。

争议点/讨论角度

  • “开源 ≠ 人人可用”:模型 1.5TB,部署需要的硬件比一辆车还贵。所谓“开源民主化”到底是真的还是口号?
  • 华为芯片训练:GLM-5 完全在华为昇腾芯片上训练,不依赖任何美国 GPU。2025 年美国把智谱列入实体清单,这个技术独立性意味着什么?
  • "Agentic Engineering" 谁先说的?:智谱、Karpathy、Addy Osmani 几乎同时在用这个词,Simon Willison 专门写了博客讨论这个命名权的问题
  • IPO 后一个月暴涨 173%:是实力还是泡沫?$19B 市值对比 24.7 亿亏损,投资者在赌什么?

热度数据

  • PH:138 票(中等热度)
  • Hacker News:多条讨论帖上首页
  • Twitter/X:Z.ai 官方推文 88.97 万浏览
  • 媒体覆盖:VentureBeat、South China Morning Post、Latent Space、Medium 大量报道
  • Simon Willison 博客:专文评论

内容建议

  • 适合写的角度:"开源 AI 的代价 -- 当免费模型需要百万级硬件"
  • 蹭热点机会:中美 AI 竞争叙事、“Agentic Engineering”概念解读、开源 vs 闭源 2026 终极对决

给早期采用者

定价分析

方式费用适合谁够用吗?
chat.z.ai免费体验用户日常体验够了
API (OpenRouter)约 $1/$3 /M tokens开发者/小团队性价比极高
Ollama 本地零 API 成本,但需硬件技术极客量化后 Mac Studio 可跑
vLLM 集群硬件投入大企业级部署最佳性能

隐藏成本:自部署的电费和硬件折旧。BF16 满血版需要 ~1.5TB VRAM(约 20 张 A100 80GB),就算 2-bit 量化也需要 241GB(高配 Mac Studio 级别)。

上手指南

  • 上手时间:5 分钟(API/chat.z.ai)到 2 小时(本地 Ollama)
  • 学习曲线:低(API)/ 中(本地部署)

最快开始方式

  1. 直接去 chat.z.ai 试用(零门槛)
  2. 用 Ollama 本地跑:ollama run glm-5:cloud
  3. 用 API:在 OpenRouter 注册,获取 API key,兼容 OpenAI SDK

坑和吐槽

  1. 简单任务反而慢:短对话、代码补全这种活儿,GLM-5 有明显延迟。用户反馈“搜索建议插件换成 GLM-5 后,用户能感觉到那一点点迟钝”
  2. 只有文本:没有图片理解、没有音频处理。如果你需要多模态,看 Kimi K2.5 或 GPT-5.2
  3. 推理成本翻倍:比 GLM-4.7 贵了 2 倍。对于已经在用 GLM-4.7 的团队,升级要算清楚账
  4. 生成质量偶有瑕疵:测试中发现 UI demo 里出现假文本消息、图形质量下降等小问题
  5. Token 效率不如 Claude:输出的 token 更多但信息密度不如 Claude Opus

安全和隐私

  • 开源透明:权重完全开放,理论上可以审计
  • 数据存储:自部署 = 数据完全在本地;API = 走 Z.ai 或 OpenRouter 的服务器
  • 注意:智谱是中国公司(虽然港股上市),数据敏感的场景建议自部署

替代方案

替代品优势劣势
DeepSeek R1便宜 96%,部署门槛低推理能力不如 GLM-5
Llama 3Meta 生态成熟License 限制多,性能略逊
Kimi K2.5有视觉能力Agent 能力不如 GLM-5
Claude Opus 4.6 API目前最强贵 5 倍,闭源
GPT-5.2 API全模态,400K 上下文中等价位,闭源

给投资人

市场分析

  • LLM 全球市场:2026 年约 $10B,预计 2033 年达 $82B(CAGR 33.7%)
  • 企业 LLM 市场:2026 年 $5.91B,预计 2034 年达 $48.25B(CAGR 30%)
  • 亚太区:增速全球最快,CAGR 89.21%
  • 成本趋势:GPT-4 级性能成本已降至 2 年前的 1/100

竞争格局

层级玩家定位
闭源头部Anthropic (Claude)、OpenAI (GPT)最强性能,最高价格
开源头部Z.ai (GLM-5)、Meta (Llama)接近闭源性能,MIT/开源许可
性价比层DeepSeek、MiniMax、xAI (Grok)更便宜,性能次一档
多模态层Google (Gemini)、OpenAI文本+视觉+音频全能

Timing 分析

  • 为什么是现在:开源模型追上闭源的窗口从 18 个月缩短到几个月。GLM-5 发布后 3 天就能在 Ollama 上跑,这种速度前所未有
  • 技术成熟度:MoE 架构、Sparse Attention、异步 RL 都是成熟技术的创新组合,不是实验性质
  • 市场准备度:企业已经从“试试 AI”进入“AI 是核心基础设施”阶段,需要可控、可自部署的方案

团队背景

  • 创始人:唐杰(清华教授,IEEE/ACM/AAAI Fellow)、李娟子(清华教授)
  • CEO:张鹏(清华校友)
  • 公司地位:中国“AI 六小虎”之一,IDC 评为中国第三大 LLM 市场玩家
  • 过往成绩:GLM 系列从 2021 年迭代至今,GLM-4.7 上线一周就在 OpenRouter 上 token 用量排第一

融资情况

  • IPO:2026 年 1 月 8 日港股上市(HKEX: 2513),募资 $558M
  • IPO 估值:$6.6B
  • 当前市值:$19B+(IPO 后一个月暴涨 173%)
  • 总融资:约 $1.5B
  • 投资人:阿里巴巴、蚂蚁集团、腾讯、美团、小米、红杉、沙特阿美
  • 财务状况:2024 年净亏损 RMB 24.7 亿,研发支出 > 收入 700%
  • 盈亏平衡:预计 2027-2028 年
  • 分析师:JPMorgan 给“增持”评级,目标价 HK$400

结论

GLM-5 是 2026 年开源 AI 最重要的发布之一。它不是“又一个开源模型”,而是第一个在 Agent 能力上真正逼近 Claude/GPT 的开源选手。但“开源”不等于“免费午餐”-- 真正的成本藏在硬件里。

用户类型建议
独立开发者试试。先用 chat.z.ai 或 API 感受下,如果你在做 Agent 应用,GLM-5 是目前性价比最高的选择
产品经理关注。“Agentic Engineering” 是 2026 年最重要的产品范式之一,GLM-5 的“先规划后执行”设计值得借鉴
科技博主可写。清华教授 -> 港股 IPO -> 美国实体清单 -> 华为芯片训练开源模型,故事线足够精彩
早期采用者值得折腾。API 够便宜,Ollama 部署够简单。但如果你需要多模态,这个不适合
投资人值得关注但需谨慎。$19B 市值对比 24.7 亿亏损,短期看热度,长期看能否在开源 + API 的模式下走出盈利路径

资源链接

资源链接
官网z.ai/blog/glm-5
GitHubgithub.com/zai-org/GLM-5
在线体验chat.z.ai
API 文档docs.z.ai/guides/llm/glm-5
Ollamaollama.com/library/glm-5
HuggingFacehuggingface.co/zai-org
ProductHuntproducthunt.com/products/z-ai
Twitter/X@Zai_org

2026-02-14 | Trend-Tracker v7.3 | 数据来源:VentureBeat, SCMP, Hacker News, GitHub, Twitter/X, Caproasia, Precedence Research

一句话判断

GLM-5 是 2026 年开源 AI 的里程碑,首次在 Agent 能力上逼近闭源顶尖模型。它是开发者追求性价比和技术自主的首选,但需注意其高昂的本地部署硬件门槛。

常见问题

关于 GLM-5 的常见问题

智谱AI 发布的 744B 参数开源大模型,专为“长线程自主工程任务”设计,具备极强的 Agent 能力。

GLM-5 的主要功能包括:Agentic Mode(自主规划执行)、Deep Thinking(低幻觉模式)、200K 超长上下文、原生多格式文档生成。

API 约 $1-$3/百万 tokens;网页版免费;本地部署零 API 费但硬件昂贵。

AI 辅助编程开发者、需降低成本的 AI 应用团队、关注开源生态的技术人及中国开发者。

GLM-5 的主要竞品包括:Claude Opus 4.6, GPT-5.2, DeepSeek R1, Llama 3, Kimi K2.5。

数据来源: ProductHunt2026年2月14日
最后更新: