
GLM-4.7 上线并开源。 新版本面向 Coding 场景强化了编码能力、长程任务规划与工具协同,并在多项主流公开基准测试中取得开源模型中的领先表现。
目前,GLM-4.7 已通过 BigModel.cn 提供 API ,并在 z.ai 全栈开发模式中上线 Skills 模块,支持多模态任务的统一规划与协作。
Coding 能力再提升
GLM-4.7 在编程、推理与智能体三个维度实现突破:

Code Arena:全球百万用户参与盲测的专业编码评估系统,GLM-4.7 位列开源第一、国产第一,超过 GPT-5.2 。
在主流基准测试表现中,GLM-4.7 的代码能力对齐 Claude Sonnet 4.5: 在 SWE-bench-Verified 获得 73.8% 的开源 SOTA 分数; 在 LiveCodeBench V6 达到 84.9% 的开源 SOTA 分数,超过 Claude Sonnet 4.5 ; SWE-bench Multilingual 达到 66.7%(提升 12.9%); Terminal Bench 2.0 达到 41%(提升 16.5%)。

真实编程场景下的体感提升
在 Claude Code 环境中,我们对 100 个真实编程任务进行了测试,覆盖前端、后端与指令遵循等核心能力。结果显示,GLM-4.7 相较 GLM-4.6 在稳定性与可交付性上均有明显提升。

GLM Coding Plan
作为本次升级的首个体验权益,所有购买套餐的用户将获得「体验卡」礼包,可邀请 37 位新用户免费体验 7 天套餐权益。
领取链接:[https://zhipuaishengchan.datasink.sensorsdata.cn/t/kc]
1 mogutouer 1 小时 39 分钟前 说个想法,程序员是用来工作的,投入到实际产出中的,要保证质量和省去来回拉扯的时间,要减少隐形 bug ,减少测试的时间,一定是用效果最好能力最强的,除非你能超过 opus ,否则没必要试用,现在有更好的不用为什么要用一个各方面都更差的呢? |
2 twofox 1 小时 35 分钟前 在 Claude code 中的体验确实好了不少。希望后期不要降智太厉害。 |
3 Felixchen1062 1 小时 24 分钟前 @mogutouer 你说的确实有道理 二选一不要钱我肯定也选 Opus, 但合规性,数据安全,企业采购成本(这个不好说),对方服务企业意愿(anthropic 不向中国开放服务) 那其他的模型以及 AIIDE 就有存在的意义了 |
4 sunny352787 1 小时 23 分钟前 claude code 中有一定提升,tools call 错误率低了,过度设计的问题有一定抑制,再试试看 |
6 mogutouer 1 小时 14 分钟前 @Felixchen1062 #3 @twofox #5 我觉得一个能让你一周的工作一两天就干完的工具,并且还能完成你不熟悉的技术栈,省下大把的页面设计实现的工作,这种工具一个月居然只要花个一千几百就能拥有,已经算很划算了。 |
7 Felixchen1062 1 小时 7 分钟前 @mogutouer 我愿意个人买但公司不愿意让我用, 可能外企这块比较闭塞 合规性和隐私要求高一点, 我们只能用百炼平台上有的模型, 很羡慕那些可以自由采购, 自己采买哪怕付费的 |
8 caiyuan 49 分钟前 刚刚让它写一篇博客,卡了十几分钟不动。。。最后直接终端,再试了 2 次,才写出来。 |