GLM大模型 09月25日
GLM-4.5旗舰模型开源,代码智能体能力达SOTA
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

今日,GLM技术团队发布新一代旗舰模型GLM-4.5,专为智能体应用打造。该模型在推理、代码、智能体综合能力上达到开源SOTA水平,实测国内最佳。GLM-4.5采用混合专家(MoE)架构,参数量达3550亿,并支持思考模式与非思考模式两种应用方式。API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens,高速版最高可达100 tokens/秒。GLM-4.5已上线开放平台BigModel.cn,并可在智谱清言和Z.ai免费体验。

🔍 GLM-4.5 是由GLM技术团队打造的新一代旗舰模型,专为智能体应用设计,在推理、编码和智能体能力上达到开源模型的SOTA水平,实测国内最佳。

🧠 GLM-4.5 采用混合专家(MoE)架构,总参数量达3550亿,并支持思考模式和非思考模式两种应用方式,以满足不同场景的需求。

💰 GLM-4.5 API调用价格低廉,输入0.8元/百万tokens,输出2元/百万tokens,高速版最高可达100 tokens/秒,兼顾成本效益与交互体验。

🌐 GLM-4.5已上线开放平台BigModel.cn,并可在智谱清言和Z.ai免费体验,欢迎开发者、企业、用户广泛测试与集成,探索AGI的奥秘。

GLM技术团队 2025-07-28 21:13 北京

代码能力超强~

今天,我们带来新一代旗舰模型 GLM-4.5,专为智能体应用打造的基础模型。Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License。

要点如下:

GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA 水平,在真实代码智能体的人工对比评测中,实测国内最佳;采用混合专家(MoE)架构,包括 GLM-4.5:总参数量 3550 亿,激活参数 320 亿;GLM-4.5-Air:总参数 1060 亿,激活参数 120 亿两种模式:用于复杂推理和工具使用的思考模式,及用于即时响应的非思考模式;高速、低成本:API 调用价格低至输入 0.8 元/百万tokens、输出 2 元/百万tokens;高速版最高可达 100 tokens/秒。

API 已上线开放平台 BigModel.cn可以一键兼容 Claude Code 框架同时,大家也可以上智谱清言(chatglm.cn)Z.ai免费体验满血版。欢迎开发者企业、用户广泛测试与集成,探索 AGI 的奥秘

一、综合性能SOTA

衡量 AGI 的第一性原理,是在不损失原有能力的前提下融合更多通用智能能力,GLM-4.5 是我们对此理念的首次完整呈现,有幸取得技术突破GLM-4.5 首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求

为综合衡量模型的通用能力我们选择了最具有代表性的 12 个评测基准,包括MMLU Pro、AIME24、MATH 500、SciCode、GPQA HLE、LiveCodeBench、SWE-Bench VerifiedTerminal-Bench、TAU-BenchBFCL v3和 BrowseComp综合平均分,GLM-4.5 取得了全球模型第三、国产模型,开源模型第一

GLM-4.5 和 GLM-4.5-Air 使用了相似的训练流程:首先在 15 万亿 token 的通用数据上进行了预训练,此后在代码、推理、智能体等领域的 8 万亿 token 数据上进行针对性训练,最后通过强化学习进一步增强模型推理、代码与智能体能力。更多技术细节可参考我们的技术博客(https://z.ai/blog/glm-4.5),后续也会发布更加详细的技术报告。

二、更高的参数效率

GLM-4.5 参数量为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,但在多项标准基准测试中表现得更为出色,这得益于 GLM 模型的更高参数效率

衡量模型代码能力的 SWE-bench Verifie榜单上,GLM-4.5 系列位于性能/参数比帕累托前沿,表明在相同规模下 GLM-4.5 系列实现了最佳性能。

三、低成本、高速度

在性能优化之外,GLM-4.5 系列也在成本和效率上实现突破,由此带来远低于主流模型定价:API 调用价格低至输入 0.8 元/百万 tokens,输出 2 元/百万 tokens

同时高速版本实测生成速度最高可至 100 tokens/秒,支持低延迟、高并发的实际部署需求,兼顾成本效益与交互体验。

四、真实场景测试

真实场景表现比榜单更重要。为了评测GLM-4.5在真实场景Agent Coding中的效果,我们接入Claude Code与Claude-4-Sonnet、Kimi-K2、Qwen3-Coder进行对比测试。测试采用52个编程开发任务,涵盖六大开发领域,在独立容器环境中进行多轮交互测试。实测结果显示如下图,

GLM-4.5相对其他开源模型展现出强劲竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。GLM-4.5相比Claude-4-Sonnet仍有提升空间,在大部分场景中可以实现平替的效果

为确保评测透明度,我们公布52道题目及Agent轨迹https://huggingface.co/datasets/zai-org/CC-Bench-trajectories,供业界验证复现

五、模型原生Agent场景

1、全栈开发

GLM-4.5系列能够胜任全栈开发任务,编写较为复杂的应用、游戏、交互网页。这需要模型原生具备在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意的智能体应用等能力。以下是用GLM-4.5一句话上线的互联网大厂APP(目前可在z.ai网站免费体验)

一个真的能搜索的搜索引擎

>>> Prompt:做一个Google搜索网站。

 一个真的能发弹幕的B站

>>> Prompt: 开发一个包含 UI 的 bilibili 网页端 Demo,页面包括:首页与视频详情页。首页需还原 bilibili 首页的主要设计元素,如顶部导航栏、横幅轮播、推荐视频瀑布流布局、hover 时播放预览、视频封面与标题展示等基础交互。详情页需展示视频标题、UP 主信息、播放区域(支持点击播放/暂停、切换全屏)、预设弹幕(可滚动)、评论区(展示预置评论并支持展开/收起)。视频素材可从 Google/B 站公开视频中挑选,封面图、标题与弹幕内容需根据所选视频内容拟定,保持风格一致。无需支持真实播放,仅需模拟播放行为与基础交互。整体风格参考 bilibili 现有布局,适配 PC 浏览器展示。

一个真的能发博的微博
>>> Prompt:开发一个包含 UI 的微博网页端 Demo,页面包括:首页与个人主页。首页设计与交互:首页需还原微博首页的主要设计元素,如:顶部导航栏:包含微博 Logo、搜索框、消息、个人中心入口等。左侧功能区:展示热门话题、推荐用户等。内容信息流:模拟微博信息流布局,展示预设的微博内容。每条微博需包含:用户头像、昵称、发布时间、微博正文(支持长文本展开/收起)、图片/视频缩略图(若有)、点赞、评论、转发等基础交互(点击后数字变化)。图片/视频缩略图:需要在首页就能看到图片预览。右侧功能区:展示热搜榜、广告位等。发布框:模拟发微博功能,点击后可以发布微博到首页瀑布流。个人主页设计与交互:个人主页需展示用户基本信息与发布内容:顶部区域:展示用户头像、昵称、简介、关注/粉丝数量、关注/私信按钮等。导航栏:切换“微博”、“相册”、“赞”等不同内容分类。微博列表:展示该用户发布的所有预设微博内容,与首页信息流展示方式类似。内容素材与风格:微博内容(文字、图片、视频缩略图)、用户头像、昵称、评论内容等,均需根据所选主题拟定,保持风格一致性和真实感。整体风格参考微博现有布局,适配 PC 浏览器展示。

2、Artifacts效果

GLM-4.5不仅擅长处理复杂代码,同时也具有优秀的数据精准处理、交互动画设计能力。以下是GLM-4.5制作的一个Flappy Bird小游戏,欢迎大家前来挑战。

Flappy Bird 小游戏

>>> Prompt:Build a webpage using Three.js and JavaScript that creates a 3D world displaying places I've visited, based on an array. Clicking markers on the 3D globe will animate a zoom effect and open detailed trip information with photos.

3、PPT制作

使用GLM-4.5制作PPT或者图文卡片,你将得到信息翔实、配图准确、排版精美的成果。与传统的AI PPT使用模板填充信息不同,GLM-4在制作过程中会自主搜索资料、寻找配图,根据实际材料直接以HTML形式编写图文。除了16:9的PPT,GLM-4.5也可以用来制作长图、小红书、社交媒体封面或简历等多比例的图片。

向下滑动查看

六、编程工具使用方式

GLM-4.5 深度优化了全栈编程与工具调用能力,兼容Claude Code、Cline、Roo Code等主流代码智能体。完整使用指南:

完整使用指南:

国内用户:https://docs.bigmodel.cn/cn/guide/develop/claude

海外用户:https://docs.z.ai/scenario-example/develop-tools/claude

>>>>>>

开源仓库:

模型仓库:

体验地址:

>>>>>>


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GLM-4.5 智能体 开源模型 代码能力 AGI
相关文章