Claude Sonnet 4.5发布，性能与安全全面升级

夕小瑶科技说 10月01日 19:22

Claude Sonnet 4.5发布，性能与安全全面升级

Anthropic发布了其最新的AI模型Claude Sonnet 4.5，宣称其为“世界上最好的编码模型”。此次更新不仅带来了性能的全面提升，尤其在软件编码、复杂任务处理和多领域推理方面表现卓越，甚至超越了GPT-5和Gemini 2.5 Pro。同时，新模型在安全性和对齐方面也显著进步，失调行为评分更低，并加强了对提示注入攻击的防御。此外，Claude Agent SDK的推出为开发者提供了强大的工具集，支持构建更复杂的AI应用，而“Imagine with Claude”的研究预览则展示了AI在软件开发领域的巨大潜力，标志着AI正从“会说”走向“会干”，加速“AI下沉到生产力”的进程。

🚀 **性能全面超越，编码能力登顶**：Claude Sonnet 4.5 在包括SWE-bench Verified真实软件编码评测在内的多项基准测试中表现出色，在复杂多步骤任务中展现出长达30小时的专注度，远超竞品。其在OSWorld真实电脑任务的成功率提升至61.4%，代码修复准确率达到82%，并在数学推理、金融、法律、医学、STEM等专业领域均实现了显著飞跃，巩固了其作为顶尖AI模型的地位。

🛡️ **安全与对齐显著增强，风险管控更严**：新模型在“失调行为评分”上表现更佳，显著降低了讨好迁就、欺骗、权力欲等令人不安的AI行为。特别是在防御Prompt Injection攻击方面进步显著，其安全级别提升至AI安全等级3（ASL-3），并引入了专门拦截CBRN风险内容的分类器，同时大幅减少了误报率，确保AI行为更加可控和可靠。

💻 **Claude Agent SDK赋能开发者，降低应用门槛**：Anthropic推出的Claude Agent SDK为开发者提供了构建复杂AI应用的底层架构，解决了长任务记忆、权限设计、多子代理协作等关键难题。结合“Imagine with Claude”的研究预览，用户可以通过简单的对话指令驱动AI现场生成软件，预示着AI在软件开发领域的巨大潜力，加速AI技术在实际生产力中的应用。

💰 **成本效益显著，价格保持不变**：Claude Sonnet 4.5直接替代Sonnet 4，开发者调用成本与前代持平，输入每百万token 3美元，输出15美元。与上一代旗舰Opus 4.1相比，成本大幅降低了5倍，这使得更强大的AI能力得以广泛普及，进一步推动AI在各行业的落地应用。

原创 R.Zen 2025-09-30 11:07 北京

今天凌晨 Claude 发布 Claude Sonnet 4.5——「世界上最好的编码模型」（Claude 称）。

真不愧是国庆，前脚 DeepSeek 刚刚抛出 v3.2-Exp，后脚 Claude 就把自家新作甩出来。

这次不只是模型升级，API 也同步带来了一整套新能力：新增了上下文编辑和记忆工具，让代理能跑得更久、处理更复杂的任务。

在 Claude 应用里，代码执行和文件创建（表格、幻灯片、文档）被直接拉进对话；Chrome 扩展也向 Max 用户开放。

我们最关心的价格没变！Claude Sonnet 4.5 直接替代 Sonnet 4，开发者调用时只需在 Claude API 里写上 claude-sonnet-4-5 即可，费用依然是输入每百万 token 3 美元、输出 15 美元。而和上一代旗舰 Opus 4.1相比，成本足足压低了5倍。

下面我们一起来看看，Claude Sonnet 4.5 到底凭什么敢喊出「最强编码模型」的口号。

性能全面刷新天花板。

这次更新，可以用四个字形容：全面碾压。

Claude Sonnet 4.5 在几乎所有维度都超过了 Claude Sonnet 4 和 Opus 4.1，有的地方甚至直接把 GPT-5、Gemini 2.5 Pro 拉开差距。

最亮眼的成绩单：

在 SWE-bench Verified 真实软件编码评测中，Sonnet 4.5 稳坐头名，且能在复杂多步骤任务中保持 超过 30 小时的专注度，远超 GPT-5-Codex 的 7 小时。

在 OSWorld 真实电脑任务中，它把成功率从 42.2% 一口气拉到 61.4%，四个月跨了近 20 个百分点。

代码修复准确率 82%，领跑全场；数学推理直接跃入第一梯队。

并且，它的提升不仅限于编程和数学，在 金融、法律、医学、STEM 等专业领域，对比前代模型同样实现了显著飞跃。

安全：更聪明，也更难忽悠

如果说性能测试展示了 Claude Sonnet 4.5 的硬实力，那安全与对齐部分就是它的软约束。这次官方用了很强的表述：“我们迄今为止最一致的模型”。

什么意思？看这张图就懂了。

图里显示的是「失调行为评分」（Misaligned behavior scores，越低越好）。

所谓「失调行为」，包括讨好迁就（sycophancy）、欺骗（deception）、权力欲（power-seeking）、鼓励妄想（encouragement of delusions）、以及服从有害指令。简单说，就是那些让人不安的 AI 行为。

结果是，Claude Sonnet 4.5 的分数最低，比前代 Sonnet 4 和 Opus 4.1 都低一大截。它比 GPT-5 还要更少出格，尤其在“拍马屁”和“鼓励妄想”这类风险点上收紧得很明显。

而且，Anthropic 这次还特别强调了 Sonnet 4.5 在防御 Prompt Injection（提示注入攻击） 这方面上的进步。

安全级别上，这次它被归入 AI 安全等级 3（ASL-3），意味着已经要按“核级别”标准来设防。具体做法包括：

增加了一层「分类器」过滤器，专门拦截和化学、生物、放射、核（CBRN）相关的风险内容；

同时减少误报：和今年 5 月的 Opus 4 相比，误报率降低了一半，如果追溯到最初设计阶段，已经降了整整 10 倍。

Claude Agent SDK：开发者的大礼包

这应该是开发者们的福音了。

过去半年，Anthropic 一直在打磨 Claude Code，踩过无数坑：

长任务里，AI 该怎么记忆？别做到一半忘了前面干了啥。

权限系统怎么设计？既要让 AI 有足够自主性，又不能放任它“随心所欲”。

多个子代理如何协作？避免各干各的，最后拼不起来。

这些难题，他们一个个啃下来，才有了今天的 Claude Code。而现在，他们把这套底层架构打包成了 SDK，开放出来给所有开发者。

Imagine with Claude：一句话造软件

和 Sonnet 4.5 一起登场的，还有一个小彩蛋——Imagine with Claude。

这是一个临时研究预览，开放五天，Max 用户可以体验。玩法很简单：你让 Claude 帮你做一个软件，它不是调用预设模块，而是现场现写，边聊边造。

地址：claude.ai/imagine

当强大的模型和完善的基础设施结合在一起，软件开发的门槛可能会低到“一句话”的程度。

从性能到安全，从 SDK 到 Imagine with Claude，这次的 Sonnet 4.5 其实透露了一个信号：AI 已经从“会说”走向了“会干”，从单纯的模型变成了可以搭建生态的底层基建。

所以，Claude 4.5 背后，是真正“AI 下沉到生产力”的加速信号。

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude Sonnet 4.5 AI模型 AI编码 AI安全 Claude Agent SDK 人工智能 Claude Anthropic

相关文章

人工智能正在摧毁互联网内容生态系统

阿里云：通义千问API日调用量破亿企业用户破9万

【iThome 2024 CIO大調查系列1】AI、資安和永續變革三箭齊發

鈺登跨入AI，推出搭配英特爾四代Xeon SP與Gaudi2的伺服器

蘋果發表M4晶片，更新iPad產品線

Red Hat推出AI平臺，內建IBM開源Granite模型

【iThome 2024 CIO大調查系列 1｜IT投資趨勢】IT投資布局更多角化，雲端比重明顯增加