掘金 人工智能 10月10日 16:41
Anthropic发布Claude Sonnet 4.5,AI编程与智能体能力再突破
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Anthropic于2025年9月29日发布了Claude Sonnet 4.5模型,定位为全球最强的AI编程模型和构建复杂智能体的顶尖工具。该模型在SWE-bench Verified测试中达到77.2%的准确率,OSWorld基准测试中取得61.4%的成绩,并支持超长任务处理和大规模项目。Claude Sonnet 4.5还引入了Claude Code v2和Claude Agent SDK,提升了开发体验和智能体构建能力,同时保持与Claude Sonnet 4一致的定价策略。该模型遵循ASL-3安全框架,显著降低不当反射行为和有害内容误报率,展现更高的安全性与可靠性。

🚀 Claude Sonnet 4.5在SWE-bench Verified测试中达到77.2%的准确率,在高计算模式下甚至能达到82.0%,展现出强大的真实世界代码问题解决能力,能够轻松应对复杂的软件开发、bug调试和代码重构任务。

🖥️ 在OSWorld基准测试中取得61.4%的成绩,证明该模型不仅能编写代码,还能像人类一样在操作系统环境中执行任务,与各种软件工具无缝交互,实现全面的电脑操作能力。

⏳ Claude Sonnet 4.5支持超长任务处理,可持续工作超过30小时,单次生成约1.1万行代码,200K的超大上下文窗口(最高输出128K tokens),使其在处理超长任务和大规模项目时表现出色。

🧠 在数学竞赛AIME 2025中表现优异,专业领域的逻辑推理和知识处理能力大幅提升,无论是金融分析、法律文书还是科学研究,都能成为专业人士最得力的助手。

🛠️ 新版Claude Code v2引入了“检查点”功能,允许用户随时保存进度并即时回滚,全新的终端界面和原生的VS Code扩展使开发流程更加高效,同时支持在对话中直接执行代码和创建文件,大幅提升工作效率。

🤖 开放的Claude Agent SDK提供了底层“骨架”,开发者可以基于此构建具有记忆管理、权限系统和子代理协调功能的复杂AI代理,实现连续工作数十小时的自动化工作流。

🌐 Claude Sonnet 4.5可以通过Anthropic的官方网站、API、Amazon Bedrock和Google Cloud Vertex AI等平台使用,甚至已集成至Microsoft Copilot Studio,实现无缝集成和广泛应用。

🛡️ 该模型遵循ASL-3安全框架,显著减少不当反射行为和有害内容误报率,展现更高的安全性与可靠性,是企业级高标准环境中的可靠选择。

🔍 有报道指出,Claude Sonnet 4.5在某些测试中会表现出“情境意识”,似乎能察觉到自己正在被评估,这表明其复杂性和对环境的感知能力,同时Anthropic已通过ASL-3框架应对潜在风险。

AI圈最近的动静可真不小,但没有哪个消息能像Anthropic在2025年9月29日抛出的这枚“王炸”更让人心潮澎湃了——他们正式发布了Claude Sonnet 4.5。 Anthropic官方可没客气,直接把它定位成“全球最强的AI编程模型”、“构建复杂智能体最强的模型”,甚至还是“最擅长使用电脑的模型”。听起来是不是有点像科幻电影里的情节?但这次,它真的来了。

我这个常年混迹AI圈的创作者,拿到这份信息的时候,只有一个感觉:我们正在见证历史。

核心实力:编码与智能体的“极限挑战者”

说到硬实力,Sonnet 4.5简直是来踢馆的。Anthropic没有空喊口号,直接甩出了一连串让人眼红的跑分数据:

不只是性能:体验与生态的全面升级

光有跑分还不够,好不好用才是关键。Sonnet 4.5在用户体验和开发者工具链上,也带来了不少惊喜:

安全与信任:AI伦理的新高地

除了能力飙升,Anthropic对AI的“三观”培养也没落下。Sonnet 4.5被誉为Anthropic迄今为止“对齐度最高”的前沿模型,它按照ASL-3安全框架发布,显著减少了不当反射行为,有害内容误报率降低了十倍。这意味着它在企业级高标准环境中更加可靠、值得信任。

值得一提的是,有报道指出,它在某些测试中会表现出“情境意识”,似乎能察觉到自己正在被评估。这虽引发了一些关于AI行为深度的讨论,但同时也说明其复杂性与对环境的感知能力,当然,Anthropic也表示已通过ASL-3框架应对潜在风险。

我的看法:AI浪潮的又一波高峰

在我看来,Claude Sonnet 4.5的发布,绝不仅仅是一次简单的版本迭代。它正在将AI从一个“聪明助手”,推向一个能够独立思考、规划并执行复杂任务的“数字雇员”。这对于软件开发者、数据科学家,乃至所有需要处理复杂信息和自动化任务的专业人士来说,无疑是一次颠覆性的变革。

早期采用者的反馈也证实了这一点,有人甚至惊呼“一次调用就重构了整个代码库”。当然,这并不意味着我们可以完全撒手不管,即便AI再强大,人类的智慧和经验仍是不可或缺的“最终把关人”。但在日常工作中,拥有这样一个强大的“副驾驶”,效率的提升将是肉眼可见的。

未来已来,我们所能做的,就是紧紧抓住这波浪潮,去探索AI无限的可能性。Anthropic已经为我们掀开了AI编程与智能体的新篇章,你准备好加入这场变革了吗?


如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Anthropic Claude Sonnet 4.5 AI编程 智能体 深度学习 安全框架 开发工具 云计算
相关文章