FishAI官方 09月25日
Claude 4 技术革新与未来趋势
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Claude Opus 4 与 Claude Sonnet 4 将大模型从单次对话推向长时段、自主管理的思考实体。它们具备并行工具调用、可写可读的持久记忆和扩展思考能力,让 AI 能自我管理任务。Claude Code 转正并嵌入 DevOps 闭环,提升 AI 在编程领域的角色。GitHub Copilot Coding Agent 默认调用 Sonnet 4,显示 Claude 技术实力。尽管 Opus 在代码领域不如 Sonnet,但它们各有优势,表明细分模型和智力比单纯的知识更重要。

💡Claude 4 引入长时段、自主管理的思考实体,具备并行工具调用、可写可读的持久记忆和扩展思考能力,让 AI 能自我管理任务,实现数小时乃至跨日的任务处理。

🛠Claude Code 转正并配套 VS Code / JetBrains 插件和 GitHub Actions,嵌入 DevOps 闭环,使 AI 从对话助手变为代码流上的二号提交者,提升编程效率。

🔗GitHub Copilot Coding Agent 默认调用 Sonnet 4,显示 Claude 技术实力,并暗示 GitHub 与 OpenAI 的关系由深度绑定转向并行发展。

🧠尽管 Opus 在代码领域不如 Sonnet,但它们各有优势,表明细分模型和智力比单纯的知识更重要,知识已接近尾声,而智力才是全部。

🔒Opus 4 和 Sonnet 4 共同提升安全等级,触发 Anthropic ASL-3 风险管控,启动更严密的越狱防护与安全赏金,保障 AI 的安全性。

原创 Sanlang 2025-05-23 02:48 意大利

Claude 4:彻底炸了,知识已接近尾声,而智力才是全部

 


一、一骑绝尘的孤独

Anthropic 今晚揭幕的 Claude Opus 4 与 Claude Sonnet 4,把大模型从「一次对话回答」推向「长时段、自主管理的思考实体」。从并行工具调用、可写可读的持久记忆、可挂起数小时的“扩展思考”——便会发现:

这些改动让 AI 第一次具备了“自己给自己留备忘录、再回头翻阅并继续任务”的能力。

这一能力,也许比任何单项基准分数都更具箭头意义,兄弟们,AI 越来越像个人了,会自己整理知识,会并行的使用与反思进展!人类距离下岗还有多久!!

二、Code、Code、Code

不得不表扬,Claude 系列在 Coding 上持续有效的投入,本次发布在Coding 上又有新的提,而且不仅仅是代码层面的提升,而是整体生态的突破:

三、上不去的跑分,得上去的智商

有意思的是Opus 并不是在任何领域都强于 Sonnet,反而在代码领域 Sonnet 更强一些,这信息其实很有意思,至少能说明几个事情:

四、其他汇总

维度

Opus 4

Sonnet 4

共同新特性

定位

超长任务、极限推理与代码生成的旗舰

性价比与瞬时响应兼顾的中坚

双模式:瞬时回答 / 扩展思考

代码基准

SWE-bench 72.5%、Terminal-bench 43.2%,居业界首位

SWE-bench 72.7%,刷新中档模型纪录

并行工具调用;可写入本地“记忆文件”

安全等级

首批触发 Anthropic ASL-3 风险管控的模型,启动更严密的越狱防护与安全赏金

同步继承

65% ↓ “走捷径”倾向;思维摘要仅在 5 % 长链条场景触发

价格

$15 / $75 每百万 tokens(入/出)

$3 / $15

旧价续用,API、Bedrock、Vertex AI 同步上架

 

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Claude 4 人工智能 长时段思考 DevOps 编程助手
相关文章