一支烟一朵花 2025-08-10 09:59 上海
看看 Anthropic 的发布模式:
Claude 3 系列于 2024 年 3 月推出,
Claude 3.5 Sonnet 于 2024 年 7 月发布,
Claude 3.7 Sonnet 于 2025 年 2 月推出,
Claude 4 Opus于 2025 年 5 月推出
Claude 4.1 Opus是 2025 年 8 月
按照这个节奏 盲猜一下Claude 4.5 可能是 2025 年 12 月
为啥期待 Claude4.5?
因为Opus 4.1 相对于 4.0 单从 SWE 对比分数而言仅仅提升了 2 分左右。Github的反馈说在多文件重构处理上好了一些,在体感上确实不太明显,属于锦上添花。没有看到一些新的亮点。
同时我们从一支烟花 AI Coding 社群拿到的不少反馈来讲都觉得coding 效果提升的有限,不是特别明显。
基本上 Claude属于大模型 coding 领域领头羊的地位,其他家在追赶的状态,Claude 4.5 会有什么新的特性或者单向能力的持续提升?确实可以期待一下。
说一下目前 AI Coding 常见的几个痛点:
1 UI 还是太差,现在即使结合 Figma 这些外部工具也很难
2 aicoding 的 subagent 模式在多开窗口的情况下会有点问题
3 aicoding 的过程非常无聊,似乎只有在初始阶段有较强的参与感
4 原型级别的代码非常快可以完成,但是要想稍微搞的像点样子,需要花费较大精力去精调,这个是目前最花时间的
5 多轮对话后会变得卡顿,费用也会因为长上下文变贵,存储了比较多中间过程没有必要的信息。目前一个最佳实践是在固定多轮对话后重新开启新的对话,用文档把结果体现出来
6 过度注释和中间文档
7 整体代码结构稳定后为了 fix 某个 bug 或功能增强会非常坚定大胆进行多轮全局重构(灾难级)
其实不止是 Claude 4.5,也期待其他的 ai coding 工具或模型可以考虑 aicoding 1 到 100 过程中非常多的细节问题然后进行专项提升。
