热点
关于我们
xx
xx
"
Claude Opus
" 相关文章
AI被严重低估,AlphaGo缔造者罕见发声:2026年AI自主上岗8小时
36氪 - 科技频道
2025-11-04T12:22:11.000000Z
Summary and Comments on Anthropic's Pilot Sabotage Risk Report
少点错误
2025-10-30T20:34:21.000000Z
AI是「天才」还是「话术大师」?Anthropic颠覆性实验,终揭答案
36氪 - AI相关文章
2025-10-30T10:12:33.000000Z
AI是「天才」还是「话术大师」?Anthropic颠覆性实验,终揭答案
36氪 - AI相关文章
2025-10-30T10:12:33.000000Z
Emergent Introspective Awareness in Large Language Models
少点错误
2025-10-30T05:01:49.000000Z
ImpossibleBench: Measuring Reward Hacking in LLM Coding Agents
少点错误
2025-10-30T03:15:41.000000Z
Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5
爱范儿
2025-10-18T09:44:37.000000Z
Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5
爱范儿
2025-10-16T01:57:20.000000Z
LLMs one-box when in a "hostile telepath" version of Newcomb's Paradox, except for the one that beat the predictor
少点错误
2025-10-06T08:52:21.000000Z
CompileBench: Can AI Compile 22-year-old Code?
https://simonwillison.net/atom/everything
2025-09-30T11:10:12.000000Z
OpenAI推出GDPval基准测试:GPT-5与Claude已接近人类专业水准
动点科技
2025-09-26T15:16:15.000000Z
OpenAI推出GDPval基准测试:GPT-5与Claude已接近人类专业水准
动点科技
2025-09-26T15:16:15.000000Z
OpenAI称GPT-5在众多职业领域表现比肩人类
Cnbeta
2025-09-25T19:14:32.000000Z
OpenAI称GPT-5在众多职业领域表现比肩人类
Cnbeta
2025-09-25T19:14:32.000000Z
GPT-5仅23.3%,全球AI集体挂科,地狱级编程考试,夺金神话破灭
36氪 AI
2025-09-22T11:33:16.000000Z
ScienceQA最新榜单出炉!多家公司新模型分数均提升|xbench 月报
红杉汇
2025-09-22T01:07:39.000000Z
[程序员] 我的 AI 会员终于到期了
V2EX
2025-09-16T12:08:16.000000Z
Claude Opus 4具自我防護機制,遭持續辱罵將自動結束對話
AI & Big Data
2025-08-18T08:26:11.000000Z
谁是最强编程大模型?横向对比Claude Opus 4.1、GPT-5、Gemini 2.5 Pro、Grok4
掘金 人工智能
2025-08-18T04:21:28.000000Z
Claude Opus:从智能升级到场景落地的旗舰模型进阶之路
掘金 人工智能
2025-08-08T09:08:31.000000Z