热点
"SWE-Bench Pro" 相关文章
GPT-5仅23.3%,全球AI集体挂科!地狱级编程考试,夺金神话破灭
智源社区 2025-09-23T13:25:32.000000Z
GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍
智源社区 2025-09-23T13:25:13.000000Z
GPT-5 编程测评“表面不及格”:实际 63.1% 的任务没交卷,全算上成绩比 Claude 高一倍
IT之家 2025-09-22T16:05:29.000000Z
GPT-5仅23.3%,全球AI集体挂科!地狱级编程考试,夺金神话破灭
新智元 2025-09-22T15:50:48.000000Z
GPT-5编程测评大反转,表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍
36kr-科技 2025-09-22T11:40:52.000000Z
GPT-5仅23.3%,全球AI集体挂科,地狱级编程考试,夺金神话破灭
36氪 AI 2025-09-22T11:33:16.000000Z