热点
关于我们
xx
xx
"
GDPval
" 相关文章
AI被严重低估,AlphaGo缔造者罕见发声:2026年AI自主上岗8小时
36氪 - 科技频道
2025-11-04T12:22:11.000000Z
AI被严重低估!AlphaGo缔造者罕见发声:2026年AI自主上岗8小时
新智元
2025-11-04T06:50:07.000000Z
GDPval: Evaluating AI Model Performance on Real-World Economically Valuable Tasks
cs.AI updates on arXiv.org
2025-10-07T04:16:57.000000Z
GDPval: Evaluating AI Model Performance on Real-World Economically Valuable Tasks
cs.AI updates on arXiv.org
2025-10-07T04:16:56.000000Z
如何让 Kimi 的新 Agent 给我做国庆攻略,跟着 AI 旅游会踩雷吗?
爱范儿
2025-10-03T12:58:29.000000Z
AI #136: A Song and Dance
少点错误
2025-10-02T14:07:00.000000Z
AI models are already as good as experts at half of tasks, a new OpenAI benchmark suggests
Fortune | FORTUNE
2025-09-30T19:20:44.000000Z
人类要小心了!OpenAI已全面评估AI对各行各业的工作替代
华尔街见闻 - 最热文章
2025-09-30T15:31:45.000000Z
Open AI 最新研究|GDPval:评估 AI 模型在真实经济价值任务中的表现【AI产业观察】
智源社区
2025-09-30T13:33:18.000000Z
对AI的质疑,是“自欺欺人”?
虎嗅
2025-09-30T05:21:04.000000Z
OpenAI研究大模型对GDP贡献,三大行业已能代替人类,并自曝不敌Claude
机器之心
2025-09-27T13:05:58.000000Z
OpenAI研究大模型对GDP贡献,三大行业已能代替人类,并自曝不敌Claude
机器之心
2025-09-27T12:16:16.000000Z
OpenAI研究大模型对GDP贡献,三大行业已能代替人类,并自曝不敌Claude
机器之心
2025-09-27T11:13:33.000000Z
OpenAI 发布 AI 打工人报告:前沿模型完成专家级任务,速度快 100 倍,成本仅 1%
IT之家
2025-09-27T01:15:50.000000Z
OpenAI推出GDPval基准测试:GPT-5与Claude已接近人类专业水准
动点科技
2025-09-26T15:16:15.000000Z
OpenAI推出GDPval基准测试:GPT-5与Claude已接近人类专业水准
动点科技
2025-09-26T15:16:15.000000Z
谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己
36kr-科技
2025-09-26T12:03:46.000000Z
OpenAI 3万亿美元测试,AI首战44个行业人类专家!
新智元
2025-09-26T10:23:34.000000Z
OpenAI 3万亿美元测试,AI首战44个行业人类专家
36kr-科技
2025-09-26T10:01:41.000000Z
OpenAI 3万亿美元测试,AI首战44个行业人类专家!
新智元
2025-09-26T09:17:33.000000Z