热点
"模型能力" 相关文章
LLMs Position Themselves as More Rational Than Humans: Emergence of AI Self-Awareness Measured Through Game Theory
cs.AI updates on arXiv.org 2025-11-05T05:14:41.000000Z
[程序员] 一道三年级数学题把大模型难住了,不是说数学推理都很厉害吗
V2EX 2025-10-29T06:20:34.000000Z
[程序员] 一道三年级数学题把大模型难住了,不是说数学推理都很厉害吗
V2EX 2025-10-29T05:00:56.000000Z
[程序员] 一道三年级数学题把大模型难住了,不是说数学推理都很厉害吗
V2EX 2025-10-29T04:19:48.000000Z
[程序员] 一道三年级数学题把大模型难住了,不是说数学推理都很厉害吗
V2EX 2025-10-29T03:37:30.000000Z
Beyond Reasoning Gains: Mitigating General Capabilities Forgetting in Large Reasoning Models
cs.AI updates on arXiv.org 2025-10-28T04:12:48.000000Z
Anthropic 顶级研究员:AI 进入指数增长,你需要看懂这三件事
36kr-科技 2025-10-28T01:54:56.000000Z
Can Reasoning Models Obfuscate Reasoning? Stress-Testing Chain-of-Thought Monitorability
少点错误 2025-10-24T17:40:57.000000Z
What Makes a Good Curriculum? Disentangling the Effects of Data Ordering on LLM Mathematical Reasoning
cs.AI updates on arXiv.org 2025-10-23T04:15:34.000000Z
Can GRPO Help LLMs Transcend Their Pretraining Origin?
cs.AI updates on arXiv.org 2025-10-21T04:16:24.000000Z
OpenAI、Google、Anthropic 都在做的 “Agent 工具箱” 是什么丨晚点播客
晚点LatePost 2025-10-20T16:32:36.000000Z
“Claude Skills很棒,可能比 MCP 更重要”
36氪 - AI相关文章 2025-10-17T09:43:55.000000Z
Equipping agents for the real world with Agent Skills
Anthropic Engineering 2025-10-16T19:40:48.000000Z
Current Language Models Struggle to Reason in Ciphered Language
少点错误 2025-10-14T09:26:37.000000Z
四家明星Agent公司创始人辩论:少谈点“通用”,对大家都好
硅星人Pro 2025-10-14T09:14:11.000000Z
[推广] 给哥哥们送免费 ai 模型额度啦, gpt5, gpt4, claude4(sonnet,oups), claude4.5, gemini, deepseek,豆包,每日十人,快来吧好哥哥们
V2EX 2025-10-14T01:39:48.000000Z
Base Models Know How to Reason, Thinking Models Learn When
cs.AI updates on arXiv.org 2025-10-10T04:05:33.000000Z
2月写过一篇文档《做AI产品近 2年总结出来的25条核心认知》,很快因为某些原因删除了。现在回看,不少内容都过时了,甚至被打脸,尤其2月之后的模型和应用层发展...
AI探索站 - 即刻圈子 2025-10-09T21:44:48.000000Z
2月写过一篇文档《做AI产品近 2年总结出来的25条核心认知》,很快因为某些原因删除了。现在回看,不少内容都过时了,甚至被打脸,尤其2月之后的模型和应用层发展...
AI探索站 - 即刻圈子 2025-10-09T21:44:48.000000Z
大摩:市场低估了明年潜在的“AI重大利好”,但存在关键的不确定性
富途牛牛头条 2025-10-09T07:59:38.000000Z