热点
关于我们
xx
xx
"
Chain of Thought
" 相关文章
我MiniMax,用实习生处理数据,照样屠榜开源大模型
量子位
2025-11-04T09:04:08.000000Z
Agent 一年半开发复盘:大家对 Agent 的理解有错位,有效的「认知流程」很关键
智源社区
2025-10-23T20:53:28.000000Z
SDC2025 精彩议题预告 | SCPGA:自认同CoT渐进式泛化攻击
看雪学院
2025-10-21T11:39:09.000000Z
First Try Matters,不是Aha Moment:邴立东团队揭示推理模型靠首答,不靠反思
PaperWeekly
2025-10-19T08:34:28.000000Z
GPT-5 核心成员详解 RL:Pre-training 只有和 RL 结合才能走向 AGI
海外独角兽
2025-10-18T16:26:25.000000Z
GPT-5 核心成员详解 RL:Pre-training 只有和 RL 结合才能走向 AGI
海外独角兽
2025-10-18T16:26:25.000000Z
First Try Matters,不是Aha Moment:邴立东团队揭示推理模型靠首答,不靠反思
PaperWeekly
2025-10-18T15:48:21.000000Z
颠覆大模型后训练!陈丹琦团队提出「基于模型奖励思维的强化学习」RLMT
智源社区
2025-09-30T13:33:18.000000Z
Exploration of Counterfactual Importance and Attention Heads
少点错误
2025-09-30T01:58:20.000000Z
颠覆大模型后训练,陈丹琦团队提出「基于模型奖励思维的强化学习」RLMT
36kr-科技
2025-09-29T11:02:15.000000Z
What’s your AI thinking?
少点错误
2025-08-19T15:23:05.000000Z
Scrutinizing LLM Reasoning Models
Communications of the ACM - Artificial Intelligence
2025-08-07T18:25:03.000000Z
Can Reasoning Models Avoid the Most Forbidden Technique?
少点错误
2025-05-17T23:27:27.000000Z
[Interim progress] Decrypting hidden chain of thought
少点错误
2024-08-11T19:51:55.000000Z