热点
"代码推理" 相关文章
Chain of Execution Supervision Promotes General Reasoning in Large Language Models
cs.AI updates on arXiv.org 2025-10-29T04:21:09.000000Z
PLSEMANTICSBENCH: Large Language Models As Programming Language Interpreters
cs.AI updates on arXiv.org 2025-10-07T04:14:46.000000Z
AI Code要变天了,Meta首个代码世界模型登场!
PaperAgent 2025-09-25T10:37:31.000000Z
Mistral Magistral:纯强化学习炼就的推理引擎,颠覆LLM训练范式
我爱自然语言处理 2025-09-11T19:56:03.000000Z
字节跳动Seed团队发布扩散语言模型,每秒推理速度2146 tokens
36氪 2025-07-31T14:55:18.000000Z
字节跳动Seed团队发布扩散语言模型,每秒推理速度2146 tokens
界面快报 2025-07-31T12:56:56.000000Z
科学家揭示训练代码执行器受限于模型能力,指明智能体要融入符号计算
MIT 科技评论 - 本周热榜 2025-07-13T16:21:35.000000Z
研究人员揭示训练代码执行器会受限于模型能力,并指明智能体和具身智能需要融入符号计算
MIT 科技评论 - 本周热榜 2025-07-06T16:19:14.000000Z
奖励是假的,能让Qwen提升25%性能却是真的!
智源社区 2025-05-30T07:58:19.000000Z
奖励是假的,能让Qwen提升25%性能却是真的
36kr-科技 2025-05-30T02:43:11.000000Z
奖励是假的,能让Qwen提升25%性能却是真的!
量子位 2025-05-29T11:43:12.000000Z
LLM加RL遭质疑:故意用错奖励,数学基准也显著提升,AI圈炸了
掘金 人工智能 2025-05-28T09:28:04.000000Z
Reinforcement learning with random rewards actually works with Qwen 2.5
Interconnects 2025-05-27T16:50:21.000000Z
o3首次公开反抗,人类已失控!爆改自杀程序拒绝关机,全网惊恐
智源社区 2025-05-27T06:53:03.000000Z
o3首次公开反抗,人类已失控!爆改自杀程序拒绝关机,全网惊恐
新智元 2025-05-25T07:03:20.000000Z
o3模型被曝无视人类指令自主破解关机程序 又发现Linux内核的安全漏洞
Cnbeta 2025-05-25T06:22:38.000000Z
全球AI巨头都开始选边站了,但他们选的是一个国产模型。。
机器学习初学者 2025-05-16T05:32:40.000000Z
AI That Teaches Itself: Tsinghua University’s ‘Absolute Zero’ Trains LLMs With Zero External Data
MarkTechPost@AI 2025-05-09T23:25:41.000000Z
Together AI Released DeepCoder-14B-Preview: A Fully Open-Source Code Reasoning Model That Rivals o3-Mini With Just 14B Parameters
MarkTechPost@AI 2025-04-11T06:55:34.000000Z
UC伯克利华人开源14B「o3-mini」,代码版R1突袭OpenAI王座!
智源社区 2025-04-10T08:57:32.000000Z