代码推理_Fishai

热点

"代码推理" 相关文章

Chain of Execution Supervision Promotes General Reasoning in Large Language Models

cs.AI updates on arXiv.org 2025-10-29T04:21:09.000000Z

PLSEMANTICSBENCH: Large Language Models As Programming Language Interpreters

cs.AI updates on arXiv.org 2025-10-07T04:14:46.000000Z

AI Code要变天了，Meta首个代码世界模型登场！

PaperAgent 2025-09-25T10:37:31.000000Z

Mistral Magistral：纯强化学习炼就的推理引擎，颠覆LLM训练范式

我爱自然语言处理 2025-09-11T19:56:03.000000Z

字节跳动Seed团队发布扩散语言模型，每秒推理速度2146 tokens

36氪 2025-07-31T14:55:18.000000Z

字节跳动Seed团队发布扩散语言模型，每秒推理速度2146 tokens

界面快报 2025-07-31T12:56:56.000000Z

科学家揭示训练代码执行器受限于模型能力，指明智能体要融入符号计算

MIT 科技评论 - 本周热榜 2025-07-13T16:21:35.000000Z

研究人员揭示训练代码执行器会受限于模型能力，并指明智能体和具身智能需要融入符号计算

MIT 科技评论 - 本周热榜 2025-07-06T16:19:14.000000Z

奖励是假的，能让Qwen提升25%性能却是真的！

智源社区 2025-05-30T07:58:19.000000Z

奖励是假的，能让Qwen提升25%性能却是真的

36kr-科技 2025-05-30T02:43:11.000000Z

奖励是假的，能让Qwen提升25%性能却是真的！

量子位 2025-05-29T11:43:12.000000Z

LLM加RL遭质疑：故意用错奖励，数学基准也显著提升，AI圈炸了

掘金人工智能 2025-05-28T09:28:04.000000Z

Reinforcement learning with random rewards actually works with Qwen 2.5

Interconnects 2025-05-27T16:50:21.000000Z

o3首次公开反抗，人类已失控！爆改自杀程序拒绝关机，全网惊恐

智源社区 2025-05-27T06:53:03.000000Z

o3首次公开反抗，人类已失控！爆改自杀程序拒绝关机，全网惊恐

新智元 2025-05-25T07:03:20.000000Z

o3模型被曝无视人类指令自主破解关机程序又发现Linux内核的安全漏洞

Cnbeta 2025-05-25T06:22:38.000000Z

全球AI巨头都开始选边站了，但他们选的是一个国产模型。。

机器学习初学者 2025-05-16T05:32:40.000000Z

AI That Teaches Itself: Tsinghua University’s ‘Absolute Zero’ Trains LLMs With Zero External Data

MarkTechPost@AI 2025-05-09T23:25:41.000000Z

Together AI Released DeepCoder-14B-Preview: A Fully Open-Source Code Reasoning Model That Rivals o3-Mini With Just 14B Parameters

MarkTechPost@AI 2025-04-11T06:55:34.000000Z

UC伯克利华人开源14B「o3-mini」，代码版R1突袭OpenAI王座！

智源社区 2025-04-10T08:57:32.000000Z

Copyright © 2019 FISHAI.All Rights Reserved