热点
"VSRM" 相关文章
可验证过程奖励在提升大模型推理效率中的探索与实践
oschina.net 2025-10-16T04:22:54.000000Z
可验证过程奖励在提升大模型推理效率中的探索与实践
oschina.net 2025-10-16T04:22:54.000000Z
可验证过程奖励在提升大模型推理效率中的探索与实践
掘金 人工智能 2025-10-10T08:39:40.000000Z
可验证过程奖励在提升大模型推理效率中的探索与实践
美团技术团队 2025-10-10T07:18:00.000000Z
攻克AI过度思考难题!美团新研究让通过“可验证”过程奖励激活LRM的高效推理
智源社区 2025-09-12T13:23:03.000000Z
攻克AI过度思考难题!美团新研究让通过“可验证”过程奖励激活LRM的高效推理
智源社区 2025-09-12T13:23:03.000000Z
攻克AI过度思考难题!美团新研究让通过“可验证”过程奖励激活LRM的高效推理
量子位 2025-09-12T09:11:15.000000Z
Promoting Efficient Reasoning with Verifiable Stepwise Reward
cs.AI updates on arXiv.org 2025-08-15T04:18:15.000000Z