热点
"自回归 MCMC" 相关文章
不用强化学习也能推理,哈佛新采样算法竟能让基础模型比肩GRPO后训练版本
机器之心 2025-10-23T06:15:42.000000Z