热点
"模型后训练" 相关文章
BaNEL: Exploration Posteriors for Generative Modeling Using Only Negative Rewards
cs.AI updates on arXiv.org 2025-10-13T04:14:43.000000Z
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
掘金 人工智能 2025-01-10T08:17:35.000000Z
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
智源社区 2024-08-20T08:23:33.000000Z