热点
"On-Policy Distillation" 相关文章
只要强化学习1/10成本!翁荔的Thinking Machines盯上了Qwen的黑科技
智源社区 2025-10-29T07:36:32.000000Z
Thinking Machine新研究刷屏!结合RL+微调优势,小模型训练更具性价比了
智源社区 2025-10-29T07:36:31.000000Z
让AI学习效率飙升50倍的秘密:在线策略蒸馏
硅星人Pro 2025-10-29T03:42:23.000000Z
OpenAI前CTO Mira Murati团队又放大招,让大模型训练成本暴降10倍
夕小瑶科技说 2025-10-28T14:40:12.000000Z
OpenAI前CTO Mira Murati团队又放大招,让大模型训练成本暴降10倍
夕小瑶科技说 2025-10-28T13:51:54.000000Z
让AI学习效率飙升50倍的秘密:在线策略蒸馏
硅星GenAI 2025-10-28T13:33:42.000000Z
只要强化学习1/10成本!翁荔的Thinking Machines盯上了Qwen的黑科技
新智元 2025-10-28T08:20:04.000000Z
刚刚,Thinking Machines Lab博客提出在策略蒸馏,Qwen被cue 38次
机器之心 2025-10-28T05:42:24.000000Z
刚刚,Thinking Machines Lab博客提出在策略蒸馏,Qwen被cue 38次
36氪 AI 2025-10-28T02:04:10.000000Z