热点
"LLaMA-3" 相关文章
告别梯度!Evolution Strategies全参微调挑战PPO/GRPO:更稳、更省、更好复现
PaperWeekly 2025-10-07T23:52:56.000000Z
告别梯度!Evolution Strategies全参微调挑战PPO/GRPO:更稳、更省、更好复现
PaperWeekly 2025-10-07T15:18:44.000000Z
从「会说」迈向「会做」,LLM下半场:Agentic强化学习范式综述
机器之心 - 知乎专栏 2025-09-11T19:56:05.000000Z
Manipulating Self-Preference In LLMs
少点错误 2025-07-01T18:12:32.000000Z
Exploring vocabulary alignment of neurons in Llama-3.2-1B
少点错误 2025-06-07T11:22:33.000000Z
Cursor: 以每秒 1000 个 Token 的速度编辑文件
宝玉的分享 2025-02-17T14:48:56.000000Z
力挺开源!扎克伯格抨击闭源AI竞争对手正试图“创造上帝”
快科技资讯 2024-06-28T11:05:25.000000Z
遥遥领先!阿里Qwen-2成全球开源大模型排行榜第一
快科技资讯 2024-06-27T04:05:10.000000Z
Huggingface CEO:阿里Qwen-2成全球开源大模型排行榜第一,中国处于领导地位
华尔街见闻 2024-06-27T02:04:58.000000Z