热点
关于我们
xx
xx
"
蒸馏
" 相关文章
OpenAI前CTO Mira Murati团队又放大招,让大模型训练成本暴降10倍
夕小瑶科技说
2025-10-28T13:51:54.000000Z
推理效率狂飙60倍:DiDi-Instruct让扩散大模型16步超越千步GPT
机器之心
2025-10-27T09:42:20.000000Z
One-step Diffusion Models with Bregman Density Ratio Matching
cs.AI updates on arXiv.org
2025-10-21T04:27:38.000000Z
Fine-tuning with RAG for Improving LLM Learning of New Skills
cs.AI updates on arXiv.org
2025-10-03T04:03:57.000000Z
腾讯、复旦、上海创智学院提出SwiftVideo:首个Continuous-time视频蒸馏加速框架,实现业界最快最高清视频生成
我爱计算机视觉
2025-09-17T09:39:44.000000Z
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
智源社区
2025-08-16T06:40:18.000000Z
大模型 “瘦身术”:量化与蒸馏背后的秘密
掘金 人工智能
2025-07-19T09:38:48.000000Z
DistillQwen-ThoughtY:通过变长思维链蒸馏,全面提升模型推理能力!
掘金 人工智能
2025-07-01T12:14:06.000000Z
R1时代,RAG-Retrieval技术总结与展望~
PaperAgent
2025-06-01T13:28:09.000000Z
大模型算法架构:DeepSeek技术演进及剖析
掘金 人工智能
2025-05-28T02:18:17.000000Z
纯蒸馏模型 SOTA 出现!直接 SFT 成本直降 50 倍,数据已全部开源
AI科技评论
2025-05-21T12:07:45.000000Z
强化学习被高估!清华上交:RL不能提升推理能力,新知识得靠蒸馏
智源社区
2025-04-27T09:48:02.000000Z
86 条 DeepSeek 的关键思考 |Best Ideas 开源
海外独角兽
2025-04-09T10:06:17.000000Z
DeepSeek-R1解读:纯强化学习,模型推理能力提升的新范式?
智源社区
2025-01-29T03:07:12.000000Z
确认了!o3-mini几周内发布,奥特曼表示AGI只需872兆瓦计算功率
机器之心
2025-01-18T07:54:56.000000Z
国产白酒比进口红酒更健康—甲醇对比。
虎扑-热帖
2024-12-30T19:05:25.000000Z
OpenAI 新货详解:强化微调
赛博禅心
2024-12-07T12:51:32.000000Z
NeurIPS 2024|单步生成:让扩散模型实现高速无损的内容生成
我爱计算机视觉
2024-11-19T12:10:46.000000Z
微軟AI主管談AI趨勢:大小模型將「齊頭並進」,「規模法則」遠沒有到極限
富途牛牛头条
2024-11-03T06:20:03.000000Z
大模型相关的产品化路径思考|奇绩大模型笔记 #3
奇绩创坛
2024-10-28T14:26:24.000000Z