蒸馏_Fishai

热点

"蒸馏" 相关文章

OpenAI前CTO Mira Murati团队又放大招，让大模型训练成本暴降10倍

夕小瑶科技说 2025-10-28T13:51:54.000000Z

推理效率狂飙60倍：DiDi-Instruct让扩散大模型16步超越千步GPT

机器之心 2025-10-27T09:42:20.000000Z

One-step Diffusion Models with Bregman Density Ratio Matching

cs.AI updates on arXiv.org 2025-10-21T04:27:38.000000Z

Fine-tuning with RAG for Improving LLM Learning of New Skills

cs.AI updates on arXiv.org 2025-10-03T04:03:57.000000Z

腾讯、复旦、上海创智学院提出SwiftVideo：首个Continuous-time视频蒸馏加速框架，实现业界最快最高清视频生成

我爱计算机视觉 2025-09-17T09:39:44.000000Z

被曝蒸馏DeepSeek还造假！欧版OpenAI塌房了

智源社区 2025-08-16T06:40:18.000000Z

大模型 “瘦身术”：量化与蒸馏背后的秘密

掘金人工智能 2025-07-19T09:38:48.000000Z

DistillQwen-ThoughtY：通过变长思维链蒸馏，全面提升模型推理能力！

掘金人工智能 2025-07-01T12:14:06.000000Z

R1时代，RAG-Retrieval技术总结与展望~

PaperAgent 2025-06-01T13:28:09.000000Z

大模型算法架构：DeepSeek技术演进及剖析

掘金人工智能 2025-05-28T02:18:17.000000Z

纯蒸馏模型 SOTA 出现！直接 SFT 成本直降 50 倍，数据已全部开源

AI科技评论 2025-05-21T12:07:45.000000Z

强化学习被高估！清华上交：RL不能提升推理能力，新知识得靠蒸馏

智源社区 2025-04-27T09:48:02.000000Z

86 条 DeepSeek 的关键思考｜Best Ideas 开源

海外独角兽 2025-04-09T10:06:17.000000Z

DeepSeek-R1解读：纯强化学习，模型推理能力提升的新范式？

智源社区 2025-01-29T03:07:12.000000Z

确认了！o3-mini几周内发布，奥特曼表示AGI只需872兆瓦计算功率

机器之心 2025-01-18T07:54:56.000000Z

国产白酒比进口红酒更健康—甲醇对比。

虎扑-热帖 2024-12-30T19:05:25.000000Z

OpenAI 新货详解：强化微调

赛博禅心 2024-12-07T12:51:32.000000Z

NeurIPS 2024｜单步生成：让扩散模型实现高速无损的内容生成

我爱计算机视觉 2024-11-19T12:10:46.000000Z

微軟AI主管談AI趨勢：大小模型將「齊頭並進」，「規模法則」遠沒有到極限

富途牛牛头条 2024-11-03T06:20:03.000000Z

大模型相关的产品化路径思考｜奇绩大模型笔记 #3

奇绩创坛 2024-10-28T14:26:24.000000Z

Copyright © 2019 FISHAI.All Rights Reserved