热点
关于我们
xx
xx
"
Sparse Attention
" 相关文章
长文本生成迎来新突破:拓元智慧推出 DrDiff ,实现效率与质量双提升
AI科技评论
2025-10-22T11:48:55.000000Z
DeepSeek苦练1T,清华只用5B?InfLLM-V2把稀疏注意力玩明白了
PaperWeekly
2025-10-10T15:36:20.000000Z
DeepSeek苦练1T,清华只用5B?InfLLM-V2把稀疏注意力玩明白了
PaperWeekly
2025-10-10T15:36:20.000000Z
第二代InfLLM开源,同尺寸快三倍!零参数,可训练稀疏注意力
新智元
2025-10-10T10:05:30.000000Z
第二代InfLLM开源,同尺寸快三倍!零参数,可训练稀疏注意力
新智元
2025-10-09T17:51:25.000000Z
第二代InfLLM开源,同尺寸快三倍,零参数,可训练稀疏注意力
36kr-科技
2025-10-09T15:09:48.000000Z
果然一到假期,DeepSeek 就发新东西了。。。
差评
2025-09-30T17:19:31.000000Z
刚刚,DeepSeek-V3.2开源,V4也要来~
PaperAgent
2025-09-30T10:10:46.000000Z
DeepSeek V3.2-Exp Cuts Long-Context Costs with DeepSeek Sparse Attention (DSA) While Maintaining Benchmark Parity
MarkTechPost@AI
2025-09-30T09:30:41.000000Z
DeepSeek releases ‘sparse attention’ model that cuts API costs in half
TechCrunch News
2025-09-29T20:47:40.000000Z
DeepSeek releases ‘sparse attention’ model that cuts API costs in half
TechCrunch News
2025-09-29T20:47:40.000000Z
DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价
DeepSeek
2025-09-29T16:38:32.000000Z
独家!DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
新智元
2025-09-29T16:37:43.000000Z
DeepSeek新版本,节前突袭发布!
Datawhale
2025-09-29T15:39:57.000000Z
DeepSeek-V3.2-Exp模型发布并开源,API价格大幅下调
36氪 - 科技频道
2025-09-29T15:24:44.000000Z
DeepSeek开源V3.2-Exp 公开新稀疏注意力机制DSA
cnBeta全文版
2025-09-29T13:32:06.000000Z
火速!寒武纪Day 0适配DeepSeek-V3.2-Exp 并同步开源
快科技资讯
2025-09-29T13:23:55.000000Z
国庆前放大招!DeepSeek-V3.2-Exp发布并开源,API成本将降低50%以上
富途牛牛头条
2025-09-29T11:58:35.000000Z
社区供稿丨基座上新:MiniCPM 4.1 将「高效深思考」引入端侧
智源社区
2025-09-13T04:40:26.000000Z
社区供稿丨基座上新:MiniCPM 4.1 将「高效深思考」引入端侧
Hugging Face
2025-09-12T16:40:57.000000Z