热点
关于我们
xx
xx
"
稀疏注意力机制
" 相关文章
vAttention: Verified Sparse Attention
cs.AI updates on arXiv.org
2025-10-08T04:13:51.000000Z
DeepSeek's new V3.2-Exp model cuts API pricing in half to less than 3 cents per 1M input tokens
VentureBeat
2025-10-03T12:43:23.000000Z
DeepSeek新模型自砍一刀大降价50% 华为寒武纪已适配
cnBeta全文版
2025-09-30T15:21:23.000000Z
导致DeepSeek价格暴降,「稀疏注意力机制」,到底是个啥?
特大号
2025-09-30T11:36:55.000000Z
DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路
硅星人Pro
2025-09-30T06:38:29.000000Z
科创芯片ETF指数涨超2.2%,DeepSeek发布新模型V3.2-Exp。截至2025年9月30日10:44,上证科创板芯片指数(000685)强势上涨2.29%,成分股佰维存储(688525)上涨10.84%...
虎嗅
2025-09-30T03:51:49.000000Z
DeepSeek模型首次引入“稀疏注意力”机制
联合早报-中国即时新闻
2025-09-29T23:32:47.000000Z
【国金电子】Deepseek模型更新,国产算力迅速实现适配 0929
韭研公社
2025-09-29T16:27:36.000000Z
火速!寒武纪Day 0适配DeepSeek-V3.2-Exp 并同步开源
快科技资讯
2025-09-29T13:23:55.000000Z
DeepSeek-V3.2-Exp 模型正式发布,API 大幅降价
IT之家
2025-09-29T10:12:51.000000Z
Less Is More: Training-Free Sparse Attention with Global Locality for Efficient Reasoning
cs.AI updates on arXiv.org
2025-08-12T04:39:24.000000Z
刚刚,DeepSeek全新注意力机制NSA发布,超快速长文训练与推理~
PaperAgent
2025-02-22T16:22:51.000000Z
DeepSeek AI Introduces NSA: A Hardware-Aligned and Natively Trainable Sparse Attention Mechanism for Ultra-Fast Long-Context Training and Inference
MarkTechPost@AI
2025-02-19T04:01:07.000000Z