热点
"DSA" 相关文章
苹果硬刚欧盟,称其监管要求相互矛盾
IT之家 2025-11-06T14:03:05.000000Z
EU accuses Meta of violating content rules in move that could anger Trump
Ars Technica - All content 2025-10-24T18:52:16.000000Z
欧盟指控Meta与TikTok违反数字法规
cnBeta全文版 2025-10-24T11:59:19.000000Z
欧盟指控Meta与TikTok违反数字法规
cnBeta全文版 2025-10-24T11:59:19.000000Z
欧盟指控Meta与TikTok违反数字法规
cnBeta全文版 2025-10-24T11:59:19.000000Z
“万亿参数”VS“半价长文”:国产大模型的“规模幻象”与“算力革命”之战
钛媒体:引领未来商业与生活新知 2025-10-23T12:54:35.000000Z
“万亿参数”VS“半价长文”:国产大模型的“规模幻象”与“算力革命”之战
钛媒体:引领未来商业与生活新知 2025-10-23T12:54:35.000000Z
国产设备改变诊疗模式 能否构建“UPS”新格局
第一财经头条 2025-10-22T01:41:56.000000Z
国产设备改变诊疗模式 能否构建“UPS”新格局
第一财经头条 2025-10-22T01:41:56.000000Z
猛涨至30000!Temu卖家保证金或将大幅上调……
出海指南 2025-10-21T15:16:23.000000Z
独家!DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
智源社区 2025-09-30T13:33:18.000000Z
DeepSeek新模型自砍一刀大降价50% 华为寒武纪已适配
Cnbeta 2025-09-30T13:31:56.000000Z
导致DeepSeek价格暴降,「稀疏注意力机制」,到底是个啥?
特大号 2025-09-30T11:36:55.000000Z
价格屠夫 DeepSeek 又出手了,虽然性能有一点点下滑,但这价格就像蜜雪冰城让人无话可说。 新模型使用 DeepSeek Sparse Attention(DSA) 首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。 DeepSeek 3.2 百万字价格,输出3元,输入2元 很便宜,同时很有趣 输出和输入价格接近1:1了 这背后是多么极致的工程优化
橘子汽水铺 2025-09-30T09:43:11.000000Z
DeepSeek V3.2-Exp Cuts Long-Context Costs with DeepSeek Sparse Attention (DSA) While Maintaining Benchmark Parity
MarkTechPost@AI 2025-09-30T09:30:41.000000Z
DeepSeek发布V3.2-Exp:引入DSA、价格腰斩,为V4、R2铺路
硅星人Pro 2025-09-30T06:38:29.000000Z
DeepSeek新版本,节前突袭发布!
Datawhale 2025-09-30T03:45:05.000000Z
DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
36氪 - AI相关文章 2025-09-30T00:19:17.000000Z
刚刚,DeepSeek开源V3.2-Exp,公开新稀疏注意力机制DSA
机器之心 2025-09-29T16:37:49.000000Z
DeepSeek V3.2 发布:长文本能力新突破,API 价格砍半
Founder Park 2025-09-29T14:19:48.000000Z