DeepSeek开源V3.2-Exp模型，优化长文本处理并降低API成本

深度财经头条 09月29日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

DeepSeek正式发布并开源了实验性模型V3.2-Exp，作为迈向下一代架构的过渡。新模型在V3.1-Terminus基础上引入了DeepSeek稀疏注意力（DSA）机制，旨在探索和验证长文本训练与推理的效率优化。DSA实现了细粒度稀疏注意力，在保持模型输出质量的同时，显著提升了处理长文本的计算效率。中信建投分析师评价其“易用性再次大幅提升”。此外，DeepSeek还开源了TileLang版本GPU算子，并大幅降低了API价格，开发者调用成本可降低50%以上。官方App、网页端和小程序均已同步更新。

🚀 **DeepSeek-V3.2-Exp模型发布与开源**：DeepSeek正式发布并开源了其实验性模型V3.2-Exp，该版本是迈向下一代AI架构的过渡性产品。模型引入了创新的DeepSeek稀疏注意力（DSA）机制，旨在探索和优化长文本的处理能力，提升训练和推理效率。

💡 **稀疏注意力机制提升效率**：DSA实现了细粒度稀疏注意力，能够在保持模型输出质量几乎不变的前提下，显著提高处理长文本时的计算效率。这一技术突破对于需要处理大量文本信息的AI应用至关重要。

💰 **API价格大幅下调**：伴随新模型的发布，DeepSeek大幅降低了API调用价格，开发者调用成本预计将降低50%以上。具体而言，在缓存命中情况下，输入价格从0.5元/百万token降至0.2元，未命中时从4元降至2元；输出价格则从12元/百万token大幅降至3元。

💻 **GPU算子开源与TileLang应用**：DeepSeek不仅开源了CUDA版本的GPU算子，还首次开源了基于TileLang版本的GPU算子。TileLang是一种由北京大学主导开发的开源AI算子编程语言，其简洁高效的特点有助于社区进行研究性实验和快速迭代。

🌐 **同业动态与模型迭代**：在DeepSeek发布新模型的同时，业界其他大模型公司如阿里云（发布Qwen3-Max）、智谱（即将发布GLM-4.6）以及月之暗面（Kimi Agent模式灰度测试）也在积极推进大模型的迭代升级，显示出大模型技术快速发展的趋势。

《科创板日报》9月29日讯（记者黄心怡）梁文锋最新动作来了，DeepSeek-V3.2-Exp 今天正式发布并开源。

根据DeepSeek官方介绍，这是一个实验性（Experimental）的版本，作为迈向下一代架构的过渡。V3.2-Exp 在 V3.1-Terminus 的基础上引入了DeepSeek稀疏注意力（Sparse Attention）机制，旨在对长文本的训练和推理效率进行探索性的优化和验证。

对于此次模型更新，中信建投TMT行业首席分析师武超则评价，DeepSeek-V3.2-Exp“易用性再次大幅提升”。

值得一提的是，除了英伟达CUDA版本外，DeepSeek还开源了TileLang版本GPU算子。

目前，官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp，同时API大幅度降价。

在缓存命中的情况下，输入价格由0.5元/百万token降低为0.2元。在缓存未命中的情况下，输入价格由4元/百万token减低为2元。输出价格则从12元/百万token大幅降低为3元。

在新的价格政策下，开发者调用DeepSeek API的成本将降低50%以上。

据介绍，该实验版本代表了DeepSeek对更高效的transformer架构的研究，特别注重提高处理扩展文本序列时的计算效率。

DeepSeek稀疏注意力架构(DSA)首次实现了细粒度（fine-grained）稀疏注意力，在保持几乎相同的模型输出质量的同时，显著提高了长文本训练和推理效率。

为了评估引入稀疏注意力机制的影响，DeepSeek方面特意将DeepSeek-V3.2-Exp的训练配置与V3.1-Terminus进行了对齐。在各个领域的公开基准测试中，DeepSeek-V3.2-Exp的表现与V3.1-Terminus相当。

DeepSeek方面称，在新模型的研究过程中，需要设计和实现很多新的GPU算子。

“我们使用高级语言TileLang进行快速原型开发，以支持更深入的探索。在最后阶段，以TileLang作为精度基线，逐步使用底层语言实现更高效的版本。因此，本次开源的主要算子包含TileLang与CUDA两种版本。我们建议社区在进行研究性实验时，使用基于TileLang的版本以方便调试和快速迭代。”

《科创板日报》了解到，TileLang编程语言是由北京大学计算机学院副研究员杨智团队主导开发的开源AI算子编程语言。在华为全联接大会上，该团队核心成员董宇骐曾介绍，TileLang实现了FlashAttention算子开发，代码量从500+行减少至80行，并保持了与官方版本持平的性能。

除了DeepSeek外，近期阿里通义千问、智谱也都在推进大模型的迭代升级。

在2025云栖大会现场，阿里云接连发布了七款大模型技术产品，覆盖语言、语音、视觉、多模态、代码等模型领域。其中包括了阿里旗舰模型Qwen3-Max正式发布，预训练数据量达36T，总参数超过万亿，在Coding编程能力和Agent工具调用能力上有较大提升。

智谱新模型GLM-4.6将于近日发布，目前已可通过API接口调用。

月之暗面Kimi则发布Agent模式“OK Computer”并开启灰度测试。据官方介绍，“OK Computer”延续“模型即Agent”理念，通过端到端训练Kimi K2模型，进一步提升智能体及工具调用能力。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签