富途牛牛头条 09月29日
DeepSeek发布新模型V3.2-Exp,优化长文本处理并大幅降价
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek于9月29日在Hugging Face平台发布并开源了其最新的V3.2-Exp模型。该模型引入了自研的DeepSeek Sparse Attention (DSA)稀疏注意力机制,旨在优化长文本的训练和推理效率,同时降低计算资源消耗。华为云已完成对该模型的适配,支持高达160K的长序列上下文。DSA技术在几乎不影响模型性能的前提下,显著提升了长文本处理能力。此外,DeepSeek大幅下调了官方API价格超过50%,新价格已生效。新模型已在Huggingface和ModelScope全面开源,相关论文和GPU算子也已公开,方便社区研究和应用。

✨ **DeepSeek V3.2-Exp模型发布与开源**:该模型于9月29日正式发布,并在Hugging Face和ModelScope平台开源。作为迈向下一代架构的关键一步,它在V3.1-Terminus基础上进行了优化,旨在探索和验证长文本处理的效率。

💡 **引入DeepSeek Sparse Attention (DSA)机制**:DSA是一种细粒度的稀疏注意力机制,其核心优势在于能够显著提升长文本的训练和推理效率,同时大幅降低计算资源消耗,且几乎不影响模型的输出效果。华为云已适配此模型,支持高达160K的超长序列上下文。

💰 **API价格大幅下调**:随着新模型服务成本的降低,DeepSeek同步将官方API价格下调超过50%,新价格即刻生效。这使得开发者能够以更低的成本使用DeepSeek的模型服务,包括官方App、网页端和小程序。

📚 **研究与社区支持**:DeepSeek-V3.2-Exp模型及其相关论文已同步公开。为支持社区研究,团队还开源了新模型研究中设计的GPU算子(TileLang和CUDA版本),并建议社区优先使用TileLang版本进行研究性实验,以利于调试和快速迭代。

9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。DeepSeek大幅下调官方 API 价格,降价幅度超过 50%,新价格已即刻生效。

国庆长假在即,Deepseek又放大招了!

9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。

该版本作为迈向下一代架构的重要中间步骤,在 V3.1-Terminus 的基础上引入了团队自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。

目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。

核心技术突破:DeepSeek Sparse Attention (DSA)

DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制。DeepSeek 方面表示,这项技术在几乎不影响模型输出效果的前提下,大幅提升了长文本场景下的训练和推理效率。

为了确保评估的严谨性,DeepSeek-V3.2-Exp 的训练设置与前代 V3.1-Terminus 进行了严格对齐。测试结果显示,该模型在各大公开评测集上的表现与 V3.1-Terminus 基本持平,有效性得到了初步验证。

API成本将降低50%以上

随着新模型服务成本的显著降低,DeepSeek 同步采取了重磅举措:大幅下调官方 API 价格,降价幅度超过 50%,新价格已即刻生效。目前,官方 App、网页端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。

DeepSeek 现已将 DeepSeek-V3.2-Exp 模型在 Huggingface 和 ModelScope 平台上全面开源,相关论文也已同步公开。

作为一款实验性版本,DeepSeek 认识到模型仍需在更广泛的用户真实场景中进行大规模测试。为便于开发者进行效果对比,DeepSeek 为 V3.1-Terminus 版本临时保留了 API 访问接口,且调用价格与 V3.2-Exp 保持一致。该对比接口将保留至北京时间 2025 年 10 月 15 日 23:59。

此外,为支持社区研究,DeepSeek 还开源了新模型研究中设计和实现的 GPU 算子,包括 TileLang 和 CUDA 两种版本。团队建议社区在进行研究性实验时,优先使用基于 TileLang 的版本,以便于调试和快速迭代。

编辑/rice

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek V3.2-Exp Sparse Attention 长文本 AI模型 开源 API降价
相关文章