Founder Park 09月29日 22:19
DeepSeek V3.2-Exp发布,模型效率提升,API价格下调
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek最新推出实验性模型V3.2-Exp,引入DeepSeek Sparse Attention(DSA)技术,显著提升长文本处理效率,同时API价格下调超50%。新模型在V3.1-Terminus基础上,通过DSA机制在几乎不影响性能的前提下,加快了长文本的训练和推理速度。官方App、网页端和小程序已同步更新,开发者可享受更低成本的API服务。为方便用户对比,V3.1模型API接口将限时保留至2025年10月15日,价格与新版一致。

🚀 **技术革新:DeepSeek Sparse Attention (DSA)**:DeepSeek V3.2-Exp模型引入了创新的DSA技术,这是一种细粒度的稀疏注意力机制。该技术能够在几乎不影响模型输出效果的前提下,大幅提升处理长文本的训练和推理效率。通过与V3.1-Terminus进行严格的训练设置对齐和多领域公开评测集对比,V3.2-Exp在性能上基本持平,显示了DSA在保持模型能力的同时优化效率的有效性。

💰 **API价格大幅下调**:得益于DSA技术带来的效率提升,DeepSeek宣布API调用价格即刻下调超过50%。这一举措直接降低了开发者的成本,使他们能够以更低的投入构建更强大的AI应用。所有官方平台(App、网页端、小程序)以及标准API接口均已默认升级至V3.2-Exp模型,用户将立即受益于此价格调整。

🔄 **无缝升级与旧版保留**:官方App、网页端和小程序均已同步更新至V3.2-Exp。为了便于用户在新旧模型之间进行对比和测试,DeepSeek限时保留了V3.1模型的API访问通道,直至2025年10月15日。在此期间,用户可以访问旧版API,并且价格与新版V3.2-Exp相同,这为开发者提供了充足的时间来评估和迁移。

原创 Founder Park 2025-09-29 18:53 北京

DeepSeek 又降价了!

DeepSeek-V3.2 来了!

DeepSeek 正式推出其最新的实验性模型 DeepSeek-V3.2-Exp。这是一个实验性(Experimental)的版本,该版本在 V3.1-Terminus 的基础上,引入了革命性的 DeepSeek Sparse Attention(DSA) 技术,旨在大幅提升长文本处理的效率。

目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp。

与此同时,官方宣布 API 服务价格下调超过 50%

核心亮点一览:

    技术革新:首创 DeepSeek 稀疏注意力(DSA) 机制,在几乎不影响模型性能的前提下,显著提升了长文本的训练和推理速度。

    成本骤降:得益于效率提升,API 调用成本直降超过 50%

    无缝升级与对比测试:官方 App、网页端等平台已全面升级。同时为方便用户对比,限时保留了旧版 V3.1 模型的 API 接口,并同样享受新版价格。

以下内容要点来自官方文章。


超 14000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 

进群后,你有机会得到:

    最新、最值得关注的 AI 新品资讯; 

    不定期赠送热门新品的邀请码、会员码;

    最精准的AI产品曝光渠道


01 

DeepSeek Sparse Attention(DSA)

DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

为了严谨地评估引入稀疏注意力带来的影响,我们特意把 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。

DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp

论文也已同步公开:

https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

官方注:在新模型的研究过程中,需要设计和实现很多新的 GPU 算子。使用高级语言 TileLang 进行快速原型开发,以支持更深入的探索。在最后阶段,以 TileLang 作为精度基线,逐步使用底层语言实现更高效的版本。因此,本次开源的主要算子包含 TileLang 与 CUDA 两种版本。我们建议社区在进行研究性实验时,使用基于 TileLang 的版本以方便调试和快速迭代。

02 

API 价格大幅下调

模型服务成本的降低,最直接的受益者就是开发者。DeepSeek 宣布,API 定价即刻生效新标准,整体降幅超过 50%。这意味着开发者能够以更低的成本,构建更强大的应用。

目前,所有官方平台(App、网页端、小程序)和标准 API 接口均已默认使用 V3.2-Exp 模型。

03 

DS-V3.1 限时保留

作为实验性版本,V3.2-Exp 虽然在评测中表现优异,但仍需在真实应用场景中接受更广泛的检验。为此,DeepSeek 诚挚邀请所有用户参与测试,并提供宝贵的反馈。

为了方便您进行新旧版本对比,官方限时保留了 V3.1 模型的API访问通道(至 2025 年 10 月 15 日),且调用价格与新版 V3.2-Exp 相同。

用户只需修改 base_url="https://api.deepseek.com/v3.1_terminus_expires_on_20251015" 即可访问 V3.1-Terminus,调用价格与 V3.2-Exp 相同。

更详细的使用方法请参考官方文档:

https://api-docs.deepseek.com/zh-cn/guides/comparison_testing。

反馈链接:

https://feedback.deepseek.com/dsa

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek V3.2-Exp DSA AI模型 长文本处理 API降价 人工智能
相关文章