Foresight News 消息,据官方消息,DeepSeek-V3.2-Exp 模型今日正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对 DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大 EP 并行方案部署,基于稀疏 Attention 结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
来源链接

Foresight News 消息,据官方消息,DeepSeek-V3.2-Exp 模型今日正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对 DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大 EP 并行方案部署,基于稀疏 Attention 结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑