深度求索正式发布了实验性模型DeepSeek-V3.2-Exp,该模型发布即获得多家国产芯片厂商的Day 0适配。华为昇腾、寒武纪、海光信息等厂商已快速完成适配部署,并开源了相关推理代码和算子实现。华为昇腾基于vLLM/SGLang框架实现0day支持;寒武纪结合其计算效率,旨在降低长序列场景的训推成本;海光信息DCU展现了优异性能和生态兼容性。此举标志着国产大模型与国产芯片正朝着软硬协同的统一生态演进,有望加速国内AI产业发展。同时,DeepSeek-V3.2-Exp已更新至官方App、网页端和小程序,API调用成本大幅降低。
🚀 **DeepSeek-V3.2-Exp模型发布与生态适配**:深度求索最新发布的实验性模型DeepSeek-V3.2-Exp,在发布当天即获得多家国产芯片厂商的“Day 0适配”,包括华为昇腾、寒武纪和海光信息。这种快速的适配速度体现了国内AI软硬件生态的协同发展能力,为模型的广泛应用奠定了基础。
💡 **技术创新与成本优化**:华为昇腾基于vLLM/SGLang等推理框架实现了对DeepSeek-V3.2-Exp的快速适配和0day支持,并开源了所有推理代码和算子实现。寒武纪则结合其极致的计算效率,利用DeepSeek Sparse Attention机制,大幅降低了长序列场景下的训练和推理成本。海光信息DCU通过无缝适配和深度调优,展现了其在高通用性、高生态兼容度和自主可控方面的技术优势。
📈 **国产AI产业加速演进**:此次软硬件厂商的集体响应,标志着国产大模型与国产芯片正朝着软硬协同的统一生态演进。这不仅验证了国内AI技术在快速迭代和应用落地方面的能力,也预示着国内AI产业有望迎来进一步的加速发展,形成更具竞争力的生态体系。
💰 **用户体验提升与成本降低**:DeepSeek-V3.2-Exp模型已同步更新至官方App、网页端和小程序,为用户提供了更便捷的访问和体验。同时,API调用价格大幅度降低了50%以上,极大地降低了开发者的使用成本,鼓励更多用户进行体验测试并反馈意见,以持续优化模型和服务。
快科技9月30日消息,日前,深度求索宣布,正式发布DeepSeek-V3.2-Exp模型。尽管这是一个实验性(Experimental)的版本,还是吸引了多家芯片厂商集体宣布Day 0适配。
据华为计算微信公众号消息,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。
寒武纪在官方微信号宣布,已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配。依托DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本。
海光信息宣布,其DCU实现对DeepSeek-V3.2-Exp的无缝适配+深度调优,DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能,同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。
此前国泰海通证券研究指出,国产大模型与国产芯片正朝着软硬协同的统一生态演进,国内AI产业的发展有望进一步加速。
ps.“Day 0 适配” 是软件开发和技术适配领域的一个术语,通常指在某个新系统、新平台、新设备或新功能正式发布的第一天(Day 0) 就完成适配工作,确保相关软件、服务或功能能与新环境无缝兼容并同步可用。
深度求索表示,目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时API大幅度降价,欢迎广大用户体验测试并反馈意见。
据悉,在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。
【本文结束】如需转载请务必注明出处:快科技
责任编辑:朝晖
文章内容举报]article_adlist-->