最新-新浪科技科学探索 08月12日
基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

国产大模型DeepSeek的重大更新——DeepSeek-R2预计于2025年8月15日至8月30日之间发布。该模型将采用更先进的混合专家模型(MoE)架构,并有望在性能、成本和自主可控方面实现突破。据透露,DeepSeek-R2的训练基于华为昇腾910B芯片集群,计算能力强大,且成本可能显著低于OpenAI的同类产品,预示着AI服务定价模式可能面临颠覆。这一消息也带动了国内算力链相关公司的股价上涨,如寒武纪股价大幅走高,创下历史新高。DeepSeek-R2的推出,标志着国产AI技术在自主可控和性能提升方面迈出了重要一步。

🚀 DeepSeek-R2模型预计于2025年8月15日至8月30日之间发布,将采用更先进的混合专家模型(MoE)架构,并通过智能门控网络层优化高负载推理任务的性能。

💡 分析师预测DeepSeek-R2的定价可能显著低于OpenAI的同类产品,并且训练成本预计比GPT-4下降97%,这可能对现有AI服务的定价模式产生颠覆性影响。

🇭🇺 DeepSeek-R2是在华为昇腾910B芯片集群上训练的模型,实现了全方位全产业链的自主可控,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%,性能接近英伟达上一代A100训练集群的91%。

📈 随着DeepSeek-R2发布预期的临近,国产算力链相关公司如寒武纪股价出现大幅上涨,创历史新高,显示出市场对国产AI算力发展前景的看好。

快科技8月12日消息,ChatGPT-5已经发布,那么国产大模型DeepSeek大版本更新也就不远了。

从网友向DeepSeek提出的问题看,该模型给出的答案是,DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

在这样的背景下,国产算力链多家公司股价出现了大涨,比如寒武纪直接今天20cm涨停,股价创历史新高,市值突破3550亿元。

按照之前的说法,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。

据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:雪花

文章内容举报

]article_adlist-->

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek-R2 国产大模型 AI算力 昇腾910B 混合专家模型
相关文章