03月02日
DeepSeek首次晒出账单!日赚346万元,理论利润率达545%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

DeepSeek首次披露大模型的盈利情况,引爆投资圈,理论利润率高达545%。DeepSeek披露了大规模V3、R1部署的成本和收益,成为第一个详细披露自己成本结构的大模型公司。运营一天V3和R1的算力成本为87072美元,而以R1定价来看,收入理论上为562027美元,利润率为545%。DeepSeek V3和R1的所有服务均使用H800 GPU,通过一套机制,在白天负荷高时用所有节点部署推理服务,晚上负荷低时减少推理节点,以用于研究和训练。开源周DeepSeek还连续开源了5天Infra相关的库。

💰DeepSeek披露运营大规模V3和R1的算力成本为每天87072美元,而以R1定价计算,理论日收入可达562027美元,利润率高达545%。

⏱️DeepSeek通过动态调整推理节点数量,实现算力资源的优化配置,白天高峰期全节点部署推理服务,夜间低峰期则减少推理节点用于研究和训练。

🚀DeepSeek开源周连续发布了多个Infra相关的库,包括FlashMLA、DeepEP、DeepGEMM、DualPipe与EPLB以及3FS文件系统,旨在加速数据处理并优化GPU负载均衡。

一天8.7万美元的成本 vs 56万美元的API收入

周末,DeepSeek又放大招,首次披露大模型的盈利情况,引爆投资圈。


理论利润率达545%


3月1日,DeepSeek发文披露了大规模V3、R1部署的成本和收益,成为了第一个详细披露了自己成本结构的大模型公司。

据DeepSeek计算,运营一天V3和R1的算力成本为87072美元,而以R1定价来看,收入理论上为562027美元,利润率为545%。

据介绍,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度。

由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制。在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。

在2025年02月27日12:00至2025年02月28日12:00,DeepSeek V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定 GPU 租赁成本为2美金/小时,总成本为87,072美元/天。

在24小时统计时段内,DeepSeek V3和 R1的网页、APP和API的所有负载如下

输入token总数为608B,其中 342B tokens(56.3%)命中KVCache硬盘缓存。
输出 token总数为168B。平均输出速率为20~22tps,平均每输出一个token的KVCache长度是4989。
平均每台H800的吞吐量为:对于prefill任务,输入吞吐约73.7k tokens/s(含缓存命中);对于decode任务,输出吞吐约14.8k tokens/s。

如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562,027美元(折合人民币409.36万元),成本利润率545%。

以此计算,DeepSeek理论上最高每天可盈利47. 5万美元(折合人民币约346万元)。

不过,DeepSeek也表示,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

巨大的盈利下,有投资人开始按计算器,称其在美国应该是一家估值超百亿美元的公司。

MenloVentures投资人Deedy表示:“理论ARR(年收入)2亿美元、利润率超过500%,这样的商业效率理应是一家值100亿美元的公司。

还有网友评论,DeepSeek掀起了行业新一轮卷Infra热潮。

DeepSeek官方直接披露内部的成本利润细节,这下所有做Infra的兄弟都要被老板上压力了——如果利润率达不到DeepSeek的水平,就说明自家的Infra团队菜。


开源周收官


上周,DeepSeek进行了开源周,连续放了5天Infra相关的库。

第一天,开源项目 FlashMLA 正式发布,专为Hopper GPU优化的高效MLA解码内核,支持变长序列处理

第二天,DeepEP发布,DeepEP是一个专为混合专家系统(MoE)和专家并行(EP)设计的通信库。

第三天,DeepGEMM发布,DeepGEMM 是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能。

第四天,DualPipe与EPLB发布,DualPipe是一种创新的双向管道并行算法。EPLB即专家并行负载均衡器,自动平衡GPU负载,避免部分显卡过载或闲置。

最后一天,3FS文件系统发布,并行文件系统Fire-Flyer File System,利用SSD和RDMA网络技术,显著加速数据处理。

周六,DeepSeek又披露了盈利情况,算是为开源周做了一个很好的收尾。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek 大模型 盈利 Infra 开源
相关文章