热点
关于我们
xx
xx
"
FP8训练
" 相关文章
前阿里、字节大模型带头人杨红霞创业:大模型预训练,不是少数顶尖玩家的算力竞赛|智能涌现独家
36kr-科技
2025-10-30T09:03:44.000000Z
Ling-1T:蚂蚁百灵如何以“非思考”策略,开启万亿参数效率新篇章?
掘金 人工智能
2025-10-09T23:50:56.000000Z
InfiR2: A Comprehensive FP8 Training Recipe for Reasoning-Enhanced Language Models
cs.AI updates on arXiv.org
2025-09-29T04:16:32.000000Z
首发|硅基流动上线蚂蚁集团 Ling-mini-2.0
硅基流动
2025-09-11T15:44:35.000000Z
AMD Instinct数据中心GPU第一时间支持DeepSeek!FP8高性能提升显著
快科技资讯
2025-02-10T16:24:21.000000Z
DeepSeek是否有国运级创新?2万字解读与硬核分析V3/R1的架构
2025-02-09T16:19:42.000000Z
Infra视角下的DeepSeek-V3,到底有多强?
智源社区
2025-01-22T12:43:28.000000Z
671B大模型训练只需此前算力1/10 国产之光DeepSeek把AI大佬全炸出来了
Cnbeta
2024-12-27T07:06:33.000000Z