第一财经头条 前天 18:48
Kimi CEO回应模型训练成本,强调算力卡极致利用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

人工智能初创公司月之暗面Kimi的CEO杨植麟在Reddit上就模型训练成本等问题进行了回应。他表示,关于Kimi K2 Thinking模型460万美元的训练成本并非官方数字,研究与实验的投入使得成本难以精确量化。针对模型推理长度和榜单成绩的质疑,他指出目前优先考虑绝对性能,token效率和榜单与实测脱节的问题将在后续版本中改善。文章还提到,中国开源大模型在国际市场调用量增加,Kimi团队表示正极致利用H800 GPU算力资源,并计划继续坚持开源策略,优化K2 Thinking模型,在文本模型基础上兼顾多模态,寻求差异化竞争优势。

💰 **训练成本与研究投入:** Kimi CEO杨植麟澄清,Kimi K2 Thinking模型460万美元的训练成本并非官方数据,实际投入大量资金于研究与实验,使得精确量化训练成本变得困难,这反映了AI模型研发的高投入特性。

🚀 **模型性能与优化方向:** 针对网友关于Kimi K2 Thinking模型推理长度过长及榜单成绩与实际体验不符的质疑,杨植麟回应称,当前版本优先追求绝对性能,后续版本将着重改善token效率,并解决榜单分数与实际应用之间的差距,展现了持续优化的策略。

📈 **中国开源模型国际影响力:** 文章指出,中国开源大模型在国际市场上的调用量正在显著增长,OpenRouter模型调用榜单显示,中国模型已占据重要席位,这表明中国在AI领域的技术进步和国际竞争力日益增强。

💡 **算力资源极致利用与差异化战略:** Kimi团队正通过携带InfiniBand的H800 GPU,即使在数量和性能不及美国高端卡的情况下,也努力将每张卡发挥到极致。公司未来将坚持开源策略,重点推进Kimi K2 Thinking的应用与优化,并在优先文本模型的同时兼顾多模态,以架构创新、开源和成本控制来建立差异化优势,避免与头部厂商直接竞争。

每一张算力卡都被用到了极致。

北京时间11月11日,人工智能初创公司月之暗面Kimi CEO杨植麟等人在社交平台Reddit上解答网友提问,回应关于模型训练成本等问题。

Kimi近半年时间持续投入开源模型的研发与更新。11月6日发布了最新版本的开源思考模型Kimi K2 Thinking。彼时有消息称,Kimi K2 Thinking的训练成本为460万美元,低于DeepSeek V3模型的560万美元和OpenAI GPT-3的数十亿美元。

针对该数据,杨植麟在此次对话中回应称:(460万美元)不是官方数字,由于大部分投入都花在研究与实验上,因此训练成本很难量化。

网友也提出Kimi K2 Thinking推理长度过长、榜单成绩与实际体验不符等质疑,杨植麟表示现阶段该模型优先考虑绝对性能,token效率会在后续得到改善,榜单高分与实测的脱节问题也会在模型通用能力得到补齐后被逐渐消解。

当下,越来越多的中国开源大模型在国际市场中被调用。记者搜索OpenRouter模型调用榜单,最新一周内,排名前二十名的模型产品中,中国开源模型产品占五席,具体包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp。Kimi因OpenRouter平台接口问题,目前只能以API形式被使用。

持续的模型更新与庞大训练量需要算力资源支持,Kimi团队表示所使用的芯片是携带InfiniBand(一种面向高性能计算和AI训练的网络互连技术)的H800 GPU,性能虽然比不上美国的高端卡,数量也处于劣势,但每张卡都被用到了极致。

整体来看,月之暗面Kimi未来很长一段时间内仍将坚持开源策略,重点推进Kimi K2 Thinking模型的应用与优化。在优先文本模型前提下兼顾多模态模型推进,避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争,通过架构创新、开源策略与成本控制尝试建立差异化优势。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

月之暗面 Kimi AI模型 训练成本 开源模型 算力 H800 GPU Moonshot AI Kimi AI Model Training Cost Open Source Model Compute Power H800 GPU
相关文章