Z Potentials 10月30日 16:46
MiniMax M2开源登顶,全模态技术引领AI新方向
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

MiniMax(稀宇极智)发布新一代开源文本大模型M2,在权威榜单上登顶全球开源模型第一,并在智能体和代码能力上逼近顶尖闭源模型。其原创算法CISPO获Meta认可。MiniMax还推出了Hailuo 2.3视频模型和Speech 2.6语音模型,通过技术创新和成本优化,推动AI走向生产力工具,并以“飞轮生态”式路径,为AI竞赛提供了“中国解法”。

🌟 M2模型登顶与技术认可:MiniMax新一代开源文本大模型M2在权威榜单上荣获全球开源模型第一,综合能力在智能体和代码维度上表现卓越,接近GPT-5等顶尖闭源模型。其原创算法CISPO获得了AI巨头Meta在其最新论文中的公开致敬和验证,显示了其在提升多轮对话逻辑性方面的效率和效果,标志着MiniMax在底层技术上的深厚实力。

💰 颠覆性成本与普惠战略:M2模型的单位成本仅为同级竞品Claude 4.5的8%,并且面向全球限时免费。这一举措不仅是对“算力税”的瓦解,更是MiniMax推动AI技术普惠化的战略体现,旨在让更多开发者和企业能够以更低的成本使用先进的AI能力,加速AI技术的广泛应用和普及。

🌐 全模态协同与生产力工具转型:MiniMax通过Hailuo 2.3视频模型(含Fast版本,降低B端应用成本50%)和Speech 2.6语音模型(解决语音交互延迟痛点,实现250ms首包延迟),全面展示了其在多模态领域的体系化实力。这些模型不仅在技术上实现了突破,更致力于将AI从“黑盒生成器”转变为“创作伙伴”和高效的生产力工具,满足工业级应用和实时交互的需求。

🚀 AI竞赛的“中国解法”与务实路径:在全球AI竞争进入“中场战事”的关键时刻,MiniMax展现了一种区别于“大力出奇迹”的“飞轮生态”式发展路径。它在文本、视频、语音等多个战线深耕技术,并将模型能力注入自研应用,通过已跑通的商业闭环反哺模型迭代,以商业成功对冲技术路线不确定性,步步为营,为AI竞赛下半场提供了一种务实的“中国解法”。

原创 Z Potentials 2025-10-30 10:31 北京

M2开源即登顶,全模态破壁,MiniMax亮出AI竞赛的“中国解法”

01AI竞赛中的中场战事焦虑?

2025年10月的最后一周,面对市场关于其冲刺“大模型第一股”的传闻,总部位于上海的AI公司MiniMax稀宇极智,选择用一场纯粹的技术发布来回应外界的关注。

其新一代自研开源文本大模型M2,在权威的Artificial Analysis榜单上登顶全球开源模型第一,综合能力在智能体(Agent)和代码(Coding)等关键维度上,逼近了GPT-5等顶尖闭源模型。同时,一个值得注意的细节是,其原创算法CISPO被AI巨头Meta在其最新论文中公开致敬。

这一系列事件,发生在全球AI竞争进入“中场战事”的关键节点。自GPT-4o发布以来,“多模态”与“智能体”已成为行业共识。当用户期待AI从“对话”升级为“执行”,技术愿景的宏大与商业化落地的焦虑形成了鲜明对比。

MiniMax的此次亮相,不仅是技术实力的展示,更是其长期战略的一次集中兑现。它以一种独特的节奏,与海外大厂同周期实现了技术突破,却以一条更聚焦于“成本-效率”的路径,为行业竞争范式带来了新的变量。

02 不务正业的AI创业公司?

曾几何时,MiniMax被质疑“大模型自研公司搞多模态是不务正业”,“文本模型没有视频好”、“战线太分散什么都做”;时隔四月,MiniMax用新一轮全模态技术发布,给出了自己的答案——一切回归技术本身。

此次系列发布的重头戏,是新一代开源文本大模型M2。它的实力不仅体现在榜单排名,更体现在扎实的底层能力和来自同行的认可。上线3天,便在知名AI聚合平台OpenRouter就快速攀升到全球调用量第7名与编程场景第3名。

就在M2发布前夕,Meta在其重磅论文中,详细阐述并验证了来自MiniMax的一项原创强化学习算法——CISPOMeta在其研究中采纳了该算法,并指出其在提升多轮对话逻辑性方面展现了良好的效率和结果。

图源:《The Art of Scaling Reinforcement Learning Compute for LLMs

这份来自顶尖同行的认可,也让M2在权威评测机构Artificial Analysis (AA)榜单上的表现显得顺理成章:总分冲入全球前五,在所有开源模型中位列第一,综合表现超越GoogleGemini 2.5 ProAnthropicClaude 4.1,直逼Claude 4.5 Sonnet

而榜单之下,更能体现M2“肌肉”的是其在多个垂直专业基准测试中的统治级表现,这些测试的结果与开发者在终端、IDE和CI/CD中的日常体验高度相关:

首先,M2展现了强大的端到端开发能力,它不仅在处理多代码文件、执行完整的“编码-运行-调试”循环上表现出色,更是在Terminal-Bench和SWE-Bench等高难度基准测试中名列前茅。这标志着它已具备真正深入开发者工作流的实用价值。

伴随M2发布的,是其颠覆性的价格:单位成本不到同级竞品Claude 4.5的8%,并面向全球限时免费,“直到服务器扛不住为止”。这不再是简单的价格战,而是一场旨在瓦解“算力税”、推动AI普惠的战略举措。

03  模仿者 or 开拓者?

在M2吸引了全球目光的同时,MiniMax的多模态模型迅速展开了协同出击,视频、语音不同战线,全力推动AI走向“生产力工具”。新发布的Hailuo 2.3视频模型,并同步推出 Fast 版本,为B端工业级应用降本50%,精准打击了AI视频“叫好不叫座”的商业软肋。同时,革命性的Media Agent交互范式,将AI从“黑盒生成器”变为“创作伙伴”,展示了其对下一代内容创作工作流的深刻思考。

在语音模型上,Speech 2.6模型打通了Voice Agent场景下的高延迟痛点,以250ms首包延迟的极致性能,彻底解决了语音交互的“卡顿感”,并凭借自动文本规整、高鲁棒性复刻等“像素级”打磨,赢得了LiveKit、Pipecat、Vapi等海内外顶级客户的订单。

10月的这一系列密集发布、配合默契,全面展示了MiniMax作为一家全栈自研、多模态公司的体系化实力。就在这个月初,Sora2的发布和快速走红,让全球用户再次看到多模态的席卷之势;而在此之前,上一个出圈的还是Google Veo3模型的音视频融合及OpenAI GPT-4o模型的宫崎骏画风。

可以看到,多模态融合已经成为大模型发展的全球趋势,而MiniMax这场三线并进的预演,清晰地展示了MiniMax的体系化作战能力和务实路径,市场由此意识到,一场更大的战役正在酝酿。

在中美AI竞赛的宏大背景下,通往AGI的路径出现了分野:一种是“大力出奇迹”式的,倾力吞卡上规模全力构建一个大一统的底层模型,理论优雅,但成本高昂且商业化缓慢。

而MiniMax展示的,是另一种“飞轮生态”式的路径。它务实地在文本、视频、语音等各条战线上深耕技术,并将最前沿的模型能力注入自研应用,用已经跑通的商业闭环去反哺、验证模型的迭代方向。它的打法,是在抵达AGI的终局之前,先确保赢得中场战事,用商业上的成功去对冲技术路线的不确定性,步步为营。这种打法,或许正是AI竞赛下半场的一种“中国解法”。至于能否成功,我们拭目以待。

References:

• The Art of Scaling Reinforcement Learning Compute for LLMs》 https://arxiv.org/pdf/2510.13786

• https://www.minimax.io/news/minimax-m2

-----------END-----------

🚀 我们正在招募新一期的实习生

🚀 我们正在寻找有创造力的00后创业

关于Z Potentials

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniMax M2 开源大模型 全模态 AI技术 中国AI Open Source LLM Multimodal AI AI Innovation China AI
相关文章