原创 鱼丸 2025-10-30 17:17 北京
性能、速度和低价,全都要
作者|鱼丸
编辑|星奈
媒体|AI大模型工场
如今,大模型领域的竞争重心,正在从“参数比拼”转向“落地效率的”较量尤其是在Agent和代码生成这两个实际应用最密集的场景中,模型的智能平成本的效率以及响应速度,正在成为衡量产品力的新三角。
在行业探索如何平衡这三者时,MiniMax给出了一种新的答案——MiniMax M2。
这款新近开源的模型,被官方定位为“专为Agent与代码而生”,在技术路和性能取舍上都颇具实验色彩:它采用激活参数100亿、总参数2300亿的MoE混合专家架构,目标是在不牺牲智能表现的前提下压缩推理成本。
据官方表示,MiniMax M2以Claude Sonnet 4.5约8%的价格,达到了近2倍的响应速度,成为近期开源模型里少有能在“效果—价格—速度”三者之间同时做到平衡的选手。
那它在真实使用体验中表现如何?我们用几个案例感受下:
一句话,“秒”级响应
如下所示,这是一款非常简单的竞速小游戏,有种小时候玩4399双人竞速第一关的感觉,但是我要不说,谁知道这是自己制作的呢。
那有些人可能就要问,这要敲多少代码啊,虽然简单,但是双人操作还需要跳过障碍,也得需要一些时间吧。
我的回答是,十秒。
“做一个双人糖豆人的小游戏”,敲12个字的时间。
没错,这是用最近开源的一款大模型MiniMax M2制作的,当然不算MiniMax M2制作等待的时间,简单的指令说出需求,它就可以帮你完成。
那这指令要多简单呢,一句话就够了,就像MiniMax说的那样,简单指令,无限可能。
其实在体验过程中就明显的感觉到,MiniMax M2和人的沟通交互上自然顺畅的程度就比市面上很多Agent顺滑很多,甚至可以把它当作电脑另一端的同事。
下面让M2做一个介绍《剑来》的PPT,风格要求水墨古风。
从发布这个要求开始,MiniMax M2就立马开始思考,并且在思考旁边还标明了思考时间,以为2秒多已经很快了,结果还精确到了零点几秒的反应速度。
在执行过程中,会询问有没有别的需求,可以进行选择。
右边的视窗可以完整i清晰的看到执行过程。
甚至还有更新待办提醒,把已完成的划掉,这和平时使用记事本的真人有什么区别呢。
有问题还可以自行检查修复。
最后来看看效果:
从整体的概述到海报到人物介绍再到书中的高光到最后设计,并且下方可以点击左右来控制,这个效率和质量完全可以在工作中节约不少时间,还能交一份满意的答卷。
再来看看多模态能力,上传一张房屋毛坯图,给这个毛坯房屋图生成复古风格装饰的渲染。
MiniMax M2给出了四个复古风格。
中古风:
工业复古风格:
法式复古Art Deco风格:
地中海复古风:
还给出了风格对比,真别说,风格的理解和定位确实非常准确,MiniMax M2直接做到心坎上了。
我们再输入“制作一个5页的童话故事绘本,主题是小蝌蚪找妈妈”。
甚至可以让它帮忙收集资讯。
“收集24小时之内的AI动态,并且总结出来,以快讯的形式”
MiniMax M2背后的底层逻辑
在这次的测评中首先给人最直观的感受是“秒出”。这种“响应即结果”的体验,背后是MiniMax M2在架构上的一系列创新。
MiniMax M2 采用MoE混合专家结构,在推理时仅激活约 100 亿参数,显著降低了算力消耗,同时保留 2300 亿参数的知识容量。这种“动态激活”机制让它在保持高智能表现的同时,实现了高效能+低延迟+低成本的三重平衡。
同时,MiniMax M2支持长达200k的输入上下文和128k的输出长度,能够处理长文本和复杂任务,满足多步骤推理、深度搜索等需求。
在全球测评机构 Artificial Analysis 的榜单中,MiniMax M2在数学、科学、指令遵循、编码和工具使用等维度,超越Google的Gemini 2.5 Pro、Anthropic的Claude 4.1等模型跻身前五。
并且在Agent最重要的三个能力,编程、使用工具和深度搜索的能力上,M2的成绩也名列前茅。
价格层面上,MiniMax M2 的商业定价仅为 Claude Sonnet 4.5 的约 8%,输入 2.1 元 / 百万 Token,输出 8.4 元 / 百万 Token,推理吞吐量可达 100 TPS。性价比已经进入全球头部梯队。
总体来看,MiniMax M2 不只是一次性能上的升级,更代表着国内大模型从“对话体”向“执行体”过渡的一个信号。以M2目前的速度、能力和价格来看,它的确“让每个人都拥有充裕的智能(Intelligence with Everyone)”,变得更近了一点。
现在MiniMax-M2的通用Agent产品MiniMax Agent现已全面开放使用(网址:https://agent.minimaxi.com/),并限时免费,大家感兴趣的话可以去跑跑体验下。
