AI大模型工场 10月31日 00:38
MiniMax M2:兼顾性能、速度与成本的Agent新选择
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章介绍了MiniMax新开源的大模型M2,该模型专为Agent和代码生成场景设计,采用MoE混合专家架构,在保持高智能表现的同时,显著降低了推理成本和响应时间。通过实际案例展示,M2在制作游戏、生成PPT、图像渲染和内容总结等方面表现出色,交互自然流畅,响应速度极快。其商业定价仅为Claude Sonnet 4.5的约8%,推理吞吐量高达100 TPS,在“效果—价格—速度”三者之间实现了有效平衡,被视为大模型从“对话体”向“执行体”过渡的信号。

🚀 **MiniMax M2的创新架构与定位:** 该模型采用激活参数100亿、总参数2300亿的MoE混合专家架构,专为Agent和代码生成场景优化,旨在不牺牲智能表现的前提下大幅压缩推理成本,实现性能、速度和低价的兼顾,成为行业探索平衡三者的“新答案”。

⏱️ **“秒级”响应与高效执行力:** 通过竞速小游戏制作、《剑来》PPT生成等案例,展示了M2极快的响应速度和强大的执行能力。指令输入简单(如“做一个双人糖豆人的小游戏”),M2能在短时间内完成复杂任务,并能进行自主思考、检查修复,交互体验媲美真人同事。

🎨 **卓越的多模态与内容生成能力:** M2不仅在文本和代码生成上表现突出,其多模态能力也令人印象深刻。例如,上传毛坯房图可生成多种风格的复古装饰渲染图,并进行风格对比。此外,它还能高效地根据指令制作绘本、收集并总结AI动态,展现出强大的内容创作和信息处理能力。

💰 **极具竞争力的成本效益:** M2的商业定价仅为Claude Sonnet 4.5的约8%,输入和输出的Token价格均极具优势,推理吞吐量高达100 TPS。在全球测评机构Artificial Analysis的榜单中,M2在多个维度上表现优异,尤其在Agent关键能力上名列前茅,提供了极高的性价比。

🌟 **从“对话体”到“执行体”的转变信号:** MiniMax M2的出现,标志着国内大模型正从侧重于对话交互向更侧重于实际任务执行的“执行体”方向发展,其在速度、能力和价格上的综合优势,让“让每个人都拥有充裕的智能”的愿景更加触手可及。

原创 鱼丸 2025-10-30 17:17 北京

性能、速度和低价,全都要

作者|鱼丸

编辑|星奈

媒体|AI大模型工场

如今,大模型领域的竞争重心,正在从“参数比拼”转向“落地效率的”较量尤其是在Agent和代码生成这两个实际应用最密集的场景中,模型的智能平成本的效率以及响应速度,正在成为衡量产品力的新三角。

在行业探索如何平衡这三者时,MiniMax给出了一种新的答案——MiniMax M2

这款新近开源的模型,被官方定位为“专为Agent与代码而生”,在技术路和性能取舍上都颇具实验色彩:它采用激活参数100亿、总参数2300亿的MoE混合专家架构,目标是在不牺牲智能表现的前提下压缩推理成本

据官方表示,MiniMax M2以Claude Sonnet 4.5约8%的价格,达到了近2倍的响应速度,成为近期开源模型里少有能在“效果—价格—速度”三者之间同时做到平衡的选手。

那它在真实使用体验中表现如何?我们用几个案例感受下:

一句话,“秒”级响应

如下所示,这是一款非常简单的竞速小游戏,有种小时候玩4399双人竞速第一关的感觉,但是我要不说,谁知道这是自己制作的呢。

那有些人可能就要问,这要敲多少代码啊,虽然简单,但是双人操作还需要跳过障碍,也得需要一些时间吧。

我的回答是,十秒。

“做一个双人糖豆人的小游戏”,敲12个字的时间。

没错,这是用最近开源的一款大模型MiniMax M2制作的,当然不算MiniMax M2制作等待的时间,简单的指令说出需求,它就可以帮你完成。

那这指令要多简单呢,一句话就够了,就像MiniMax说的那样,简单指令,无限可能。

其实在体验过程中就明显的感觉到,MiniMax M2和人的沟通交互上自然顺畅的程度就比市面上很多Agent顺滑很多,甚至可以把它当作电脑另一端的同事。

下面让M2做一个介绍《剑来》的PPT,风格要求水墨古风。

从发布这个要求开始,MiniMax M2就立马开始思考,并且在思考旁边还标明了思考时间,以为2秒多已经很快了,结果还精确到了零点几秒的反应速度。

在执行过程中,会询问有没有别的需求,可以进行选择。

右边的视窗可以完整i清晰的看到执行过程。

甚至还有更新待办提醒,把已完成的划掉,这和平时使用记事本的真人有什么区别呢。

有问题还可以自行检查修复。

最后来看看效果:

从整体的概述到海报到人物介绍再到书中的高光到最后设计,并且下方可以点击左右来控制,这个效率和质量完全可以在工作中节约不少时间,还能交一份满意的答卷。

再来看看多模态能力,上传一张房屋毛坯图,给这个毛坯房屋图生成复古风格装饰的渲染。

MiniMax M2给出了四个复古风格。

中古风:

工业复古风格:

法式复古Art Deco风格:

地中海复古风:

还给出了风格对比,真别说,风格的理解和定位确实非常准确,MiniMax M2直接做到心坎上了。

我们再输入“制作一个5页的童话故事绘本,主题是小蝌蚪找妈妈”。

甚至可以让它帮忙收集资讯。

“收集24小时之内的AI动态,并且总结出来,以快讯的形式”

MiniMax M2背后的底层逻辑

在这次的测评中首先给人最直观的感受是“秒出”。这种“响应即结果”的体验,背后是MiniMax M2在架构上的一系列创新。

MiniMax M2 采用MoE混合专家结构,在推理时仅激活约 100 亿参数,显著降低了算力消耗,同时保留 2300 亿参数的知识容量。这种“动态激活”机制让它在保持高智能表现的同时,实现了高效能+低延迟+低成本的三重平衡。

同时,MiniMax M2支持长达200k的输入上下文和128k的输出长度,能够处理长文本和复杂任务,满足多步骤推理、深度搜索等需求。

在全球测评机构 Artificial Analysis 的榜单中,MiniMax M2在数学、科学、指令遵循、编码和工具使用等维度,超越Google的Gemini 2.5 Pro、Anthropic的Claude 4.1等模型跻身前五。

并且在Agent最重要的三个能力,编程、使用工具和深度搜索的能力上,M2的成绩也名列前茅。

价格层面上,MiniMax M2 的商业定价仅为 Claude Sonnet 4.5 的约 8%,输入 2.1 元 / 百万 Token,输出 8.4 元 / 百万 Token,推理吞吐量可达 100 TPS。性价比已经进入全球头部梯队。

总体来看,MiniMax M2 不只是一次性能上的升级,更代表着国内大模型从“对话体”向“执行体”过渡的一个信号。以M2目前的速度、能力和价格来看,它的确“让每个人都拥有充裕的智能(Intelligence with Everyone)”,变得更近了一点。

现在MiniMax-M2的通用Agent产品MiniMax Agent现已全面开放使用(网址:https://agent.minimaxi.com/),并限时免费,大家感兴趣的话可以去跑跑体验下。

AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」,覆盖超1000位AIGC圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信fqq2000nian,注明真实身份。

数据支持天眼查,大模型独家合作账号

— END —

监制 / 刘老师

编辑 / AIGCCCCC

视觉 / 大模型

微博 / @AI大模型工场

TG/AI  Marketing Field

 

大模型应用创业者,你怎么看

■ 百度文心一言 阿里通义千问 ▍通用大模型案例

■ 科大讯飞星火 京东 ▍产业大模型案例

■ 商汤日日新,腾讯,昆仑万维 ▍ 金融大模型案例

■ 盘古大模型,中国电信,医联 ▍医疗大模型案例

■阅文大模型,腾讯音乐大模型 ▍文娱大模型案例

■知乎,360大模型,火山引擎 ▍ 教育大模型案例

■  网易,金山办公大模型 ▍更多行业大模型案例

上次介绍Zen7 Labs 开源全球首个去中心化支付智能体(DePA),打造下一代AI Agent 金融基础设施

本文由大模型领域垂直媒体「AI大模型工场」

原创出品,未经许可,请勿转载。

/

欢迎提供新的大模型商业化落地思路

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniMax M2 大模型 Agent 代码生成 MoE AI MiniMax
相关文章