量子位 09月12日
阿里发布1万亿参数模型Qwen3-Max-Preview,能力显著增强
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里发布1万亿参数模型Qwen3-Max-Preview,在中英文理解、复杂指令遵循、工具调用等维度实现显著增强,大幅减少知识幻觉。该模型通过通义APP、Qwen Chat网页和阿里云API全面上线,实测显示其在解答难题和编程方面能力更强,尤其编程方面所有尝试一次成功。Qwen3-Max-Preview的发布标志着阿里在大型语言模型领域取得重要进展,其后续发展值得关注。

🔍 Qwen3-Max-Preview是阿里发布的一款1万亿参数的大型语言模型,在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强,并大幅减少了知识幻觉,使其更加智能和可靠。

📈 官方测评和网友反馈显示,Qwen3-Max-Preview不仅比阿里前一代最强模型Qwen3(235B)更强,还打败了包括Claude Opus 4在内的国内外其他劲敌,受到国内外热烈反响。

💻 实测结果显示,Qwen3-Max-Preview在编程方面表现出色,能够轻松完成各种编程任务,例如解答AIME数学竞赛题、创建可交互动画、生成扫雷游戏代码以及制作前端网页等,且所有尝试都一次成功。

🌐 Qwen3-Max-Preview通过通义APP、Qwen Chat网页和阿里云API全面上线,用户可以通过这些平台体验其强大的功能。

🚀 Qwen3-Max-Preview的发布标志着阿里在大型语言模型领域取得重要进展,其后续发展值得关注,预计将会推出更多功能和版本。

关注前沿科技 2025-09-06 11:45 北京

通义APP、Qwen Chat网页等均已全面上线

一水 发自 凹非寺量子位 | 公众号 QbitAI总参数达到1万亿,阿里迄今为止最大的模型来了!

没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)

1万亿啥概念?几乎一下子就比前一代Qwen3(235B)多了四倍之多,相当于给大学生换了个爱因斯坦的脑子(bushi~

根据官方介绍,其最大亮点如下:

相较于2.5系列,新版本在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强,同时大幅减少了知识幻觉,让模型更智能、更可靠。

而且发布即全面上线,目前可通过通义APP、 Qwen Chat网页和阿里云API体验。

更多官方测评显示,Qwen3-Max-Preview一登场不仅比自家前一代最强模型Qwen3(235B)更强,而且还打败了包括Claude Opus 4在内的国内外劲敌。

国内外反响更是一片热烈,随之而来的还有一大波测评:

1万亿!模型规模真是越来越扩张了,迫不及待想要尝试。

Qwen再次令人惊叹!

so,模型真实效果如何?不妨简单实测一下见真章。

支持多模态,编程已无需抽卡综合官方测评和网友反馈,接下来我们主要考查Qwen3-Max-Preview解答难题和动手编程的能力。

需要提醒一下,阿里从Qwen3(235B)开始就不再使用混合思维模式,所以这次的Instruct版本仅支持非思考模式

使用Qwen Chat网页,一上来就给它扔一道AIME数学竞赛题试试:

(AIME:美国数学邀请赛,是介于AMC10、AMC12及美国数学奥林匹克竞赛之间的一个数学竞赛。)

由于Qwen3-Max-Preview支持多模态,这里我们可以直接上传图片。

几乎转眼间,模型就唰唰唰地给出了详细作答过程及结果,最终答案“204”也与AIME这道题的标准答案一致。

小试牛刀过后,接下来进入编程环节。

用p5js创建多彩的可交互动画。

速度同样很快,Qwen3-Max-Preview几乎立即给出了一段完整代码,而且代码能够成功运行。

鼠标点到哪里,哪里就会产生交互效果:

生成一个扫雷游戏。

一句话制作扫雷这种经典小游戏也是轻轻松松,而且是一次成功,无需反复沟通和抽卡。

代码成功运行后,我们也简单试玩了一下,只是很快就“踩雷”了(doge):

最后来试试制作前端网页,不妨就让它来个自我介绍:

帮我制作一个介绍Qwen3-Max-Preview的可交互网站。

网站代码生成后,既可以保存成文件直接打开,还能在问答末尾点击“预览”一键查看效果。

预览效果如下,网站设计简洁直观,也具有初级交互效果:

当然,如果你更懂提示词,效果也会更好,某网友为Qwen3-Max-Preview制作的庆祝网页效果就还不错。

顺带一提,不知道Qwen3-Max-Preview的代码生成速度能不能赶上之前开源的Qwen3-Coder,大家可以感受一下后者的速度:

以>107个token/秒的速度生成4467个token。

以上实测不难看出新模型确实能力更强了,尤其在编程方面,所有尝试都是一次成功。

此外,阿里云百炼平台还透露了模型的API价格——当前版本根据输入Token数,采取阶梯计费。

原生支持的上下文长度及最大输入/输出如下:

虽然目前官方并未正式宣布开源这款模型,但Qwen身为开源阵营的重要一员,其后续仍然值得期待。

One More Thing就在Qwen3-Max-Preview基础版发布后,通义千问开源负责人林俊旸还在朋友圈透露其正式版很快到来

而且还表达了自己对这款模型的感受:

确实是我们搞过的最有趣的模型,(虽然)配方上没有大改,但比之前的235B版本明显好了不少。

这也让他对继续扩展模型规模充满信心。

另外,关于正式版人们现在也有了更多推测。

按照官方之前的节奏,预计大概率后面还有一个推理版本,而且或许就在几天之后。(Qwen3-235B推理非推理中间仅隔了4天)

最后,你体验这款新模型了吗?欢迎回评论区分享一波~

立即体验:Qwen Chat:https://chat.qwen.ai阿里云百炼API服务:https://bailian.console.aliyun.com/?tab=model#/model-market

参考链接:[1]https://x.com/alibaba_qwen/status/1963991502440562976?s=46&t=R82LqSqpRZuVhcZxqH_Vlw[2]https://x.com/ali_tongyilab/status/1963979028890546222?s=46&t=R82LqSqpRZuVhcZxqH_Vlw[3]https://x.com/vectro/status/1964080871759139322?s=46&t=R82LqSqpRZuVhcZxqH_Vlw[4]https://mp.weixin.qq.com/s/LU0mgpQ6EvjlczTCaHM0sA

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

专属AI产品从业者的实名社群,只聊AI产品最落地的真问题  扫码添加小助手,发送「姓名+公司+职位」申请入群~

进群后,你将直接获得:

 👉 最新最专业的AI产品信息及分析 🔍 

 👉 不定期发放的热门产品内测码 🔥

 👉 内部专属内容与专业讨论 👂

🌟 点亮星标 🌟

科技前沿进展每日见

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Qwen3-Max-Preview 阿里 大型语言模型 人工智能 编程 通义APP Qwen Chat
相关文章