Grok 4 Fast上线，多模态融合，性价比SOTA

智源社区 09月22日

Grok 4 Fast上线，多模态融合，性价比SOTA

xAI公司发布了Grok 4 Fast，一款集推理与非推理模式于一体的创新大模型。该模型支持高达200万的上下文窗口，并在数学和编码等任务上展现出卓越性能，显著优于前代Grok 3 Mini。在扩展版NYT Connections Benchmark测试中，Grok 4 Fast Reasoning位居榜首，超越了包括GPT-5、Gemini 2.5 Pro在内的多款领先模型。Grok 4 Fast还具备行业领先的性价比，成本仅为Gemini 2.5 Pro的约25分之一，同时在网页和X平台搜索能力、工具调用方面表现出色，为开发者提供了更快速、更经济的AI解决方案。

🚀 **Grok 4 Fast重磅发布，引领大模型新纪元：** xAI公司推出的Grok 4 Fast是一款革命性的AI模型，它首次实现了推理（reasoning）与非推理（non-reasoning）“双模式”的融合，并支持高达200万token的超长上下文。这一创新架构使得Grok 4 Fast在处理复杂任务时更加高效和灵活，能够理解和生成更长、更连贯的内容，从而在各种应用场景下带来前所未有的体验。

🏆 **性能卓越，多项基准测试登顶：** Grok 4 Fast在多项关键性能测试中表现突出。在扩展版NYT Connections Benchmark（纽约时报连线谜题基准测试）中，Grok 4 Fast Reasoning以绝对优势碾压众多顶尖模型，包括自家大哥Grok 4，以及GPT-5、Gemini 2.5 Pro等。尤其在数学和编码能力方面，Grok 4 Fast取得了显著提升，显示出其在逻辑推理和代码生成方面的强大实力。

💰 **极致性价比，成本效益显著：** Grok 4 Fast在成本效益方面展现了惊人的优势。其推理性能媲美Gemini 2.5 Pro，但成本仅为其约25分之一。通过大规模RL技术优化，Grok 4 Fast平均节省了40%的推理token消耗，推理成本直降98%。此外，其API输入输出价格极具竞争力，并且输出速度惊人，端到端时延仅3.8秒，是目前最快的前沿模型之一，极大地降低了获取先进AI智能的门槛。

🌐 **智能工具调用，实时信息增强：** Grok 4 Fast在工具调用方面表现出色，能够智能判断何时调用代码执行、网页浏览或X平台搜索等工具。它能够像人类一样流畅地浏览网页和X平台，解析图文视频内容，并利用实时数据增强查询结果，快速整合信息并得出结论。这一能力使其在信息检索和内容生成方面更具实用性和时效性，完胜前代模型Grok 4在工具调用和深度研究方面的表现。

编辑：犀牛

一图看透全球大模型！新智元十周年钜献，2025 ASI前沿趋势报告37页首发

Grok 4 Fast官宣上线，马斯克再次兑现了承诺！

它首次将推理/非推理「双模式」合一，支持200万上下文，直接刷爆性价比SOTA。

推理测试中，Grok 4 Fast直接碾压前代Grok 3 Mini，尤其是数学、编码性能大增。

基准测试显示，Grok 4 Fast Reasoning登顶了扩展版NYT Connections Benchmark（纽约时报连线谜题基准测试，共759道题）。

Grok 4则排名第2，xAI在这个项目上展现了绝对的统治力。

对此，马斯克自豪地表示，这就是进展！

Grok 4 Fast Reasoning不仅击败了自家大哥Grok 4，也将GPT-5、o3-pro、Gemini 2.5 Pro、DeepSeek和Qwen 3等一众模型斩于马下。

Grok 4发布之后，基本上xAI一月一迭代，速度堪称惊人。

25/1成本，堪比Gemini 2.5 Pro

技术博客中，介绍了Grok 4 Fast所具备的四大核心优势：

行业SOTA级性价比

最强网页与X平台搜索能力

支持200万token的超长上下文

创新统一架构：单模型融合推理与非推理双模式

基于大规模RL技术，xAI团队将Grok 4 Fast智能密度推向了极致。

实测表明，新模型性能直逼Grok 4，但平均节省了40%推理token的消耗，成本直降98%。

Grok 4 Fast不仅在NYT Connections Benchmark上表现出色，在著名的Artificial Analysis Intelligence Index（AA智能指数）上同样表现不俗。

它以大约25分之一的成本就实现了Gemini 2.5 Pro级别的智能！

Grok 4 Fast是一个将reasoning和non-reasoning融合统一的模型。

在推理模式下，Grok 4 Fast Reasoning在AA智能指数上取得了60分的亮眼成绩，与Gemini 2.5 Pro和Claude 4.1 Opus相当。

低于此前发布的Grok 4和GPT-5（high）。

在编码评测中，Grok 4 Fast表现尤为出色，在他们的LiveCodeBench榜单上登顶第一，甚至超越其体量更大的自家大哥Grok 4。

成本方面Grok 4 Fast也挺有优势：输入0.2美元每百万Tokens，输出0.5美元每百万Tokens。而且输出效率很高。

Artificial Analysis在对Grok 4 Fast的预发布API进行基准测试时，发现它的速度惊人非常迅速，达到了每秒344个输出Token——约为 OpenAI GPT-5 API的2.5倍。端到端时延仅3.8秒，是目前最快的前沿模型。

Grok 4 Fast的发布延续了这个趋势：获取AI智能的成本正在快速下降。

在过去一年半里，获取GPT-4级别智能的成本已下降约500倍；而且随着智能前沿不断被推进，获取成本仍在持续走低。

原生工具调用

通过端到端工具使用RL训练，Grok 4 Fast特别擅长智能判断，何时调用代码执行、网页浏览等工具。

举个栗子，在搜索时，它可以像人类一样流畅地浏览网页和X平台，并用实时数据增强查询结果——

自动跳转链接、解析X上图文视频内容，并以闪电速度整合信息得出结论。

可以看出，Grok 4 Fast基准测试中，工具调用、深度研究等能力上完胜Grok 4。

现在，通过API即可调用推理/非推理Grok 4 Fast，每100万token价格再创新低。

什么是NYT Connections Benchmark？

NYT Connections Benchmark（纽约时报连线谜题基准测试）的核心源于《纽约时报》推出的益智游戏「Connections」，后被转化为评估大语言模型「语义关联与分类推理能力」的重要基准。

地址：https://github.com/lechmazur/nyt-connections/

其核心逻辑与原始游戏一致：给定16个看似无关联的词语，AI需从语义、逻辑或常识维度，将它们精准划分成4组（每组4个词），且每组需符合一个明确的「潜在关联主题」（例如不同类型的水果、计算机硬件部件、经典文学角色等）。

而此次Grok 4 Fast参加的「扩展版」在基础规则上进一步提升难度——每个谜题额外增加多达4个「技巧词」（即易混淆、可能同时贴合多个主题的干扰词），更考验AI排除干扰、精准捕捉深层语义关联的能力。

举两个栗子。大家感受一下难度。

在扩展版上模型的排名如下图，xAI一家占据前两名。

为排除LLM的训练数据中包含答案的可能性，基准方还仅对最新增加的100道谜题进行了测试。

结果依然是xAI家的Grok 4、Grok 4 Fast Reasoning排名前两位，只不过这次大哥终于排第一了。

看来Grok 4 Fast Reasoning在智能上确实有两下子，结合其速度快、价格低的优势，很有可能成为开发者的新宠。

参考资料：

https://x.com/Prashant_1722/status/1969352801290436855

https://github.com/lechmazur/nyt-connections/

https://x.com/mark_k/status/1969423645463150990

https://x.ai/news/grok-4-fast

https://x.com/ArtificialAnlys/status/1969180023107305846

内容中包含的图片若涉及版权问题，请及时与我们联系删除

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Grok 4 Fast xAI 大模型 AI 推理上下文窗口性价比 NYT Connections Benchmark 工具调用 Grok 4 Fast xAI Large Language Models AI Reasoning Context Window Cost-Effectiveness NYT Connections Benchmark Tool Invocation

相关文章

【iThome 2024 CIO大調查系列 1｜CIO年度目標】CIO更重視開創型IT戰略，AI創新優先度今年驟增

How popular is ChatGPT? Part 1: more popular than Taylor Swift

Weka Makes Life Simpler for Developers, Engineers, and Architects

回顾我的 prompt 能力从小白到熟练的一些重要节点：防杠叠甲： 1. 仅代表我自己的认知，没啥权威性。 2. 认为提示词那么简单至于搞那么复杂么的朋友，你对 3. ...

✨ 人人都能用好AI，这款GPTs 助你定制高效工作流：Prompt for me 作为一个AI布道者，Hans 在即刻写下数百篇新产品介绍、模型研究和心得，却仍感受到不同领域和...

Redundancy in AI: A Hybrid Convolutional Neural Networks CNN Approach to Minimize Computational Overhead in Reliable Execution

OpenAI计划下周宣布ChatGPT和GPT-4更新，但不会推出GPT-5和搜索引擎

Intersect360 Research Takes a Deep Dive into the HPC-AI Market in New Report

SAP大中华区总裁黄陈宏：SAP不做大模型

Is the Future of Retail AI in the Hands of CTOs?