xAI推出Grok 4 Fast：AI推理效率与成本双优化

IT之家 09月20日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

xAI公司近期发布了全新AI模型Grok 4 Fast，旨在企业和消费级任务中提供接近Grok 4的推理性能，同时显著降低成本。该模型平均可减少40%的推理tokens，价格降低高达98%。在各项性能测试中，Grok 4 Fast在数学推理、搜索及信息获取方面表现出色，尤其在多跳搜索能力上居于领先地位。其创新之处在于将长链推理与快速响应模式整合至同一模型，并通过系统提示动态切换，有效降低了延迟和Token成本，适用于多种实时场景。Grok 4 Fast已对所有用户开放，并在特定平台提供限时免费使用。

🚀 **高效推理性能与成本优化**：Grok 4 Fast 在企业和消费级任务中实现了接近 Grok 4 的推理表现，并平均减少了 40% 的推理 tokens，价格降低了 98%，显著提升了AI模型的成本效益。

🧠 **卓越的数学与搜索能力**：在 AIME 2025 无工具测试中，Grok 4 Fast 正确率高达 92.0%，超越 Grok 3 Mini。其多跳搜索能力在 LMArena 搜索竞技场中排名第一，展现了强大的信息整合和获取能力。

💡 **创新架构与灵活应用**：Grok 4 Fast 首次将长链推理与快速响应模式统一到同一模型中，并可通过系统提示动态切换，有效减少延迟，降低 Token 成本，适用于实时搜索、代码执行等多种场景，开发者可按需调整推理深度。

🌐 **广泛的可用性与早期优惠**：Grok 4 Fast 目前已对所有用户（包括免费用户）开放，并在 OpenRouter 和 Vercel AI Gateway 上限时免费提供，降低了用户体验新技术的门槛。

IT之家 9 月 20 日消息，埃隆・马斯克（Elon Musk）旗下 xAI 公司今天（9 月 20 日）推出全新 AI 模型 Grok 4 Fast，在企业与消费级任务中实现接近 Grok 4 的推理表现，同时平均减少 40% 推理 tokens。

在性能测试中，Grok 4 Fast 的推理基准表现与 Grok 4 相当，但平均使用的推理 tokens 减少了 40%，价格降低 98%。

例如，在 AIME 2025 无工具测试中，其正确率达 92.0%，超越 Grok 3 Mini，并在 HMMT 2025 等数学推理任务中取得显著优势。

在搜索与信息获取能力上，Grok 4 Fast 展现出前沿的多跳搜索（multihop search）表现。在 LMArena 搜索竞技场中，grok-4-fast-search 以 1163 Elo 分数排名第一，领先第二名 17 分；在中文搜索、跨平台数据整合等任务中，其准确率明显高于同类模型。

在 LMArena 的 Text Arena 中，grok-4-fast （代号： tahoe ）排名第 8 ，性能与 grok-4-0709 相当，凸显了其卓越的智能密度。值得注意的是，所有同等大小的模型都排在第 18 位或更靠后。

架构方面，Grok 4 Fast 首次将长链推理模式与快速响应模式统一到同一模型中，并通过系统提示动态切换。这不仅减少了延迟，也进一步降低了 Token 成本，适用于实时搜索、代码执行等多种场景。开发者可通过 xAI API 调整推理深度以匹配不同需求。

Grok 4 Fast 目前已对所有用户（包括免费用户）开放，并在 OpenRouter 和 Vercel AI Gateway 上限时免费提供。

在 API 调用方面，每 100 万 tokens 输入费用为 0.20 美元（IT之家注：现汇率约合 1.4 元人民币）起，每 100 万 tokens 输出费用为 0.50 美元（现汇率约合 3.6 元人民币）起。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签