IT之家 09月20日
xAI推出Grok 4 Fast:AI推理效率与成本双优化
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

xAI公司近期发布了全新AI模型Grok 4 Fast,旨在企业和消费级任务中提供接近Grok 4的推理性能,同时显著降低成本。该模型平均可减少40%的推理tokens,价格降低高达98%。在各项性能测试中,Grok 4 Fast在数学推理、搜索及信息获取方面表现出色,尤其在多跳搜索能力上居于领先地位。其创新之处在于将长链推理与快速响应模式整合至同一模型,并通过系统提示动态切换,有效降低了延迟和Token成本,适用于多种实时场景。Grok 4 Fast已对所有用户开放,并在特定平台提供限时免费使用。

🚀 **高效推理性能与成本优化**:Grok 4 Fast 在企业和消费级任务中实现了接近 Grok 4 的推理表现,并平均减少了 40% 的推理 tokens,价格降低了 98%,显著提升了AI模型的成本效益。

🧠 **卓越的数学与搜索能力**:在 AIME 2025 无工具测试中,Grok 4 Fast 正确率高达 92.0%,超越 Grok 3 Mini。其多跳搜索能力在 LMArena 搜索竞技场中排名第一,展现了强大的信息整合和获取能力。

💡 **创新架构与灵活应用**:Grok 4 Fast 首次将长链推理与快速响应模式统一到同一模型中,并可通过系统提示动态切换,有效减少延迟,降低 Token 成本,适用于实时搜索、代码执行等多种场景,开发者可按需调整推理深度。

🌐 **广泛的可用性与早期优惠**:Grok 4 Fast 目前已对所有用户(包括免费用户)开放,并在 OpenRouter 和 Vercel AI Gateway 上限时免费提供,降低了用户体验新技术的门槛。

IT之家 9 月 20 日消息,埃隆・马斯克(Elon Musk)旗下 xAI 公司今天(9 月 20 日)推出全新 AI 模型 Grok 4 Fast,在企业与消费级任务中实现接近 Grok 4 的推理表现,同时平均减少 40% 推理 tokens。

在性能测试中,Grok 4 Fast 的推理基准表现与 Grok 4 相当,但平均使用的推理 tokens 减少了 40%,价格降低 98%。

例如,在 AIME 2025 无工具测试中,其正确率达 92.0%,超越 Grok 3 Mini,并在 HMMT 2025 等数学推理任务中取得显著优势。

在搜索与信息获取能力上,Grok 4 Fast 展现出前沿的多跳搜索(multihop search)表现。在 LMArena 搜索竞技场中,grok-4-fast-search 以 1163 Elo 分数排名第一,领先第二名 17 分;在中文搜索、跨平台数据整合等任务中,其准确率明显高于同类模型。

在 LMArena 的 Text Arena 中,grok-4-fast (代号: tahoe )排名第 8 ,性能与 grok-4-0709 相当,凸显了其卓越的智能密度。值得注意的是,所有同等大小的模型都排在第 18 位或更靠后。

架构方面,Grok 4 Fast 首次将长链推理模式与快速响应模式统一到同一模型中,并通过系统提示动态切换。这不仅减少了延迟,也进一步降低了 Token 成本,适用于实时搜索、代码执行等多种场景。开发者可通过 xAI API 调整推理深度以匹配不同需求。

Grok 4 Fast 目前已对所有用户(包括免费用户)开放,并在 OpenRouter 和 Vercel AI Gateway 上限时免费提供。

在 API 调用方面,每 100 万 tokens 输入费用为 0.20 美元(IT之家注:现汇率约合 1.4 元人民币)起,每 100 万 tokens 输出费用为 0.50 美元(现汇率约合 3.6 元人民币)起。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

xAI Grok 4 Fast AI模型 推理性能 成本优化 多跳搜索 长链推理 快速响应 AI API
相关文章