xAI上周五(9/19)發表了Grok 4 Fast,這是款延伸自Grok 4的新模型,首度採用了統一架構,可於快速回應及長鏈推理之間自由調整,而且支援200萬個Token的脈絡長度。Grok 4 Fast標榜效能接近Grok 4,但成本降低98%。
今年5月推出、延伸自Grok 3的輕量版模型Grok 3 Mini只支援12.8萬個Token的脈絡長度,而今年7月發表的旗艦型模型Grok 4亦支援200萬個Token的脈絡長度。
在衡量跨學科研究所等級問題的GPQA基準測試中,Grok 3 Mini的分數為79%,Grok 4 Fast為85.7%,Grok 4為87.5%;在衡量基於高中數學競賽的AIME基準測試中,Grok 3 Mini的得分為83%,Grok 4 Fast為92%,Grok 4為91.7%。
xAI表示,過去推理模式(長鏈思考)與非推理模式(快速回應)通常需要不同模型,但Grok 4 Fast採用了統一架構,讓同一組模型參數同時處理兩種需求,並能透過系統提示來調整模型行為,降低端對端的延遲,也會減少Token的使用。
由於xAI使用大規模的強化學習以最大化Grok 4 Fast的智慧密度,而讓該模型在基準測試中實現了與Grok 4相當的性能,但平均使用的Token數量少了40%,此外,Grok 4 Fast每百萬個輸入/輸出Token的費用為0.2/0.5美元,Grok 4則是3/15美元,而讓xAI宣稱使用Grok 4 Fast的成本比Grok 4減少了98%。
一般使用者可以透過Grok首頁及行動程式存取Grok 4 Fast,且現已開放免費用戶使用;開發者則可經由xAI API、第三方平臺OpenRouter或是Vercel AI Gateway存取該模型的推理端點或快速端點。
