Anthropic公布技術報告說明今年8月至9月初期間,3項基礎設施缺陷交疊,導致Claude的回應品質出現間歇性下降。官方強調這些問題並非因需求、伺服器負載或時段而調降模型水準,而是基礎設施部署與配置的缺陷所致。目前多數修復已完成,並同步推動更嚴格的品質檢測與監控機制。
事件起於8月5日,Sonnet 4部分請求被誤導向新一代100萬Token上下文長度伺服群,起初影響比例僅0.8%。但是在8月29日的負載平衡調整放大了流量分配,至8月31日時,受影響比例一度達16%。由於採用具黏著性的路由策略,一旦對話首次被分派至錯誤伺服群,後續請求也更可能持續受到影響。在第三方平臺上,Amazon Bedrock高峰期受影響約0.18%,Google Cloud Vertex AI則比例低於0.0004%。
第二個問題出現在8月25日,Claude API的TPU伺服器因部署設定錯誤,導致部分請求在Token生成時出現機率分配異常。表現上,英文回應中可能夾入泰文或中文字符,或程式碼中出現明顯語法錯誤。此問題影響到8月25日至28日的Opus 4.1與Opus 4,以及8月25日至9月2日的Sonnet 4。Anthropic已在9月2日回退相關變更,並新增非預期字元的檢測流程,以降低類似風險。
第三個問題則與XLA:TPU編譯器中的近似top-k演算法有關。8月25日部署的新取樣程式觸發潛在錯誤編譯(Miscompilation),已確認影響Haiku 3.5,並推測波及部分Sonnet 4與Opus 3。Anthropic於9月4日先回退Haiku 3.5的變更,9月12日再針對Opus 3處理,對Sonnet 4則採取預防性回退,後續Claude全面改採精確top-k運算,並統一部分運算至fp32精度。
Anthropic指出,此次事件難以快速診斷的原因在於3個缺陷同時發生,且在不同平臺上呈現的症狀各異,外觀看似隨機錯誤。現有的評測流程對零星失誤敏感度不足,再加上內部隱私規範限制工程團隊直接存取未經使用者回報的互動內容,增加了問題定位的難度。尤其在8月29日負載平衡調整後,負面回饋同時攀升,進一步模糊了變更與問題的關聯。
針對後續改進,Anthropic已提高評測靈敏度,並將評測機制延伸至真實生產環境持續執行,以便在異常發生時能更快捕捉。同時開發除錯工具,讓工程團隊能在不影響使用者隱私的前提下,更有效重現社群回報案例。
官方也提醒,因生成流程調整為精確top-k並加強數值精度管理,極少數使用場景可能需要開發者重新微調top-p等參數。至於平臺影響層面,自家服務,包含API、網頁版Claude與Claude Code受影響較明顯,第三方平臺影響範圍則相對有限。目前多數修復已完成,Amazon Bedrock仍在推送,更新稍晚完成。
