AI & Big Data 09月19日
Anthropic公布Claude回應品質下降的技術報告
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Anthropic近期公布技術報告,說明今年8月至9月初期間,因3項基礎設施缺陷交疊,導致Claude的回應品質出現間歇性下降。這些問題源於基礎設施部署與配置的缺陷,而非模型效能調整。報告詳細闡述了請求被誤導向錯誤伺服群、TPU伺服器部署設定錯誤導致Token生成異常,以及XLA:TPU編譯器中的近似top-k演算法觸發潛在錯誤編譯等問題。Anthropic已完成大部分修復,並同步推動更嚴格的品質檢測與監控機制,以提升系統穩定性與回應準確性。

🧰 **基礎設施缺陷導致回應品質下降**:Anthropic的技術報告指出,今年8月至9月初,Claude的回應品質出現間歇性下降,主因是3項基礎設施缺陷疊加。這些問題源於部署與配置錯誤,而非刻意調降模型效能,影響了Claude在不同時間段的表現。

🗼 **多重技術問題疊加影響**:報告詳細列舉了三大技術問題:一是部分請求被誤導向新一代100萬Token上下文長度伺服群,隨著負載平衡調整,影響比例一度擴大;二是Claude API的TPU伺服器因部署設定錯誤,導致Token生成時機率分配異常,英文回應中夾雜非預期字符或程式碼出現語法錯誤;三是XLA:TPU編譯器中的近似top-k演算法部署新取樣程式後觸發潛在錯誤編譯,影響部分模型版本。

🔍 **診斷難度與改進措施**:Anthropic指出,3項缺陷同時發生且症狀各異,加上現有評測流程對零星失誤敏感度不足,以及內部隱私規範限制,增加了問題診斷的難度。為此,公司已提高評測靈敏度,將評測機制延伸至真實生產環境,並開發除錯工具,以提升問題捕捉與定位效率,確保系統穩定性。

📈 **平台影響與後續調整**:此次事件對自家服務(API、網頁版Claude、Claude Code)影響較明顯,第三方平台影響相對有限。Anthropic已完成多數修復,並提醒開發者因生成流程調整,極少數場景可能需重新微調參數。未來將持續加強品質檢測與監控,確保系統穩定性。

Anthropic公布技術報告說明今年8月至9月初期間,3項基礎設施缺陷交疊,導致Claude的回應品質出現間歇性下降。官方強調這些問題並非因需求、伺服器負載或時段而調降模型水準,而是基礎設施部署與配置的缺陷所致。目前多數修復已完成,並同步推動更嚴格的品質檢測與監控機制。

事件起於8月5日,Sonnet 4部分請求被誤導向新一代100萬Token上下文長度伺服群,起初影響比例僅0.8%。但是在8月29日的負載平衡調整放大了流量分配,至8月31日時,受影響比例一度達16%。由於採用具黏著性的路由策略,一旦對話首次被分派至錯誤伺服群,後續請求也更可能持續受到影響。在第三方平臺上,Amazon Bedrock高峰期受影響約0.18%,Google Cloud Vertex AI則比例低於0.0004%。

第二個問題出現在8月25日,Claude API的TPU伺服器因部署設定錯誤,導致部分請求在Token生成時出現機率分配異常。表現上,英文回應中可能夾入泰文或中文字符,或程式碼中出現明顯語法錯誤。此問題影響到8月25日至28日的Opus 4.1與Opus 4,以及8月25日至9月2日的Sonnet 4。Anthropic已在9月2日回退相關變更,並新增非預期字元的檢測流程,以降低類似風險。

第三個問題則與XLA:TPU編譯器中的近似top-k演算法有關。8月25日部署的新取樣程式觸發潛在錯誤編譯(Miscompilation),已確認影響Haiku 3.5,並推測波及部分Sonnet 4與Opus 3。Anthropic於9月4日先回退Haiku 3.5的變更,9月12日再針對Opus 3處理,對Sonnet 4則採取預防性回退,後續Claude全面改採精確top-k運算,並統一部分運算至fp32精度。

Anthropic指出,此次事件難以快速診斷的原因在於3個缺陷同時發生,且在不同平臺上呈現的症狀各異,外觀看似隨機錯誤。現有的評測流程對零星失誤敏感度不足,再加上內部隱私規範限制工程團隊直接存取未經使用者回報的互動內容,增加了問題定位的難度。尤其在8月29日負載平衡調整後,負面回饋同時攀升,進一步模糊了變更與問題的關聯。

針對後續改進,Anthropic已提高評測靈敏度,並將評測機制延伸至真實生產環境持續執行,以便在異常發生時能更快捕捉。同時開發除錯工具,讓工程團隊能在不影響使用者隱私的前提下,更有效重現社群回報案例。

官方也提醒,因生成流程調整為精確top-k並加強數值精度管理,極少數使用場景可能需要開發者重新微調top-p等參數。至於平臺影響層面,自家服務,包含API、網頁版Claude與Claude Code受影響較明顯,第三方平臺影響範圍則相對有限。目前多數修復已完成,Amazon Bedrock仍在推送,更新稍晚完成。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Anthropic Claude AI模型 技術報告 基礎設施 模型穩定性 AI performance
相关文章