Google周一(10/6)發表了專屬於AI產品的抓漏獎勵計畫,根據產品等級與漏洞嚴重程度來發放獎勵,最高獎金可達3萬美元。不過,Google也提醒,不管是越獄、提示注入或對齊問題都未被列入獎勵範圍。
Google是在2023年的10月正式將AI產品納入濫用漏洞獎勵計畫(Abuse Vulnerability Reward Program,Abuse VRP),迄今已發放逾43萬美元的相關漏洞獎勵,此次的更新主要是為了釐清獎勵範圍,以及整合了濫用與安全問題,同時鼓勵安全研究人員專注於影響力最大與最多獎勵的目標。
在新的AI VRP中,Google先將產品分級,等級愈高,獎金就愈多,例如Google Search、Gemini Apps與Google Workspace各種核心應用都屬於旗艦產品;而AI Studio、Jules與Google Workspace的非核心應用則被列為標準產品,而被整合於Google產品中的其它AI則被歸類為其它。
至於漏洞懸賞範圍則包括:能修改受害者帳戶或資料狀態,且產生安全影響的攻擊;敏感資料外洩;可被用來執行網釣攻擊的Google網站漏洞;可竊取完整、詳細與機密模型參數的漏洞;可持續修改AI系統脈絡的安全漏洞;存取控制繞過漏洞;可未經授權使用產品;以及持續性服務阻斷攻擊漏洞。
若在旗艦級AI產品中發現能修改受害者帳號或資料的安全漏洞(Rogue Actions),其基本獎金為2萬美元;若報告品質高且漏洞具新穎性,最高可獲3萬美元獎勵。
值得注意的是,Google此次特別澄清,不管是越獄(Jailbreak)、提示注入(Prompt Injection)或對齊問題(Alignment Issues)都未被列入AI VRP獎勵範圍。其中,越獄指的是透過特定提示誘導AI解除原本的安全限制,例如讓它說出原本禁止的內容;提示注入則是於輸入時嵌入惡意指令,以誘導AI忽略原本任務而執行駭客行為;對齊問題是指AI模型未符合預期或道德標準。
Google解釋,VRP的主要目的是鼓勵安全研究人員向Google回報安全漏洞與濫用問題,但上述屬於內容問題,這些問題需要長期且跨學科的努力,必須藉由分析大量報告的趨勢、更新模型及評估使用者脈絡來改善,與VRP的目標並不一致,因而未被列入獎勵範圍,但研究人員仍能藉由產品內的回報機制向Google舉報。
