Anthropic Mythos AI 未經授權存取事件:Discord 團體如何入侵「過於危險」的網路安全模型

主要摘要
- 一個小型 Discord 群組在 Mythos (Claude Mythos 預覽版) 宣布將在「玻璃翼計畫」下進行有限測試的當天,便取得了存取 Anthropic 這項受限模型的權限。
- 取得權限的途徑,是結合了第三方承包商的正當登入憑證,以及根據 Mercor 數據洩漏事件中外流的模式,對端點 URL 進行猜測——並非複雜的模型駭客技術。
- 該群組僅將模型用於良性任務,例如建立簡單網站,並刻意避開網路安全相關的提示,以避免被偵測。
- 此事件凸顯出 AI 安全風險 往往源於營運、供應鏈和人為因素,而非僅是模型本身的核心能力。
- Anthropic 正透過其一間第三方供應商的環境,積極調查此次未經授權的存取事件。
什麼是 Anthropic 的 Mythos AI 模型?
Anthropic 開發的 Mythos 是一個高度先進、專門用於網路安全任務的 AI 模型。根據該公司說法,它在識別和利用各大作業系統及網頁瀏覽器的零時差漏洞方面,展現了前所未有的能力。
據報導,基準測試和內部評估顯示,Mythos 能生成數千個潛在的攻擊程式碼,而先前的模型則一無所獲。這使得 Anthropic 認定其公開釋出的風險過高,因此將初期存取權限限制在「玻璃翼計畫」下的特定合作夥伴,包括 Apple、Amazon、Cisco 及其他組織。
該模型被定位為一種防禦性工具,旨在幫助大型企業和政府強化其系統,以抵禦新興的 AI 驅動威脅。然而,其攻擊潛力也引發了擔憂,即如果落入惡意者手中,可能造成擴散風險。


未授權存取如何發生
分析報告顯示,此次入侵手法出奇簡單,並非針對模型本身的高科技攻擊:
- 時機:存取發生於2026年4月7日——正是Anthropic宣布啟動有限度測試的當天。
- 手法:一個私密Discord頻道(專門追蹤未發布AI模型)的成員利用了以下幾點:
- 來自群組內一位成員的合法憑證,該成員是Anthropic第三方供應商(參與模型評估)的承包商。
- 對Anthropic API端點命名慣例的了解,這源自近期AI新創公司Mercor大規模資料外洩事件。
- 運用常見網路偵察技術,對Mythos預覽版端點URL進行有根據的猜測。
這些條件的結合讓該群組得以持續存取超過兩週。他們向記者提供了截圖與線上演示,以證實其說法。
值得注意的是,他們避開了高風險的網路安全提示指令,轉而進行無害活動,例如生成簡單網站。這種低調的做法可能幫助他們更長時間未被察覺。

為何此次入侵事關重大:超越模型權重
社群回饋與專家討論認為,此事件凸顯了AI安全領域一個關鍵事實:最脆弱的環節通常是程序性與人為因素,而非技術性的模型防護措施。
雖然Mythos的基準測試聚焦於其網路能力,但實際暴露的風險源於:
- 供應鏈漏洞:擁有合法存取權的第三方承包商與供應商。
- 可預測的基礎設施模式:模型端點重複使用的命名慣例。
- 資料外洩的放大效應:來自無關入侵事件(例如Mercor)的資訊助長了偵察活動。
- 信任假設:過度依賴受控環境,卻未對供應商存取進行充分的隔離或監控。
與過去AI事件比較,可見一種模式——許多「危險」模型面臨的管控挑戰,並非來自對模型權重的對抗性攻擊,而是來自營運缺口。此案例類似於將先進武器鎖在房間內,卻讓建築側門敞開。
值得注意的特殊情況包括:
- 承包商或合作夥伴間共用憑證。
- 公開線索(GitHub、文件模式)有助於URL預測。
- 當使用量低於特定風險閾值時,監控可能出現盲區。
限制性AI部署的常見陷阱
針對類似高風險AI發布案例的分析揭示了反覆出現的問題:
- 過度強調模型對齊,卻未充分投資於運行時存取控制與審計機制。
- 引入供應商與合作夥伴時,缺乏細粒度、時效性權限或異常檢測措施。
- 命名規則與端點可預測性過高,使具備內部知識的相關人員更容易進行偵察。
- 未能有效區隔環境,導致內部測試、供應商評估與有限合作夥伴存取之間缺乏隔離。
網路安全領域討論的高級緩解策略包括:
- 實施嚴格身份驗證的動態臨時端點。
- 行為監控機制,即使來源未預期但行為看似良性的使用模式也予以標記。
- 定期輪替命名規則與憑證授權範圍。
- 聚焦於承包商存取路徑的供應鏈安全審計。
對AI安全與網路安全的影響
Mythos事件引發了關於強力雙用途AI技術治理的更廣泛問題。雖然該組織未將模型武器化,但輕易取得的程度顯示了受限能力如何能透過非正式網絡快速擴散。
測試Mythos的金融機構、政府與企業現在必須重新評估,不僅是模型的防禦價值,還包括類似曝光途徑的風險。監管機構已在密切關注發展,金融穩定委員會等論壇的討論亦突顯了系統性擔憂。
與其他AI公司的比較顯示,Anthropic並非孤例——許多組織都在努力平衡創新速度與雲端部署中的強健防護。
結論
對Anthropic的Mythos模型的未授權存取,及時提醒了我們真正的AI安全遠不止於訓練資料與對齊技術。營運安全、供應鏈完整性和人為因素同樣扮演決定性角色。
隨著AI在網路安全等敏感領域的能力持續進步,組織必須將全面的存取治理與模型開發同等重視。AI、網路安全與政策相關的利益攸關方應密切關注Anthropic的調查結果,並考慮強化限制性部署的最佳實踐。
對於從事前沿AI系統的專業人士而言,立即檢視內部供應商管理、端點安全與監控協議是降低類似曝光風險的建議步驟。
Continue Reading
More articles connected to the same themes, protocols, and tools.
Referenced Tools
Browse entries that are adjacent to the topics covered in this article.







