Anthropic Mythos AI 資料外洩：Discord 團體存取受限網路安全模型

主要摘要

一個小型 Discord 群組在 Mythos (Claude Mythos 預覽版) 宣布將在「玻璃翼計畫」下進行有限測試的當天，便取得了存取 Anthropic 這項受限模型的權限。
取得權限的途徑，是結合了第三方承包商的正當登入憑證，以及根據 Mercor 數據洩漏事件中外流的模式，對端點 URL 進行猜測——並非複雜的模型駭客技術。
該群組僅將模型用於良性任務，例如建立簡單網站，並刻意避開網路安全相關的提示，以避免被偵測。
此事件凸顯出 AI 安全風險 往往源於營運、供應鏈和人為因素，而非僅是模型本身的核心能力。
Anthropic 正透過其一間第三方供應商的環境，積極調查此次未經授權的存取事件。

什麼是 Anthropic 的 Mythos AI 模型？

Anthropic 開發的 Mythos 是一個高度先進、專門用於網路安全任務的 AI 模型。根據該公司說法，它在識別和利用各大作業系統及網頁瀏覽器的零時差漏洞方面，展現了前所未有的能力。

據報導，基準測試和內部評估顯示，Mythos 能生成數千個潛在的攻擊程式碼，而先前的模型則一無所獲。這使得 Anthropic 認定其公開釋出的風險過高，因此將初期存取權限限制在「玻璃翼計畫」下的特定合作夥伴，包括 Apple、Amazon、Cisco 及其他組織。

該模型被定位為一種防禦性工具，旨在幫助大型企業和政府強化其系統，以抵禦新興的 AI 驅動威脅。然而，其攻擊潛力也引發了擔憂，即如果落入惡意者手中，可能造成擴散風險。

未經授權的存取如何發生

未授權存取如何發生

分析報告顯示，此次入侵手法出奇簡單，並非針對模型本身的高科技攻擊：

時機：存取發生於2026年4月7日——正是Anthropic宣布啟動有限度測試的當天。
手法：一個私密Discord頻道（專門追蹤未發布AI模型）的成員利用了以下幾點：
- 來自群組內一位成員的合法憑證，該成員是Anthropic第三方供應商（參與模型評估）的承包商。
- 對Anthropic API端點命名慣例的了解，這源自近期AI新創公司Mercor大規模資料外洩事件。
- 運用常見網路偵察技術，對Mythos預覽版端點URL進行有根據的猜測。

這些條件的結合讓該群組得以持續存取超過兩週。他們向記者提供了截圖與線上演示，以證實其說法。

值得注意的是，他們避開了高風險的網路安全提示指令，轉而進行無害活動，例如生成簡單網站。這種低調的做法可能幫助他們更長時間未被察覺。

為何此次入侵事關重大：超越模型權重

社群回饋與專家討論認為，此事件凸顯了AI安全領域一個關鍵事實：最脆弱的環節通常是程序性與人為因素，而非技術性的模型防護措施。

雖然Mythos的基準測試聚焦於其網路能力，但實際暴露的風險源於：

供應鏈漏洞：擁有合法存取權的第三方承包商與供應商。
可預測的基礎設施模式：模型端點重複使用的命名慣例。
資料外洩的放大效應：來自無關入侵事件（例如Mercor）的資訊助長了偵察活動。
信任假設：過度依賴受控環境，卻未對供應商存取進行充分的隔離或監控。

與過去AI事件比較，可見一種模式——許多「危險」模型面臨的管控挑戰，並非來自對模型權重的對抗性攻擊，而是來自營運缺口。此案例類似於將先進武器鎖在房間內，卻讓建築側門敞開。

值得注意的特殊情況包括：

承包商或合作夥伴間共用憑證。
公開線索（GitHub、文件模式）有助於URL預測。
當使用量低於特定風險閾值時，監控可能出現盲區。

限制性AI部署的常見陷阱

針對類似高風險AI發布案例的分析揭示了反覆出現的問題：

過度強調模型對齊，卻未充分投資於運行時存取控制與審計機制。
引入供應商與合作夥伴時，缺乏細粒度、時效性權限或異常檢測措施。
命名規則與端點可預測性過高，使具備內部知識的相關人員更容易進行偵察。
未能有效區隔環境，導致內部測試、供應商評估與有限合作夥伴存取之間缺乏隔離。

網路安全領域討論的高級緩解策略包括：

實施嚴格身份驗證的動態臨時端點。
行為監控機制，即使來源未預期但行為看似良性的使用模式也予以標記。
定期輪替命名規則與憑證授權範圍。
聚焦於承包商存取路徑的供應鏈安全審計。

對AI安全與網路安全的影響

Mythos事件引發了關於強力雙用途AI技術治理的更廣泛問題。雖然該組織未將模型武器化，但輕易取得的程度顯示了受限能力如何能透過非正式網絡快速擴散。

測試Mythos的金融機構、政府與企業現在必須重新評估，不僅是模型的防禦價值，還包括類似曝光途徑的風險。監管機構已在密切關注發展，金融穩定委員會等論壇的討論亦突顯了系統性擔憂。

與其他AI公司的比較顯示，Anthropic並非孤例——許多組織都在努力平衡創新速度與雲端部署中的強健防護。

結論

對Anthropic的Mythos模型的未授權存取，及時提醒了我們真正的AI安全遠不止於訓練資料與對齊技術。營運安全、供應鏈完整性和人為因素同樣扮演決定性角色。

隨著AI在網路安全等敏感領域的能力持續進步，組織必須將全面的存取治理與模型開發同等重視。AI、網路安全與政策相關的利益攸關方應密切關注Anthropic的調查結果，並考慮強化限制性部署的最佳實踐。

對於從事前沿AI系統的專業人士而言，立即檢視內部供應商管理、端點安全與監控協議是降低類似曝光風險的建議步驟。

Anthropic Mythos AI 未經授權存取事件：Discord 團體如何入侵「過於危險」的網路安全模型

主要摘要

什麼是 Anthropic 的 Mythos AI 模型？

未授權存取如何發生

為何此次入侵事關重大：超越模型權重

限制性AI部署的常見陷阱

對AI安全與網路安全的影響

結論

Continue Reading

Anthropic Mythos AI Unauthorized Access: How a Discord Group Breached the 'Too Dangerous' Cybersecurity Model

How to Access the Fable 5 API: A Developer’s Guide to Claude’s Mythos-Class Model

Google 投入高達400億美元支持 Anthropic 並提供5GW運算力：AI軍備競賽進入新紀元

Referenced Tools

Claude Code

Claude Desktop

Claude Agent via Zed External Agents

X MCP

Bitbucket MCP

openaiDeveloperDocs