Checkmarx 應用程式安全性指南:解析 Claude Mythos
文章翻譯
2026-05-18 by 高田鑑識
前言
2026 年 4 月 7 日,Anthropic 發布了全新 AI 模型「Mythos」(目前處於私人測試階段),目標是在 AI 時代保障軟體安全性。
Anthropic 表示,AI 已在網路安全領域達到關鍵轉折點。隨著 Mythos 的即將發布,AI 模型即將具備識別並利用軟體漏洞的能力,其水準足以媲美頂尖人類專家,甚至在許多情況下超越他們。Mythos 已在主流作業系統與瀏覽器中發現數千個高嚴重性漏洞,顯示能力與風險正同步急速加速。
在 Mythos 公告發布後不久,Anthropic 隨即成立了一個聯盟,以透明翅膀的熱帶蝴蝶命名為「Glasswing 計畫」。該計畫涵蓋 Apple、Google、Microsoft、Nvidia 等逾 40 家主要科技企業,其核心任務是將這股強大的大型語言模型(LLM)力量導向防禦而非攻擊。
Anthropic 分享的近期案例清楚展現了能力的躍進:Opus 4.6 模型在數百次嘗試中,僅成功為 Firefox 147 漏洞生成可運作的 JavaScript shell 漏洞利用程式兩次;而 Mythos 的成功率則大幅提升,在 181 個案例中成功生成可運作的攻擊程式。這不只是小幅進步,而是本質上截然不同的能力層次。
本文將提供一份實用指南,協助您深入理解這項公告的意涵、對應用程式安全性主管的影響,以及在 AI 旅程中可供參考的具體建議。
Anthropic 為何發布此公告?為何選在此時?
多年來,許多軟體漏洞之所以未被發現,是因為識別並利用這些漏洞需要高度專業的知識。隨著先進 AI 模型的崛起,成本、精力與技術門檻大幅降低,使得漏洞發現與利用變得觸手可及、快速且可大規模執行。如 Checkmarx 自身研究所示,AI 的強大能力與普及程度大幅縮短了漏洞利用的時間。
過去需要數週、數月甚至數年才能利用的漏洞,如今可在數分鐘內被武器化。這定義了應用程式安全性的全新現實,對任何資安主管、工程主管乃至整個管理團隊而言,這都必須是首要優先事項。
根據我們年度《應用程式安全性的未來》報告,逾 81% 的組織在明知程式碼存在漏洞的情況下仍選擇發布,原因在於龐雜的雜訊、缺乏脈絡的積壓清單以及資源有限。這只是應用程式安全性(AppSec)主管如今必須面對的諸多 AI 驅動挑戰之一。
純粹採用 AI 模型安全性解決方案的挑戰
隨著各組織加速邁向 AI 原生開發,安全性環境也以同等速度轉變,且往往難以預測。新型 AI 模型展現出前所未有的能力,能在現有程式碼庫中發現漏洞,包括多年來未被察覺的長期缺陷。與此同時,這些模型也大幅降低了漏洞利用的門檻,使已知與未知漏洞的武器化速度更快。這形成了雙重挑戰:漏洞發現能力雖然提升,風險的數量與速度卻也同步增加。
有鑑於此,以下是代理式開發中正在浮現、企業必須正視的幾項關鍵安全性挑戰:
- 新模型正在舊有程式碼中發現大量零時差漏洞。
- AI 加速漏洞武器化:無論已知或未知漏洞皆然。
- 多達 45% 的 AI 生成程式碼可能存在安全性風險。
- 大型語言模型(LLM)存在漏洞遺漏的情況,涵蓋範圍並不完整。
- 各模型的訓練來源不同,導致不同 LLM 之間的結果缺乏一致性。
- AI 模型的涵蓋範圍不夠全面,且缺乏足夠的脈絡資訊。
針對已知與未知漏洞的確定性與機率性應用程式安全性
隨著軟體環境逐漸演進為代理式架構,LLM 持續進步,我們必須認清:單靠 AI 驅動的安全性分析並不足夠。以機率性推理來生成並標記問題的模型,必須與根植於真實脈絡、客戶環境、真實可利用性、政策執行、可稽核性及完整可視性的確定性系統並行運作。在企業規模下,這也意味著需要支援數千個儲存庫、分散式團隊以及高度互聯的系統。
正如 Tomasz Tunguz 在《AI 安全性的參差前沿》一文中所指出,AI 能力並非線性發展,而是存在不一致性且高度依賴脈絡。Mythos 等模型雖能在發現與利用未知漏洞方面展現突破性表現,但在提供適當輸入的情況下,較小型模型往往也能達到類似結果。與此同時,那些埋沒在積壓清單中、缺乏優先排序的已知漏洞,在 AI 時代仍是重大且可被武器化的風險。
在這種參差不齊的現實中,部分漏洞能以高精準度識別,其他則完全遭到遺漏。這導致錯誤的安全感、輸出不一致,以及風險涵蓋範圍出現關鍵缺口。若偵測不具一致性,便無從信賴。
這正是混合模型不可或缺之處——AI 的機率性推理提供速度與規模,但必須輔以確定性安全性層,依據脈絡與真實可利用性來驗證發現結果。機率性與確定性方法相互結合,為代理式應用程式安全性樹立新標準,在規模化下提供高保真、可付諸行動的結果。
代理式分類處理與修復的必要性
我們已確立:將發現大量未知漏洞的 LLM 驅動安全性,與原本就難以管理的已知問題積壓清單(使 81% 的組織暴露於風險中)相結合,需要一種融合機率性與確定性分析的混合方法。但這仍然不夠。
如今龐大的漏洞數量迫切需要代理式分類處理與修復。人工流程已無法應對;它們無法提供脈絡、有效排定優先順序,也無法在規模化下自信地化解風險。
這正是 AI 代理人(AI Agent)至關重要之處。透過自動執行智慧型分類處理來消除雜訊、優先處理真正可利用的風險,並推動快速的自動化修復,AI 代理人將推理能力與精準度融為一體。最終成果是不只具有可擴展性,更在 AI 原生開發環境中真正可付諸行動的安全性。
總結與建議
Mythos 的發布公告與 Glasswing 計畫的成立,標誌著 AI 驅動安全性的重要里程碑,但它們不是、也無法成為獨立存在的解決方案。如上所述,AI 模型既放大了既有風險,也暴露了新的風險,形成需要更廣泛、更整合性方法才能應對的挑戰。
為打造真正符合企業級需求、值得信賴的 AI 安全性計畫,我們建議採取以下步驟:
- 混合應用程式安全性模型
結合確定性精準度與機率性 AI,全面涵蓋已知與未知風險。 - 代理式分類處理與修復
運用 AI 代理人擴展脈絡感知的分類處理能力,並加速修復流程。 - 左移至源頭
在程式碼創建階段識別並修復 AI 生成的漏洞,防患於未然,避免進入正式環境。


